완구에 있어서 대화형 음성 및 다감각인식 시스템 및 이의방법专利检索-情景感知人工智能专利检索查询-专利查询网

완구에 있어서 대화형 음성 및 다감각인식 시스템 및 이의방법

阅读：92发布：2020-11-05

专利汇可以提供완구에 있어서 대화형 음성 및 다감각인식 시스템 및 이의방법专利检索，专利查询，专利分析的服务。并且PURPOSE: Interactive type audio and multi-sense cognition system in toy satisfies curiosity and interest of children by various vocal expression for identical question of user, improves culture of sentiments and speech study of children by various vocal and motion expression of children sense. CONSTITUTION: Interactive type audio and multi-sense cognition system in toy comprises first step to extract selected vocal sample to study data on audio cognition training process using IDMLP(Input Driven Multi Layer Perceptron) nerve circuit net algorithm through computer; second step to store study data and vocal scenario corresponding to study data in memory part(20) through PC interface part(12) of toys; third step to extract study data corresponding to vocal signal using IDMLP nerve circuit net algorithm after passing whole treatment process in control part(10); fourth step to select vocal expression and motion expression among scenario for vocal output and motion expression through audio and working composition part(11), memory part(20) in control part(10); fifth step to send control signal to output selected vocal expression and motion expression through output part(40); sixth step to output vocal and motion expression by control signal of control part(10).，下面是완구에 있어서 대화형 음성 및 다감각인식 시스템 및 이의방법专利的具体信息内容。

权利要求

완구에 있어서 대화형 음성 및 다감각인식 방법에 있어서,

선별된 음성표본이 소정의 컴퓨터를 통해 IDMLP신경회로망 알고리즘을 이용한 음성인식 훈련과정을 거쳐 소정의 학습데이터로 추출되는 제1단계; 상기 제1단계에서 추출한 소정의 학습데이터 및 상기 학습데이터에 해당하는 음성 시나리오를 본 발명에 의해 구현한 완구류의 PC 인터페이스부를 통해 소정의 메모리부에 저장하는 제2단계; 상기 제2단계이후, 입력부를 통해 소정의 음성신호가 입력되면, 제어부에서 전처리과정을 거친 후 IDMLP신경회로망 알고리즘을 이용하여 입력한 음성신호에 해당하는 학습데이터를 추출하는 제3단계; 상기 제3단계이후, 상기 제어부에서 음성 및 작동합성부 및 소정의 메모리부를 통해 학습데이터에 해당하는 음성출력 및 동작표현용 시나리오 중에서 소정의 음성표현 및 동작표현을 임의로 선택하는 제4단계; 상기 제4단계에서 선택한 음성표현 및 동작표현을 출력부를 통해 출력할 수 있도록 해당 장치에 제어신호를 보내는 제5단계; 상기 출력부의 해당 장치가 상기 제어부의 제어신호에 의해 소정의 음성표현 및 동작표현을 출력하는 제6단계로 구성함을 특징으로 하는, 완구에 있어서 대화형 음성 및 다감각인식 방법.

제1항에 있어서,

상기 제2단계이후, 입력부인 소정의 센서를 통해 소정의 신호가 입력되면, 제어부에서 이를 인식하여 음성 및 작동합성부를 통해 소정의 메모리부에 저장된음성표현 및 동작표현용 시나리오 중에서 소정의 음성표현 및 동작표현을 임의로 선택하는 제1단계; 상기 제1단계에서 선택된 음성표현 및 동작표현을 출력부를 통해 출력할 수 있도록 해당 장치에 제어신호를 보내는 제2단계; 상기 출력부의 해당 장치가 상기 제어부의 제어신호에 의해 소정의 음성표현 및 동작표현을 출력하는 제3단계로 구성함을 특징으로 하는, 완구에 있어서 대화형 음성 및 다감각인식 방법.

완구에 있어서 대화형 음성 및 다감각인식 시스템에 있어서,

IDMLP신경회로망 알고리즘을 이용한 입력부를 통해 공급되는 음성신호 인식 및 소정의 센서를 통해 공급되는 신호를 인식하여 소정의 음성표현 및 동작표현을 출력하도록 해당 장치를 제어하는 제어부; 상기 제어부의 운용 소프트웨어를 저장하고, IDMLP신경회로망 알고리즘을 이용하여 학습과정을 거쳐 얻어진 학습데이터를 저장하는 제1메모리부, 음성표현 및 동작표현 시나리오를 저장하는 제2메모리부, 내부적인 데이터 신호처리를 담당하는 제3메모리부로 이루어지는 메모리부; 상기 제어부와 연동하여 제2메모리부에 저장되어 있는 소정의 음성표현 및 동작표현 데이터를 출력부로 공급하는 음성 및 작동합성부; 사용자의 음성을 수신하여 전기적인 아날로그 음성신호로 변환하는 마이크, 촉감을 감지하여 소정의 신호를 상기 제어부로 공급하는 촉감감지센서, 일정거리를 감지하여 소정의 신호를 상기 제어부로 공급하는 초음파센서, 빛과 어둠을 감지하여 소정의 신호를 상기 제어부로 공급하는 적외선센서, 사용자의 음성신호 중 잡음신호와 주변의 소음을 제거하는 필터부, 약한 아날로그신호를 상기 제어부가 인식하여 운용할 수 있도록 소정의 크기로 증폭하는 제1증폭부로 이루어지는 입력부; 출력부의 해당 장치를 작동할 수 있도록 상기 음성 및 작동합성부를 통해 공급되는 약한 아날로그신호를 소정의 크기로 증폭하는 제2증폭부, 소정의 음성표현 데이터를 가진 전기적인 신호를 사용자가 인식할 수 있는 음성으로 변환하여 출력하는 스피커, 상기 제어부의 제어신호에 의해 일정간격으로 빛을 발광하는 LED, 소정의 동작표현 데이터에 해당하는 동작을 출력하는 구동수단부로 이루어지는 출력부; 소정의 학습과정을 수행하여 학습데이터를 추출한 컴퓨터에 용이하게 접근할 수 있도록 하는 PC 인터페이스부; 소정의 전압을 유지하여 각 회로와 소자에 일정한 전원을 공급하는 전원부 로 구성함을 특징으로 하는, 완구에 있어서 대화형 음성 및 다감각인식 시스템.

제3항에 있어서,

상기 완구의 소정 부위에 설치되는 센서는 사용자가 만지는 촉각을 감지하여 소정의 음성표현 및 동작표현을 출력하도록 촉각감지센서로 구성함을 특징으로 하는, 완구에 있어서 대화형 음성 및 다감각인식 시스템.

제3항에 있어서,

상기 완구의 소정 부위에 설치되는 센서는 사용자가 일정거리에 접근하는 것을 감지하여 소정의 음성표현 및 동작표현을 출력하도록 초음파센서로 구성함을 특징으로 하는, 완구에 있어서 대화형 음성 및 다감각인식 시스템.

제3항에 있어서,

상기 완구의 소정 부위에 설치되는 센서는 빛과 어둠을 감지하여 소정의 음성표현 및 동작표현을 출력하도록 적외선센서로 구성함을 특징으로 하는, 완구에 있어서 대화형 음성 및 다감각인식 시스템.

说明书全文

완구에 있어서 대화형 음성 및 다감각인식 시스템 및 이의 방법{The system and method of a dialogue form voice and multi-sense recognition for a toy}

본 발명은 완구에 있어서 대화형 음성 및 다감각인식 시스템 및 이의 방법에 관한 것으로, 보다 상세하게는 인형 및 장난감과 같은 완구류내에 음성인식 및 다감각인식 시스템을 내장하여 사용자의 다양한 음성과 행위 및 주변상황에 적절히 반응하도록 소프트웨어와 하드웨어적으로 구현한 사용자와 커뮤니케이션이 가능한 완구에 있어서 음성 및 다감각인식 시스템 및 이의 방법에 관한 것이다.

일반적으로 완구는 예로부터 어린이와 밀접한 관계를 맺으면서 그들의 호기심을 충족하는 동시에 창작성이나 감성과 같은 교육적인 측면을 고려하여 다양한 형태로 꾸준히 개발 되고 있는데, 초창기에는 주로 어린이의 호기심을 충족하기 위하여 당시 유행하는 캐릭터를 중심으로 개발이 되어 왔으나 갈수록 교육적인 측면에 대한 요구가 반영되어 다양한 형태의 완구가 제작되고 있다.

특히 어린이의 다양한 음성과 행위에 따라 상황에 맞는 적절한 음성표현과 동작행위를 하는 경우는 아이들의 호기심을 충족하는 동시에 교육적인 효과가 대단히 우수하여 대부분의 완구제작업체들은 이러한 방향으로 개발을 하고 있는데, 지금까지의 기술수준은 완구내에 소정의 저장매체를 내장한 후 아이들의 호기심을 충족할 수 있는 음향 및 음성표현을 저장하고, 터치센서에 의해 작동하도록 하여 소정의 음향 및 음성을 표현하도록 하고 있으나, 비용에 대한 부담, 기술의 한계성으로 인하여 유행에 민감하고 변덕이 심한 어린 아이들의 특성상 호기심충족에 대한 욕구를 계속 지속하기가 어렵다는 문제점이 있다.

최근 들어 전세계적으로 상기와 같은 문제점을 해결하기 위하여 아이들의 호기심을 충족하는 동시에 교육적인 측면을 고려한 완구 제작이 활기를 띠고 있는데, 특히 음성인식기술을 이용한 음성인식시스템을 완구내에 내장하여 적절한 상황에 맞는 음성을 출력하도록 하고 있지만 아직은 초보적인 단계에 머물고 있어 단순히 저장되어 있는 음성이 출력되는 수준이고, 좀 더 개선된 형태로 일정한 시나리오가 있는 형태의 음성이 출력되기도 하지만 출력되는 음성 역시 획일화된 형태로 음성표현이 되어 일정시간이 소요되면 어린이가 흥미를 잃어버리게 되고, 교육적인 효과도 약화된다는 문제점을 여전히 지니고 있다.

또한 인형 및 로봇 같은 완구내에 소정의 구동수단을 내장하여 어린이의 흥미를 자아내기 위해 일정한 동작을 표현하도록 하는 경우도 있으나 이는 비용에 대한 부담이나 기술의 한계성으로 인해 단순한 표현만 반복하기 때문에 아이들의 호기심에 대한 욕구를 충족하기에는 미흡하다는 문제점을 안고 있다.

따라서 어린이의 다양한 음성, 행위 및 주변상황에 맞는 음성 및 동작을 표현하도록 하여 어린이와 커뮤니케이션이 가능하도록 함으로써 흥미를 충족하면서도 교육적인 기능을 동시에 구현할 수 있는 완구의 필요성이 대두되고 있다.

본 발명은 상기의 종래 문제점을 해결하기 위하여 안출된 것으로, IDMLP신경회로망 알고리즘을 이용하여 소정의 입력장치를 통해 입력되는 사용자의 음성을 인식하고, 인식된 음성에 해당하는 음성 시나리오의 다양한 음성표현 중에서 임의로 하나의 음성표현을 선택한 후 해당 출력장치를 통해 출력함으로써 사용자가 동일한 질문을 하여도 완구는 상황에 따라 다양하면서도 새로운 답변을 할 수 있게 되어 있어 어린이의 흥미를 충족시키는 동시에 다양한 언어학습에 의한 교육적인 기능이 부가되도록 하는데 목적이 있다.

또한 본 발명에 의해 구현된 완구내에 촉각감지센서, 초음파센서, 적외선센서를 내장하여 사용자가 만지는 촉각을 감지하고, 사용자와의 일정거리를 감지하고, 빛과 어둠을 감지하여 그에 상응하는 소정의 음성표현 및 동작표현을 함으로써 어린이들의 감각을 그대로 반영하여 살아있는 생물과 대화하는 것과 같은 효과를 느끼게 해 어린이의 정서함양에 도움을 주는데 목적이 있다.

상기의 목적을 달성하기 위하여 본 발명은 사용자에 제한없이 다양한 음성신호를 인식하기 위해 IDMLP신경회로망 알고리즘을 이용하여 음성인식 훈련과정을 거쳐 추출된 학습데이터와 상기 학습데이터에 대응하는 음성출력 및 동작출력용 시나리오를 완구내에 내장되어 있는 소정의 저장매체에 저장하여 사용자가 입력하는 음성신호와 소정의 센서가 공급하는 신호를 제어부가 감지하고, 상기 제어부의 제어신호에 의해 소정의 저장매체에 저장된 음성 시나리오의 다양한 음성표현 중에서 임의로 하나를 선택한 후 상기 선택된 음성표현 및 소정의 동작표현을 해당 출력장치를 통해 출력하도록 하여 사용자와 다양한 대화가 가능하도록 하는 대화형 음성 및 다감각인식 완구를 구현하고자 하는 것이다.

도1은 본 발명의 일실시례에 의해 구성된 구성 블록도

도2는 본 발명에 따른 음성인식 훈련과정을 도시한 흐름도

도3은 본 발명에 따른 음성인식과정을 도시한 흐름도

도4는 본 발명에 따른 메모리부상에 저장된 학습데이터의 테이블을 도시한 예시도

도5는 본 발명에 따른 메모리부상에 저장된 음성 시나리오의 테이블을 도시한 예시도

*도면의 주요부분에 대한 부호설명*

1. PC 10. 제어부

11. 음성 및 작동합성부 12. PC 인터페이스부

13. 전원부 20. 메모리부

21. 제1메모리부 22. 제2메모리부

23. 제3메모리부 30. 입력부

31. 마이크 32. 촉각감지센서

33. 적외선센서 34. 초음파센서

35. 필터부 36. 제1증폭부

40. 출력부 41. 제2증폭부

42. 구동수단부 43. 스피커

44. LED

이하, 본 발명의 구성을 첨부된 도면과 관련하여 상세히 설명하되, 후술되는 용어들은 본 발명에서의 기능을 고려하여 정의 내려진 용어로서 이는 당 분야에 종사하는 기술자의 의도 또는 관례 등에 따라 달라질 수 있으므로, 그 정의는 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다.

본 발명은 IDMLP(Input Driven Multi Layer Perceptron)신경회로망을 이용한 음성인식기법으로 사용자에 대한 제한이 없는 화자 독립형 음성인식이 가능하도록 하여 상황에 맞는 시나리오에 의해 적절한 음성 및 동작표현이 가능하도록 하고, 촉각감지센서, 거리감지센서 및 빛감지센서를 장착하여 사용자의 다양한 행위를 감지하여 적절하게 반응하도록 한다.

마이크로프로세서(10)를 이용하여 마이크(31)를 통해 입력되는 다양한 음성신호를 IDMLP알고리즘 기반의 음성인식기술로 인식한 후, 학습과정을 거쳐 제1메모리부(21)에 저장되어 있는 해당 학습 데이터를 인식하여 음성 및 작동합성부(11)에 제어신호를 전송하고, 상기 음성 및 작동합성부(11)에서 제2메모리부(22)에 저장되어 있는 음성출력용 시나리오 중에서 해당 시나리오를 선택한 후 다양한 음성표현데이터 중에서 무작위로 하나를 선택한 후 하나의 음성표현데이터를 추출하여 스피커(43)를 통해 출력하도록 소프트웨어와 하드웨어적으로 구현함으로써 사용자와 대화가 이루어지도록 하고, 상기의 과정을 반복하여 사용자가 같은 질문을 하여도 본발명에 의해 구현된 인형 및 장난감과 같은 완구류는 항상 다른 음성을 출력함으로써 어린이의 흥미를 � �발하고, 동시에 교육적인 기능이 부가되도록 구성한다.

또한 상기 마이크로프로세서(10)에 촉각감지센서(32), 빛감지센서(33), 거리감지센서(34)를 연결하여 사용자가 만지거나 다가오는 등의 일정한 행위 및 빛과 어둠을 감지한 신호를 ADC(Analog to Digital Converter)를 통하여 상기 마이크로프로세서(10)가 인식하여 음성 및 작동합성부(11)에 제어신호를 전송하고, 상기 음성 및 작동합성부(11)에서 제2메모리부(22)에 저장되어 있는 해당 동작표현 데이터를 추출하여 구동수단부(42)를 통해 일정한 동작을 표현하도록 소프트웨어와 하드웨어적으로 구현함으로써 사용자의 다양한 행위에 대해 상황에 맞는 적절한 반응을 할 수 있도록 하여 어린이의 흥미 유발과 교육적인 기능을 겸하도록 한다.

본 발명에 의한 인형 및 장난감과 같은 완구류가 사용자의 다양한 음성과 행위에 따라 상황에 맞는 적절한 반응을 하기 위해서는 완구가 시나리오 상황에서 들을 수 있는 예측가능한 음성에 대해 사전에 특징을 기억하여 인식할 수 있도록 훈련과정을 거쳐야 하는데, 상기의 훈련과정은 일반 PC(1)를 이용하여 일정한 상황과 동일한 질문에 대해 약 30명 정도의 어린이 음성을 녹음을 하도록 한 후 신호차이축적법 및 구간검출을 통한 정규화과정인 전처리과정을 거치고, IDMLP신경회로망 알고리즘에 의해 각 음성을 음소별로 분류하여 음소에 대한 일정한 가중치를 부여하고, 그에 대한 데이터를 추출하는 훈련과정을 반복하여 소정의 결과값이 추출되면 본 발명의 PC 인터페이스부(12)를 통하여 메모리부(20)에 저장하도록 함으로써 다양한 어린이의 음성신� �가 마이크(31)를 통하여 입력되면 마이크로프로세서(10)가 해당 데이터를 검색하여 인식할 수 있도록 한다.

상기의 훈련과정을 거쳐 학습과정이 완료된 완구의 인식과정을 보면, 사용자의 음성이 마이크(31)를 통하여 마이크로프로세서(10)에 전송되면 상기 마이크로프로세서(10)에서 음성신호를 입력받아 신호처리축적법 및 구간검출을 통한 정규화과정인 전처리과정을 거친 후, 입력된 음성을 IDMLP신경회로망 알고리즘에 의해 해당 학습데이터를 메모리부(20)를 통해 추출하고, 상기 제어부(10)는 인식된 학습데이터에 해당하는 음성 및 동작 시나리오를 선택하기 위해 음성 및 작동합성부(11)에 제어신호를 전송하여 해당 시나리오를 선택한 후 다양한 음성표현 및 동작표현 중에서 임의의 음성표현을 선택하여 스피커(43)를 통해 출력하고, 일정한 동작표현을 실시하도록 구동수단부(42)를 통해 출력한다.

또한 사용자의 촉각이나 사용자의 거리, 빛의 양을 각종 센서에서 감지하여 해당 신호를 마이크로프로세서(10)로 전송하고, 상기 마이크로프로세서(10)에서는 ON/OFF여부를 인식하여 음성 및 작동합성부(11)를 통해 해당 음성표현 및 동작표현을 스피커(43)와 구동수단부(42)를 통해 출력한다.

이와 같이 사용자의 다양한 음성 및 행위에 대해 상황에 맞는 적절한 음성표현 및 동작표현을 할 수 있도록 소프트웨어 및 하드웨어적으로 완구를 구현하여 취학전 어린 아동을 대상으로 흥미를 충족하는 동시에 다양한 언어학습능력을 배양할 수 있는 교육적인 요소를 가미하도록 구성한다.

이하, 참조된 도면을 참조하여 본 발명의 일실시례에 의해 구성된 완구에 있어서 대화형 음성 및 다감각인식 시스템 및 이의 방법에 대해 상세히 설명한다.

도1은 본 발명의 일실시례에 의해 구성된 구성 블록도이고, 도2는 본 발명에 따른 음성인식 훈련과정을 도시한 흐름도이고, 도3은 본 발명에 따른 음성인식과정을 도시한 흐름도이고, 도4는 본 발명에 따른 메모리부상에 저장된 학습데이터의 테이블을 도시한 예시도이고, 도5는 본 발명에 따른 메모리부상에 저장된 음성 시나리오의 테이블을 도시한 예시도이다.

도1은 본 발명의 일실시례에 의해 구성된 구성 블록도이다.

도시된 바와 같이 본 발명은 입력부(30), 제어부(10), 메모리부(20), 음성 및 작동합성부(11), 출력부(40), 전원부(13) 및 PC 인터페이스부(12)로 구성하는데, 상기 입력부(30)는 마이크(31), 촉각감지센서(32), 초음파센서(34), 적외선센서(33), 필터부(35), 제1증폭부(36)로 이루어지고, 상기 메모리부(20)는 제1메모리부(21), 제2메모리부(22), 제3메모리부(23)로 이루어지고, 상기 출력부(40)는 제2증폭부(41), 구동수단부(42), 스피커(43), LED(Light Emitting Diode)(44)로 구성한다.

상기 제어부(10)는 원칩 마이크로프로세서인 Intel 80C196KC를 사용하여 시스템을 제어하도록 하는데, 입력부(30)를 통해 수신되는 아날로그신호를 디지털신호로 변환한 후, 학습과정을 거쳐 추출된 음성데이터와 비교할 수 있는 형태로 처리하여 사용자의 음성을 인식하도록 하고, 제1메모리부(21)에 소정의 압축형태로 저장되어 있는 음성데이터를 디코딩하여 입력된 음성데이터를 제3메모리부(23)에서 비교처리를 하여 해당 음성데이터를 검색하고, 각종 센서를 통해 입력되는 신호를 수신하여 ON/OFF여부를 인식하고, 또한 메모리부(20), 음성 및 작동합성부(11), 입력부(30), 출력부(40) 및 전원부(13)와 같은 주위의 다른 구성요소에 제어신호를 보내 상기 제어부(10)가 일괄적으로 통제하도록 한다.

상기 메모리부(20)는 제1메모리부(21), 제2메모리부(22), 제3메모리부(23)로 구성하는데, 상기 제1메모리부(21)는 32K 바이트 EPROM을 사용하여 상기 제어부(10)를 운용할 수 있도록 운용 소프트웨어를 저장하고, IDMLP신경회로망 알고리즘을 이용하여 학습과정을 거쳐 얻어진 학습데이터를 소정의 압축된 형태로 저장하여 상기 제어부(10)로 임의의 음성신호가 수신되면, 상기 제1메모리부(21)의 학습데이터와 연동하여 해당 음성데이터를 추출하도록 한다.

상기 제2메모리부(22)는 256K 바이트 EPROM을 사용하여 완구가 소정의 음성표현 및 동작표현을 할 수 있도록 각 상황에 맞는 음성 시나리오 데이터를 소정의 압축형태로 저장함으로써 마이크(31)를 통해 소정의 음성신호 및 센서를 통해 ON/OFF신호가 상기 제어부(10)에 수신되면, 음성신호인 경우는 제1메모리부(21)와 연동하여 해당 음성데이터를 추출하여 제2메모리부(22)에 저장되어 있는 해당 음성시나리오 데이터 중에서 상기 제어부(10)가 무작위로 하나를 선택하여 음성 및 작동합성부(11)를 통해 출력하고, 각종 센서를 통한 ON/OFF신호인 경우는 상기 제어부(10)가 제2메모리부(22)에 저장되어 있는 소정의 음성표현 및 동작표현을 선택하여 음성 및 작동합성부(11)를 통해 출력하도록 한다.

상기 제3메모리부(23)는 32K 바이트 RAM을 사용하여 내부적인 데이터 신호처리를 담당하는 소자로, 마이크(31)를 통해 입력되는 음성신호를 인식하기 위한 사용공간으로 이용한다.

상기 음성 및 작동합성부(11)는 제어부(10)로부터 제어신호를 수신하여 제2메모리부(22)에 저장되어 있는 음성표현 및 동작표현 시나리오를 선택한 후 해당 시나리오 중에서 상기 제어부(10)가 선택하는 임의의 음성표현 및 동작표현을 추출하여 스피커(43) 및 구동수단부(42)로 전송하여 소정의 음성 및 동작을 출력하도록 한다.

상기 입력부(30)는 마이크(31)와 촉각감지센서(32), 적외선센서(33), 초음파센서(34), 필터부(35), 제1증폭부(36)로 이루어지는데, 상기 마이크(31)는 사용자의 음성을 수신한 후 음향에너지인 음압을 전기에너지로 변환하여 아날로그 음성신호를 상기 제어부(10)로 공급하고, 상기 촉각감지센서(32)는 사용자가 완구를 만지는 경우 촉감을 감지하여 ON/OFF신호를 상기 제어부(10)로 공급하고, 상기 초음파센서(34)는 사용자의 일정거리를 감지하여 ON/OFF신호를 상기 제어부(10)로 공급하고, 상기 적외선센서(33)는 주위가 어두위지거나 밝아지는 경우 빛과 어둠을 인식하여 ON/OFF신호를 상기 제어부(10)로 공급하고, 상기 필터부(35)는 저역통과필터(LPF; Low Pass Filter)를 사용하여 마이크(31) 및 각종 센서를 통해 입력되는 신호의 저역부분만을 통과시킴으로써 상기 제어부(10)� � 인식하기 용이하도록 음성신호와 섞인 잡음신호를 걸러주고, 사용자의 접촉이나 주변 소음으로 인한 일정한 잡음을 제거하도록 하고, 상기 제1증폭부(36)는 연산 증폭기(OP AMP;Operating Amplifier)를 사용하여 상기 필터부(35)가 공급하는 약한 아날로그 신호를 상기 제어부(10)가 인식하여 운용할 수 있도록 소정의 크기로 신호를 증폭하여 준다.

상기 출력부(40)는 제2증폭부(41), 구동수단부(42), 스피커(43), LED(Light Emitting Diode)(44)로 이루어지는데, 상기 제2증폭부(41)는 입력부(30)의 제1증폭부(36)와 동일하게 연산 증폭기(OP AMP;Operating Amplifier)를 사용하여 상기 음성 및 작동합성부(11)를 통해 공급되는 약한 아날로그 음성신호 및 동작신호를 구동수단부(42), 스피커(43) 및 LED(44)가 작동할 수 있도록 소정의 크기로 신호를 증폭하고, 상기 스피커(43)는 제어부(10)에서 음성인식과정을 거쳐 공급되는 음성표현 데이터를 가진 전기적인 신호를 음의 진동으로 변환하여 사용자가 인식할 수 있는 음성으로 출력하고, 상기 LED(44)는 발광 다이오드를 사용하여 상기 제어부(10)의 제어신호에 의해 일정간격으로 빛을 발광하고, 상기 구동수단부(42)는 다양한 구동장치로 이루어져 상기 제어부(10)의 제어신호를 수신하� �� 해당 장치들이 제어신호에 따른 소정의 동작을 출력하도록 한다.

상기 PC 인터페이스부(12)는 학습과정을 수행하여 소정의 학습데이터를 도출한 일반 PC에 접근하여 해당 데이터를 공급받음에 있어서 상기 제어부(10)에서 전송되는 신호들과 버스충돌을 방지하여 용이하게 접근할 수 있도록 하는 장치로 입·출력용 포트를 가진다.

상기 전원부(13)는 전압변동이 있는 임의의 전압을 본 발명에 의해 구현된 완구가 작동할 수 있는 소정의 전압으로 유지하여 각 회로와 소자에 일정한 양의 전원을 공급할 수 있도록 하는데, 본 발명의 특성상 소정의 건전지를 사용하여 이동에 용이하도록 구성하는 것이 무난하다.

도2는 본 발명에 따른 음성인식 훈련과정을 도시한 흐름도이다.

본 발명에 의해 구현된 완구가 다양한 사용자의 음성을 인식하기 위해서는 소정의 훈련과정을 거쳐 추출되는 음소마다 각 가중치를 부여하여 소정의 학습데이터를 생성해야 하는데, 이러한 일련의 학습과정은 일반 PC(1)를 사용하여 작업하도록 한다.

화자독립형 음성인식이 가능하기 위하여 통상적으로 현지 어린이 30명 정도의 음성을 표본 추출하여(100) 소정의 입력장치를 통해 녹음한 후, 각 음성신호에 대해 신호차이 축적법 및 구간검출을 통한 정규화작업인 전처리 과정을 거치도록 한 후(110) IDMLP신경회로망 알고리즘을 이용하여 음성의 각 음소를 분류하고, 각 음소의 특징점을 추출한 후(120) 가중치를 부여하여(130) 소정의 저장매체에 저장하고(140), 이러한 일련의 음성인식 훈련과정을 반복적으로 실시하여(150) 다양한 사용자의 음성을 인식할 수 있도록 공통된 결과값을 추출한다.

상기의 과정으로 일반 PC(1)를 통해 소정의 음성인식을 위한 결과값이 추출되면 본 발명에 의한 시스템의 PC 인터페이스부(12)를 통해 해당 데이터를 제1메모리부(21)에 저장하여 음성인식이 가능하도록 한다.

도3은 본 발명에 따른 음성인식과정을 도시한 흐름도이다.

도2에 도시된 바와 같은 음성인식을 위한 훈련과정을 거쳐 제1메모리부(21)에 학습 데이터를 저장한 후, 본 발명에 의해 구현된 완구류의 입력부(30)인 마이크(31)를 통해 사용자의 일정한 음성이 입력되면(200) 필터부(35)에서 소정의 잡음신호를 걸러주고(210), 제1증폭부(36)에서 상기 필터부(35)에서 잡음신호가 제거된 음성신호를 제어부(10)에서 처리하기 용이하도록 소정의 크기로 증폭한 후(220) 제어부(10)로 상기 음성신호를 전송한다.

상기 제어부(10)에서는 제1증폭부(36)를 거쳐 수신된 아날로그 음성신호를 디지털 음성신호로 변환한 후 상기 음성신호를 인식하기 위해 전처리과정인 신호차이축적법 및 구간 검출을 통한 정규화작업을 하고(230), 상기 전처리과정을 거친 음성신호를 IDMLP신경회로망 알고리즘에 의해 제1메모리부(21)에 저장되어 있는 학습데이터와 비교 검색하는 처리과정을 거쳐(240) 해당 학습데이터를 추출하고(250), 상기 학습데이터에 해당하는 음성 및 동작시나리오를 음성 및 작동합성부(11)를 통해 제2메모리부(22)에 소정의 압축형태로 저장되어 있는 해당 시나리오 데이터를 불러들이고, 상기 시나리오 데이터 중에서 제어부(10)가 임의로 하나의 음성표현 데이터를 선택하고(260), 그에 해당하는 동작표현 데이터를 선택한 후 출력부(40)의 해당 장치에 제어신호를 출� �하여 각 장치들이 제어신호에 따른 음성표현 및 동작표현을 하도록 한다(270).

예를들면, 사용자가 본 발명에 의해 구현된 완구류에 '네 이름이 뭐니'라는 음성표현을 하는 경우 제어부(10)가 상기 음성표현을 인식하여 도3에 도시한 바와 같은 과정을 통해 음성인식을 하게 되는데, 상기 제어부(10)는 도4에 도시된 바와 같이 제1메모리부(21)에 저장되어 있는 학습데이터를 비교 검색한 후 '네 이름이 뭐니'라는 학습데이터를 추출하고, 음성 및 작동합성부(11)를 통해 제2메모리부(22)에 저장되어 있는 도5에 도시된 바와 같은 음성시나리오 테이블 중 해당 음성 시나리오를 추출한 후 '내 이름은 사오정이야', '너부터 말해줘'‥‥‥ '알아서 뭐하게'라는 다양한 음성표현 중에서 제어부(10)가 무작위로 하나의 음성표현을 선택한 후, 그에 대한 동작표현을 지정하여 출력부(40)의 해당 장치에 제어신호를 공급하여 소정의 음성표현 및 동작표 현을 하도록 한다.

이상과 같이 IDMLP신경회로망 알고리즘을 이용하여 음성인식 훈련과정을 거친 본 발명에 의해 구현된 완구류는 사용자의 다양한 음성표현을 인식하여 동일한 질문에 대해서도 상이한 음성표현이 가능하도록 소프트웨어 및 하드웨어적으로 구현하여 어린이의 흥미 충족 및 다양한 음성표현으로 인한 언어학습을 할 수 있어 교육적인 기능이 가미된 유용한 완구이다.

이상에서 설명한 본 발명은, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 있어 본 발명의 기술적 사상을 벗어나지 않는 범위내에서 여러 가지 치환, 변형 및 변경이 가능하므로 전술한 실시례 및 첨부된 도면에 한정되는 것이 아니다.

사용자의 음성을 IDMLP신경회로망 알고리즘을 이용하여 인식하고, 인식된 음성에 상응하는 음성 시나리오의 다양한 음성표현 중에서 하나의 음성표현을 임의로 선택하여 소정의 출력장치를 통해 출력하고, 각종 센서를 통해 사용자가 만지는 촉각을 감지하고, 일정거리 접근하는 것을 감지하고, 빛과 어둠을 감지하여 그에 상응하는 음성표현 및 동작표현을 함으로써 사용자의 동일한 질문에 대해 늘 다양하고 새로운 음성표현으로 인해 어린이의 호기심과 흥미를 충족시킬 수 있고, 어린의의 감각을 그대로 반영한 다양한 음성표현 및 동작표현으로 인해 어린이의 정서함양과 언어학습을 향상시킬 수 있는 이점이 있다.

标题	发布/更新时间	阅读量
基于虚拟现实技术带有互动感知性的智慧课堂系统	2020-05-12	1025
一种VR场景下人机协同抓取物体的方法	2020-05-12	308
基于二次型规划和神经网络的自动驾驶换道轨迹规划方法	2020-05-14	341
一种基于多药房协同技术的医疗服务资源优化系统	2020-05-18	704
将用户接口装置导入虚拟现实/增强现实的系统	2020-05-18	504
基于人工智能的威胁情景感知信息安全主动防御系统	2020-05-19	845
一种电子设备基于人机动作交互的安全控制方法及装置	2020-05-17	450
一种利用车载划船机实现模拟划船情景的方法	2020-05-13	208
一种基于声纹和情境感知的音乐推荐方法和终端设备	2020-05-18	843
群智感知中基于感知误差的感知任务信息分配系统及方法	2020-05-08	107

완구에 있어서 대화형 음성 및 다감각인식 시스템 및 이의방법

완구에 있어서 대화형 음성 및 다감각인식 시스템 및 이의 방법{The system and method of a dialogue form voice and multi-sense recognition for a toy}

该功能需要专业版企业版VIP权限，您可以：