채팅 에이전트를 위한 대화 관리 장치 및 그 방법专利检索-聊天机器人对话代理人工智能专利检索查询-专利查询网

채팅 에이전트를 위한 대화 관리 장치 및 그 방법

阅读：210发布：2020-11-07

专利汇可以提供채팅 에이전트를 위한 대화 관리 장치 및 그 방법专利检索，专利查询，专利分析的服务。并且A device and a method for managing dialog of a chatting agent are provided to improve performance of a chatting robot continuously by providing an answer to the chatting robot based on dialog stacks in consideration of dialog context. A dialog analyzer(120) analyzes a speech sound(110) received from a user. A domain determiner(130) determines and verifies domains to determine the domain of the speech sound based on a speech sound analysis result. A dialog expert(140) provides a system speech sound(170) in response to the user speech sound by searching a dialog example database constructed from a dialog corpus. The domain determiner includes a language/semantic quality extractor(121,122) and a keyword extractor(123), and determines the domain by integrating and applying extracted qualities to a quality based probability model. The dialog expert includes a dialog stack(150) storing dialog example session information of the previous user speech sound and dialog/main flow analysis result, and a dialog example selector(160) indexing information such as semantic information of the previous user speech sound and scenario session information added from a scenario based dialog corpus.，下面是채팅 에이전트를 위한 대화 관리 장치 및 그 방법专利的具体信息内容。

权利要求

담화 스택을 이용하여 대화 문맥을 반영할 수 있는 채팅 에이전트의 대화 관리 방법에 있어서,

(a) 입력된 사용자 발화를 분석하고, 분석된 결과를 바탕으로 사용자 발화의 도메인을 결정하는 도메인 결정 및 검증 단계; 및

(b) 대화 코퍼스로부터 구축된 대화 예제 데이터베이스(DB)를 검색하여 사용자 발화에 대한 답변으로 시스템 발화를 제공하는 단계를 포함하는 채팅 에이전트를 위한 대화 관리 방법.

제1항에 있어서, 상기 (a) 단계는 다양한 자질을 결합한 확률 기반의 도메인 결정 단계로서,

(a1) 사용자 발화의 도메인을 판별하기 위해 자연언어처리를 이용한 언어 자질과 언어 이해를 통한 의미 자질을 이용하는 단계;

(a2) 키워드 모델을 이용한 키워드 자질을 추출하는 단계; 및

(a3) 상기 추출된 자질들을 통합하여 자질 기반의 확률 모델에 적용하여 도메인을 결정하는 단계를 포함하는 채팅 에이전트를 위한 대화 관리 방법.

제2항에 있어서, 상기 (a) 단계는 의미적 자질 기반의 도메인 지속성 검증 단계로서, 사용자의 화행 또는 의도 정보 등을 이용하여 직전 사용자 발화의 의미 적 자질과 현재 발화의 의미적 자질의 조건부 확률값을 이용하여 같은 도메인에서 대화가 지속되는지 검증하는 단계를 포함하는 채팅 에이전트를 위한 대화 관리 방법.

제1항에 있어서, 상기 (b) 단계에 적용되는 대화 예제 데이터베이스(DB)를 구축하는 단계를 더 포함하며, 대화 예제 데이터베이스(DB) 구축 단계는 의미 기반의 대화 예제 DB 구축하는데 사용자 발화의 의미 정보를 바탕으로 색인을 하는 것으로서,

(c1) 의미 정보로 화행, 주행 및 도메인 정보를 사용하고 대화 문맥을 반영하기 위하여 이전 의미정보를 색인키로 하여 대화 예제 DB를 인덱싱하는 단계; 및

(c2) 수집된 시나리오 기반 채팅 대화 코퍼스를 대화 예제 DB를 구축하기 위한 일련의 과정들로 자동으로 사용자발화추출, 시나리오 및 발화 세션 추출, 이전 의미정보 추출, 현재 화행 및 주행, 도메인 추출 및 시스템 발화 추출하는 단계를 포함하는 채팅 에이전트를 위한 대화 관리 방법.

제1항에 있어서, 상기 (b) 단계는 담화스택을 이용하여 대화 문맥을 반영하는 단계로서,

(d1) 사용자 발화의 이전 정보를 대표하기 위해 이전 사용자 발화의 대화 예제 세션 정보와 화행 분석 결과 및 주행 분석 결과를 기록한 담화스택을 이용하는 단계; 및

(d2) 대화 예제 DB를 구축하는데 대화 문맥을 고려하기 위해서 시나리오 기반의 대화 코퍼스로부터 이전 사용자 발화의 의미 정보 및 시나리오 세션 정보 등의 정보를 추가하여 색인하는 단계를 포함하는 채팅 에이전트를 위한 대화 관리 방법.

담화 스택을 이용하여 대화 문맥을 반영할 수 있는 채팅 에이전트의 대화 관리 장치에 있어서,

입력된 사용자 발화를 분석하는 대화분석부;

상기 대화 분석된 결과를 바탕으로 사용자 발화의 도메인을 결정하기 위하여 도메인 결정 및 검증을 수행하는 도메인 결정부; 및

대화 코퍼스로부터 구축된 대화 예제 데이터베이스(DB)를 검색하여 사용자 발화에 대한 답변으로 시스템 발화를 제공하는 대화전문가를 포함하는 채팅 에이전트를 위한 대화 관리 장치.

제6항에 있어서, 상기 도메인 결정부는 사용자 발화의 도메인을 판별하기 위해 각각 자연언어처리를 이용한 언어 자질과 언어 이해를 통한 의미 자질을 추출하는 언어자질추출부 및 의미자질 추출부; 및

키워드 모델을 이용한 키워드 자질을 추출하는 키워드 추출부를 포함하고 상기 추출된 자질들을 통합하여 자질 기반의 확률 모델에 적용하여 도메인을 결정하는 것을 특징으로 하는 채팅 에이전트를 위한 대화 관리 장치.

제7항에 있어서, 상기 도메인 결정부는 의미적 자질 기반의 도메인 지속성 검증 단계로서, 사용자의 화행 또는 의도 정보 등을 이용하여 직전 사용자 발화의 의미적 자질과 현재 발화의 의미적 자질의 조건부 확률값을 이용하여 같은 도메인에서 대화가 지속되는지 검증하는 것을 특징으로 하는 채팅 에이전트를 위한 대화 관리 장치.

제6항에 있어서, 상기 대화 예제 데이터베이스(DB)는 의미 정보로 화행, 주행 및 도메인 정보를 사용하고 대화 문맥을 반영하기 위하여 이전 의미정보를 색인키로 하여 대화 예제 DB를 인덱싱하고; 수집된 시나리오 기반 채팅 대화 코퍼스를 대화 예제 DB를 구축하기 위한 일련의 과정들로 자동으로 사용자발화추출, 시나리오 및 발화 세션 추출, 이전 의미정보 추출, 현재 화행 및 주행, 도메인 추출 및 시스템 발화 추출하여 구축되는 것을 특징으로 하는 채팅 에이전트를 위한 대화 관리 장치.

제6항에 있어서, 상기 대화전문가는 담화스택을 이용하여 대화 문맥을 반영하기 위하여,

사용자 발화의 이전 정보를 대표하기 위해 이전 사용자 발화의 대화 예제 세션 정보와 화행 분석 결과 및 주행 분석 결과를 기록한 담화스택; 및

대화 예제 DB를 구축하는데 대화 문맥을 고려하기 위해서 시나리오 기반의 대화 코퍼스로부터 이전 사용자 발화의 의미 정보 및 시나리오 세션 정보 등의 정보를 추가하여 색인하는 대화예제 선택부를 포함하는 것을 특징으로 하는 채팅 에이전트를 위한 대화 관리 장치.

说明书全文

채팅 에이전트를 위한 대화 관리 장치 및 그 방법{Dialog management apparatus and method for chatting agent}

도 1은 본 발명에 따른 대화 문맥을 반영하는 채팅 에이전트를 위한 대화 관리 장치의 전반적인 구조를 나타낸 블록도이다.

도 2는 본 발명에 따른 도메인 결정 및 검증을 위한 순서도이다.

도 3은 본 발명에 따른 대화 예제 DB를 구축하는 과정을 나타낸 흐름도이다.

도 4는 본 발명에 따른 대화 예제 DB의 레코드 예를 나타낸 도면이다.

<도면의 주요 부분에 대한 부호의 설명>

110...사용자 발화 121...언어자질 추출부

122...의미자질 추출부 123...키워드자질 추출부

130...도메인 결정부 140...대화전문가

150...담화기록 스택 160...대화예제 선택부

170...시스템 발화

본 발명은 지능형 채팅 에이전트에서 사용되는 사람과 채팅 로봇 간의 대화 관리 장치 및 방법에 관한 것으로서, 담화스택을 이용, 대화 문맥을 고려하여 채팅로봇의 답변을 제공하는 대화 관리 장치 및 방법에 관한 것이다.

채팅은 컴퓨터나 휴대용 단말기 등을 이용하여 네트워크를 통해 상대방과 대화를 할 수 있도록 구성된 것으로 예전부터 널리 이용되고 있었다. 그러나, 사람과 사람 사이의 채팅에서는 상대방이 없는 경우에 채팅을 할 수 없는 단점을 지니고 있고 이를 극복하기 위해서 채팅 로봇이 탄생하게 되었다. 이것은 현재 많은 분야에서 요구하는 지능형 에이전트에서 사람 대 컴퓨터(로봇)간의 자연어를 이용한 의사소통 수단으로 필요성이 증대되고 있다. 그러나 대부분의 채팅로봇이 입력된 문장과 정확하게 패턴 매칭이 되는 경우에만 해당 답변을 할 수 있다는 단점이 있기때문에 많은 양의 대화 예제가 필요하여 대화 예제 데이터베이스(DB)를 구축하는데 비용이 많이 든다. 또한 기존의 채팅 로봇들은 대화 문맥을 고려하지 못하여 과거의 정보에 상관없이 1문1답의 채팅이 진행이 되는 문제점이 있다. 그러므로 기존의 채팅로봇은 사람과 사람 사이의 대화 방식과 괴리가 있어 채팅로봇의 대화 모델의 향상이 필요하다.

따라서 본 발명자는 상술한 종래 기술의 문제점을 극복하기 위하여 본 발명에서는 지능적인 채팅로봇을 위한 대화 예제 DB 구축 방법과 대화 문맥을 고려하여 과거의 정보에 따라 채팅로봇의 답변이 달라지는 대화 관리 장치 및 방법을 제시한다.

상기의 목적을 달성하기 위하여 담화 스택을 이용하여 대화 문맥을 반영할 수 있는 채팅 에이전트의 대화 관리 방법에 있어서, (a) 입력된 사용자 발화를 분석하고, 분석된 결과를 바탕으로 사용자 발화의 도메인을 결정하는 도메인 결정 및 검증 단계; 및 (b) 대화 코퍼스로부터 구축된 대화 예제 데이터베이스(DB)를 검색하여 사용자 발화에 대한 답변으로 시스템 발화를 제공하는 단계를 포함하는 채팅 에이전트를 위한 대화 관리 방법을 제공하고자 한다.

본 발명의 다른 국면에 의하면, 담화 스택을 이용하여 대화 문맥을 반영할 수 있는 채팅 에이전트의 대화 관리 장치에 있어서, 입력된 사용자 발화를 분석하는 대화분석부; 상기 대화 분석된 결과를 바탕으로 사용자 발화의 도메인을 결정하기 위하여 도메인 결정 및 검증을 수행하는 도메인 결정부; 및 대화 코퍼스로부터 구축된 대화 예제 데이터베이스(DB)를 검색하여 사용자 발화에 대한 답변으로 시스템 발화를 제공하는 대화전문가를 포함하는 채팅 에이전트를 위한 대화 관리 장치를 제공한다.

이어서, 첨부된 도면을 참조하여 본 발명에 대하여 설명을 한다.

도 1은 본 발명에 따른 채팅로봇을 위한 대화 관리 시스템의 전반적인 구조도이다. 도 1에서 사용자 발화(110)는 키보드 입력이나 음성 입력 등으로 사용자 입력 문장을 받아들이게 된다. 사용자 발화(110)가 들어오면 대화분석부(120)에서는 언어자질추출부(121), 의미자질추출부(122), 그리고 키워드자질추출부(123)를 통해서 도메인(주제) 및 대화예제를 결정하기 위한 자질을 추출하는 대화 분석을 수행한다. 상기와 같은 대화 분석을 거친 후, 도메인결정부(130)에서는 사용자 발 화의 도메인(주제)을 결정하고 검증하는 도메인 결정 및 검증 단계를 수행한다. 그후 도메인 결정부(130)는 결정된 도메인에 따라 대화전문가(140)를 호출한다.

대화전문가(140)는 도메인별로 나누어져 있으며, 각 대화전문가(140)는 고유한 담화기록스택(150)을 가지고 있다. 담화기록스택(150)에는 이전 사용자 발화들에 대한 분석 결과와 채팅로봇의 답변 등의 정보를 가지고 있다. 대화예제선택부(160)에서는 현재 대화 상황과 가장 유사한 대화 예제를 대화 예제 데이터베이스(DB)로부터 검색한다. 여기서, 대화 상황은 대화 예제를 검색하기 위한 현재 대화 상태 정보를 총괄적으로 의미한다. 즉, 도메인, 화행 및 의미 분석 결과, 담화 기록, 시나리오 세션 정보 등을 포함한다. 선택된 대화 예제 후보들 중에서 사용자 발화 유사도를 측정하여 유사도가 가장 높은 대화 예제를 최종적으로 선택하여 그 예제에 해당하는 답변을 시스템 발화(170)로 하게 된다.

본 발명에서는 사용자 발화로부터 다양한 자질을 추출하여 발화의 도메인(주제) 결정 및 대화 예제 선택을 하게 된다. 도메인을 결정하는 것은 채팅에서 대화 예제 시나리오를 도메인별로 색인을 하여 도메인별로 검색된 답변 후보 중에서 적절한 답변을 선택하고 도메인에 무관한 대화예제를 검색 후보에서 제외하기 위한 것이다. 또한, 의미자질을 추출하는 것은 기존의 채팅로봇의 대화 예제 DB들이 어휘 기반으로 구축되어져 있어서 의미상으로 동일한 사용자 발화일지라도 다른 예제를 가지고 처리를 하기 위한 것이다. 이것은 대화 예제 DB를 구축하는데 많은 양의 대화 예제를 요구하는 단점을 가지고 있다. 그러므로 본 발명에서는 의미 기반으로 대화 예제 DB를 구축하여 사용자 발화가 의미상으로 동일한 경우에 같은 예제 문장으로 처리를 할 수 있도록 한다. 이것은 의미 기반의 대화 예제 DB를 구축하여 비용을 줄이고 효율성을 높이게 된다. 또한 대화 문맥을 고려하기 위하여 대화 예제 DB를 구축할 때, 시나리오 기반의 채팅 대화 코퍼스(Corpus; 언어자료)를 이용한다. 코퍼스를 시나리오별로 세션 정보를 기록하고 대화 예제 색인을 할 때, 이전 사용자 발화의 의미 정보(화행 및 주행 분석 결과) 및 세션 정보를 현재 사용자 발화에 추가하여 색인을 하게 된다. 이렇게 함으로써 담화기록스택(150)의 정보들을 이용하여 대화 예제를 검색할 수 있게 된다.

도 2를 보면, 도 1에서 도시된 도메인결정부(130)에서 수행되는 단계를 상술하고 있다. 사용자 발화를 형태소 분석과 품사 태깅을 거쳐서(210단계) 언어적 자질을 추출한다(220단계). 여기서 언어적 자질은 상기 기술을 위한 다양한 형태가 가능하다. 일반적으로 언어적 자질은 도메인과 언어이해를 결정하는데 도움이 되는 자질로 형태소 원형이나 형태소 N-gram, 품사 태그 등을 추출한다. 그리고 분석된 언어적 자질을 바탕으로 사용자 발화의 화행 및 의미를 분석하여(230단계) 현재 사용자의 화행 및 의도, 그리고 구성 성분 요소 등의 의미적 자질을 추출한다(240단계). 그리고 키워드 모델을 통해서 사용자 발화 속에 포함된 키워드와 그 키워드의 각 도메인별 가중치를 추출한다(250단계). 여기서 키워드 자질은 TF*IDF값만을 이용한 도메인 분류 결과로 사용자 발화 중에서 가중치가 가장 높은 순서대로의 키워드 N개와 키워드들의 TF*IDF값에 의한 가장 가중치가 높은 도메인 N개를 추출하게 된다. 여기서, TF*IDF는 정보 검색에서 많이 이용하는 것으로, 각각 Term Frequency와 Inverse Document Frequency의 약자로, 이것을 이용하여 키워드를 추 출하게 된다. TF는 말 그대로 그 워드가 나오는 빈도수이고, IDF는 전체 문서 중에서 그 단어가 나오는 문서가 몇 개인가라는 것의 역수로 너무 많이 나오는 단어는 키워드가 아니라는 것이다. 즉, 조사나 어미 이런 것들은 키워드가 될 수가 없다 (이에 대한 관련된 웹페이지 http://abolapia.egloos.com/207027를 참조).

도메인을 결정하는데 현재 사용자의 발화가 직전의 도메인과 동일한 경우에는 대화의 지속성이 있다. 그러므로 도메인 스위칭 없이 이전의 대화에 연장선에 있는 것으로 생각하여 이전의 대화전문가가 계속해서 사용자 발화를 처리하면 된다. 현재 발화가 이전 발화의 지속성이 있는지를 검증하기 위해 직전과 현재의 화행 및 의도의 조건부 확률을 구하고 설정된 기준치와 비교한다(260단계). 이 확률 값이 기준치보다 높으면 도메인 결정(270단계)을 생략하고 바로 직전의 대화전문가(140)로 가고 기준치보다 낮은 경우에는 상기에서 추출된 언어적 자질(220단계)과 의미적 자질(240단계), 키워드 자질(250단계)를 결합하여 확률 모델을 이용하여 확률이 가장 높은 도메인을 결정하게 된다(270단계).

도 3은 상기에 기술한 대화 예제 DB를 구축하는 과정을 나타낸 흐름도이다. 시나리오 기반의 채팅대화코퍼스(310)로부터 사용자 발화를 추출(320단계)하고 해당하는 시나리오 및 발화 세션 정보를 추출(330단계)한다. 그리고 이전 의미 정보를 추출(340단계)한다. 이전 의미 정보는 이전 사용자 발화의 화행 및 주행 분석 결과를 묶은 것이다. 그리고 현재 화행 정보 및 주행 정보, 그리고 시나리오가 해당하는 도메인 정보를 추출(350단계)한다. 마지막으로 시스템 발화 추출(360단계)한다. 최종적으로 추출된 정보들을 이용하여 색인을 하여 시나리오 기반의 채팅 대 화예제 데이터베이스(370)를 만들게 된다.

도 4는 대화 코퍼스로부터 색인된 시나리오 기반의 채팅 대화 예제 DB의 레코드 예제들이다. 대화 예제는 도시된 정보 중에 시나리오 세션 정보, 이전 의미정보, 현재 화행정보, 현재 주행정보, 도메인 정보 등을 가지고 대화 예제를 검색하고 사용자 발화를 가지고 편집 거리(Edit Distance)를 측정하여 대화 예제를 선택하게 된다. 그리고 필요에 따라서 검색 조건을 완화하여 전체 일치로 찾을 수 없는 경우에는 부분 일치로 대화 예제를 찾게 된다. 예를 들어서 주어진 시나리오에서 대화 예제를 검색하지 못한 경우에는 시나리오 세션 정보와 이전 의미정보를 제외하고 대화 예제 DB를 검색하게 된다.

상술한 바와 같이 본 발명에 의하면, 채팅 에이전트 대화 관리 장치를 구축하는데 있어서 의미 기반의 대화 예제 DB를 구축하여 적은 양의 대화 예제를 가지고 만들 수 있으며 시나리오 기반의 대화 예제를 이용하여 대화 문맥을 반영하는 채팅로봇 대화 관리 장치를 구현할 수 있다. 이러한 방법론은 대화 코퍼스로부터 자동으로 학습된 확률 모델 및 색인된 DB를 이용하여 수행함으로써 학습이 가능하여 지속적으로 채팅로봇의 성능을 향상시킬 수 있다.

상기 채팅로봇은 실시간으로 사용자 발화를 분석하여 적절한 응답을 하여 휴대폰의 대화형 단문 메시지 서비스나 지능 로봇, 홈네트워크 등의 지능형 에이전트의 채팅로봇으로 유용하게 이용될 수 있다. 본 발명에 속하는 기술 분야의 통상의 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 타 실시예가 가능하다는 점을 이해할 것이다. 따라서 본 발명의 진정한 기술적 보호 범위는 첨부된 특허 청구 범위의 기술적 사상에 의해 정해져야 할 것이다.

标题	发布/更新时间	阅读量
机器人系统及其实现方法、客户端、服务器以及游戏系统	2020-05-17	960
控制装置、存储介质及控制方法	2020-05-11	927
信息处理装置以及计算机可读介质	2020-05-11	404
信息处理装置和存储程序的非暂时性计算机可读介质	2020-05-18	299
对话交互方法、装置及电子设备	2020-05-19	6
一种智能对话系统	2020-05-08	504
一种智慧居家养老系统方案	2020-05-14	792
意图识别方法及装置	2020-05-14	902
检索式聊天方法、装置以及计算机设备	2020-05-14	676
一种数据智能分析识别方法及系统	2020-05-13	655

채팅 에이전트를 위한 대화 관리 장치 및 그 방법

채팅 에이전트를 위한 대화 관리 장치 및 그 방법{Dialog management apparatus and method for chatting agent}

该功能需要专业版企业版VIP权限，您可以：