专利汇可以提供在方言语音合成系统中进行文本方言化处理的方法专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种在方言语音合成系统中对输入文本进行文本方言化处理的方法,包括文本方言化处理思想,将文本方言化处理内嵌入方言语音合成系统的方法,是建立普通话与目标方言之间的同意翻译的方言化规则,根据该规则,将输入方言语音合成系统的普通话文本转 化成 方言文本,将方言文本送入语音合成模 块 ,来提高合成方言语音的可懂度和自然度。引入文本方言化技术处理手段将海量的普通话文本转换为方言文本后运用于合成系统录音语料库的语料收集。,下面是在方言语音合成系统中进行文本方言化处理的方法专利的具体信息内容。
1、一种在方言语音合成系统中进行文本方言化处理的方法,其特征在于:建立普通话 与目标方言之间的同意翻译的方言化规则,根据该规则,将输入方言语音合成系统 的普通话文本转化成方言文本,将方言文本送入语音合成模块,来提高合成方言语 音的可懂度和自然度。
2、根据权利要求1所述的方法,其特征在于所述的规则是:在符合方言习惯的前提下, 建立下列条件与措施之间对应关系,即以某些词语的上下文的词语含义、词性以及 该词语所包含的字等信息作为条件,来规定普通话中的某些词语在何种条件下应该 进行方言用语替换,以及是否需要调换方言用语在句中的顺序作为措施。
3、根据权利要求1所述的方法,其特征在于包括以下步骤:
(1)、方言化规则的建立:
a、首先建立方言化手工标注句库:收集较大规模(如5000个句子)尽量覆盖不同的词 语和语法结构的普通话文本语料,然后安排熟悉目标方言的人员对这些句子进行手工标注工 作,标注出每个普通话句子对应的方言化句子,建成方言化标注句库;
b、对普通话文本语料中的每个普通话句子进行自动分词和词性自动标注处理,自动分 词采用前后向最大分词建立分词网格并应用词语的出现概率作为消歧准则,即选取词语出现 概率连乘积最大的路径为最终的分词路径;词性自动标注则是采用词性三元连接概率模型;
c、对照标注的普通话句子与其对应的方言化句子,总结方言化规律,并按照规则体系 要求书写出相应的规则:即以某些词语的上下文的词语含义、词性以及该词语所包含的字等 信息作为条件,来规定普通话文本中的某些词语在何种条件下应该进行方言用语替换,以及 是否需要调换方言用语在句中的顺序作为措施;在处理句子时,通过计算机程序或人工在普 通话文本语料中从上到下逐句匹配所述条件,并按照第一条匹配成功的所述措施进行方言化 处理;因此规则的排列顺序也是影响方言化结果的,因此也是需要调整的;
d、反复测试和调整所述的条件与措施,使得对每个普通话文本运用所述的条件与措施 进行方言化处理后,得到的句子都能与手工标注方言句子相匹配;
(2)、将输入方言语音合成系统的普通话文本,首先对每一句子进行步骤(1)的b中 的方法进行分词和词性标注处理,然后对每一个词遍历所有的方言化规则,并按第一条成功 匹配的规则的措施进行方言化处理,所有的词处理完毕,就普通话文本转化成了方言文本, 将这些信息送入语音合成模块,即可合成更符合方言习惯的语音。
本发明涉及方言语音合成领域,具体是一种将普通话输入的待合成文本经过方言化处 理,使得最终合成的方言语音更符合方言习惯的一种方法。
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
一种基于深度学习的校园心理辅导的方法及装置 | 2020-05-13 | 942 |
互联网政治外交类新闻事件抽取方法 | 2020-05-13 | 81 |
一种电商产品竞争分析方法及系统 | 2020-05-14 | 221 |
一种电力营销知识体系平台及应用方法 | 2020-05-14 | 979 |
一种智能文本处理方法、装置、电子设备及存储介质 | 2020-05-11 | 5 |
一种用于智能质检服务禁语的识别方法及系统 | 2020-05-08 | 805 |
一种基于句法模式和机器学习的开放式关系的抽取方法 | 2020-05-11 | 921 |
非命名实体对象抽取方法、装置、电子设备及存储介质 | 2020-05-13 | 627 |
用于增强已标注样本的方法和设备 | 2020-05-11 | 934 |
一种基于事理推荐的逻辑图谱构建及预警方法和装置 | 2020-05-13 | 332 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。