首页 / 专利库 / 心理学与精神病学 / 构音障碍 / 训练构音障碍的说话者的系统和方法

训练构音障碍的说话者的系统和方法

阅读:502发布:2020-05-11

专利汇可以提供训练构音障碍的说话者的系统和方法专利检索,专利查询,专利分析的服务。并且本 发明 描述了一种基于计算机的系统,其中该系统要求(101)病人发出显示在监视器上的单词的读音,自动评定(104,105)语音 质量 ,并且使用适当的装置来反馈(106)语音质量改善或恶化。,下面是训练构音障碍的说话者的系统和方法专利的具体信息内容。

1.一种用于训练构音障碍的说话者的系统(1),包括:
第一计算模(4),适于自动确定说话者的输入话语的语音质量量度,
第二计算模块(5),适于自动将语音质量量度与说话者至少一个先前 的语音质量量度相比较,以及
反馈模块(6),适于根据该比较来自动向说话者提供生物反馈。
2.如权利要求1所述的系统(1),包括:记录设备(3),适于记录 说话者的输入话语。
3.如权利要求1所述的系统(1),包括:接口模块(6),适于向说 话者提供说话指令。
4.如权利要求1所述的系统(1),其中,第一计算模块(4)包括语 音分析组件(11),适于在音位和/或单词级别上执行语音分析。
5.如权利要求1所述的系统(1),其中,第一计算模块(4)包括比 较组件(12),适于将输入话语与参考数据相比较,所述参考数据是以多 个非构音障碍的说话者的数据为基础的。
6.如权利要求1所述的系统(1),其中,第二计算模块(5)包括评 估组件(13),适于相对于说话者的先前结果执行语音质量量度的比较评 估。
7.一种训练构音障碍的说话者的方法,包括以下步骤:
自动确定(104)说话者的输入话语的语音质量量度,
自动将语音质量量度与说话者的至少一个先前语音质量量度相比较 (105),以及
根据该比较,自动向说话者提供(106)生物反馈。
8.一种在计算机(2)中执行的计算机程序,当在计算机(2)中执 行该计算机程序时,所述程序包括:
用于自动确定(104)说话者的输入话语的语音质量量度的计算机指 令,
用于自动将该语音质量量度与说话者的至少一个先前语音质量量度 相比较(105)的计算机指令,以及
用于根据所述比较来自动向说话者提供(106)生物反馈的计算机指 令。

说明书全文

发明涉及一种训练构音障碍的说话者(dysarthric speaker)的系 统和方法。此外,本发明还涉及一种用于训练构音障碍的说话者的计算机 程序。

语音障碍(speech deficit)是中之类的神经系统疾病的一个共同 症状。在美国,每年都会新发700,000起中风。虽然在这些病例中只有 20%是致命的,但是中风将会导致60%的受害者受到损伤。大约25%的病人 将会显现出语音障碍。每年,康复措施和劳动损失会使美国社会每年承 受500亿美元的代价。

目前有两大组语音障碍:失语症和构音障碍。失语症是指病人没有能 力正确叫出物体的名称。而构音障碍则是指病人没有能力清楚、正确地发 音。

语音治疗学家通常会通过让病人重复某个单词,以便在一对一的会话 中训练构音障碍的说话者。而病人则并未接收到详细的纠正。很明显,这 种治疗方式的成本非常密集,并且对治疗学家的要求很高。

为了在优化成本的同时将康复成果增至最大,较为理想的是由病人在 没有监理专业人员可用的情况下在家中继续进行康复练习。众所周知,恰 当的反馈将会增强康复成功率。为此目的,有必要自动对练习进行评定, 例如借助计算机来进行评定。

在计算机上,失语症的测试相对容易,例如,该测试可以通过显示物 体的图像以及通过以多选方式向病人询问该物体的正确名称来进行。当 前,训练软件业已得到商用,并且在康复实践中得到了使用。但是,由于 语音状况有可能会很严重,因此,在计算机上是很难测试构音障碍的。当 前,用于以无人监管的方式训练受损语音的系统只能用于失语症,而不能 用于构音障碍。

本发明的一个目的是提供一种训练构音障碍的说话者的廉价、可靠且 无人监管的技术、

这个目标根据本发明是通过一种用于训练构音障碍的说话者的系统 来实现的,该系统包括:第一计算模,适于自动确定说话者的输入话语 的语音质量量度;第二计算模块,适于自动将语音质量量度与说话者的至 少一个先前语音质量量度相比较;以及反馈模块,适于自动根据该比较来 向说话者提供生物反馈。

本发明的目标还可以通过一种训练构音障碍的说话者的方法来实现, 其中该方法包括以下步骤:自动确定说话者的输入话语的语音质量量度, 自动将语音质量量度与说话者的至少一个先前语音质量量度相比较,以及 根据该比较来自动向说话者提供生物反馈。

本发明的目标还可以通过一种在计算机中执行的计算机程序来实现, 当在计算机中执行该计算机程序时,所述程序包括:用于自动确定说话者 的输入话语的语音质量量度的计算机指令,用于自动将该语音质量量度与 说话者的至少一个先前语音质量量度相比较的计算机指令,以及用于根据 该比较来自动向说话者提供生物反馈的计算机指令。由此,根据本发明所 需要的技术效果可以基于根据本发明的计算机程序指令来实现。

这种计算机程序可以保存在CD-ROM之类的载体上,或者可以通过因 特网或另一种计算机网络得到。例如,在执行计算机程序之前,通过借助 CD-ROM播放器从载体读取或是从因特网读取计算机程序,以及通过将计 算机程序保存在计算机存储器中,可以将计算机程序加载到计算机中。特 别地,计算机包括中央处理器(CPU)、总线系统、RAM或ROM等存储器装 置、软盘硬盘单元等存储装置、以及输入/输出单元。可替换地,本发 明的方法可以在硬件中实施,例如使用一个或多个集成电路来实施。

本发明的核心思想是提供一种借助简单廉价的训练系统来自动训练 构音障碍的说话者的技术。例如,该思想可以借助标准的计算机系统、与 计算机系统耦合的麦克风以及在计算机系统上执行的专用计算机程序来 实现。

本发明的另一个核心思想是让说话者、例如正在康复的病人通过生物 反馈效果来改善其状况。生物反馈是一种使用来自个人自身身体的信号对 其进行训练,以便改善其身体状况的技术。在本例中,关于说话者的语音 能力的信息被返还给说话者。优选地,该反馈信息取决于语音质量的改善 或恶化。通过使用这个反馈信息,说话者可以逐步改善其语音能力。这种 生物反馈机制允许说话者接收,例如查看或收听关于其语音能力的信息。 为此目的,说话者的话语被“翻译”成了可以被说话者察觉的信号,例如 闪光灯灯泡,蜂鸣器等等。例如,与先前结果相对比的语音质量的改善是 以“交通灯”或特定声音的形式来说明的。说话者尝试改善其技能并且监 视其自己的成绩。根据通过生物反馈信号提供的结果,说话者将会“自动” 调整其语音。通过使用这种生物反馈机制,详细的语言校正将变得不再必 要。这样做极大降低了训练的成本和劳动。由于该训练完全是自动提供的, 因此不会发生治疗或训练错误。由此,根据本发明的训练技术是非常可靠 的。

根据本发明,说话者并不是被训练成产生只能为机器理解的语音。该 目标很容易就可以通过请求说话者始终以相同方式重复某个单词来实现。 取而代之的是,根据本发明的系统和方法旨在提高对于每一个平均听者、 用户语音的智能性。因此,在本发明的优选实施例中,语音质量量度与所 产生语音和平均正常语音生成的偏差是相互关联的。

本发明给出了用于训练构音障碍的说话者的语音质量的技术的一种 实现方式。它使用户能够在没有语音治疗学家的情况下训练发音。而反馈 将被提供给病人,并且该反馈将会指导其获得更好的语音质量。

通过本发明可以提供一种无人监管的训练。由此,本发明可以缩短乃 至消除包括与语音治疗学家进行的昂贵的会话在内的成本密集的治疗。总 而言之,本发明提供了一种在不需要监管的情况下训练构音障碍的说话者 的简单、廉价、可靠的技术。

本发明的这些和其他方面将会根据从属权利要求中定义的后续实施 例而被进一步阐述。

根据本发明的优选实施例,该系统包括适于记录说话者输入话语的记 录设备。根据本发明的方法,说话者的输入话语是在确定语音质量量度之 前记录的。该记录设备例如可以是麦克风,并且优选被连接到第一计算模 块,以便直接在说话者的话音中馈送。可替换地,说话者的话语将会从麦 克风传送到预处理设备,例如话音过滤器等等,其中所述预处理设备适于 在借助第一计算模块执行的计算步骤之前预先处理说话者的话音。优选 地,说话者的话语是在产生话语之后立即处理和评估的,换言之,该话语 并未保存在数据库或类似设备中。由此,该训练系统可以用一种非常简单 和廉价的方式来设计。

根据本发明的另一个优选实施例,该系统包括适于向说话者提供说话 指令(speaking instruction)的接口模块。根据本发明的方法,说话指令 是在记录说话者的输入话语之前提供给说话者的。为此目的,训练系统的 接口模块优选包含一个用于显示将要由说话者重复的单词的监视器装置, 例如内置显示器。换句话说,说话者读取所要重复的单词。代替内置监视 器装置,该接口模块也可以被连接到一个外部显示器。作为所述监视器装 置的替换或补充,接口模块包括用于重放将要由说话者重复的单词的语音 输出设备,例如内置扬声器。换句话说,说话者收听将要重复的一个或多 个单词。与说话者随机说出某个单词的情形相比,如果实施这种说话指令, 那么由第一计算模块执行的语音分析可以更加容易、快速,并且复杂度更 低。由此,第一计算模块可以用一种复杂度更低的方式来内置,而这将会 显著降低成本。

在将说话者的话语被输入训练系统之后,该系统将会自动评定语音质 量。为此目的,在这里将会使用语音识别技术。

根据本发明的另一个优选实施例,第一计算模块包括适于在音位和/ 或单词级别上执行语音识别和语音分析的语音分析组件。根据本发明的方 法,确定语音质量量度的步骤包括:在音位和/或单词级别上执行语音分 析。由于构音障碍的说话者在大多数情况下在产生特定声音时有缺陷,因 此,音位和/或单词级别上的语音分析是优选的。这些声音来自音位,也 就是构成音节、单词和整个句子的声音差别的最小语音单位。单词级别的 语音分析允许对相似单词中的音位质量进行比较:例如‘cheese’和 ‘freeze’都包含了‘e:’音位。此外还可以在相邻音位的上下文中分析 音位:例如,如果病人在发‘killed’音的过程中显现出问题,但同时能 够说出‘cold’、‘mold’和‘kitten’,那么明显是因为‘i’和‘l’的 次序导致发生的问题。由此,以音位为基础的语音分析允许分析哪一个特 定的声音偏离了多个非构音障碍的说话者发出的相同声音。

根据本发明的另一个实施例,第一计算模块包括适于将输入话语与参 考数据相比较的比较组件,其中该比较是根据多个非构音障碍的说话者的 数据来进行的。根据本发明的方法,确定语音质量量度的步骤包括:将输 入话语与这种参考数据相比较。优选地,该参考数据是以多个非构音障碍 的说话者的平均数据为基础的。为此目的,将会为在训练中使用的每一个 单词提供参考发音数据,例如在数据库中提供。该参考发音数据在训练之 前已经收集了,并且代表多个非构音障碍的说话者的平均单词发音。

根据语音分析以及与参考数据的比较,第一计算模块计算客观语音质 量量度。该语音质量量度优选是为每一个单个训练单词确定的。所有结果, 也就是训练单词的语音质量量度都会由第一计算模块保存在训练数据库 中。优选地,该训练结果是连同时间戳一起保存的。借助这种手段,随后 可以将每一个结果分配给特定的日期和日时。

根据本发明的另一个优选实施例,第二计算模块包括适于相对于说话 者的先前结果来执行语音质量量度的对比评估的评估组件。根据本发明的 方法,比较语音质量量度的步骤包括:相对于说话者的先前结果来执行语 音质量量度的对比评估。为此目的,使用历史训练数据,也就是相应单词 的在前语音质量量度,来执行比较。这种历史训练数据保存在可以被第二 计算模块访问的训练数据库中。优选地,第二计算模块不仅根据先前结果 还根据执行训练的日时来评估语音质量。由此,时间相关的性能波动可以 被最小化或者消除。

作为这种相对于先前结果来评估语音质量量度的结果,提供关于发音 改善或损伤的信息,其中该信息优选是为每一个单独的单词提供的。换句 话说,个人改善将被用于生物反馈。

在下文将会将会参考下列实施例和附图来举例详述本发明的这些和 其他方面,其中:

图1显示了根据本发明的系统的示意性框图

图2显示了根据本发明的方法的简化流程图

在所描述的实施例中,用于训练构音障碍的说话者的系统1是借助例 如笔记本或PC之类的标准计算机系统2、与计算机系统2相耦合的麦克 风3以及在计算机系统2上执行的专用计算机程序来实现的。在计算机系 统2上执行的计算机程序实现的是第一计算模块4和第二计算模块5。此 外,计算机系统2包括组合的接口和反馈模块6。系统1的所有装置都适 于执行根据本发明的方法。所有模块、设备和组件都是以一种依照本发明 的方法来运行数据和/或信息输入、处理和输出的过程的方式而被构造和 编程的。特别地,计算机系统2的处理单元适于执行所有那些计算和运算 输入数据以及确定和评定结果的任务。根据本发明,这种处理是借助专用 计算机软件来实现的,其中该计算机软件包含了计算机指令,这些指令适 于在计算机系统1的处理单元执行软件时执行本发明的方法。处理单元自 身可以包括功能模块或单元,并且这些功能模块或单元是以硬件、软件或 软硬件组合的形式实施的。

在第一步骤101中,用户(说话者)被要求说出某个单词或短句。为 此目的,组合的接口和反馈模块6向说话者提供说话指令。该组合的接口 和反馈模块6包括计算机系统2的内置监视器7或者与计算机系统相连的 外部监视装置,例如电视机。组合的接口和反馈模块6还包括用于重放将 要由说话者重复的单词的内置扬声器8。为了提供说话指令,所述组合的 接口和反馈模块6是受专用计算机程序控制的。

在接下来的步骤102,用户语音、也就是说话者的输入话语将会借助 麦克风3而被记录,其中该麦克风3与计算机系统2相连,并且适于向计 算机系统2传送语音信号,以便进行处理。

随后,说话者的输入话语的语音质量量度将会借助第一计算模块4而 被计算。为此目的,在步骤103中通过第一计算模块4的语音分析组件 11来执行语音识别。该语音识别在音位和/或单词级别上执行,以便确定 所说的一个或多个单词。随后,第一计算模块4的比较组件12在步骤104 中将输入话语与参考数据相比较,其中所述参考数据是以多个非构音障碍 的说话者的平均数据为基础的。为此目的,比较组件12访问存储了每一 个训练单词的参考数据的参考数据库9。根据语音分析以及与参考数据的 比较,第一计算模块4为每一个单独的训练单词计算客观的语音质量量 度。

优选地,第一计算模块4是如下工作的:为发音训练给出单词W。说 话者的语音产生有可能是单词O。现在,第一计算模块4计算两个概率。 首先,给定语音产生O与给定单词W相匹配的概率,也就是所谓的“强制 对准”。其次,给定语音产生O是任意音位序列的最大概率,也就是所谓 的“自由音位循环”。这两个概率的比值(R=W/O将会产生给定单词W的 发音质量的量度。描述这种方法的详细资料可以在H.Boulard和B. D’hoors于1994年4月发表于Proc.ICASSP第1卷第373页的论文 ‘Optimizing Recognition and rejection performance in word spotting systems’中找到。

随后,语音质量量度R将被第一计算模块4连同时间戳以及相应的一 个或多个单词一起保存在训练数据库10中。

在接下来的步骤105中,第二计算模块5的评估组件13自动将语音 质量量度与说话者的至少一个先前语音质量量度相比较。在该步骤中,可 以通过对当前会话的所有值求取平均,和/或通过使用该会话的最小/最大 值,和/或通过在时间方面加权每一个值(最新近的值被加权最大)以及 在此后求取平均,和/或通过对先前会话的累积结果加以考虑,由此顾及 先前结果。为此目的,评估组件访问存储了每一个训练单词的先前结果的 训练数据库10。如果该系统是首次使用的,那么测量得到的关于标准单 词集合的语音质量将被用于对历史训练数据的数据库10进行初始化,并 且还会用于对与所给出的生物反馈相关的性能等级进行初始化。

在接下来的步骤106,根据当前练习结果来向说话者提供反馈。为此 目的,组合的接口和反馈模块6提供了一个“信号灯”信令方案,在该方 案中,如果有所改善,则显示绿灯,如果没有改善,则显示黄灯,如果出 现恶化,则通过计算机系统2的内置监视器7来向说话者显示红灯。为了 提供反馈信息,组合的接口和反馈模块6是由计算机程序来控制的。

优选地,说话者被要求重复训练处理,直至满足退出条件(步骤107)。 例如,这种退出条件可以是:达到最大训练时间,达到某一行的最大“绿” 结果,达到某一行的最大“黄”结果,达到某一行的最大“红”结果,超 出最大练习次数,手动停止。

一般的训练结果以及与每一个单独的单词或短语相关的训练结果被 保存在结果数据库(未显示)中和/或被使得可以供治疗学家借助计算机 系统2来使用,例如通过因特网之类的计算机网络针对治疗学家的在线数 据传送来使用。

优选地,本发明既可以作为家庭中风测试的一部分来使用,也可以作 为基于家庭的康复应用的一部分来使用,还可以在康复诊所中使用。此外, 本发明还可以作为电子远程医疗平台的一部分来使用。

对本领域技术人员来说,很明显,本发明并不局限于上述说明性实施 例的细节,在不脱离本发明的本质或是其基本属性的情况下,本发明是可 以在其他特定形式中实施的。由此,本发明的所有方面都被视为说明性而 不是限制性的,本发明的范围是由所附权利要求而不是前述说明书指示 的,由此,落入权利要求含义和等价范围以内的所有变化全都落入其中。 此外,非常明显的是,单词“包括”并未排除其他元件或步骤,单词“一” 或“一个”并未排除多个,并且诸如计算机系统或另一个单元之类的单个 元件可以满足权利要求中述及的若干个装置的功能。权利要求中的任何参 考符号都不应该被解释成是对所涉及权利要求进行限制。

参考数字

1  系统

2  计算机

3  麦克风

4  第一计算单模块

5  第二计算模块

6  组合的接口和反馈模块

7  监视器

8  扬声器

9  参考数据库

10 训练数据库

11 语音分析组件

12 比较组件

13 评估组件

高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈