首页 / 专利库 / 心理学与精神病学 / 构音障碍 / 一种基于声学指标的构音障碍分级评估方法

一种基于声学指标的构音障碍分级评估方法

阅读:992发布:2020-05-12

专利汇可以提供一种基于声学指标的构音障碍分级评估方法专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种基于声学指标的 构音障碍 分级评估方法,其包括下述步骤:采集脑卒中后构音障碍患者的语音数据;提取所述语音数据的客观声学特征听懂度,收集、提取、分析被试者的声学指标,所述客观声学特征听懂度,是在国内外认可度高、灵敏度好的病理语音分析指标;将所得的声学特征听懂度基于 人工智能 的自动聚类法 算法 K-means确定语音轻度异常、中度异常、重度异常的临界值;使用该听懂度临界值,用于临床评定被试者构音障碍的严重等级。本发明减少了由于技术人员的技术 水 平、主观判断、地域差异等主观因素导致的评估误差,同时操作简单,耗时少。,下面是一种基于声学指标的构音障碍分级评估方法专利的具体信息内容。

1.一种基于声学指标的构音障碍分级评估方法,其特征在于,包括下述步骤:
采集脑卒中后构音障碍患者的语音数据;
提取所述语音数据的客观声学特征听懂度,通过采访级录音笔收集A例临床确诊为构音障碍患者的每人B个音节,所述音节包括单元音、复合元音、辅音和声调,通过软件剪辑成B独立音频文件,通过Matlab软件编程随机提取独立音频文件,听辩者根据随机听到的声音进行记录,完成与目标音的差异度分析,并计算声学特征听懂度,所述声学特征听懂度,是在国内外认可度高、灵敏度好的病理语音分析指标;
将所得的声学特征听懂度基于人工智能的自动聚类法算法K-means确定语音轻度异常、中度异常、重度异常的临界值;
使用该听懂度临界值,用于临床评定被试者构音障碍的严重等级。
2.根据权利要求1所述基于声学指标的构音障碍分级评估方法,其特征在于,采集脑卒中后构音障碍患者的语音数据采用的是《中国构音障碍语音评估系统词表》,所述《中国构音障碍语音评估系统词表》由82个目标音组成;所述A取值为100,B取值为82。
3.根据权利要求1所述基于声学指标的够音障碍等级评估方法,其特征在于,采集脑卒中后构音障碍患者的语音数据时,采取的Sony Zoom H4nPro便携式数码录音机进行录音,采样率为44100Hz,采用精度为16bit,双声道,对所有被试者进行录音,被试者取端坐位,笔者手拿录音机,被试者口唇距录音机约10cm,语速自然平稳、音量适中,将词表重复录2次。
4.根据权利要求3所述基于声学指标的够音障碍等级评估方法,其特征在于,将所述语音数据使用音频剪辑软件剪辑后存档,随后将被试者使用Cool Edit Pro2.1软件进行单个元音的剪切,并使用WAV格式保存存档。
5.根据权利要求1所述基于声学指标的够音障碍等级评估方法,其特征在于,评判客观声学特征听懂度,采用两女一男分别进行客观声学特征听懂度的评判,随后将3人的听懂度结果进行一致性检验后取其平均值,最终得出被试者的客观声学特征听懂度;对两女一男共3人听懂度的结果进行一致性检验,客观评判该声学特征听懂度结果的准确性。
6.根据权利要求1所述基于声学指标的构音障碍分级评估方法,其特征在于,还包括对客观声学特征听懂度进行预处理,通过录音获得连续的音频文件,预处理是通过语音软件观察被剪辑的音节是否符合强度适中,机振动波幅平均在采集框高度的1/3-2/3、无明显噪音或干扰,通过Praat3.0软件观察并确定F1的起始为起点,F2的结束为终点,采用Cool Edit Pro2.1剪辑出每个患者的82个音节样本,每个音节在观察和剪辑前有两个录音样本备选,仅当第一个样本不能使用时方启用第二个样本。
7.根据权利要求1所述基于声学指标的构音障碍分级评估方法,其特征在于,所述提取所述语音数据的客观声学特征听懂度,具体通过下述方式实现:
将A例构音患者每人的B个语音发声采用随机抽取的方式让听辩者判断,并记录,每个听辩者听理解后记录到的声音与目标音的完全一致则记录为2分;每个听辩者听理解后记录到的声音与目标音的有部分不一致(元音、辅音、声调)则记录为1分;每个听辩者听理解后记录到的声音与目标音的完全不一致或为刻板无意义发音则记录为0分,如果82个音节完全准确,听懂度量化值164(82*2),完全不正确,听懂度量化值为0(82*0)。
8.根据权利要求1所述基于声学指标的构音障碍分级评估方法,其特征在于,将所得的声学特征听懂度基于人工智能的自动聚类法算法K-means确定语音轻度异常、中度异常、重度异常的临界值,具体为:
8.1、每个患者N个独立语音音频,其量化听懂度值在0-164之间;
8.2、名患者有各自A个量化值,构成数据集,X={X1,X2,X3,...,Xm}
8.3、通过误差平方和sum of the squared errors确定最优的分类数,即通过K-means法最终希望将构音障碍分为几级严重程度;
其中,Ci是第i个簇,p是Ci中的样本点,mi是Ci的质心,Ci中所有样本的均值,SSE是所有样本的聚类误差,计算中,如果随着聚类数k的增大,样本划分会更加精细,每个簇的聚合程度越来越高,误差平方和会逐渐变小,因此计算过程中由小到大调试k值,当k小于真实聚类数时,由于k的增大会大幅增加每个簇的聚合程度,故SSE的下降幅度会很大,而当k到达真实聚类数时,再增加k所得到的聚合程度回报会迅速变小,此时SSE的下降幅度会骤减,然后随着k值的继续增大而趋于平缓,这个趋于平缓的转折点就是最终确定的k值,也就是分类数;
8.4、在Matlab2013b中输入数据集,设定k值,最大迭代次数N由自动收敛决定输出是簇划分C={C1,C2,...Ck}
1)从数据集X中随机选择k个样本作为初始的k个质心向量:
2)对于n=1,2,...,N
a)将簇划分C初始化为
b)对于i=1,2...m,计算样本Xi和各个质心向量μj(j=1,2,...k)的距离:
将xi标记最小的为dij最小所对应的类别λi,此时更新
c)对于j=1,2,...,k,对Cj中所有的样本点重新计算新的质心
e)如果所有的k个质心向量都没有发生变化,则转到步骤3)
3)输出簇划分C={C1,C2,...Ck}
8.5根据步骤8.4计算出K的取值,即轻度、中度和重度构音障碍的数据集、质心值、边界值,轻度与中度障碍的边界值,重度与中度障碍的边界值即为确定的临界值。
9.根据权利要求8所述基于声学指标的构音障碍分级评估方法,其特征在于,计算出最佳k值是3,符合临床对疾病严重程度分类的习惯。

说明书全文

一种基于声学指标的构音障碍分级评估方法

技术领域

[0001] 本发明属于声音处理的技术领域,具体涉及一种基于声学指标的构音障碍分级评估方法。

背景技术

[0002] 中华医学会神经病学分会2004--2005年完成的全国第3次死因回顾性抽样调查报告发现,脑血管病已至我国疾病死因的首位。从1990至2013年,我国因脑卒中死亡导致生命年损失居首位的省从16个上升至27个。其中城市卒中的死亡率为125.56/10万人,农村脑卒中的死亡率为150.17/10万人。根据研究报道,在2013年,全球中幸存者约有2570万,约有650万人死于中风。并且我国脑卒中患者年轻化趋势明显,40~64岁的劳动人群占近
50%。根据文献报道,脑卒中患者中构音障碍的发生率为30%~40%。帕金森病患者中有
69.6%的患者的言语清晰度低于正常组,构音障碍发病率在多发性硬化患者中高达51%。
脑血管病的发生率极高,且年轻化趋势明显,脑卒中后构音障碍的发生率也很高,因此对于脑血管病的后遗症的诊断、评估、治疗的研究也尤为重要,以改善及提高脑卒中人群的生活质量,为脑卒中后人群的诊断及预后提供更完善的研究。
[0003] 目前国内构音障碍的评估主要采用主观方式进行,客观评估的研究并不多见,这是由于构音障碍客观评估的研究缺乏真正实现客观的评价方法和评价体系。与其他类型的言语障碍客观评估一样,客观评估构音能力需要具备客观评价参数和软硬件设备。基于语音特性系统的客观评估符合构音障碍评估与康复应用的实际需求,本发明基于人工智能应用于痉挛型构音障碍脑卒中被试者,评定被试者是否存在构音障碍并对构音障碍进行分级,制定客观构音障碍分级新方法,为脑卒中后构音障碍被试者诊断、评估、治疗计划及评定疗效提供帮助。
[0004] 与本发明最接近的可以用于构音障碍分级的工具是一种问卷结合体检的评估量表,即Frenchay构音障碍评定表,该构音障碍严重程度分级方法,主要从解剖、运动等临床度分类,没有采用声学指标分类,因此仍然缺乏客观性。

发明内容

[0005] 本发明的主要目的在于克服现有技术的缺点与不足,提供一种基于声学指标的构音障碍分级评估方法,为脑卒中后构音障碍患者提供客观的评估方法,解放人力以及减少由于人力以及技术平的不同造成的误差,为构音障碍的诊断、治疗、评估以及预后提供更加客观的理论依据。
[0006] 为了达到上述目的,本发明采用以下技术方案:
[0007] 一种基于声学指标的构音障碍分级评估方法,包括下述步骤:
[0008] 采集脑卒中后构音障碍患者的语音数据;
[0009] 提取所述语音数据的客观声学特征听懂度,通过采访级录音笔收集A例临床确诊为构音障碍患者的每人B个音节,所述音节包括单元音、复合元音、辅音和声调,通过软件剪辑成B独立音频文件,通过Matlab软件编程随机提取独立音频文件,听辩者根据随机听到的声音进行记录,完成与目标音的差异度分析,并计算声学特征听懂度,所述声学特征听懂度,是在国内外认可度高、灵敏度好的病理语音分析指标;
[0010] 将所得的声学特征听懂度基于人工智能的自动聚类法算法K-means确定语音轻度异常、中度异常、重度异常的临界值;
[0011] 使用该听懂度临界值,用于临床评定被试者构音障碍的严重等级。
[0012] 作为优选的技术方案,采集脑卒中后构音障碍患者的语音数据采用的是《中国构音障碍语音评估系统词表》,所述《中国构音障碍语音评估系统词表》由82个目标音组成;所述A取值为100,B取值为82.
[0013] 作为优选的技术方案,采集脑卒中后构音障碍患者的语音数据时,采取的Sony ZoomH4nPro便携式数码录音机进行录音,采样率为44100Hz,采用精度为16bit,双声道,对所有被试者进行录音,被试者取端坐位,笔者手拿录音机,被试者口唇距录音机约10cm,语速自然平稳、音量适中,将词表重复录2次。
[0014] 作为优选的技术方案,将所述语音数据使用音频剪辑软件剪辑后存档,随后将被试者使用Cool Edit Pro2.1软件进行单个元音的剪切,并使用WAV格式保存存档。
[0015] 作为优选的技术方案,评判客观声学特征听懂度,采用两女一男分别进行客观声学特征听懂度的评判,随后将3人的听懂度结果进行一致性检验后取其平均值,最终得出被试者的客观声学特征听懂度;对两女一男共3人听懂度的结果进行一致性检验,客观评判该声学特征听懂度结果的准确性。
[0016] 作为优选的技术方案,还包括对客观声学特征听懂度进行预处理,通过录音获得连续的音频文件,预处理是通过语音软件观察被剪辑的音节是否符合强度适中,机振动波幅平均在采集框高度的1/3-2/3、无明显噪音或干扰,通过Praat3.0软件观察并确定F1的起始为起点,F2的结束为终点,采用Cool Edit Pro2.1剪辑出每个患者的82个音节样本,每个音节在观察和剪辑前有两个录音样本备选,仅当第一个样本不能使用时方启用第二个样本。
[0017] 作为优选的技术方案,所述提取所述语音数据的客观声学特征听懂度,具体通过下述方式实现:
[0018] 将A例构音患者每人的B个语音发声采用随机抽取的方式让听辩者判断,并记录,每个听辩者听理解后记录到的声音与目标音的完全一致则记录为2分;每个听辩者听理解后记录到的声音与目标音的有部分不一致(元音、辅音、声调)则记录为1分;每个听辩者听理解后记录到的声音与目标音的完全不一致或为刻板无意义发音则记录为0分,如果82个音节完全准确,听懂度量化值164(82*2),完全不正确,听懂度量化值为0(82*0)。
[0019] 作为优选的技术方案,将所得的声学特征听懂度基于人工智能的自动聚类法算法K-means确定语音轻度异常、中度异常、重度异常的临界值,具体为:
[0020] 8.1、每个患者N个独立语音音频,其量化听懂度值在0-164之间;
[0021] 8.2、名患者有各自A个量化值,构成数据集,X={X1,X2,X3,...,Xm}
[0022] 8.3、通过误差平方和sum of the squared errors确定最优的分类数,即通过K-means法最终希望将构音障碍分为几级严重程度;
[0023]
[0024] 其中,Ci是第i个簇,p是Ci中的样本点,mi是Ci的质心,Ci中所有样本的均值,SSE是所有样本的聚类误差,计算中,如果随着聚类数k的增大,样本划分会更加精细,每个簇的聚合程度越来越高,误差平方和会逐渐变小,因此计算过程中由小到大调试k值,当k小于真实聚类数时,由于k的增大会大幅增加每个簇的聚合程度,故SSE的下降幅度会很大,而当k到达真实聚类数时,再增加k所得到的聚合程度回报会迅速变小,此时SSE的下降幅度会骤减,然后随着k值的继续增大而趋于平缓,这个趋于平缓的转折点就是最终确定的k值,也就是分类数;
[0025] 8.4、在Matlab2013b中输入数据集,设定k值,最大迭代次数N由自动收敛决定输出是簇划分C={C1,C2,...Ck}
[0026] 1)从数据集X中随机选择k个样本作为初始的k个质心向量:
[0027] 2)对于n=1,2,...,N
[0028] a)将簇划分C初始化为
[0029] b)对于i=1,2...m,计算样本Xi和各个质心向量μj(j=1,2,...)的距离:将xi标记最小的为dij最小所对应的类别λi,此时更新
[0030] c)对于j=1,2,...,k,对Cj中所有的样本点重新计算新的质心
[0031]
[0032] e)如果所有的k个质心向量都没有发生变化,则转到步骤3)
[0033] 3)输出簇划分C={C1,C2,...Ck}
[0034] 8.5根据步骤8.4计算出K的取值,即轻度、中度和重度构音障碍的数据集、质心值、边界值,轻度与中度障碍的边界值,重度与中度障碍的边界值即为确定的临界值。
[0035] 作为优选的技术方案,计算出最佳k值是3,符合临床对疾病严重程度分类的习惯。
[0036] 本发明与现有技术相比,具有如下优点和有益效果:
[0037] 1、本发明的方法相对于现有的构音障碍评估方法而言,减少了由于技术人员的技术水平、主观判断、地域差异等主观因素导致的评估误差,同时操作简单,耗时少,约5分钟/人,因此患者配合程度高,减少由于患者不配合以及当时情绪状态等因素造成的一系列误差。
[0038] 2、本发明消耗少,重复测量度高,存储方便,语音材料存储可随时提取分析比较,可使被试者治疗前后分析比较可视化以及直观化,同时可平行比较多个不同被试者的语音情况;本发明是基于人工智能的基础上研发的一种客观的构音障碍评估方法,与时代的技术水平紧密结合,研发创新出一种适合当代人群的客观评估方法,应用于现代技术,紧随时代的发展趋势。
[0039] 3、与本发明最接近的可以用于构音障碍分级的工具是一种问卷结合体检的评估量表,即Frenchay构音障碍评定表,该构音障碍严重程度分级方法,主要从解剖、运动等临床角度分类,没有采用声学指标分类,而本发明是从纯声学特征和参数基于机器学习算法获得的声学参数界值分类,更加客观、便捷,重测信度高。附图说明
[0040] 图1是本发明的流程图

具体实施方式

[0041] 下面结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式不限于此。
[0042] 实施例
[0043] 在无明显干扰的室内环境中,被试者取端坐位,技术人员手拿SONY ZOOM H4NPRO专业录音机,使被试者口唇距录音机约10cm,录音之前,专业技术人员对被试者进行演示说明,录音期间提醒被试者保持语速自然平稳;开始录音后让被试者读取《中国构音障碍语音评估系统词表》中共82个目标音,用专业的录音设备进行录音,每个目标音重复录2次并存档;使用Cool Edit Pro2.1软件将82个目标音分别剪切出来,命名并分类归档。
[0044] 提取目标语音,分析计算被试者的客观声学特征听懂度。具体方法为将被试者使用Cool Edit Pro2.1软件剪切存档的语音,同时采用两女一男专业技术人员分别对该被试者的语音材料进行客观声学特征听懂度的评判,根据被试者读取的目标音,采用每个音完全读错计0分,部分读错(如音调、辅音)计1分,完全读对计2分的评分标准,分别计算出3位技术人员听辨认的总分,随后将3人的听辨认总分的结果进行一致性检验,证明其准确性,最后将3位技术人员的得出的听辨认总分进行平均,取平均值,减小误差,从而得出被使者最后的听辨认总分进行存档,最终得出被试者的客观声学特征听懂度。
[0045] 本实施例中,将100例构音患者每人的82个语音发声采用随机抽取的方式让听辩者判断,并记录,每个听辩者听理解后记录到的声音与目标音的完全一致则记录为2分,例如计算机扬声器随机发出目标音是“ba”,而听辩者听到“ba”,则记录“ba”,提示听懂度完好;每个听辩者听理解后记录到的声音与目标音的有部分不一致(元音、辅音、声调)则记录为1分,例如计算机扬声器发出目标音“bi”,而听辩者听到“pi”,则记录“pi”,提示听懂度部分受损;每个听辩者听理解后记录到的声音与目标音的完全不一致或为刻板无意义发音则记录为0分,例如计算机扬声器发出目标音“du”,而听辩者听到“e”,则记录“e”,提示听懂度完全受损。即,如果82个音节完全准确,听懂度量化值164(82*2),完全不正确,听懂度量化值为0(82*0)。
[0046] 采用上述的方法得出100名脑卒中后构音障碍患者的客观声学特征听懂度,并将被试者客观声学特征听懂度集中进行预处理,通过录音获得连续的音频文件,预处理是通过语音软件观察被剪辑的音节是否符合强度适中,机振动波幅平均在采集框高度的1/3-2/3、无明显噪音或干扰,通过Praat3.0软件观察并确定F1的起始为起点,F2的结束为终点,采用Cool Edit Pro2.1剪辑出每个患者的82个音节样本,每个音节在观察和剪辑前有两个录音样本备选,仅当第一个样本不能使用时方启用第二个样本。
[0047] 将预处理后的听懂度作为自动聚类法算法的因变量,确定语音轻度异常、中度异常、重度异常的临界值,使用该临界值,客观评定每名被试者构音障碍的严重等级,从而得出每名被试者的构音障碍严重程度的等级。如(119,129),大于129是轻度构音障碍,119-129是中度构音障碍,小于119是重度构音障碍。
[0048] 本发明可客观的评估被试者是否存在构音障碍以及构音障碍的严重程度等级,使用客观声学特征听懂度,采集真实有效的客观数据,通过k-means算法得出构音障碍语音严重程度的界值,直观的反映被使者的构音障碍的严重程度,减少主观因素造成的误差,减少技术人员技术水平的差异而导致的结果差异。此方法操作简单,耗时少,因此被使者配合程度高,更能反映被使者当前的构音障碍严重程度的客观情况,同时还可根据被试者自身的读取目标音的情况,结合声学指标的检验,判断被试者构音器官如唇、舌等损害的大致情况,是否存在活动受限,以及受限的具体方向及受损严重程度,为被试者的评估提供更加准确的理论依据,为被试者康复治疗方案的制定提供精确的方向,从而为被试者提供更加的个体化、客观化以及精准化的康复治疗。
[0049] 本发明研究了新的构音障碍的评估方法,与传统的构音障碍评估方法不同,采用客观的构音障碍评估方法,基于声学指标检验的基础上,采用人工智能的方法,从新的角度以及新的方向研究,从语音角度解释构音障碍患者分级并给出界值,是一种客观的智能化的构音障碍评估新方法。
[0050] 将所得的声学特征听懂度基于人工智能的自动聚类法算法K-means确定语音轻度异常、中度异常、重度异常的临界值,具体为:
[0051] S1、每个患者82个独立语音音频,其量化听懂度值在0-164之间;
[0052] S2、100名患者有各自M个量化值,构成数据集,X={X1,X2,X3,...,Xm}[0053] S3、通过误差平方和sum of the squared errors确定最优的分类数,即通过K-means法最终希望将构音障碍分为几级严重程度;
[0054]
[0055] 其中,Ci是第i个簇,p是Ci中的样本点,mi是Ci的质心,Ci中所有样本的均值,SSE是所有样本的聚类误差,计算中,如果随着聚类数k的增大,样本划分会更加精细,每个簇的聚合程度越来越高,误差平方和会逐渐变小,因此计算过程中由小到大调试k值,当k小于真实聚类数时,由于k的增大会大幅增加每个簇的聚合程度,故SSE的下降幅度会很大,而当k到达真实聚类数时,再增加k所得到的聚合程度回报会迅速变小,此时SSE的下降幅度会骤减,然后随着k值的继续增大而趋于平缓,这个趋于平缓的转折点就是最终确定的k值,也就是分类数;
[0056] S4、在Matlab2013b中输入数据集,设定k值,最大迭代次数N由自动收敛决定输出是簇划分C={C1,C2,...Ck}
[0057] 1)从数据集X中随机选择k个样本作为初始的k个质心向量:
[0058] 2)对于n=1,2,...,N
[0059] a)将簇划分C初始化为
[0060] b)对于i=1,2...m,计算样本Xi和各个质心向量μj(j=1,2,...k)的距离:将xi标记最小的为dij最小所对应的类别λi,此时更新
[0061] c)对于j=1,2,...,k,对Cj中所有的样本点重新计算新的质心
[0062]
[0063] e)如果所有的k个质心向量都没有发生变化,则转到步骤3)
[0064] 3)输出簇划分C={C1,C2,...Ck}
[0065] S5、根据步骤S4计算出K的取值,即轻度、中度和重度构音障碍的数据集、质心值、边界值,轻度与中度障碍的边界值,重度与中度障碍的边界值即为确定的临界值。
[0066] 本实施例中,计算出最佳k值是3,符合临床对疾病严重程度分类的习惯。
[0067] 国内针对构音障碍评估的客观方法较少,本发明客观声学特征听懂度基础上研究出一种客观的评估方法,使构音障碍的评估更趋于客观化,从而研究更为标准客观的评估方法,减少主观的评估导致的构音障碍的评估结果的差异,使最终评估结果趋于客观化以及标准化。
[0068] 基于人工智能的评估方法使人力解放,依靠于智能化的发展,是智能化时代的结晶,与智能发展相结合,是时代进步以及科学发展的结果,将构音障碍的评估与智能化相结合,使评估结果更加客观以及便于前后比较,以及智能分析,方便储存及研究,减少不同机构评估结果的差异,从而研究标准化的构音障啊评估方法。
[0069] 上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈