首页 / 专利库 / 人工智能 / 人工智能 / 机器学习 / 深度学习 / 基于语音的人格特征预测方法

基于语音的人格特征预测方法

阅读:285发布:2023-12-26

专利汇可以提供基于语音的人格特征预测方法专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种基于语音的人格特征预测方法,其实施步骤如下:针对多个参考测定人进行人格评估测定得到多项人格特征因素评分值;采集参考测定人的语音 片段 并提取多项声学韵律特征,提取多项统计特征值;建立语音人格预测 机器学习 模型,将每一个参考测定人的多项人格特征因素评分值及统计特征值分别输入语音人格预测机器学习模型进行训练;采集测定人的语音片段,提取声学韵律特征和统计特征,输入语音人格预测机器学习模型得到各项声学韵律特征对应的多项人格特征因素评分值,将每一项特征的所有人格特征因素评分值加权求和得到测定人的多项人格特征因素评分值并输出。本发明具有预测素材采集简便、预测过程快捷、效果客观准确的优点。,下面是基于语音的人格特征预测方法专利的具体信息内容。

1.一种基于语音的人格特征预测方法,其特征在于实施步骤如下:
1)建立语音人格预测机器学习模型:针对选择的多个参考测定人进行人格评估测定得到作为参考测定人的人格特征因素真实基准评分的多项人格特征因素评分值;采集多个所述参考测定人正常发音语音的语音片段,对所述语音片段进行预处理并提取多项声学韵律特征,提取所述声学韵律特征的多项统计特征值;建立包含声学韵律特征到人格特征因素评分值映射关系的语音人格预测机器学习模型,将每一个参考测定人的多项人格特征因素评分值以及语音片段各项声学韵律特征对应的多项统计特征值分别输入所述语音人格预测机器学习模型进行训练;
2)人格特征预测:采集测定人的正常发音语音得到待预测的语音片段,对所述语音片段进行预处理并提取多项声学韵律特征和对应的多项统计特征,将所述多项声学韵律特征以及对应的多项统计特征输入所述语音人格预测机器学习模型进行人格特征因素评分值回归分析得到各项声学韵律特征和统计特征对应的多项人格特征因素评分值,分别将每一项特征对应的所有人格特征因素评分值加权求和,最终得到测定人的的多项人格特征因素评分值并输出。
2.根据权利要求1所述的基于语音的人格特征预测方法,其特征在于:所述步骤1)中针对选择的多个参考测定人进行人格评估测定具体是指进行大五人格测试、明尼苏达多项人格测试、卡特尔16人格测试中的一种。
3.根据权利要求2所述的基于语音的人格特征预测方法,其特征在于:所述步骤1)及步骤2)中对语音片段进行预处理并提取多项声学韵律特征的详细步骤如下:对语音片段进行预加重、加窗处理、分、端点检测得到预处理后的语音片段,对预处理后的每一个语音片段分别提取包括Mel频率倒谱系数、线性预测倒谱系数、感知线性预测系数、音高、前两共振峰、能量、有声段长度、无声段长度、感知线性预测系数、短时过零率、谐噪比、长时平均谱中的多项在内的声学韵律特征。
4.根据权利要求3所述的基于语音的人格特征预测方法,其特征在于:所述步骤1)中提取声学韵律特征的多项统计特征值具体是指提取声学韵律特征的最大值、最小值、均值、方差、相对熵、斜率、差分值中的多种。
5.根据权利要求1~4中任意一项所述的基于语音的人格特征预测方法,其特征在于:
所述步骤1)中的语音人格预测机器学习模型具体是指高斯核支持向量机统计模型、逻辑回归方法模型、决策树模型、最小二乘法模型、感知器算法模型、Boost方法模型、隐尔科夫模型、高斯混合模型、神经网络模型、深度学习模型中的一种。

说明书全文

基于语音的人格特征预测方法

技术领域

[0001] 本发明涉及计算机应用技术领域,具体涉及一种基于语音的人格特征预测方法。

背景技术

[0002] 目前互联网上人格预测方法普遍采用基于文字答卷的形式。虽然文字答卷的人格预测方法有了丰富的研究成果,如大五人格测试(Big Five)、卡特尔16因素人格测验(Sixteen Personality Factor Questionnaire , 16PF)等。但在这种方式下用户需要花费大量时间进行答题,预测所需时间取决于题目数量和测试者的答题速度,并且预测步骤繁多冗长,测试者容易产生厌烦和抵触心理,测试结果的准确性依赖于测试者的主观配合程度,因此这种方法并不十分适合互联网所提倡简单便捷的“快餐式”应用模式。
[0003] 专利申请号为201010606120.8的技术方案公开了一种基于多种方言背景提出一种语音式交互问答形式的人格测试方法和装置,把人格测试的文字问答方式转变为语音问答形式,一定程度上解决了特殊人群的适应性和便捷性问题,但没有从本质上解决测试过程过于冗长的状况。此外,专利申请号为201310059465.X的技术方案公开了一种利用用户手写文字图片进行分析预测人格特征,虽然可以免去冗长的答题预测时间,但目前移动社交、网络社交中,手写图片的使用并不广泛,存在难以采集预测数据等问题。本发明基于语音的人格预测方式,步骤少且操作简单,可在移互联网、移动环境下众多应用中推广,进而准确、高效的为用户提供进一步社交服务。因此,如何克服了互联网、移动平台上人格特征预测方式耗时长、效果易受主观因素影响、测定数据难以获取等不足,为用户提供简单易用的“快餐式”人格预测途径,已经成为一项亟待解决的技术问题。

发明内容

[0004] 针对现有技术的上述计数问题,本发明要解决的计数问题是提供一种预测耗时短、效果客观准确、素材采集简单方便的基于语音的人格特征预测方法。
[0005] 为了解决上述计数问题,本发明采用的技术方案为:一种基于语音的人格特征预测方法,其实施步骤如下:
1)建立语音人格预测机器学习模型:针对选择的多个参考测定人进行人格评估测定得到作为参考测定人的人格特征因素真实基准评分的多项人格特征因素评分值;采集多个所述参考测定人正常发音语音的语音片段,对所述语音片段进行预处理并提取多项声学韵律特征,提取所述声学韵律特征的多项统计特征值;建立包含声学韵律特征到人格特征因素评分值映射关系的语音人格预测机器学习模型,将每一个参考测定人的多项人格特征因素评分值以及语音片段各项声学韵律特征对应的多项统计特征值分别输入所述语音人格预测机器学习模型进行训练;
2)人格特征预测:采集测定人的正常发音语音得到待预测的语音片段,对所述语音片段进行预处理并提取多项声学韵律特征和对应的多项统计特征,将所述多项声学韵律特征以及对应的多项统计特征输入所述语音人格预测机器学习模型进行人格特征因素评分值回归分析得到各项声学韵律特征和统计特征对应的多项人格特征因素评分值,分别将每一项声学韵律特征对应的所有人格特征因素评分值加权求和,最终得到测定人的的多项人格特征因素评分值并输出。
[0006] 作为本发明上述技术方案的进一步改进:所述步骤1)中针对选择的多个参考测定人进行人格评估测定具体是指进行大五人格测试、明尼苏达多项人格测试、卡特尔16人格测试中的一种。
[0007] 所述步骤1)及步骤2)中对语音片段进行预处理并提取多项声学韵律特征的详细步骤如下:对语音片段进行预加重、加窗处理、分、端点检测得到预处理后的语音片段,对预处理后的每一个语音片段分别提取包括Mel频率倒谱系数、线性预测倒谱系数、感知线性预测系数、音高、前两共振峰、能量、有声段长度、无声段长度、感知线性预测系数、短时过零率、谐噪比、长时平均谱中的多项在内的声学韵律特征。
[0008] 所述步骤1)中提取声学韵律特征的多项统计特征值具体是指提取所述声学韵律特征的最大值、最小值、均值、方差、相对熵、斜率、差分值中的多种。
[0009] 所述步骤1)中的语音人格预测机器学习模型具体是指高斯核支持向量机统计模型、逻辑回归方法模型、决策树模型、最小二乘法模型、感知器算法模型、Boost方法模型、隐尔科夫模型、高斯混合模型、神经网络模型、深度学习模型中的一种。
[0010] 本发明具有下述技术效果:本发明通过预先建立的语音人格预测机器学习模型,能够利用用户提供的任意语音片段使用语音人格预测机器学习模型来实现人格特征预测,通过利用统计学习方法建立语音特征与人格特征因素间的映射关系,预测出各项人格因素指数,克服了传统人格预测耗时长、效果易受主观因素影响、测定素材不便于获取等不足,能够充分利用目前网络社交、移动社交易于获取语音素材的特点,通过提取用户提交的待测者任意语音片段的声学韵律特征,利用统计学习方法计算出该语音片段对应的多个人格特征因素评分值,将多个人格特征因素评分值进行加权求和得到预测人的最终的人格特征综合评分值并以此为基础为用户提供社交服务,能够为用户提供基于人格特征的最佳人格匹配婚恋交友、人际关系预测、职场规划分析等社交类人格预测快速服务,具有预测耗时短、效果客观准确、素材采集简单方便、应用范围广泛的优点。附图说明
[0011] 图1为本发明实施例的方法流程示意图。
[0012] 图2为本发明实施例中人格特征预测的原理示意图。

具体实施方式

[0013] 如图1所示,本实施例基于语音的人格特征预测方法的实施步骤如下:一、建立语音人格预测机器学习模型。
[0014] 1.1)针对选择的多个参考测定人进行人格评估测定得到作为参考测定人的人格特征因素真实基准评分的多项人格特征因素评分值。本实施例中,针对选择的多个参考测定人进行人格评估测定具体是指进行大五人格测试(Big Five),得出各个参考测定人神经质性(Neuroticism)、外向性(Extroversion)、开放性(Openness)、随和性(Agreeableness)、尽责性(Conscientiousness)五项人格特征因素评分值。此外,针对多个参考测定人进行人格评估还可以采用明尼苏达多项人格测试或者卡特尔16人格测试等,其结果同样也可以得到多项人格特征因素评分值,人格特征因素评分值的项数会由于具体的人格评估测定方法不同而有所不同。
[0015] 1.2)采集多个参考测定人正常发音语音的语音片段,对语音片段进行预处理并提取多项声学韵律特征。本实施例中,共选择400个参考测定人,每个参考测定人录制10段15秒左右的任意正常发音语音,共得到4000个语音片段,由于一般实验采集数据量大于300即符合心理学分析需要,因此本实施例建立语音人格预测机器学习模型用的语音片段符合相关采样标准,本实施例中将其中约三分之二的语音片段用于训练集,余下三分之一用于测试集。本实施例中,将语音片段进行预处理并获取语音片段的多项声学韵律特征的详细步骤如下:对语音片段进行语音预处理(即依次进行预加重、加窗处理、分帧、端点检测)得到多个语音片段,对每一个语音片段分别提取Mel频率倒谱系数(MFCC)、音高(Pitch,设计每秒声带振动次数,关系到语气和语调)、前两共振峰(一阶共振峰F1和二阶共振峰F2)、能量(Energy)、有声段长度(L0)、无声段长度(L1,用于和L0结合后与发音速率相关)、感知线性预测系数(Perceptual Linear Predictive)、短时过零率、谐噪比(Harmonics-to-Noise-Ratio)、长时平均谱(Long-Term Average Spectrum)中的多项作为提取得到的多项声学韵律特征。
[0016] 1.3)提取声学韵律特征的多项统计特征值。本实施例中,提取声学韵律特征的多项统计特征值具体是指多项声学韵律特征的最大值(Max)、最小值(Min)、均值(Mean)、方差(Stdev)、相对熵KL、斜率、差分值中的多种。
[0017] 1.4)建立包含声学韵律特征到人格特征因素评分值映射关系的语音人格预测机器学习模型,将每一个参考测定人的多项人格特征因素评分值以及语音片段各项声学韵律特征对应的多项统计特征值分别输入语音人格预测机器学习模型进行训练。
[0018] 本实施例中,将每一个参考测定人的多项人格特征因素评分值以及对应的多个语音片段的多项声学韵律特征的多项统计特征值输入的语音人格预测机器学习模型具体是指高斯核支持向量机统计模型(高斯核Support Vector Machine)模型,每一个语音片段的每一项声学韵律特征都包含对应神经质性(Neuroticism)、外向性(Extroversion)、开放性(Openness)、随和性(Agreeableness)、尽责性(Conscientiousness)五项人格特征因素评分值。此外,还可以根据需要采用包括逻辑回归方法模型、决策树模型、最小二乘法模型、感知器算法模型、Boost方法模型、隐马尔科夫模型、高斯混合模型、神经网络模型、深度学习模型在内的其它语音人格预测机器学习模型,但是不论对于哪一种语音人格预测机器学习模型而言,其精确度和训练的样本数量相关,训练的样本数量越多则精确度越高。本实施例将每一个参考测定人的多项人格特征因素以及对应的多项声学韵律特征的多项统计特征值输入高斯核支持向量机统计模型后,对高斯核支持向量机统计模型完成训练得到包含声学韵律特征到人格特征因素评分值映射的高斯核支持向量机统计模型,即得到前述的语音人格预测机器学习模型。由于该语音人格预测机器学习模型包含声学韵律特征到人格特征因素评分值映射,因此能够可利用用户提供的任意语音片段进行人格预测,通过利用语音片段声学韵律特征与人格特征因素评分值之间的映射关系预测出各项人格因素指数,从而为人格特征预测奠定基础。
[0019] 二、人格特征预测。
[0020] 2.1)采集测定人的正常发音语音得到待预测的语音片段,对语音片段进行预处理并提取多项声学韵律特征对应的多项统计特征。采集语音片段可以通过两种方式:一、采集测定人的语音,用户能够使用手机、电脑、平板或其他电子设备选取已经录制的语音片段文件,通过网络提交至应用本实施例方法的语音采集接口;二、用户可选用应用本实施例方法的系统的实时录制功能,录制一段语音片段并提交至语音采集接口。本实施例中,具体是通过语音采集接口接收用户通过网络提交的语音片段音频文件,其采样率为11025Hz,且语音片段音频文件均保存为wav 格式。此外,将语音片段进行预处理并获取语音片段的多项声学韵律特征的步骤与步骤1.2)相同,在此不再赘述。
[0021] 2.2)将多项声学韵律特征以及对应的多项统计特征输入语音人格预测机器学习模型进行人格特征因素评分值回归分析得到各项声学韵律特征和统计特征对应的多项人格特征因素评分值。由于语音人格预测机器学习模型包含声学韵律特征到人格特征因素评分值映射,因此将多项声学韵律特征输入语音人格预测机器学习模型进行人格特征因素评分值回归分析,即可得到对应神经质性(Neuroticism)、外向性(Extroversion)、开放性(Openness)、随和性(Agreeableness)、尽责性(Conscientiousness)五项人格特征因素的多个人格特征因素评分值。最终,得到各项声学韵律特征对应的五项人格特征因素评分值,每一个声学韵律特征都对应有五项人格特征因素评分值。
[0022] 2.3)分别将每一项声学韵律特征对应的所有人格特征因素评分值加权求和,最终得到测定人的的多项人格特征因素评分值并输出。
[0023] 如图2所示,本实施例首先通过步骤2.1)采集语音片段并提取多项声学韵律特征及统计特征,提取多项声学韵律特征包括音高、共振峰(即前两共振峰,包括一阶共振峰F1和二阶共振峰F2)等等,计算多项统计特征包括最大值、最小值、均值、方差、相对熵等等,由于经过步骤2.2)输入语音人格预测机器学习模型进行人格特征因素评分值回归分析后,每一个声学韵律特征都得到对应神经质性(Neuroticism)、外向性(Extroversion)、开放性(Openness)、随和性(Agreeableness)、尽责性(Conscientiousness)的五项人格特征因素评分值,本实施例最终通过步骤2.3)将对应神经质性(Neuroticism)、外 向 性(Extroversion)、开 放 性(Openness)、随 和 性(Agreeableness)、尽 责 性(Conscientiousness)五项的人格特征因素评分值进行加权求和得出五项人格因素的最终评分,预测出测定人的五项人格因素指数值作为测定人的最终的人格特征预测结果。
[0024] 综上所述,本实施例通过预先建立的语音人格预测机器学习模型,能够利用用户提供的任意语音片段进行人格预测,通过利用统计学习方法建立语音特征与人格特征因素间的映射关系,预测出各项人格因素指数,克服了传统人格预测耗时长、效果易受主观因素影响、测定素材不便于获取等不足,能够充分利用目前网络社交、移动社交易于获取语音素材的特点,通过提取用户提交的待测者任意语音片段的声学、韵律等特征,利用统计学习方法计算出该语音片段对应的多个人格特征因素评分值,将多个人格特征因素评分值进行加权求和得到预测人的最终的人格特征综合评分值并以此为基础为用户提供社交服务,通过针对多个参考测定人分别进行了人格特征预测准确度对比实验,实验数据表明本实施例的先验准确度可以达到67%左右,与现有技术进行人工人格评估测定的实测准确度75%比较接近,能够满足快速准确的人格特征预测需求,能够为用户提供基于人格特征的最佳人格匹配婚恋交友、人际关系预测、职场规划分析等社交类人格预测快速服务,具有预测耗时短、效果客观准确、素材采集简单方便、应用范围广泛的优点。
[0025] 以上所述仅是本发明的优选实施方式,本发明的保护范围并不仅局限于上述实施例,凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理前提下的若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈