首页 / 专利库 / 人工智能 / 人工智能 / 机器学习 / 半监督学习 / 一种基于半监督学习的骨质状态评估模型的构建方法

一种基于半监督学习的骨质状态评估模型的构建方法

阅读:466发布:2020-05-19

专利汇可以提供一种基于半监督学习的骨质状态评估模型的构建方法专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种基于半 监督学习 的骨质状态评估模型的构建方法,包括:提取多组不同骨质状态的用户的评估数据,所述评估数据包括生命体征数据、体态数据、骨 密度 数据以及生活习性数据,所述评估数据为数值形式;预处理每组用户的评估数据,得到多组标准评估数据;将所述多组标准评估数据进行分类,形成具有 骨密度 数据的标注数据集和不具有骨密度数据的无标注数据集;基于所述标注数据集和骨质状态标准训练分类器模型,得到骨质状态评估预模型;并基于所述无标注数据集不断 迭代 训练所述骨质状态评估预模型,得到骨质状态评估模型;所述骨质状态评估模型用于根据用户的评估数据输出用户当前的骨质状态。,下面是一种基于半监督学习的骨质状态评估模型的构建方法专利的具体信息内容。

1.一种基于半监督学习的骨质状态评估模型的构建方法,其特征在于,包括:
提取多组不同骨质状态的用户的评估数据,所述评估数据包括生命体征数据、体态数据、骨密度数据以及生活习性数据,所述评估数据为数值形式;
预处理每组用户的评估数据,得到多组标准评估数据;
将所述多组标准评估数据进行分类,形成具有骨密度数据的标注数据集和不具有骨密度数据的无标注数据集;
基于所述标注数据集和骨质状态标准训练分类器模型,得到骨质状态评估预模型;并基于所述无标注数据集不断迭代训练所述骨质状态评估预模型,得到骨质状态评估模型;
所述骨质状态评估模型用于根据用户的评估数据输出用户当前的骨质状态。
2.根据权利要求1所述的基于半监督学习的骨质状态评估模型的构建方法,其特征在于,所述将所述多组标准评估数据进行分类,形成具有骨密度数据的标注数据集和不具有骨密度数据的无标注数据集的步骤包括:
根据每组标准评估数据中,是否存在骨密度数据,将多组评估数据分为具有骨密度的标注数据集和不具有骨密度的无标注数据集;所述标注数据集中具有第一组数的评估数据,而无标注数据集中具有第二组数的评估数据,所述第一组数的值与所述第二组数的值的和值为所述多组的值。
3.根据权利要求2所述的基于半监督学习的骨质状态评估模型的构建方法,其特征在于,所述基于所述无标注数据集不断迭代训练所述骨质状态评估预模型包括:
将所述第二组数的无标注数据集输入所述骨质状态评估预模型中,得到第二组数的无标注数据集的评估骨质状态和评估置信度,所述评估置信度与所述评估骨质状态对应;
将所述评估置信度与预设的置信度进行比对,根据比对结果,将第二组数的无标注数据集划分为第三组数的高置信度的数据集和第四组数的低置信度的数据集;其中,所述第三组数的值与所述第四组数的值的和值为所述第二组数的值;
基于所述第三组数的高置信度的数据集训练所述评估预模型,更新评估预模型的参数;
将所述第四组数的低置信度的数据集输入所述更新参数后的骨质状态评估预模型中,得到第四组数的低置信度的数据集的评估骨质状态和评估置信度,并将评估置信度与预设的置信度进行比对,根据比对结构,将所述第四组数的低置信度的数据集进行再次划分,并基于所得高置信度的数据集更新更新参数后的骨质状态评估预模型,直至所得低置信度的数据集为空集。
4.根据权利要求3所述的基于半监督学习的骨质状态评估模型的构建方法,其特征在于,所述评估置信度指的是预测得到的评估骨质状态类别的概率;高置信度的数据集为评估置信度大于预设的置信度的数据集,低置信度的数据集为评估置信度小于预设的置信度的数据集,所述预设的置信度设置为0.8。
5.根据权利要求1所述的基于半监督学习的骨质状态评估模型的构建方法,其特征在于,所述预处理每组用户的评估数据包括:
分析每组用户的评估数据,补全每组评估数据中缺失的数据,并去除错误的数据,得到每组用户的预评估数据;
计算所述每组用户的预评估数据中,单项数据的信息增益,并将每组评估数据中的各项数据根据信息增益的值进行降序排列,保留排序列表中前80~90%的数据;
在保留的数据中,选取相关联的数据进行组合,保留组合所得数据并去除进行组合的数据,得到每组用户的标准评估数据。
6.根据权利要求1所述的基于半监督学习的骨质状态评估模型的构建方法,其特征在于,所述生命体征数据包括:性别、年龄、绝经年龄以及是否患有疾病并长期服药的数值;所述体态数据包括:身高、体重、胸围、胸围、腰围、臀围、臂长、体脂率、股骨长以及胫骨长的数值;所述骨密度数据包括:骨密度值和骨密度检测部位的数值;所述生活习性数据包括:籍贯、原籍生活时间、从事工作种类、每天日照时长、每日锻炼时长、是否吸烟及吸烟和每日吸烟数量、是否饮酒及饮酒数量、日常饮料偏好、有无中毒史、是否补、有无骨骼相关手术史及病史的数值。
7.一种基于半监督学习的骨质状态评估模型的构建装置,其特征在于,包括:
数据提取模,用于提取多组不同骨质状态的用户的评估数据,所述评估数据包括生命体征数据、体态数据、骨密度数据以及生活习性数据,所述评估数据为数值形式;
预处理模块,用于预处理每组用户的评估数据,得到多组标准评估数据;
分类模块,用于将所述多组标准评估数据进行分类,形成具有骨密度数据的标注数据集和不具有骨密度数据的无标注数据集;
训练模块,用于基于所述标注数据集和骨质状态标准训练分类器模型,得到骨质状态评估预模型;并基于所述无标注数据集不断迭代训练所述骨质状态评估预模型,得到骨质状态评估模型;所述骨质状态评估模型用于根据用户的评估数据输出用户当前的骨质状态。
8.一种基于半监督学习的骨质状态评估方法,其特征在于,包括:
提取用户的评估数据;
将所述评估数据输入预先建立的骨质状态评估模型,得到用户当前的骨质状态;
输出与用户当前的骨质状态结果相对应的骨质状态改善建议;
所述骨质状态评估模型应用权利要求1至6中任一项方法进行构建;
所述骨质状态健康改善建议包括运动、饮食、健康照护的建议及避免不良生活习性。
9.一种基于半监督学习的骨质状态评估模型构建设备,其特征在于,包括处理器、存储器、总线及存储在存储器上并可在处理器上运行的计算机程序
其中,所述处理器,存储器通过所述总线完成相互间的通信;
所述处理器用于所述计算机程序时实现如权利要求1至6任一项所述骨质状态模型构建方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有骨质状态评估模型构建程序,所述骨质状态评估模型构建程序被处理器执行时实现如权利要求1至6任一项所述骨质状态评估模型构建方法的步骤。

说明书全文

一种基于半监督学习的骨质状态评估模型的构建方法

技术领域

[0001] 本发明涉及健康状态评估技术领域,特别是指一种基于半监督学习的骨质状态评估模型的构建方法。

背景技术

[0002] 骨质状态对个人的日常生活影响很大。骨质状态如果出现异常,例如骨质不足和骨质疏松等,都可能会致使骨强度下降,产生较大的危害。在轻微创伤或日常活动时易于发生骨折,即脆性骨折,此类型骨折难于康复,致残、致死率高,常使生活质量下降,劳动丧失,加重了个人与社会的经济负担。
[0003] 随着我国人口老龄化加剧,早期评估骨质健康的状态,并使被评估者根据预估的骨骼健康状况,通过加强日常骨骼健康的防护和改善生活习性,对于预防或避免脆性骨折具有重要的意义。
[0004] 目前的骨质健康状态的评估方法主要分为传统评估方法和基于机器学习的评估方法。传统的评估方法具有评估因素过于简单、没有考虑到不同险因素之间相互关联的作用,无法发现弱相关因素组合时的潜在风险等。基于机器学习的评估方法多为无监督机器学习和有监督机器学习,无监督机器学习多为定性分析,无法准确定量地给出评估结果的准确性;有监督机器学习存在模型较为简单,无法对数据的特征进行准确的拟合,且无法对数据特征本身进行研究,无法准确评估骨质状态的问题。

发明内容

[0005] 有鉴于此,本发明的目的在于提出一种能够构建更加完善的骨质状态评估模型方法。
[0006] 基于上述目的本发明提供的一种基于半监督学习的骨质状态评估模型的构建方法,其特征在于,包括:
[0007] 提取多组不同骨质状态的用户的评估数据,所述评估数据包括生命体征数据、体态数据、骨密度数据以及生活习性数据,所述评估数据为数值形式;
[0008] 预处理每组用户的评估数据,得到多组标准评估数据;
[0009] 将所述多组标准评估数据进行分类,形成具有骨密度数据的标注数据集和不具有骨密度数据的无标注数据集;
[0010] 基于所述标注数据集和骨质状态标准训练分类器模型,得到骨质状态评估预模型;并基于所述无标注数据集不断迭代训练所述骨质状态评估预模型,得到骨质状态评估模型;所述骨质状态评估模型用于根据用户的评估数据输出用户当前的骨质状态。
[0011] 在其中一个实施例中,所述将所述多组标准评估数据进行分类,形成具有骨密度数据的标注数据集和不具有骨密度数据的无标注数据集的步骤包括:
[0012] 根据每组标准评估数据中,是否存在骨密度数据,将多组评估数据分为具有骨密度的标注数据集和不具有骨密度的无标注数据集;所述标注数据集中具有第一组数的评估数据,而无标注数据集中具有第二组数的评估数据,所述第一组数的值与所述第二组数的值的和值为所述多组的值。
[0013] 在其中一个实施例中,所述基于所述无标注数据集不断迭代训练所述骨质状态评估预模型包括:
[0014] 将所述第二组数的无标注数据集输入所述骨质状态评估预模型中,得到第二组数的无标注数据集的评估骨质状态和评估置信度,所述评估置信度与所述评估骨质状态对应;
[0015] 将所述评估置信度与预设的置信度进行比对,根据比对结果,将第二组数的无标注数据集划分为第三组数的高置信度的数据集和第四组数的低置信度的数据集;其中,所述第三组数的值与所述第四组数的值的和值为所述第二组数的值;
[0016] 基于所述第三组数的高置信度的数据集训练所述评估预模型,更新评估预模型的参数;
[0017] 将所述第四组数的低置信度的数据集输入所述更新参数后的骨质状态评估预模型中,得到第四组数的低置信度的数据集的评估骨质状态和评估置信度,并将评估置信度与预设的置信度进行比对,根据比对结构,将所述第四组数的低置信度的数据集进行再次划分,并基于所得高置信度的数据集更新更新参数后的骨质状态评估预模型,直至所得低置信度的数据集为空集。
[0018] 在其中一个实施例中,所述评估置信度指的是预测得到的评估骨质状态类别的概率;高置信度的数据集为评估置信度大于预设的置信度的数据集,低置信度的数据集为评估置信度小于预设的置信度的数据集,所述预设的置信度设置为0.8。
[0019] 在其中一个实施例中,所述预处理每组用户的评估数据包括:
[0020] 分析每组用户的评估数据,补全每组评估数据中缺失的数据,并去除错误的数据,得到每组用户的预评估数据;
[0021] 计算所述每组用户的预评估数据中,单项数据的信息增益,保留信息增益的值大于阈值的数据,去除信息增益的值小于阈值的数据;
[0022] 在保留的信息增益的值大于阈值的数据中,选取相关联的数据进行组合,保留组合所得数据并去除进行组合的数据,得到每组用户的标准评估数据。
[0023] 在其中一个实施例中,所述生命体征数据包括:性别、年龄、绝经年龄以及是否患有疾病并长期服药的数值;所述体态数据包括:身高、体重、胸围、胸围、腰围、臀围、臂长、体脂率、股骨长以及胫骨长的数值;所述骨密度数据包括:骨密度值和骨密度检测部位的数值;所述生活习性数据包括:籍贯、原籍生活时间、从事工作种类、每天日照时长、每日锻炼时长、是否吸烟及吸烟和每日吸烟数量、是否饮酒及饮酒数量、日常饮料偏好、有无中毒史、是否补、有无骨骼相关手术史及病史的数值。
[0024] 本发明还提供一种基于半监督学习的骨质状态评估模型的构建装置,包括:
[0025] 数据提取模,用于提取多组不同骨质状态的用户的评估数据,所述评估数据包括生命体征数据、体态数据、骨密度数据以及生活习性数据,所述评估数据为数值形式;
[0026] 预处理模块,用于预处理每组用户的评估数据,得到多组标准评估数据;
[0027] 分类模块,用于将所述多组标准评估数据进行分类,形成具有骨密度数据的标注数据集和不具有骨密度数据的无标注数据集;
[0028] 训练模块,用于基于所述标注数据集和骨质状态标准训练分类器模型,得到骨质状态评估预模型;并基于所述无标注数据集不断迭代训练所述骨质状态评估预模型,得到骨质状态评估模型;所述骨质状态评估模型用于根据用户的评估数据输出用户当前的骨质状态。
[0029] 本发明还提供一种基于半监督学习的骨质状态评估方法,包括:
[0030] 提取用户的评估数据;
[0031] 将所述评估数据输入预先建立的骨质状态评估模型,得到用户当前的骨质状态;
[0032] 输出与用户当前的骨质状态结果相对应的骨质状态改善建议;
[0033] 所述骨质状态评估模型应用如上所述的方法进行构建;
[0034] 所述骨质状态改善建议包括运动、饮食、健康照护的建议及避免的不良生活习性。
[0035] 本发明还提供一种基于半监督学习的骨质状态评估模型构建设备,包括处理器、存储器、总线及存储在存储器上并可在处理器上运行的计算机程序
[0036] 其中,所述处理器,存储器通过所述总线完成相互间的通信;
[0037] 所述处理器用于所述计算机程序时实现如上所述骨质状态评估模型构建方法的步骤。
[0038] 本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有骨质状态评估模型构建程序,所述骨质状态评估模型构建程序被处理器执行时实现如上所述骨质状态评估模型构建方法的步骤。
[0039] 从上面所述可以看出,本发明提供的基于半监督学习的骨质状态评估模型的构建方法,根据每组标准评估数据中,是否存在骨密度数据,将多组评估数据分为具有骨密度的标注数据集和不具有骨密度的无标注数据集,并基于所述标注数据集和骨质状态标准训练分类器模型,得到骨质状态评估预模型;并将无标注数据集输入所述骨质状态评估预模型中,得到评估骨质状态和与评估骨质状态对应的评估置信度,将评估置信度与预设的置信度进行对比,分为评估置信度大于预设的置信度的高置信度的数据集与评估置信度小于预设的置信度的低置信度的数据集,然后不断通过高置信度的数据集去更新骨质状态评估预模型的参数,直至低置信度的数据集为空,即形成了骨质状态评估模型。使得最终所得骨质状态评估模型,更加完善,能够更加准确的识别不具有骨密度数据的用户的骨质状态。附图说明
[0040] 图1为本发明实施例的基于半监督学习的骨质状态评估模型的构建方法的流程图
[0041] 图2为本发明实施例的基于半监督学习的骨质状态评估方法的流程图。

具体实施方式

[0042] 为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明进一步详细说明。
[0043] 请参阅图1,本发明实施例提供一种基于半监督学习的骨质状态评估模型的构建方法,包括:
[0044] 步骤S100,提取多组不同骨质状态的用户的评估数据,所述评估数据包括生命体征数据、体态数据、骨密度数据以及生活习性数据,所述评估数据为数值形式;
[0045] 步骤S200,预处理每组用户的评估数据,得到多组标准评估数据;
[0046] 步骤S300,将所述多组标准评估数据进行分类,形成具有骨密度数据的标注数据集和不具有骨密度数据的无标注数据集;
[0047] 步骤S400,基于所述标注数据集和骨质状态标准训练分类器模型,得到骨质状态评估预模型;并基于所述无标注数据集不断迭代训练所述骨质状态评估预模型,得到骨质状态评估模型;所述骨质状态评估模型用于根据用户的评估数据输出用户当前的骨质状态。
[0048] 步骤S100之前,还包括设计调查问卷,并通过线上电子卷和线下传播纸卷等方式,组织不同骨质状态的用户填写。不同骨质状态主要指骨质健康、骨质不足、骨质疏松等不同骨质状态的族群。该调查问卷主要依据骨质状态的标准设计,综合了相关文献中涉及的其他与骨质状态相关性较强的因素。
[0049] 调查问卷采集的信息主要包括:生命体征信息,主要包括性别、年龄、绝经年龄以及是否患有疾病并长期服药等;体态信息,主要包括身高、体重、胸围、胸围、腰围、臀围、臂长、体脂率、股骨长以及胫骨长等;骨密度信息,主要包括骨密度值和骨密度检测部位;生活习性信息,主要包括籍贯、原籍生活时间、从事工作种类、每天日照时长、每日锻炼时长、是否吸烟及吸烟和每日吸烟数量、是否饮酒及饮酒数量、日常饮料偏好、有无中毒史、是否补钙、有无骨骼相关手术史及病史等。
[0050] 步骤S100中,所述提取多组不同骨质状态的用户的评估数据,具体指的是,应用字符识别的方法,识别多份调查问卷中的各项信息,提取出调查问卷中的各项评估数据。应当说明的是,所得的评估数据的形式为数值形式。一组评估数据即指从一份调查问卷中提取的所有数值。
[0051] 具体地,所述生命体征数据包括:性别、年龄、绝经年龄以及是否患有疾病并长期服药等数值;所述体态数据包括:身高、体重、胸围、胸围、腰围、臀围、臂长、体脂率、股骨长以及胫骨长等数值;所述骨密度数据包括:骨密度值和骨密度检测部位等数值;所述生活习性数据包括:籍贯、原籍生活时间、从事工作种类、每天日照时长、每日锻炼时长、是否吸烟及吸烟和每日吸烟数量、是否饮酒及饮酒数量、日常饮料偏好、有无中毒史、是否补钙、有无骨骼相关手术史及病史等数值。
[0052] 步骤S200中,预处理每组用户的评估数据的步骤可以包括:
[0053] S210,分析每组用户的评估数据,查找评估数据中是否存在某项数据的缺失,是否存在某项数据的填写错误等情况。
[0054] 当发现存在某项数据的缺失时,对该项数据采用相应的数值进行补全。例如,当问卷中生命体征数据中性别为男性时,绝经年龄数据缺失;当问卷中生活习性数据中是否吸烟为否时,每日吸烟量数据缺失;对于类似的情况,将缺失的数据填写为数值-1。
[0055] 当发现存在某项数据的填写错误时,对该项数据进行去除。例如,当问卷中生命体征数据中性别为男性时,填写了绝经年龄数据;当问卷中生活习性数据中原籍生活时间大于年龄;对于类似的情况,将错误的数据去除。
[0056] S220,将经过步骤S210处理后所得数据,通过计算,进行数据的去除。主要为计算每项数据的信息增益,并将每组调查问卷中的各项数据根据信息增益的值进行降序排列,保留列表中前80~90%的数据。具体地,计算每项数据的信息增益即分别计算每项数据存在和缺失时调差问卷系统中的信息量的值,并计算两者的差值,该差值即为信息增益的值。
[0057] S230,在经过步骤S220处理后所得数据中,选取相关联的数据进行组合,形成新的数据。组合之后,保留新的数据,去除进行组合的数据,形成标准评估数据。组合形式可以为相加也可以为相乘等操作。例如烟龄和每日吸烟量为关联的数据,经过相乘的操作,形成总吸烟量的数据。则在该组数据中,去除烟龄和每日吸烟量,保留总吸烟量。
[0058] 经过预处理之后,可以使评估数据更加准确,更加有效,提高模型构建的效率,以及所得模型的精度
[0059] 步骤S300中,将经步骤S200所得标准评估数据进行分类,是指根据每组标准评估数据中,是否存在骨密度数据,而将多组评估数据分为两组数据集。并将具有骨密度的数据集命名为标注数据集,而将不具有骨密度的数据集命名为无标注数据集。标注数据集中具有第一组数的评估数据,而无标注数据集中具有第二组数的评估数据。也就是说,所述第一组数的值与所述第二组数的值的和值为所述多组的值。
[0060] 步骤S400中,所述基于所述标注数据集和骨质状态标准训练分类器模型的步骤中,可以使用LR(逻辑斯特)回归模型。应当说明的是,该分类器模型并不唯一,只要是能够运用半监督机器学习算法的都可以,例如LR(逻辑斯特)回归、SVM(支持向量机)、NN(神经网络)、Decision Tree(决策树)、RF (随机森林)、xgboost(极端梯度提升)等等。
[0061] 利用逻辑斯特回归模型得到骨质状态评估预模型的步骤具体包括,在线性回归的基础上,将所述标注数据集中的各项数据进行线性组合,再将组合的结果通过一层sigmoid函数映射成结果是1或是0的概率。通过梯度下降法经过一定步数的迭代,得到LR模型的参数,即得到骨质状态评估预模型。具体来说,是在线性回归的基础上,将标注数据集中的相同类型的数据进行线性组合,再将线性组合后的生命体征数据、体态数据、骨密度数据以及生活习性数据与骨质状态相对应。
[0062] 具体地,LR回归模型的表达式为参数化的逻辑斯特函数,如式(I)所示[0063]
[0064] 其中,x为标注数据集中的一项数据,θ为权值向量,即需要训练的x的参数,θTx即为标注数据集中的一项数据的线性组合。
[0065] 具体的训练过程可以为:将组合的结果通过一层sigmoid函数映射成结果是1或是0或是的概率,指的是,给定一组标准评估数据,通过式(Ⅱ)所示的目标函数和式(Ⅲ)所示的Sigmoid函数,求解出参数θ,即可得到该组评估数据的预测结果为1的概率,若概率大于
0.5,则表明属于该类别,若小于 0.5,则表明不属于该类别。类别即代表骨质状态中的任意一种状态。
[0066]
[0067] 也就是说,所得骨质状态评估预模型能够根据用户的评估数据输出用户当前的骨质状态。
[0068] 所述基于所述无标注数据集不断迭代训练所述骨质状态评估预模型包括:
[0069] S421,将所述第二组数的无标注数据集输入所述骨质状态评估预模型中,得到第二组数的无标注数据集的评估骨质状态和评估置信度。具体地,每组数的无标注数据集都具有评估骨质状态和与所述评估状态对应的评估置信度。
[0070] S422,将所述评估置信度与预设的置信度进行比对,根据比对结果,将第二组数的无标注数据集划分为第三组数的高置信度的数据集和第四组数的低置信度的数据集;其中,所述第三组数的值与所述第四组数的值的和值为所述第二组数的值;
[0071] 具体地,评估置信度指的是预测得到的评估骨质状态类别的概率。高置信度的数据集为评估置信度大于预设的置信度的数据集,低置信度的数据集为评估置信度小于预设的置信度的数据集,预设的置信度可以设置为0.8。S423,基于所述第三组数的高置信度的数据集训练所述评估预模型,更新评估预模型的参数;
[0072] S424,将所述第四组数的低置信度的数据集输入所述更新参数后的骨质状态评估预模型中,得到第四组数的低置信度的数据集的评估骨质状态和评估置信度,并将评估置信度与预设的置信度进行比对,根据比对结构,将所述第四组数的低置信度的数据集进行再次划分,并基于所得高置信度的数据集更新更新参数后的骨质状态评估预模型,直至所得低置信度的数据集为空集。
[0073] 步骤S421至S424可以理解为,将第二组数的无标注数据集输入所述骨质状态评估预模型中,进行分类,分为评估骨质状态可信度高的高置信度的数据集和评估骨质状态可信度低的低置信度的数据集,然后不断通过高置信度的数据集去更新骨质状态评估预模型的参数,直至全部评估骨质状态都具有高的可信度,即形成了骨质状态评估模型。
[0074] 较佳地,步骤S423和S424中,在更新模型的参数时,引入正则项,可以避免过拟合的问题。通过惩罚过大的参数来防止过拟合。
[0075] 本发明实施例还提供一种,基于半监督学习的骨质状态评估模型的构建装置,包括:
[0076] 数据提取模块,用于提取多组不同骨质状态的用户的评估数据,所述评估数据包括生命体征数据、体态数据、骨密度数据以及生活习性数据,所述评估数据为数值形式;
[0077] 预处理模块,用于预处理每组用户的评估数据,得到多组标准评估数据;
[0078] 分类模块,用于将所述多组标准评估数据进行分类,形成具有骨密度数据的标注数据集和不具有骨密度数据的无标注数据集;
[0079] 训练模块,用于基于所述标注数据集和骨质状态标准训练分类器模型,得到骨质状态评估预模型;并基于所述无标注数据集不断迭代训练所述骨质状态评估预模型,得到骨质状态评估模型;所述骨质状态评估模型用于根据用户的评估数据输出用户当前的骨质状态。
[0080] 本发明提供的基于半监督学习的骨质状态评估模型的构建方法,根据每组标准评估数据中,是否存在骨密度数据,将多组评估数据分为具有骨密度的标注数据集和不具有骨密度的无标注数据集,并基于所述标注数据集和骨质状态标准训练分类器模型,得到骨质状态评估预模型;并将无标注数据集输入所述骨质状态评估预模型中,得到评估骨质状态和与评估骨质状态对应的评估置信度,将评估置信度与预设的置信度进行对比,分为评估置信度大于预设的置信度的高置信度的数据集与评估置信度小于预设的置信度的低置信度的数据集,然后不断通过高置信度的数据集去更新骨质状态评估预模型的参数,直至低置信度的数据集为空,即形成了骨质状态评估模型。使得最终所得骨质状态评估模型,更加完善,能够更加准确的识别不具有骨密度数据的用户的骨质状态。
[0081] 请参阅图2,本发明实施例还提供一种基于半监督学习的骨质状态评估方法,包括:
[0082] S500,提取用户的评估数据;
[0083] S600,将所述评估数据输入预先建立的骨质状态评估模型,得到用户当前的骨质状态;
[0084] S700,输出与用户当前的骨质状态结果相对应的骨质状态改善建议;
[0085] 其中,步骤S600中,所述骨质状态评估模型应用上述的方法进行构建所得。
[0086] 步骤S700中,骨质状态改善建议包括运动、饮食、健康照护的建议及避免的不良生活习性。
[0087] 本发明实施例还提供一种基于半监督机器学习的骨质状态评估模型的构建设备,包括:处理器、存储器、总线及存储在存储器上并可在处理器上运行的计算机程序;
[0088] 其中,所述处理器,存储器通过所述总线完成相互间的通信;
[0089] 所述处理器执行所述计算机程序时实现如上所述的方法。
[0090] 本发明实施例所述骨质状态评估模型的构建设备的各功能模块的功能可根据上述方法实施例中的方法具体实现,其具体实现过程可以参照上述方法实施例的相关描述,此处不再赘述。
[0091] 本发明实施例还提供一种非暂态计算机可读存储介质,所述存储介质上存储有骨质状态评估模型构建程序,该计算机程序被处理器执行时实现如上所述的方法。
[0092] 本发明实施例所述的计算机可读存储介质的各功能模块的功能可根据上述方法实施例中的方法具体实现,其具体实现过程可以参照上述方法实施例的相关描述,此处不再赘述。
[0093] 需要说明的是,本发明实施例中所有使用“第一”和“第二”的表述均是为了区分两个相同名称非相同的实体或者非相同的参量,可见“第一”“第二”仅为了表述的方便,不应理解为对本发明实施例的限定,后续实施例对此不再一一说明。
[0094] 所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本公开的范围(包括权利要求)被限于这些例子;在本发明的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,步骤可以以任意顺序实现,并存在如上所述的本发明的不同方面的许多其它变化,为了简明它们没有在细节中提供。
[0095] 另外,为简化说明和讨论,并且为了不会使本发明难以理解,在所提供的附图中可以示出或可以不示出与集成电路(IC)芯片和其它部件的公知的电源 /接地连接。此外,可以以框图的形式示出装置,以便避免使本发明难以理解,并且这也考虑了以下事实,即关于这些框图装置的实施方式的细节是高度取决于将要实施本发明的平台的(即,这些细节应当完全处于本领域技术人员的理解范围内)。在阐述了具体细节(例如,电路)以描述本发明的示例性实施例的情况下,对本领域技术人员来说显而易见的是,可以在没有这些具体细节的情况下或者这些具体细节有变化的情况下实施本发明。因此,这些描述应被认为是说明性的而不是限制性的。
[0096] 尽管已经结合了本发明的具体实施例对本发明进行了描述,但是根据前面的描述,这些实施例的很多替换、修改和变型对本领域普通技术人员来说将是显而易见的。例如,其它机器学习算法(例如,LR(逻辑斯特)回归、SVM(支持向量机)、NN(神经网络)、Decision Tree(决策树)、RF(随机森林)、xgboost (极端梯度提升))可以使用所讨论的实施例。
[0097] 本发明的实施例旨在涵盖落入所附权利要求的宽泛范围之内的所有这样的替换、修改和变型。因此,凡在本发明的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本发明的保护范围之内。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈