专利类型 | 发明公开 | 法律事件 | 公开; 实质审查; |
专利有效性 | 实质审查 | 当前状态 | 实质审查 |
申请号 | CN202411789589.8 | 申请日 | 2024-12-06 |
公开(公告)号 | CN119622343A | 公开(公告)日 | 2025-03-14 |
申请人 | 澳门理工大学; | 申请人类型 | 学校 |
发明人 | 黄智谦; | 第一发明人 | 黄智谦 |
权利人 | 澳门理工大学 | 权利人类型 | 学校 |
当前权利人 | 澳门理工大学 | 当前权利人类型 | 学校 |
省份 | 当前专利权人所在省份:澳门 | 城市 | 当前专利权人所在城市: |
具体地址 | 当前专利权人所在详细地址:中国澳门高美士街澳门理工大学 | 邮编 | 当前专利权人邮编: |
主IPC国际分类 | G06F18/214 | 所有IPC国际分类 | G06F18/214 ; G06F18/25 ; G06F18/211 ; G06F18/20 ; G06F18/241 ; G06N3/08 ; G06N3/0499 ; A63B24/00 |
专利引用数量 | 0 | 专利被引用数量 | 0 |
专利权利要求数量 | 10 | 专利文献类型 | A |
专利代理机构 | 珠海智专专利商标代理有限公司 | 专利代理人 | 林永协; |
摘要 | 本 发明 提供一种运动员比赛表现 预测模型 训练方法、预测方法、计算机装置、介质及程序产品,该方法包括以下步骤:获取运动员历史表现评价数据集;获取运动员热身赛表现评价数据集;整合运动员历史表现评价数据集和运动员热身赛表现评价数据集,得到比赛运动员表现预测特征数据集;基于比赛运动员表现预测特征数据集,训练基于多层 感知 器的 深度神经网络 预测模型。本发明训练得到的深度神经网络预测模型具有较高的准确度和较好的收敛能 力 ,实现基于运动员在热身运动中的表现进行比赛表现的预测,辅助教练员和分析师进行决策。 | ||
权利要求 | 1.一种运动员比赛表现预测模型训练方法,其特征在于,包括以下步骤: |
||
说明书全文 | 运动员比赛表现预测模型训练方法、预测方法、计算机装置、介质及程序产品 技术领域背景技术[0002] 传统对运动员在赛场上表现的预测往往是基于经验。由于大多数教练员缺乏数学或统计学背景,目前大多数决策,如首发和赛场表现预测,仍然严重依赖教练员和分析师基于球员在比赛当天的状态、赛前热身运动中的表现进行预测。然而,这种基于传统的基于经验主义的预测是一种主观的预测方法,其判断往往受到多种主观因素的影响,如运动员所属的俱乐部、联赛竞争力、俱乐部地域、歧视偏见的影响,这种预测不够客观。 [0003] 随着大数据和机器学习的快速发展,机器学习、数据分析等技术开始被应用在体育领域中,通过收集运动员历史数据进行分析,可以实现对运动员未来表现的定量预测。 [0004] 然而,现有的运动员表现预测分析非常少。许多运动是以团队为基础的运动,运动员赛场的表现取决于他们的历史表现、临近比赛的状态、在场上的位置、出场阵型、俱乐部隶属关系、联赛竞争力等因素,因此预测难度较大。 [0005] 此外,一些现有的预测模型使用相对简单的机器学习技术,如支持向量机、决策树和逻辑回归。然而,这些模型的预测精度较低,对具有多特征的数据集的适用性较差。由于运动员表现的预测涉及多个具有多特征的数据集,因此,需要更复杂的机器学习解决方案来对具有多特征的数据集进行预测,并保持相对准确的预测结果。 发明内容[0006] 本发明的第一目的是提供一种提高运动员表现预测准确度的运动员比赛表现预测模型训练方法。 [0007] 本发明的第二目的是提供一种提高运动员表现预测准确度的运动员比赛表现预测方法。 [0008] 本发明的第三目的是提供一种实现上述提高运动员表现预测准确度的运动员比赛表现预测模型训练方法和运动员比赛表现预测方法的计算机装置。 [0009] 本发明的第四目的是提供实现上述提高运动员表现预测准确度的运动员比赛表现预测模型训练方法和运动员比赛表现预测方法的计算机程序产品。 [0010] 为了实现上述的第一目的,本发明提供的一种运动员比赛表现预测模型训练方法,其中,包括以下步骤:获取运动员历史表现评价数据集;获取运动员热身赛表现评价数据集;整合运动员历史表现评价数据集和运动员热身赛表现评价数据集,得到比赛运动员表现预测特征数据集;基于比赛运动员表现预测特征数据集,训练基于多层感知器的深度神经网络预测模型。 [0011] 由上述方案可见,本发明通过对运动员历史表现评价数据集和运动员热身赛表现评价数据集进行融合和扩展,得到完整的比赛运动员表现预测特征数据集,从而建立多输出模型对运动员表现进行预测。本发明解决现有对运动员表现预测过于依赖主观经验、运动员表现数据不足的问题。相对于现有的大部分采用简单的机器学习技术的预测模型,仅在小规模的数据集取得较好预测效果的问题,本发明可以较好地应用在多个具有多特征的数据集中,具有较高的准确度和较好的收敛能力。 [0012] 进一步的方案是,对运动员表现历史数据和运动员热身表现数据均进行特征重要性分析,得到运动员历史表现评价数据集和运动员热身赛表现评价数据集。 [0013] 由此可见,通过特征重要性分析可以确定对运动员表现历史数据和运动员热身表现数据中最具影响力的特征,剔除不相关或冗余特征,从而提高后续基于获取的比赛运动员表现预测特征数据集得到的深度神经网络预测模型的训练效率和准确性。 [0014] 进一步的方案是,获取运动员表现历史数据;对运动员表现历史数据进行预处理,得到历史表现数据集;根据历史表现数据集训练第一预测模型,第一预测模型用于输出运动员在下一场比赛首发上场的概率;结合第一预测模型对历史表现数据集进行特征重要性分析以优化历史表现数据集,得到运动员历史表现评价数据集。 [0015] 进一步的方案是,获取运动员热身表现数据;对运动员热身表现数据进行预处理,得到热身表现数据集;根据热身表现数据集训练第二预测模型,第二预测模型用于输出运动员下一场比赛进球或不进球的分类预测;结合第二预测模型对热身表现数据集进行特征重要性分析以优化热身表现数据集,得到运动员热身赛表现评价数据集。 [0016] 进一步的方案是,得到热身表现数据集后,根据热身表现数据集训练第二预测模型前,包括以下步骤:对热身表现数据集进行特征提取,并且进行特征重要性分析筛选出具有影响力的特征;确定数据标签,根据数据标签重新调整热身表现数据集。 [0017] 由此可见,可以在训练第二预测模型前先初步筛选数据集的特征并确定数据标签,提高后续模型训练的效率和准确性。 [0019] 由此可见,通过聚类分析可以较好地辅助确定数据标签。 [0020] 进一步的方案是,通过运动员穿戴的具有数据采集功能的装置采集得到运动员热身表现数据。 [0021] 由此可见,直接从运动员穿戴的装置中获取热身表现数据,采集方式高效,方便实施。 [0022] 为了实现上述的第二目的,本发明提供的一种运动员比赛表现预测方法,其中:获取上述的深度神经网络预测模型;获取运动员比赛前的热身数据;根据深度神经网络预测模型输出运动员比赛前的热身数据对应的目标预测表现结果。 [0023] 由上述方案可见,本发明通过获取运动员在热身运动中的表现,基于深度神经网络预测模型定量预测运动员的表现和比赛趋势,并在一定程度上为预测结果提供数据支持,使教练员和分析师能更直观、客观地考察整个比赛并及时做出反应。 [0024] 为了实现上述的第三目的,本发明提供的一种计算机装置,包括处理器和存储器,其中:存储器上存储有计算机程序,计算机程序被处理器执行时实现上述的运动员比赛表现预测模型训练方法或上述的运动员比赛表现预测方法。 [0027] 图2是本发明运动员比赛表现预测模型训练方法实施例中确定运动员热身赛表现评价数据集的流程图。 [0028] 图3是本发明运动员比赛表现预测模型训练方法实施例中确定深度神经网络预测模型的流程图。 [0030] 图5是本发明运动员比赛表现预测方法实施例的流程图。 [0031] 图6是本发明运动员比赛表现预测方法实施例中应用深度神经网络预测模型进行预测的示例图。 [0032] 以下结合附图及实施例对本发明作进一步说明。 具体实施方式[0033] 本发明的运动员比赛表现预测模型训练方法基于运动员比赛表现预测模型训练方法训练得到深度神经网络预测模型。本发明的运动员比赛预测方法将采集到的运动员比赛前的热身数据输入上述的深度神经网络预测模型,得到预测结果。 [0034] 运动员比赛表现预测模型训练方法实施例: [0035] 本实施例通过执行计算机程序实现,首先获取运动员表现历史数据和运动员热身表现数据,然后对运动员表现历史数据进行特征重要性分析以得到运动员历史表现评价数据集,对运动员热身表现数据进行特征重要性分析以得到运动员热身赛表现评价数据集。然后,融合运动员历史表现评价数据集和运动员热身赛表现评价数据集得到比赛运动员表现预测特征数据集。最后,基于比赛运动员表现预测特征数据集,训练基于多层感知器的深度神经网络预测模型。 [0036] 本实施例以应用于足球比赛的运动员表现预测的情形进行说明,可以理解,在其他的实施例中,本发明还可以应用在篮球、排球、橄榄球、网球等运动的运动员表现预测中。 [0037] 参见图1,获取运动员历史表现评价数据集包括以下步骤: [0038] S11:获取运动员表现历史数据。 [0039] 其中,运动员表现历史数据为运动员过去一段时间内的在比赛中表现的数据。本实施例中,运动员表现历史数据包括但不限于:比赛日期、主客球队信息、运动员的进球数、纪律记录、助攻次数、角球数目、传球和触底得分码、触地球分数、冲刺码数、冲次达阵、出场阵容、球员位置、比赛胜负等信息。 [0041] S12:对运动员表现历史数据进行预处理,得到历史表现数据集。 [0042] S13:根据历史表现数据集训练第一预测模型。 [0043] 其中,将历史表现数据集分为训练集和测试集,建立第一预测模型并进行训练。第一预测模型输出每位运动员在下一场比赛首发上场的概率。 [0044] 可选的,第一预测模型还可以按照运动员的位置或特质进行分类,并输出该运动员在下一场比赛首发上场的位置的预测概率。针对足球运动员的分类,按照运动员的位置分类包括但不限于后卫、中场、前锋等。 [0045] 对于第一预测模型的评价指标,采用均方根误差(Root Mean Square Error,RMSE)和平均绝对误差(Mean Abso l ute Error,MAE)。 [0046] S14:结合第一预测模型对历史表现数据集进行特征重要性分析以优化历史表现数据集,得到运动员历史表现评价数据集。 [0047] 通过历史表现数据集进行特征重要性分析,可以找到对第一预测模型输出最具影响力的特征,从而将对第一预测模型输出最具影响力的特征作为第一预测模型的输入,第一预测模型输出每位运动员的在下一场比赛首发上场的概率。根据对第一预测模型输出最具影响力的特征调整历史表现数据集,可以得到运动员历史表现评价数据集。 [0048] 参见图2,获取运动员热身赛表现评价数据集包括以下步骤: [0049] S21:获取运动员热身表现数据。 [0050] 其中,运动员热身表现数据包括但不限于运动员的跑动距离、最高速度、冲刺次数、爆发力、实时心率、心脏监测、运动员健康、职业生涯中的伤病及身体其他部位伤病监测等信息。 [0051] 本实施例中,通过运动员穿戴的具有数据采集功能的装置采集得到运动员热身表现数据,具体是在每场比赛之前的热身运动中进行采集。 [0053] S22:对运动员热身表现数据进行预处理,得到热身表现数据集。 [0054] S23:对热身表现数据集进行特征提取,并且进行特征重要性分析筛选出具有影响力的特征。 [0055] S24:确定数据标签,根据数据标签重新调整热身表现数据集。 [0056] 其中,对于步骤S23中确定的具有影响力的特征,通过K均值聚类(K‑Means)算法进行分析,将度量距离设为欧几里得距离,并结合现有技术的簇内离差平方和拐点法和轮廓系数法选取最佳K值。 [0057] 通过对通过运动员穿戴的具有数据采集功能的装置采集到的运动员的运动轨迹和技术表现进行分析,将技术的准确率和成功率作为衡量运动员水平的重要指标,同时,还可考虑主客双方球队的表现,并参考一个多维度的事件轴,对数据进行标签,并得到相对完整的数据集,即重新调整后的热身表现数据集。 [0058] S25:根据重新调整后的热身表现数据集训练第二预测模型。 [0059] 其中,将热身表现数据集分为训练集和测试集,建立第二预测模型,并确定评价指标以训练该第二预测模型。第二预测模型的输出为每位运动员在下一场比赛进球或不进球的分类预测。 [0060] S26:结合第二预测模型对热身表现数据集进行特征重要性分析以优化热身表现数据集,得到运动员热身赛表现评价数据集。 [0061] 通过重新调整后的热身表现数据集进行特征重要性分析,可以找到对第二预测模型输出最具影响力的特征,从而将对第二预测模型输出最具影响力的特征作为第二预测模型的输入,第二预测模型输出的输出为每位运动员在下一场比赛进球或不进球的分类预测。根据对第二预测模型输出最具影响力的特征调整热身表现数据集,可以得到运动员热身赛表现评价数据集。 [0062] 参见图3,训练基于多层感知器的深度神经网络预测模型包括以下步骤: [0063] S31:获取运动员历史表现评价数据集。 [0064] S32:获取运动员热身赛表现评价数据集。 [0065] 其中,运动员历史表现评价数据集来源于上述步骤S14,运动员热身赛表现评价数据集来源于上述步骤S26。 [0066] S33:整合运动员历史表现评价数据集和运动员热身赛表现评价数据集,得到比赛运动员表现预测特征数据集。 [0067] 其中,将运动员技术统计和比赛条件等关键因素与现有的特征标签进行拓展,包括将不同数据源的数据通过数据链接进行拓展,构建更完整和综合的数据集合。由此,整合得到一个完整的比赛运动员表现预测特征数据集。 [0068] S34:基于比赛运动员表现预测特征数据集,训练基于多层感知器的深度神经网络的深度神经网络预测模型。 [0069] 其中,将比赛运动员表现预测特征数据集分为训练集和测试集,建立深度神经网络预测模型,确定深度神经网络预测模型的评价指标,进行深度神经网络预测模型的训练。深度神经网络预测模型用于预测每位运动员在赛场的表现。 [0070] 深度神经网络预测模型为基于多层感知器的深度神经网络多输出预测模型,其中,准确率(Accuracy)、召回率(Reca l l)、均方根误差(Root Mean Square Error,RMSE)和F1值(F1 Score)等一系列衡量模型性能的指标可被用作该模型的评价指标。 [0071] 参见图4,深度神经网络预测模型基于多层感知器、宽输入和残差连接的神经网络。深度神经网络预测模型的输入层包含连续特征、分类特征和二进制特征层。为了使模型学习能力更强,可解析模型宽度较宽,该深度神经网络预测模型具有多个隐藏层。对于运动员表现的预测是一个多输出预测,因此该模型是一个多输出结构。 [0072] 运动员比赛表现预测方法实施例: [0073] 参见图5,本实施例基于上述实施例的深度神经网络预测模型,具体包括以下步骤: [0074] S41:获取深度神经网络预测模型。 [0075] S42:获取运动员比赛前的热身数据。 [0076] S43:根据深度神经网络预测模型输出运动员比赛前的热身数据对应的目标预测表现结果。 [0077] 由此,通过采集运动员比赛前的热身数据可以预测运动员在该场比赛的表现。教练员可以根据各种预测结果,在赛前综合考虑调配合适的首发。 [0078] 参见图6,图示出了应用深度神经网络预测模型进行预测的示例。图6中左箭头表示状态良好,平箭头表示状态一般,下箭头表示状态不好。由此实现在比赛前,通过运动员穿戴的具有数据采集功能的设备采集到的赛前热身数据,并输入到深度神经网络预测模型中以快速知道球员的状态水平,再以类似的图形用户界面的方式显示给教练,辅助教练做决策。 [0079] 综上,本发明通过对运动员历史表现评价数据集和运动员热身赛表现评价数据集进行融合和扩展,得到完整的比赛运动员表现预测特征数据集,从而建立多输出模型对运动员表现进行预测。本发明解决现有对运动员表现预测过于依赖主观经验、运动员表现数据不足的问题。相对于现有的大部分采用简单的机器学习技术的预测模型,仅在小规模的数据集取得较好预测效果的问题,本发明可以较好地应用在多个具有多特征的数据集中,具有较高的准确度和较好的收敛能力。本发明训练得到的深度神经网络预测模型具有较高的准确度和较好的收敛能力,实现基于运动员在热身运动中的表现进行比赛表现的预测,辅助教练员和分析师进行决策。 [0080] 计算机装置实施例: [0081] 本实施例的计算机装置包括处理器与存储器,存储器存储有计算机程序,处理器执行计算机程序时实现上述的运动员比赛表现预测模型训练方法实施例或运动员比赛表现预测方法实施例。 [0082] 计算机装置可包括但不限于处理器与存储器。本领域技术人员可以理解,计算机装置可以包括更多或更少的部件,或者组合某些部件,或者不同的部件,例如计算机装置还可以包括输入输出设备、网络接入设备、总线等。 [0083] 例如,处理器可以是中央处理单元(Centra l Processi ng Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digita l Signa lProcessor,DSP)、专用集成电路(App l ication Specifi c I ntegrated Ci rcuit,ASIC)、现成可编程门阵列(Fie l d Programmab l e Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微控制器或者该处理器也可以是任何常规的处理器等。处理器是计算机装置的控制中心,利用各种接口和线路连接整个计算机装置的各个部分。 [0084] 存储器可用于存储计算机程序和/或模块,控制器通过运行或执行存储在存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现计算机装置的各种功能。例如,存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(例如声音接收功能、声音转换成文字功能等)等;存储数据区可存储根据手机的使用所创建的数据(例如音频数据、文本数据等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Med ia Card,SMC),安全数字(Secure Digita l,SD)卡,闪存卡(F l ash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。 [0085] 上述实施例的计算机装置集成的模块如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。基于这样的理解,实现上述的运动员比赛表现预测模型训练方法实施例或运动员比赛表现预测方法实施例的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,计算机程序可存储于一计算机可读存储介质中,该计算机程序在被控制器执行时,可实现上述的运动员比赛表现预测模型训练方法实施例或运动员比赛表现预测方法实施例的步骤。其中,计算机程序包括计算机程序代码,计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。存储介质可以包括:能够携带计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-On l y Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。 [0086] 计算机程序产品实施例: [0087] 本实施例的计算机程序产品包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述的运动员比赛表现预测模型训练方法实施例或运动员比赛表现预测方法实施例的各个步骤。 |