首页 / 专利库 / 道路 / 停车场 / 停车位 / 基于车联网的智能客服系统

基于车联网的智能客服系统

阅读:1029发布:2020-07-12

专利汇可以提供基于车联网的智能客服系统专利检索,专利查询,专利分析的服务。并且本 发明 公开一种基于车联网的智能客服系统,包括:AI即时通讯、 机器学习 、智能工单、海量 知识库 、智能客户应用模 块 、后台管理模块;所述AI即时通讯包括自助服务模块和消息处理模块;所述消息处理模块采用自然 语义处理 技术,结合海量知识库进行机器学习,对车主反馈的问题进行快速分类,并与海量知识库比对,给出最佳匹配解决方案。本发明致 力 于提供 汽车 AI助手产品,为车主提供变革式、智能化的疑难解答、车辆诊断、智慧出行服务。将原有被动的电话反馈模式转换为主动关怀和及时多样的互联网反馈模式。利用本发明的车载端应用获取的用户和车辆数据,智能客服系统可快速为车主提供的精准服务。,下面是基于车联网的智能客服系统专利的具体信息内容。

1.一种基于车联网的智能客服系统,包括:AI即时通讯、机器学习、智能工单、海量知识库、智能客户应用模、后台管理模块;
所述AI即时通讯包括自助服务模块和消息处理模块;所述自助服务模块采用智能引导技术,车主可借助机器人客服进行常见问题自助处理,自助新办业务、自助查询在办业务;
所述消息处理模块采用自然语义处理技术,结合机器学习,对车主反馈的问题进行快速分类,并与海量知识库比对,给出最佳匹配解决方案;
所述智能工单将所述AI即时通讯反馈的最佳匹配解决方案直接反馈给车主;
所述智能客户应用模块包括统一文言回复、语音语义识别、客户需求预测、知识关联呈现、智能业务场景、营销管理;
所述后台管理模块包括知识管理,业务管理,工单管理,报表管理,用户管理,客服监控及管理,排班、预测、HR、绩效管理。
2.根据权利要求1所述的基于车联网的智能客服系统,其特征在于,所述自助服务模块包括IVR、FAQ、业务办理、业务查询、业务咨询、智能引导;所述消息处理模块包括若干语音/语义识别引擎识别单元。
3.根据权利要求1所述的基于车联网的智能客服系统,其特征在于,该智能客服系统包括如下功能:
在线客服应答:
车主可通过车载或手机端的即时通讯模块使用语音、文字、图片、视频等形式向客服人员反馈或咨询车辆相关问题;
AI语义理解与知识库:对车主反馈的信息进行语义泛化处理,对所得语料进行文本特征提取,赋予每个扩展特征一权重值,以表征每一扩展特征对海量知识库主题识别的贡献度,提高知识库匹配识别的准确度。;
专营店管理与工单分配:车厂根据需求对专营店的地址、电话、人员、服务内容等信息进行管理和上下架操作。客服人员根据预设权重向专营店下达维修或保养工单,为专营店分配适合的业务;
车辆数据诊断与在线升级:主动采集车辆故障和系统日志信息,并存储于车厂指定服务器。对故障特征进行分类,将准确的解决方案主动推送给车主,并可通过远程升级的刷写功能快速解决系统问题;
智慧出行与无感支付模块:智能引导车主驶入指定停车场指定停车位,智能引导车主驶入最便捷的加油站的指定加油位。驶离停车场或加油站时,汽车AI助手自动为车主支付相应费用,并享受折扣优惠,缴费过程无需车主干预。
4.根据权利要求1所述的基于车联网的智能客服系统,其特征在于,该智能客服系统包括如下基础服务:
感应窗:车主通过车载端应用使用语音识别反馈问题,获取问题答案;
感应号:车主通过手机端微信公众号反馈车辆问题,感受贴心服务;
智能工单:客服人员根据车辆情况和车主信息向专营店下达维修或保养工单;
备件管理:专营店可对车辆备件进行库存管理,并可按需向供应商申请邮寄备件;
培训考核:车厂可下发培训资料或考题给专营店人员,通过公众号进行学习和测试;
超级大脑-知识库:设有专业知识库,为车主智能匹配最佳解决方案,并通过机器学习不断完善;
汽车服务锦囊:移动端为车主推荐车辆配件和服务,实现在线订购;
车辆诊断:自动获取车辆故障码信息并上报至车厂或专营店;
远程控制:可远程为车主进行开关、车窗,调节空调,点火熄火等操作;
远程升级:对车载系统、应用或ECU模块进行远程升级。
5.根据权利要求1所述的基于车联网的智能客服系统,其特征在于,该智能客服系统包括如下增值服务:
智能停车:为车主智能筛选推荐附近可用的停车场,引导车主行驶至合适的停车位,通过智能客服系统支付可享受折扣优惠;
智能加油:为车主智能筛选推荐附近或沿途优质的加油站,车主通过智能客服系统支付可享受免下车加油服务及折扣优惠;
自动支付:车载应用可绑定行卡或支付宝、微信等第三方支付工具,车主驶离停车场、高速公路或完成加油后可自动支付相应费用。
6.一种基于车联网的智能语音客服系统,其特征在于,该智能客服系统载体包括:
服务器;
车载终端,其与云服务器通讯连接,该车载终端配置有智能语音客服程序;所述智能语音客服程序包括用户数据服务器、语音识别单元、会话管理单元、信源数据捜索处理单元;
所述用户数据服务器用于收集车载终端登录的用户信息;
所述语音识别单元用于采集车载终端包含客户问题的语音信息,并转化为与客户问题对应的系统指令反馈给云服务器进行解答;
所述信源数据捜索处理单元用于以队列网关形式采集车载终端及车载终端加载的第三方应用的信息输入管理;
所述会话管理单元用于协调语音识别模块与车载终端加载的第三方应用的信息输入管理。
7.根据权利要求6所述的基于车联网的智能语音客服系统,其特征在于,所述语音识别单元包括初始化智能模块、语音识别模块、文本识别模块,所述初始化智能模块获取车载终端的语音信息和文本信息,并予以识别,当其为语音信息时,经语音识别模块的语音转文本处理后,反馈给文本识别模块;当为文本信息时直接反馈给文本识别模块;所述文本识别模块将识别后的文字反馈给云服务器。
8.根据权利要求6所述的基于车联网的智能语音客服系统,其特征在于,该智能语音客服系统还包括一知识库,其包括常见问题部分与机器学习部分,常见问题部分由工作人员手动导入;机器学习部分为该系统不断学习输入的问题和解决方案的汇总。
9.根据权利要求6所述的基于车联网的智能语音客服系统,其特征在于,该智能语音客服系统还包括一智能管家模块、一AI即时通讯模块、一智能工单模块、一车辆诊断模块、一远程升级模块,其中:
所述智能管家模块用于用户赠送优惠券的管理、积分管理、保养提醒、及事故救援;
所述AI即时通讯模块包括自助服务模块和消息处理模块;所述自助服务模块采用智能引导技术,车主可借助机器人客服进行常见问题自助处理,自助新办业务、自助查询在办业务;所述消息处理模块采用自然语义处理技术,结合机器学习,对车主反馈的问题进行快速分类,并与知识库比对,给出最佳匹配解决方案;
智能工单模块将所述AI即时通讯反馈的最佳匹配解决方案直接反馈给车主。
10.根据权利要求6所述的基于车联网的智能语音客服系统,其特征在于,该智能语音客服系统还链接有微信公众号,该微信公众号包括设备绑定子模块、用户反馈子模块,设备绑定子模块用于将车载终端与用户微信对应关联;该信源数据捜索处理单元还与车辆控制系统连接,实时获取车辆状态参数;所述第三方应用包括网页浏览器、QQ、微信。

说明书全文

基于车联网的智能客服系统

技术领域

[0001] 本发明涉及车联网技术领域,特别涉及一种基于车联网的智能客服系统。

背景技术

[0002] 传统话务客服系统需要大量熟悉相关领域知识的业务人员,人成本较 高、服务对象的数量得不到提高,不便于跟踪客户或对业务数据进行统计分 析,导致客户流失。对于客户问题形成的知识库依赖运维人员手动更新,更 新工作量大,需要用户主动上报信息,客服人员无法自动获取目标设备信息。

发明内容

[0003] 针对现有技术存在的问题,本发明提供一种基于车联网的智能客服系统。
[0004] 为实现上述目的,本发明的具体技术方案如下:
[0005] 一种基于车联网的智能客服系统,包括:AI即时通讯、机器学习、智能 工单、海量知识库、智能客户应用模、后台管理模块;
[0006] 所述AI即时通讯包括自助服务模块和消息处理模块;所述自助服务模块 采用智能引导技术,车主可借助机器人客服进行常见问题自助处理,自助新 办业务、自助查询在办业务;所述消息处理模块采用自然语义处理技术,结 合机器学习,对车主反馈的问题进行快速分类,并与海量知识库比对,给出 最佳匹配解决方案;
[0007] 所述智能工单将所述AI即时通讯反馈的最佳匹配解决方案直接反馈给车 主;
[0008] 所述智能客户应用模块包括统一文言回复、语音语义识别、客户需求预 测、知识关联呈现、智能业务场景、营销管理。
[0009] 所述后台管理模块包括知识管理,业务管理,工单管理,报表管理,用 户管理,客服监控及管理,排班、预测、HR、绩效管理。
[0010] 作为本发明一优选实施方案,所述自助服务模块包括IVR、FAQ、业务办 理、业务查询、业务咨询、智能引导;所述消息处理模块包括若干语音/语义 识别引擎识别单元。
[0011] 作为本发明一优选实施方案,该智能客服系统包括如下功能:
[0012] 在线客服应答:
[0013] 车主可通过车载或手机端的即时通讯模块使用语音、文字、图片、视频 等形式向客服人员反馈或咨询车辆相关问题;
[0014] AI语义理解与知识库:对车主反馈的信息进行语义泛化处理,对所得语 料进行文本特征提取,赋予每个扩展特征一权重值,以表征每一扩展特征对 海量知识库主题识别的贡献度,提高知识库匹配识别的准确度。;
[0015] 专营店管理与工单分配:车厂根据需求对专营店的地址、电话、人员、 服务内容等信息进行管理和上下架操作。客服人员根据预设权重向专营店下 达维修或保养工单,为专营店分配适合的业务;
[0016] 车辆数据诊断与在线升级:主动采集车辆故障和系统日志信息,并存储 于车厂指定服务器。对故障特征进行分类,将准确的解决方案主动推送给 车主,并可通过远程升级的刷写功能快速解决系统问题;
[0017] 智慧出行与无感支付模块:智能引导车主驶入指定停车场指定停车位, 智能引导车主驶入最便捷的加油站的指定加油位。驶离停车场或加油站时, 汽车AI助手自动为车主支付相应费用,并享受折扣优惠,缴费过程无需车主 干预。
[0018] 作为本发明一优选实施方案,该智能客服系统包括如下基础服务:
[0019] 感应窗:车主通过车载端应用使用语音识别反馈问题,获取问题答案;
[0020] 感应号:车主通过手机端微信公众号反馈车辆问题,感受贴心服务;
[0021] 智能工单:客服人员根据车辆情况和车主信息向专营店下达维修或保养 工单;
[0022] 备件管理:专营店可对车辆备件进行库存管理,并可按需向供应商申请 邮寄备件;
[0023] 培训考核:车厂可下发培训资料或考题给专营店人员,通过公众号进行 学习和测试;
[0024] 超级大脑-知识库:设有专业知识库,为车主智能匹配最佳解决方案,并 通过机器学习不断完善;
[0025] 汽车服务锦囊:移动端为车主推荐车辆配件和服务,实现在线订购;
[0026] 车辆诊断:自动获取车辆故障码信息并上报至车厂或专营店;
[0027] 远程控制:可远程为车主进行开关、车窗,调节空调,点火熄火等 操作;
[0028] 远程升级:对车载系统、应用或ECU模块进行远程升级。
[0029] 作为本发明一优选实施方案,该智能客服系统包括如下增值服务:
[0030] 智能停车:为车主智能筛选推荐附近可用的停车场,引导车主行驶至合 适的停车位,通过智能客服系统支付可享受折扣优惠;
[0031] 智能加油:为车主智能筛选推荐附近或沿途优质的加油站,车主通过智 能客服系统支付可享受免下车加油服务及折扣优惠;
[0032] 自动支付:车载应用可绑定行卡或支付宝、微信等第三方支付工具, 车主驶离停车场、高速公路或完成加油后可自动支付相应费用。
[0033] 作为本发明一优选实施方案,该智能客服系统载体包括:
[0034] 服务器;
[0035] 车载终端,其与云服务器通讯连接,该车载终端配置有智能语音客服程 序;所述智能语音客服程序包括用户数据服务器、语音识别单元、会话管理 单元、信源数据捜索处理单元;
[0036] 所述用户数据服务器用于收集车载终端登录的用户信息;
[0037] 所述语音识别单元用于采集车载终端包含客户问题的语音信息,并转化 为与客户问题对应的系统指令反馈给云服务器进行解答;
[0038] 所述信源数据捜索处理单元用于以队列网关形式采集车载终端及车载终 端加载的第三方应用的信息输入管理;
[0039] 所述会话管理单元用于协调语音识别模块与车载终端加载的第三方应用 的信息输入管理。
[0040] 作为本发明一优选实施方案,所述语音识别单元包括初始化智能模块、 语音识别模块、文本识别模块,所述初始化智能模块获取车载终端的语音信 息和文本信息,并予以识别,当其为语音信息时,经语音识别模块的语音转 文本处理后,反馈给文本识别模块;当为文本信息时直接反馈给文本识别模 块;所述文本识别模块将识别后的文字反馈给云服务器。
[0041] 作为本发明一优选实施方案,该智能语音客服系统还包括一知识库,其 包括常见问题部分与机器学习部分,常见问题部分由工作人员手动导入;机 器学习部分为该系统不断学习输入的问题和解决方案的汇总。
[0042] 作为本发明一优选实施方案,该智能语音客服系统还包括一智能管家模 块、一AI即时通讯模块、一智能工单模块、一车辆诊断模块、一远程升级模 块,其中:
[0043] 所述智能管家模块用于用户赠送优惠券的管理、积分管理、保养提醒、 及事故救援;
[0044] 所述AI即时通讯模块包括自助服务模块和消息处理模块;所述自助服务 模块采用智能引导技术,车主可借助机器人客服进行常见问题自助处理,自 助新办业务、自助查询在办业务;所述消息处理模块采用自然语义处理技术, 结合机器学习,对车主反馈的问题进行快速分类,并与知识库比对,给出最 佳匹配解决方案;
[0045] 智能工单模块将所述AI即时通讯反馈的最佳匹配解决方案直接反馈给车 主。
[0046] 作为本发明一优选实施方案,该智能语音客服系统还链接有微信公众号, 该微信公众号包括设备绑定子模块、用户反馈子模块,设备绑定子模块用于 将车载终端与用户微信对应关联;该信源数据捜索处理单元还与车辆控制系 统连接,实时获取车辆状态参数;所述第三方应用包括网页浏览器、QQ、微 信。
[0047] 本发明智能客服安全架构安全可信,车载智能终端增加加密芯片或在原 主控芯片中设置安全可信分区用于存储密钥,对应用采集到的车辆关键数据 进行加密处理,并对外部输入的信息进行验签,从而防止数据泄漏、篡改、 防止虚假信息注入。
[0048] 本发明智能客服安全架构芯片化SOC,将智能客服的知识库深度学习功 能、车辆数据采集功能、在线支付功能、安全防护功能植入人工智能芯片中, 通过芯片化的解决方案,保证服务的高效性、可移植性及安全性。
[0049] 本发明致力于提供汽车AI助手产品,为车主提供变革式、智能化的疑难 解答、车辆诊断、智慧出行服务。将原有被动的电话反馈模式转换为主动关 怀和及时多样的互联网反馈模式。利用本发明的车载端应用获取的用户和车 辆数据,智能客服系统可快速为车主提供的精准服务。具体地,采用本发明 的技术方案,具有以下有益效果:
[0050] (1)、车载端应用可获取车辆信息,当该用户接入智能客服后,客服人 员可快速定位目标设备并自动获取车型和车主信息;相应的问题日志也可通 过工单传给技术人员用于问题分析;
[0051] (2)、知识库自动更新,通过机器学习算法对用户提出的问题及客服人 员提供的解决方法进行分类学习,训练智能机器人通过即时通讯工具自动为 用户推荐的解决方案,如无法解决转入人工服务;
[0052] (3)、智能工单管理,管理员可自定义为客服人员分配合适的工种;客 服人员可将需要技术人员跟进的任务下推送至工程师手机APP中,让工程师 与用户直接沟通;客服人员对工单进行跟踪管理
[0053] (4)、即时通讯模块可嵌入微信公众号中,如用户打电话不变可通过即 时通信工具与客服人员进行沟通,系统会根据用户在即时通信中描述的问题 智能的为该用户挑选客服人员;
[0054] (5)、提供增值服务,将流量服务、加油服务、维修保养洗车服务引入 智能客服系统,根据对用户的驾驶习惯按需定制相应服务;另因产品质量问 题可赠送用户相应服务安抚用户情绪。附图说明
[0055] 图1为本发明智能客服系统的功能示意图;
[0056] 图2为本发明智能客服系统载体组成框图
[0057] 图3为本发明语音识别单元组成框图;
[0058] 图4为本发明智能语音客服系统处理流程图
[0059] 图5为本发明中文本分类器的设计原理图;
[0060] 图6为本发明中文本分类流程图;
[0061] 图7为本发明中文本分类算法设计图。

具体实施方式

[0062] 以下结合附图和具体实施例,对本发明进一步说明。
[0063] 参照图1所示,本发明提供一种基于车联网的智能客服系统,包括:AI 即时通讯、机器学习、智能工单、海量知识库、智能客户应用模块、后台管 理模块;
[0064] 所述AI即时通讯包括自助服务模块和消息处理模块;所述自助服务模块 采用智能引导技术,车主可借助机器人客服进行常见问题自助处理,自助新 办业务、自助查询在办业务;所述消息处理模块采用自然语义处理技术,结 合机器学习,对车主反馈的问题进行快速分类,并与知识库比对,给出最佳 匹配解决方案;
[0065] 所述智能工单将所述AI即时通讯反馈的最佳匹配解决方案直接反馈给车 主;
[0066] 所述智能客户应用模块包括统一文言回复、语音语义识别、客户需求预 测、知识关联呈现、智能业务场景、营销管理。
[0067] 所述后台管理模块包括知识管理,业务管理,工单管理,报表管理,用 户管理,客服监控及管理,排班、预测、HR、绩效管理。
[0068] 所述自助服务模块包括IVR、FAQ、业务办理、业务查询、业务咨询、智 能引导;所述消息处理模块包括若干语音/语义识别引擎识别单元。
[0069] 该智能客服系统包括如下功能:
[0070] 在线客服应答:车主可通过车载或手机端的即时通讯模块使用语音、文 字、图片、视频等形式向客服人员反馈或咨询车辆相关问题;
[0071] AI语义理解与知识库:对车主反馈的信息进行语义泛化处理,对所得语 料进行文本特征提取,赋予每个扩展特征一权重值,以表征每一扩展特征对 海量知识库主题识别的贡献度,提高知识库匹配识别的准确度。;
[0072] 专营店管理与工单分配:车厂根据需求对专营店的地址、电话、人员、 服务内容等信息进行管理和上下架操作。客服人员根据预设权重向专营店下 达维修或保养工单,为专营店分配适合的业务;
[0073] 车辆数据诊断与在线升级:主动采集车辆故障和系统日志信息,并存储 于车厂指定的服务器。对故障特征进行分类,将准确的解决方案主动推送给 车主,并可通过远程升级的刷写功能快速解决系统问题;
[0074] 智慧出行与无感支付模块:智能引导车主驶入指定停车场指定停车位, 智能引导车主驶入最便捷的加油站的指定加油位。驶离停车场或加油站时, 汽车AI助手自动为车主支付相应费用,并享受折扣优惠,缴费过程无需车主 干预。
[0075] 该智能客服系统包括如下基础服务:
[0076] 感应窗:车主通过车载端应用使用语音识别反馈问题,获取问题答案;
[0077] 感应号:车主通过手机端微信公众号反馈车辆问题,感受贴心服务;
[0078] 智能工单:客服人员根据车辆情况和车主信息向专营店下达维修或保养 工单;
[0079] 备件管理:专营店可对车辆备件进行库存管理,并可按需向供应商申请 邮寄备件;
[0080] 培训考核:车厂可下发培训资料或考题给专营店人员,通过公众号进行 学习和测试;
[0081] 超级大脑-知识库:设有专业知识库,为车主智能匹配最佳解决方案,并 通过机器学习不断完善;
[0082] 汽车服务锦囊:移动端为车主推荐车辆配件和服务,实现在线订购;
[0083] 车辆诊断:自动获取车辆故障码信息并上报至车厂或专营店;
[0084] 远程控制:可远程为车主进行开关车门、车窗,调节空调,点火熄火等 操作;
[0085] 远程升级:对车载系统、应用或ECU模块进行远程升级。
[0086] 该智能客服系统包括如下增值服务:
[0087] 智能停车:为车主智能筛选推荐附近可用的停车场,引导车主行驶至合 适的停车位,通过智能客服系统支付可享受折扣优惠;
[0088] 智能加油:为车主智能筛选推荐附近或沿途优质的加油站,车主通过智 能客服系统支付可享受免下车加油服务及折扣优惠;
[0089] 自动支付:车载应用可绑定银行卡或支付宝、微信等第三方支付工具, 车主驶离停车场、高速公路或完成加油后可自动支付相应费用。
[0090] 参照图2至图3所示,本发明提供一种基于车联网的智能语音客服系统, 包括:
[0091] 云服务器10;
[0092] 车载终端20,其与云服务器10通讯连接,该车载终端20配置有智能语 音客服程序21;所述智能语音客服程序21包括语音识别单元211、会话管理 单元212、信源数据捜索处理单元213;
[0093] 所述云服务器10用于收集车载终端登录的用户信息;
[0094] 所述语音识别单元211用于采集车载终端包含客户问题的语音信息,并 转化为与客户问题对应的系统指令反馈给云服务器10进行解答;
[0095] 所述信源数据捜索处理单元213用于以队列网关形式采集车载终端及车 载终端加载的第三方应用的信息输入管理;
[0096] 所述会话管理单元212用于协调语音识别模块与车载终端20加载的第三 方应用的信息输入管理。
[0097] 其中,所述语音识别单元211包括初始化智能模块211a、语音识别模块 211b、文本识别模块211c,所述初始化智能模块211a获取车载终端20的语 音信息和文本信息,并予以识别,当其为语音信息时,经语音识别模块211b 的语音转文本处理后,反馈给文本识别模块211c;当为文本信息时直接反馈 给文本识别模块211c;所述文本识别模块211c将识别后的文字反馈给云服务 器20。
[0098] 该智能语音客服系统还包括一知识库11,其包括常见问题部分111与机 器学习部分112,常见问题部分111由工作人员手动导入;机器学习部分112 为该系统不断学习输入的问题和解决方案的汇总。
[0099] 该智能语音客服系统还包括一智能管家模块22、一AI即时通讯模块23、 一智能工单模块24、一车辆诊断模块25、一远程升级模块26,其中:
[0100] 所述智能管家模块22用于用户赠送优惠券的管理221、积分管理222、 保养提醒223、及事故救援224;
[0101] 所述AI即时通讯模块23包括自助服务模块和消息处理模块;所述自助 服务模块采用智能引导技术,车主可借助机器人客服进行常见问题自助处理, 自助新办业务、自助查询在办业务;所述消息处理模块采用自然语义处理技 术,结合机器学习,对车主反馈的问题进行快速分类,并与知识库比对,给 出最佳匹配解决方案;
[0102] 智能工单模块24将所述AI即时通讯反馈的最佳匹配解决方案直接反馈 给车主。
[0103] 该智能语音客服系统还链接有微信公众号30,该微信公众号30包括设备 绑定子模块301、用户反馈子模块302,设备绑定子模块301用于将车载终端 20与用户微信对应关联。
[0104] 该信源数据捜索处理单元还与车辆控制系统连接,实时获取车辆状态参 数。所述第三方应用包括网页浏览器、QQ、微信。
[0105] 参考图4,本发明中智能语音客服系统处理流程如下:
[0106] (1)通信网关获取客户上行会话;
[0107] (2)接入业务层识别是否开启机器人,若否则按原流程处理;若是则判 断是否已有会话,若否则进入下步;
[0108] (3)文本分类器识别是否是工作时间:①若否,则进入是否匹配知识库 中答案,若匹配则匹配对应答案,若不匹配则发送非工作时间预设答案,最 后发送答案,结束;②若是,再进入是否匹配知识库中答案,若匹配则匹配 对应答案,若不匹配则进入人工坐席在FAQ中展示空值信息,并由人工回复, 同时有人工反馈给知识库。
[0109] 图5所示为文本分类器的设计,将训练数据导入到分词系统中进行分词 处理,这里主要采用的是中科院的ICTCLAS分词系统,然后将经过分词系 统分的数据,即原始特征集进行特征值的提取,并采用SVM算法完成分类 器的设计;而在应用时,将客户输入的上行数据看成为测试数据,同样经过 分词以及特征值的提取模块,再将最后的数据导入分类器中,最终得到期望 的分类值。在分类器的建立时,会根据实际情况的需要,对由系统拆分出的 特征值以及特征值的权重进行一定程度的人工维护优化,删除掉部分对于业 务系统无意义的特征词,同时增加一些虽然比较少用到,但是属于行业特定 的业务名称或产品名称的词,由于加入了人工经验性的判断,在实际的生产 中,这样的添加不仅不会对系统造成负面的效果,反而能够使得分词系统对 于一些不常见的业务有较强的敏感性,从而对这些不常见的业务有较强的识 别能力。
[0110] 图6为文本分类流程,在对文本进行分类的时候,系统接收到的文本消 息进入到分类器之前,还需要进行分词与拆词、特征值的提取、文本的表示 以及分类算法四个环节,通过这四个环节能够将一段长文本转化为系统可以 识别的权重特征值,从而方便分类器计算。同时,为了保证系分类器能够进 行持续的训练更新,以满足发展的需要,还会将实际生产运营中客户上行分 类的数据作为系统的优化数据,在确认分类的准确性后(这个环节需人工干 预),使用这些上行分类数据调节分类器的算法分值。在这个模块的设计中, 系统的训练环节与测试环节基本保持一致的,唯一不同的是,系统在训练环 节中,需要人工干预定义出分类的特征值,以便于分类准确率的提升。
[0111] 图7为文本分类算法,在智能客服系统中,考虑到SVM分类器在文本分 类中的良好表现以及其较强的鲁棒特性,系统主要应用该算法。支持向量机 最早是由Vapnik提出的,主要用于解决二分类模式的识别问题,其理论基础 主要依靠统计学习理论,很好的避免了传统的分类中样本无限大的问题。支 持向量机(SVM)是一个处理二分类的分类模型,但在我们遇到的分类中, 几乎不会遇到二分类的情况,大部分都是需要处理多分类。以实际案例来说, 仅涉及流量相关的分类有流量包办理、流量查询、流量包退订以及流量咨询 乃至于流量规则等。因此,在这个问题上,系统采用了一种是非逻辑的思想 处理,支持向量机(SVM)分类器的分类过程以一个3分类的情形为例(n分 类的情形基本与3分类的情形一致),其核心想法为,当系统将一个文本数据 经过前面处理以后,把得到的特征值首先输入分类器中进行分类,这时,分 类器将所有的分类近似的看作正类和反类两种,即分类器随机抽取一个类型 当作正类,其他的类型当作反类。当分类器判断出是正类时,则输出该分类 结果,当分类器判断是反类时,则将正类类别剔除,再在剩下的类别中随机 抽取一个类型为正类,剩下的类型为反类,直到找到确定的分类输出正确的 分类结果;或未找到分类,输出未分类的结果为止。
[0112] 本发明中,文本分类算法的相似度计算方法的实现如下:
[0113] (1)词形相似度
[0114] 词形相似度方法是通过计算两个问句的词形即相同词的个数来比较相似 的。两个问句相同的词数越多,两个问句越相似。问句q是若干词组成的一 个序列,q的长度即是q中词的个数,此处用Len(q)表示,Sam eW c(q1,q2) 为问句q1和q2中相同词的个数,若一个词在q1、q2中出现多次则只 算一次。问句q1、q2的词形相似度WordSim(q1,q2)为:
[0115]
[0116] (2)问句长度相似度
[0117] 问句长度相似性在一定程度上反映了问句形态上的相似性。从问句整体 上来看,两句子长度相差越小,两个句子相似的可能性越大。
[0118] 对于问句q1和q2,Len(q1)、Len(q2)分别为两个问句的长度, 即两个语句中词的个数。问句长度相似度LenSim(q1,q2)为:
[0119]
[0120] (3)词序的相似度。
[0121] 关键词的顺序可以反映两个问句中所含相同词或同义词在位置关系上的 相似程度。当一个分句或短语整体发生长距离移动后,使用词序相似度可以发 现其仍与原来的语句很相似。
[0122] 对于问句q1和q2,OnceW s(q1、q2)表示在q1、q2中都出现且 都只出现一次的关键词的集合。Pfirst(q1,q2)表示OnceW s(q1,q2)中 的关键词在q1中的位置序号构成的向量,Psecond(q1,q2)表示Pfirst(q1, q2)中的分量按对应关键词在q2中的次序排序生成的向量。如对于问句q1 “进程产生的原因是什么”和q2“为什么会产生进程死锁”,两个问 句基本相似,但短语“进程死锁”发生了整体移动,从句首移到句尾。
[0123] 上述两问句经过分词和提取关键词,q1={进程,死锁,产生,原因, 是,什么},q2={为什么,会,产生,进程,死锁},OnceWs(q1,q2) ={进程,死锁,产生},q1中关键词与序号的对应关系为:
[0124]
[0125] 则Pfirst(q1,q2)=(0,1,2)。由各分量对应的关键词在q2中的顺序为:
[0126]
[0127] 则Psecond(q1,q2)=(2,0,1)。RevO rd(q1,q2)表示Psecond(q1, q2)各相邻分量的逆序数。上例中,2>0,0<1,得RevO rd(q1,q2)=1。 问句q1和q2的词序相似度O rderSim(q1,q2)为:
[0128]
[0129] 上例中OrderSim(q1,q2)=1-1/[2(3-1)]=0.75。从相似度结果可以看出, 虽然短语“进程死锁”从句首整体移动到句尾,但两个问句还是有很高的相 似度。
[0130] (4)距离相似度
[0131] 编辑距离是指把一个以字为单位的句子变成另一个以字为单位的句子所 需要最小的编辑操作个数。编辑操作有插入、删除和替换3种。在汉语中, 单个的字往往不具备具体的意义;另外使用以字为单位的编辑距离方法,插 入操作的代价会很大,这与实际情况相差太大。因此,以普通编辑距离算法为基 础,采用词语取代单个的汉字或字符作为基本的编辑单元参与运算,借助构 建的同义词词库作为语义资源来计算词汇之间的语义距离,并且给不同编辑 操作赋予不同的权重。编辑距离的实现算法如下:
[0132] 规定插入一个字符a的代价为I(a),删除一个字符a的代价为D(a), 把字符a替换为b的代价为S(a,b)。令矩阵元素M(i,j)(0≤i≤n, 0≤j≤m)为A的子串A1A2A3...Ai和B的子串B1 B2 B3...Bj 的编辑距离,则M(n,m)为字符串A和字符串B的编辑距离。根据编辑 距离的定义,存在下述等式:
[0133] M(0,0)=0
[0134]
[0135]
[0136] 当1≤i≤n且1≤j≤m时满足下列等式:
[0137] M(i,j)=min[M(i-1,j-1)+S(Ai,Bj),
[0138] M(i-1,j)+D(Ai),M(i,j-1)+I(Bj)]
[0139] 将问句看成是由一系列关键词组成的字符串,通过定义操作代价,就可以计 算出两个问句之间的距离Dis(q1,q2)。式中的n、m分别为问句q1和 q2关键词个数。
[0140] Dis(q1,q2)=min[M(n-1,m-1)+S(An,Bm), M(n-1,m)+D(An),M(n,m-1)+I(Bm)][0141] 两个问句间的编辑距离越大,那么它们之间的相似度就越小。当问句间的编 辑距离为0时,问句的相似度为1,即完全相似;但当编辑距离无穷大时,相 似度为0,即两问句不相关。因此,可定义相似度DisSim(q1,q2)和逻 辑距离Dis(q1,q2)之间的转换关系为:
[0142]
[0143] 其中:a是当相似度为0.5时的词语距离值。可以利用领域内的相似问句 进行训练,以得到a的最佳值。
[0144] 与计算普通的编辑距离相同,改进的编辑距离方法也使用动态规划法进行 计算。
[0145] (5)问句相似度。
[0146] 问句q1、q2的相似度Sim(q1,q2)计算得到:
[0147] Sim(q1,q2)=λ1·WordS in(q1,q2)+ λ2·LenS in(q1,q2)+λ3·OrderSim(q1,q2) λ4·DisSim(q1,q2)
[0148] 其中:权重λ1、λ2、λ3、λ4为常数,且满足λ1+λ2+λ3+λ4=1,各个相似度 所起的作用不同,因此权重大小亦不同,如取λ1=0.6,λ2=0.2,λ3=0.6,λ1=0.1。 Sim(q1,q2)∈[0,1],0为不相似,1为完全相似,数值越大表示两个 问句越相似。设置一个阈值作为问句相似的一个条件,当两个问句的相似度 高于这个值时,就认为这两个问句相似。
[0149] 以上所述仅为本发明的优选实施例,并非因此限制本发明的专利范围, 凡是在本发明的发明构思下,利用本发明说明书及附图内容所作的等效结构 变换,或直接/间接运用在其他相关的技术领域均包括在本发明的专利保护范 围内。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈