首页 / 专利库 / 专利权 / 专利合作条约 / 第I章 / 国际申请 / 请求书 / 发明名称 / 一种商品名称校正方法、装置和计算机可读存储介质

一种商品名称校正方法、装置和计算机可读存储介质

阅读:406发布:2020-05-12

专利汇可以提供一种商品名称校正方法、装置和计算机可读存储介质专利检索,专利查询,专利分析的服务。并且本 发明 实施例 公开了一种商品名称校正方法、装置和计算机可读存储介质,接收用户输入的商品名称;采用es字段匹配,从 数据库 中获取与商品名称相对应的标准名称;根据最小编辑距离 算法 ,计算出商品名称与各标准名称之间的名称得分;展示满足得分要求的目标标准名称及其对应的税收分类编码;其中,每个目标标准名称及其对应的税收分类编码有对应的匹配度。用户可以根据实际商品类别,选择合适的目标标准名称作为发票开具的商品名称。通过向用户提供规范化的标准名称,可大幅提高发票开具的规范性,保证了发票开具时商品名称的正确性。并且每个标准名称有其对应的税收分类编码,提高了编码匹配的准确性。,下面是一种商品名称校正方法、装置和计算机可读存储介质专利的具体信息内容。

1.一种商品名称校正方法,其特征在于,包括:
接收用户输入的商品名称;
采用es字段匹配,从数据库中获取与所述商品名称相对应的标准名称;
根据最小编辑距离算法,计算出所述商品名称与各标准名称之间的名称得分;
展示满足得分要求的目标标准名称及其对应的税收分类编码;其中,每个目标标准名称及其对应的税收分类编码有对应的匹配度。
2.根据权利要求1所述的方法,其特征在于,所述展示满足得分要求的目标标准名称及其对应的税收分类编码包括:
从所述标准名称中筛选出名称得分大于或等于预设阈值的目标标准名称;
按照名称得分降序的顺序,展示各目标标准名称及其对应的税收分类编码。
3.根据权利要求1所述的方法,其特征在于,所述根据最小编辑距离算法,计算出所述商品名称与各标准名称之间的名称得分包括:
根据所述商品名称的字符长度和第一标准名称的字符长度,确定出所述商品名称与所述第一标准名称的编辑距离;其中,第一标准名称为所有标准名称中的任意一个标准名称;
按照如下公式,计算所述商品名称与所述第一标准名称之间的名称得分,其中,m表示预先设定的匹配度分值。
4.根据权利要求1所述的方法,其特征在于,所述目标标准名称及其对应的税收分类编码所对应的匹配度由用户选择得分以及认证得分确定得到。
5.根据权利要求1所述的方法,其特征在于,在所述展示满足得分要求的目标标准名称及其对应的税收分类编码之后还包括:
在获取到用户选择的标准名称之后,将用户选择的标准名称与所述商品名称存储到对应关系库。
6.根据权利要求5所述的方法,其特征在于,还包括:
在获取到用户输入的新商品名称之后,从对应关系库中查找是否存在与所述新商品名称相对应的标准名称;
若是,则展示与所述新商品名称相对应的标准名称以及税收分类编码;
若否,则执行所述采用es字段匹配,从数据库中获取与所述新商品名称相对应的标准名称的步骤。
7.根据权利要求1-6任意一项所述的方法,其特征在于,在所述接收用户输入的商品名称之后还包括:
基于大数据分析技术,匹配出所述商品名称对应的税收分类编码;并展示所述商品名称对应的税收分类编码。
8.一种商品名称校正装置,其特征在于,包括接收单元、获取单元、计算单元和展示单元;
所述接收单元,用于接收用户输入的商品名称;
所述获取单元,用于采用es字段匹配,从数据库中获取与所述商品名称相对应的标准名称;
所述计算单元,用于根据最小编辑距离算法,计算出所述商品名称与各标准名称之间的名称得分;
所述展示单元,用于展示满足得分要求的目标标准名称及其对应的税收分类编码;其中,每个目标标准名称及其对应的税收分类编码有对应的匹配度。
9.一种商品名称校正装置,其特征在于,包括:
存储器,用于存储计算机程序
处理器,用于执行所述计算机程序以实现如权利要求1至7任意一项所述商品名称校正方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述商品名称校正方法的步骤。

说明书全文

一种商品名称校正方法、装置和计算机可读存储介质

技术领域

[0001] 本发明涉及智能编码技术领域,特别是涉及一种商品名称校正方法、装置和计算机可读存储介质。

背景技术

[0002] 商品和服务税收分类与编码是指在增值税发票升级版中,纳税人开具发票时票面上的商品名称应与税务总局核定的税收分类编码进行关联,按分类编码上注明的税率和征收率开具发票。
[0003] 现有技术中借由大数据技术,通过用户的使用习惯,包括分词技术,语义分析,机器学习,将对应商品划分至对应分类下,从而确定出商品名称对应的税收分类编码。
[0004] 由于商品种类繁杂,发票开具商品名称较为随意,时常会出现开票时商品名称中存在错字,命名不规范等问题。当商品名称存在错误或者是不规范时,可能会匹配到错误的税收分类编码,导致编码匹配错误率较高。
[0005] 可见,如何提高编码匹配的准确性,是本领域技术人员需要解决的问题。

发明内容

[0006] 本发明实施例的目的是提供一种商品名称校正方法、装置和计算机可读存储介质,可以提高编码匹配的准确性。
[0007] 为解决上述技术问题,本发明实施例提供一种商品名称校正方法,包括:
[0008] 接收用户输入的商品名称;
[0009] 采用es字段匹配,从数据库中获取与所述商品名称相对应的标准名称;
[0010] 根据最小编辑距离算法,计算出所述商品名称与各标准名称之间的名称得分;
[0011] 展示满足得分要求的目标标准名称及其对应的税收分类编码;其中,每个目标标准名称及其对应的税收分类编码有对应的匹配度。
[0012] 可选的,所述展示满足得分要求的目标标准名称及其对应的税收分类编码包括:
[0013] 从所述标准名称中筛选出名称得分大于或等于预设阈值的目标标准名称;
[0014] 按照名称得分降序的顺序,展示各目标标准名称及其对应的税收分类编码。
[0015] 可选的,所述根据最小编辑距离算法,计算出所述商品名称与各标准名称之间的名称得分包括:
[0016] 根据所述商品名称的字符长度和第一标准名称的字符长度,确定出所述商品名称与所述第一标准名称的编辑距离;其中,第一标准名称为所有标准名称中的任意一个标准名称;
[0017] 按照如下公式,计算所述商品名称与所述第一标准名称之间的名称得分,[0018]
[0019] 其中,m表示预先设定的匹配度分值。
[0020] 可选的,所述目标标准名称及其对应的税收分类编码所对应的匹配度由用户选择得分以及认证得分确定得到。
[0021] 可选的,在所述展示满足得分要求的目标标准名称及其对应的税收分类编码之后还包括:
[0022] 在获取到用户选择的标准名称之后,将用户选择的标准名称与所述商品名称存储到对应关系库。
[0023] 可选的,还包括:
[0024] 在获取到用户输入的新商品名称之后,从对应关系库中查找是否存在与所述新商品名称相对应的标准名称;
[0025] 若是,则展示与所述新商品名称相对应的标准名称以及税收分类编码;
[0026] 若否,则执行所述采用es字段匹配,从数据库中获取与所述新商品名称相对应的标准名称的步骤。
[0027] 可选的,在所述接收用户输入的商品名称之后还包括:
[0028] 基于大数据分析技术,匹配出所述商品名称对应的税收分类编码;并展示所述商品名称对应的税收分类编码。
[0029] 本发明实施例还提供了一种商品名称校正装置,包括接收单元、获取单元、计算单元和展示单元;
[0030] 所述接收单元,用于接收用户输入的商品名称;
[0031] 所述获取单元,用于采用es字段匹配,从数据库中获取与所述商品名称相对应的标准名称;
[0032] 所述计算单元,用于根据最小编辑距离算法,计算出所述商品名称与各标准名称之间的名称得分;
[0033] 所述展示单元,用于展示满足得分要求的目标标准名称及其对应的税收分类编码;其中,每个目标标准名称及其对应的税收分类编码有对应的匹配度。
[0034] 可选的,所述展示单元包括筛选子单元和排序子单元;
[0035] 所述筛选子单元,用于从所述标准名称中筛选出名称得分大于或等于预设阈值的目标标准名称;
[0036] 所述排序子单元,用于按照名称得分降序的顺序,展示各目标标准名称及其对应的税收分类编码。
[0037] 可选的,所述计算单元具体用于根据所述商品名称的字符长度和第一标准名称的字符长度,确定出所述商品名称与所述第一标准名称的编辑距离;其中,第一标准名称为所有标准名称中的任意一个标准名称;按照如下公式,计算所述商品名称与所述第一标准名称之间的名称得分,
[0038]
[0039] 其中,m表示预先设定的匹配度分值。
[0040] 可选的,所述目标标准名称及其对应的税收分类编码所对应的匹配度由用户选择得分以及认证得分确定得到。
[0041] 可选的,在所述展示满足得分要求的目标标准名称及其对应的税收分类编码之后还包括存储单元;
[0042] 所述存储单元,用于在获取到用户选择的标准名称之后,将用户选择的标准名称与所述商品名称存储到对应关系库。
[0043] 可选的,还包括查找单元;
[0044] 所述查找单元,用于在获取到用户输入的新商品名称之后,从对应关系库中查找是否存在与所述新商品名称相对应的标准名称;
[0045] 若是,则触发所述展示单元展示与所述新商品名称相对应的标准名称以及税收分类编码;
[0046] 若否,则触发所述获取单元执行所述采用es字段匹配,从数据库中获取与所述新商品名称相对应的标准名称的步骤。
[0047] 可选的,还包括匹配单元;
[0048] 所述匹配单元,用于基于大数据分析技术,匹配出所述商品名称对应的税收分类编码;
[0049] 所述展示单元还用于展示所述商品名称对应的税收分类编码。
[0050] 本发明实施例还提供了一种商品名称校正装置,包括:
[0051] 存储器,用于存储计算机程序
[0052] 处理器,用于执行所述计算机程序以实现如上述任意一项所述商品名称校正方法的步骤。
[0053] 本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述商品名称校正方法的步骤。
[0054] 由上述技术方案可以看出,接收用户输入的商品名称;采用es字段匹配,从数据库中获取与商品名称相对应的标准名称;匹配出的标准名称可能有多个,可以根据最小编辑距离算法,计算出商品名称与各标准名称之间的名称得分;名称得分越高,说明标准名称和商品名称越贴近。为了便于用户选择,可以展示满足得分要求的目标标准名称及其对应的税收分类编码;其中,每个目标标准名称及其对应的税收分类编码有对应的匹配度。用户可以根据实际商品类别,选择合适的目标标准名称作为发票开具的商品名称。在该技术方案中,通过对用户输入的商品名称进行检测,向用户提供规范化的标准名称,可大幅提高发票开具的规范性,保证了发票开具时商品名称的正确性。并且每个标准名称有其对应的税收分类编码,在确定出发票开具的商品名称之后,可以准确的匹配到税收分类编码,提高了编码匹配的准确性。附图说明
[0055] 为了更清楚地说明本发明实施例,下面将对实施例中所需要使用的附图做简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0056] 图1为本发明实施例提供的一种商品名称校正方法的流程图
[0057] 图2为本发明实施例提供的一种匹配结果展示界面的示意图;
[0058] 图3为本发明实施例提供的一种商品名称校正装置的结构示意图;
[0059] 图4为本发明实施例提供的一种商品名称校正装置的硬件结构示意图。

具体实施方式

[0060] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下,所获得的所有其他实施例,都属于本发明保护范围。
[0061] 为了使本技术领域的人员更好地理解本发明方案,下面结合附图和具体实施方式对本发明作进一步的详细说明。
[0062] 接下来,详细介绍本发明实施例所提供的一种商品名称校正方法。图1为本发明实施例提供的一种商品名称校正方法的流程图,该方法包括:
[0063] S101:接收用户输入的商品名称。
[0064] 用户可以在智能设备的开票软件中输入商品名称。
[0065] S102:采用es字段匹配,从数据库中获取与商品名称相对应的标准名称。
[0066] 在数据库中存储有规范化的商品名称,为了和用户输入的商品名称相区分,可以将规范化的商品名称作标准名称。
[0067] 用户输入的商品名称由用户自定义,因此商品名称可能会存在不规范的问题。在发明实施例中,可以采用es字段匹配的方式,从数据库中获取与商品名称具有关联性的标准名称。
[0068] S103:根据最小编辑距离算法,计算出商品名称与各标准名称之间的名称得分。
[0069] 一个商品名称所匹配到的标准名称往往有多个,为了直观的了解各标准名称和商品名称之间的关联性,在本发明实施例中,可以对商品名称和标准名称进行编辑距离的运算,具体的,可以根据商品名称的字符长度和第一标准名称的字符长度,确定出商品名称与第一标准名称的编辑距离;其中,第一标准名称为所有标准名称中的任意一个标准名称;
[0070] 按照如下公式,计算商品名称与第一标准名称之间的名称得分,
[0071]
[0072] 其中,m表示预先设定的匹配度分值。
[0073] 在实际应用中,可以设置m=65。
[0074] 举例说明,假设用户输入的商品名称为“hp打印机”,其字符长度length=5;es匹配出来的一个标准名称为“打印机”,其字符长度length=3,则商品名称和标准名称之间的编辑距离为2,相应的
[0075]
[0076] S104:展示满足得分要求的目标标准名称及其对应的税收分类编码。
[0077] 名称得分越高,说明标准名称和商品名称越贴近。标准名称的个数往往较多,为了向用户展示更加贴合商品名称的标准名称,在本发明实施例中,可以根据预设阈值对各标准名称进行初步的筛选。具体的,可以从标准名称中筛选出名称得分大于或等于预设阈值的目标标准名称。
[0078] 在向用户展示目标标准名称时,可以按照名称得分降序的顺序,展示各目标标准名称及其对应的税收分类编码。
[0079] 其中,每个目标标准名称及其对应的税收分类编码有对应的匹配度。
[0080] 目标标准名称及其对应的税收分类编码所对应的匹配度由用户选择得分以及认证得分确定得到。认证得分指的是标准名称和税收分类编码被人工强制绑定。
[0081] 在本发明实施例中,除了展示满足得分要求的目标标准名称及其对应的税收分类编码之外,在接收用户输入的商品名称之后还可以按照传统方式的基于大数据分析技术,匹配出商品名称对应的税收分类编码;并展示商品名称对应的税收分类编码。
[0082] 如图2所示为匹配结果展示界面的示意图,当用户输入的商品名称为“瓶果”,除了商品名称之外,可以匹配4个满足得分要求的标准名称,依次为“小瓶果粒橙”、“大瓶果粒橙”、“糖果瓶”和“RB瓶果粒橙”。每个名称有其对应的税收分类编码,税收分类名称和匹配度,其中,匹配度指的是名称和税收分类编码之间的匹配度。从图2中可以看出,由于商品名称“瓶果”的不规范,因此根据商品名称“瓶果”匹配到的税收分类编码和商品名称的匹配度较低。
[0083] 由上述技术方案可以看出,接收用户输入的商品名称;采用es字段匹配,从数据库中获取与商品名称相对应的标准名称;匹配出的标准名称可能有多个,可以根据最小编辑距离算法,计算出商品名称与各标准名称之间的名称得分;名称得分越高,说明标准名称和商品名称越贴近。为了便于用户选择,可以展示满足得分要求的目标标准名称及其对应的税收分类编码;其中,每个目标标准名称及其对应的税收分类编码有对应的匹配度。用户可以根据实际商品类别,选择合适的目标标准名称作为发票开具的商品名称。在该技术方案中,通过对用户输入的商品名称进行检测,向用户提供规范化的标准名称,可大幅提高发票开具的规范性,保证了发票开具时商品名称的正确性。并且每个标准名称有其对应的税收分类编码,在确定出发票开具的商品名称之后,可以准确的匹配到税收分类编码,提高了编码匹配的准确性。
[0084] 在本发明实施例中,在展示满足得分要求的目标标准名称及其对应的税收分类编码之后,可以获取用户选择的标准名称,将用户选择的标准名称与商品名称存储到对应关系库。
[0085] 在获取到用户输入的新商品名称之后,从对应关系库中查找是否存在与新商品名称相对应的标准名称。
[0086] 当对应关系库中存在与新商品名称相对应的标准名称,则展示与新商品名称相对应的标准名称以及税收分类编码。当对应关系库中不存在与新商品名称相对应的标准名称,则可以执行采用es字段匹配,从数据库中获取与新商品名称相对应的标准名称的步骤。
[0087] 通过建立对应关系库,可以针对于用户对商品的命名习惯,快速查询到常用商品名称所对应的标准名称,进一步提高了编码匹配的效率。
[0088] 图3为本发明实施例提供的一种商品名称校正装置的结构示意图,包括接收单元31、获取单元32、计算单元33和展示单元34;
[0089] 接收单元31,用于接收用户输入的商品名称;
[0090] 获取单元32,用于采用es字段匹配,从数据库中获取与商品名称相对应的标准名称;
[0091] 计算单元33,用于根据最小编辑距离算法,计算出商品名称与各标准名称之间的名称得分;
[0092] 展示单元34,用于展示满足得分要求的目标标准名称及其对应的税收分类编码;其中,每个目标标准名称及其对应的税收分类编码有对应的匹配度。
[0093] 可选的,展示单元包括筛选子单元和排序子单元;
[0094] 筛选子单元,用于从标准名称中筛选出名称得分大于或等于预设阈值的目标标准名称;
[0095] 排序子单元,用于按照名称得分降序的顺序,展示各目标标准名称及其对应的税收分类编码。
[0096] 可选的,计算单元具体用于根据商品名称的字符长度和第一标准名称的字符长度,确定出商品名称与第一标准名称的编辑距离;其中,第一标准名称为所有标准名称中的任意一个标准名称;按照如下公式,计算商品名称与第一标准名称之间的名称得分,[0097]
[0098] 其中,m表示预先设定的匹配度分值。
[0099] 可选的,目标标准名称及其对应的税收分类编码所对应的匹配度由用户选择得分以及认证得分确定得到。
[0100] 可选的,在展示满足得分要求的目标标准名称及其对应的税收分类编码之后还包括存储单元;
[0101] 存储单元,用于在获取到用户选择的标准名称之后,将用户选择的标准名称与商品名称存储到对应关系库。
[0102] 可选的,还包括查找单元;
[0103] 查找单元,用于在获取到用户输入的新商品名称之后,从对应关系库中查找是否存在与新商品名称相对应的标准名称;
[0104] 若是,则触发展示单元展示与新商品名称相对应的标准名称以及税收分类编码;
[0105] 若否,则触发获取单元执行采用es字段匹配,从数据库中获取与新商品名称相对应的标准名称的步骤。
[0106] 可选的,还包括匹配单元;
[0107] 匹配单元,用于基于大数据分析技术,匹配出商品名称对应的税收分类编码;
[0108] 展示单元还用于展示商品名称对应的税收分类编码。
[0109] 图3所对应实施例中特征的说明可以参见图1所对应实施例的相关说明,这里不再一一赘述。
[0110] 由上述技术方案可以看出,接收用户输入的商品名称;采用es字段匹配,从数据库中获取与商品名称相对应的标准名称;匹配出的标准名称可能有多个,可以根据最小编辑距离算法,计算出商品名称与各标准名称之间的名称得分;名称得分越高,说明标准名称和商品名称越贴近。为了便于用户选择,可以展示满足得分要求的目标标准名称及其对应的税收分类编码;其中,每个目标标准名称及其对应的税收分类编码有对应的匹配度。用户可以根据实际商品类别,选择合适的目标标准名称作为发票开具的商品名称。在该技术方案中,通过对用户输入的商品名称进行检测,向用户提供规范化的标准名称,可大幅提高发票开具的规范性,保证了发票开具时商品名称的正确性。并且每个标准名称有其对应的税收分类编码,在确定出发票开具的商品名称之后,可以准确的匹配到税收分类编码,提高了编码匹配的准确性。
[0111] 图4为本发明实施例提供的一种商品名称校正装置40的硬件结构示意图,包括:
[0112] 存储器41,用于存储计算机程序;
[0113] 处理器42,用于执行计算机程序以实现如上述任意一项商品名称校正方法的步骤。
[0114] 本发明实施例还提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现如上述任一项商品名称校正方法的步骤。
[0115] 以上对本发明实施例所提供的一种商品名称校正方法、装置和计算机可读存储介质进行了详细介绍。说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。
[0116] 专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
[0117] 结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈