首页 / 专利库 / 生物计算 / 力反馈 / 一种基于化工行业的搜索方法

一种基于化工行业的搜索方法

阅读:3发布:2020-11-13

专利汇可以提供一种基于化工行业的搜索方法专利检索,专利查询,专利分析的服务。并且本 发明 涉及一种基于化工行业的搜索方法,包括以下步骤:首先数据准备;然后将搜索描述拆分为多个关键词;接着通过关键词进行第一次搜索和第二次搜索,其中,所述第一次搜索用于得到与所述多个关键词匹配成功的品牌和/或店铺,将匹配成功的品牌和/或店铺及其所有属性作为搜索结果,所述第二次搜索在第一次搜索的 基础 上搜索得到与所述多个关键词匹配的商品,将匹配成功的商品的所有属性作为搜索结果作为搜索结果;最后反馈第一次搜索和第二次搜索的搜索结果。本发明通过采用CAS号和非CAS号进行搜索,实现了化工行业的搜索,另外通过数据的准备,实现数据集群,从而有效的提高了搜索速率,并且缓解了存储压 力 。,下面是一种基于化工行业的搜索方法专利的具体信息内容。

1.一种基于化工行业的搜索方法,其特征在于,包括以下步骤:
数据准备,建立集群存储的品牌库、店铺库、化合物库以及商品库;
接收输入的搜索描述,并将所述搜索描述拆分为多个关键词;
进行第一次搜索,搜索所述品牌库和所述店铺库中与所述多个关键词匹配的品牌和/或店铺;若所述第一次搜索为有至少一个匹配成功的品牌和/或店铺,则缓存匹配成功品牌的ID和/或店铺的ID,并将匹配成功的品牌及其所有属性和/或店铺及其所有属性作为搜索结果;
进行第二次搜索,第二次搜索采用化合物CAS号搜索或非化合物CAS号搜索,搜索所述商品库中与所述多个关键词匹配的商品;若第二次搜索为有与所述多个关键词匹配成功的商品,则缓存匹配成功的商品以及商品中所包含的化合物,并将匹配成功的商品的所有属性作为搜索结果;
若第一次搜索匹配成功,则将缓存的品牌的ID和/或店铺的ID带入第二次搜索,若第二次搜索匹配成功,则反馈由第二次搜索结果整理得到的反馈信息;若第二次搜索匹配不成功,则反馈第一次搜索结果,包括匹配成功的至少一个品牌及其所有属性和/或至少一个店铺及其所有属性;
若第一次搜索匹配不成功,则进行第二次搜索,若第二次搜索匹配成功,则反馈由第二次搜索结果整理得到的反馈信息;若第二次搜索匹配不成功,则反馈搜索无结果。
2.如权利要求1所述的基于化工行业的搜索方法,其特征在于,所述品牌库、所述店铺库、所述化合物库以及所述商品库以集群的方式存储;
所述品牌库包括多个品牌及其属性,所述品牌的属性包括品牌ID、品牌名称、品牌标识以及品牌黑名单;
所述店铺库包括多个店铺及其属性,所述店铺的属性包括店铺ID、店铺名称、店铺营销数据、店铺类型、店铺积分、店铺等级、店铺所在地区、店铺联系人以及店铺黑名单;
所述化合物库包括多种化合物及其属性,所述化合物的属性包括化合物ID、化合物名称、化合物别名、化合物CAS号、化合物的分子式、化合物的分子量、化合物的INCHI串、化合物的SMILES串、化合物的标签、化合物所属的分类以及化合物的属性组;
所述商品库包括多个商品及其属性,所述商品的属性包括商品ID、商品名称、商品货号、商品营销数据、商品所属的品牌的ID及搜索属性、商品所属的店铺的ID及搜索属性、商品所包含的化合物的ID及搜索属性、商品规格、商品价格、商品纯度、商品积分以及商品货期。
3.如权利要求2所述的基于化工行业的搜索方法,其特征在于,搜索过程中,所述多个关键词与所述品牌库、所述店铺库、所述化合物库以及所述商品库中的搜索属性进行匹配;
所述品牌的搜索属性包括品牌名称;
所述店铺的搜索属性包括店铺名称;
所述化合物的搜索属性包括化合物名称、化合物别名、化合物CAS号、化合物的分子式、化合物的分子量、化合物的INCHI串和化合物的SMILES串;
所述商品的搜索属性包括商品名称和商品货号。
4.如权利要求3所述的基于化工行业的搜索方法,其特征在于,在将所述搜索描述拆分为多个关键词之后,进行第一次搜索之前,还包括以下步骤:
对关键词进行转义和第一次过滤,转义用于将关键词转义成能与所述搜索属性相匹配的关键词,第一次过滤用于过滤掉无法与所述搜索属性相匹配的关键词。
5.如权利要求4所述的基于化工行业的搜索方法,其特征在于,若第一次过滤之后没有与所述搜索属性相匹配的关键词,则反馈搜索无结果。
6.如权利要求3所述的基于化工行业的搜索方法,其特征在于,在第一次搜索之后,对关键词进行第二次过滤,第二次过滤将运用于第一次搜索的关键词过滤掉,若第二次过滤之后没有与所述搜索属性相匹配的关键词,则反馈第一次搜索结果,包括匹配成功的至少一个品牌及其所有属性和/或至少一个店铺及其所有属性。
7.如权利要求6所述的基于化工行业的搜索方法,其特征在于,若品牌和/或店铺名称中包含商品或化合物的搜索属性时,则所述品牌和/或所述店铺设置黑名单,所述黑名单包括所述品牌和/或所述店铺名称中所包含商品或化合物的搜索属性;
进行第一次搜索时,若黑名单与所述多个关键词中任一关键词匹配成功,则与关键词匹配的黑名单所属的品牌和/或店铺不能被搜索到,且与所述黑名单相匹配的关键词在第二次过滤时不被过滤掉。
8.如权利要求3所述的基于化工行业的搜索方法,其特征在于,进行第一次搜索时,若与所述多个关键词匹配成功品牌和/或店铺不止一个,则匹配成功的品牌和/或店铺根据匹配评分的降序依次展示。
9.如权利要求3所述的基于化工行业的搜索方法,其特征在于,进行第二次搜索时,包括以下步骤:
若进行第二次搜索的关键词中仅含有格式正确的化合物的CAS号时,采用化合物CAS号搜索,若搜索到化合物CAS号对应的化合物所属的所有商品,则缓存所有商品,并将搜索到的所有商品及其所有属性作为搜索结果,若没有匹配到化合物,则第二次搜索匹配不成功;
若进行第二次搜索的关键词中含有化合物名称、化合物别名、化合物的分子式、化合物的分子量、化合物的INCHI串、化合物的SMILES串、商品名称以及商品货号搜索属性中的一种或多种时,采用非化合物CAS号搜索,若关键词为商品的搜索属性并匹配到多个商品,则缓存多个商品及其包含的化合物,并将所有商品的所有属性作为搜索结果;若关键词为化合物的搜索属性并匹配到多种化合物及其所属的所有商品,缓存所有商品,并将搜索到的所有商品及其所有属性作为搜索结果,若没有匹配到商品和化合物,则第二次搜索匹配不成功;
若进行第二次搜索的关键词中既含有化合物CAS号搜索的搜索属性,又含有非化合物CAS号搜索的搜索属性,则进行化合物CAS号搜索和非化合物CAS号搜索,同时反馈两种搜索的结果,若其中任意一种搜索方式没有搜索结果,则仅反馈搜索到的搜索结果,若两种搜索方式都没有结果,则第二次搜索匹配不成功。
10.如权利要求9所述的基于化工行业的搜索方法,其特征在于,第二次搜索若匹配成功,在得到搜索结果之后,反馈信息之前,还包括以下步骤:
对搜索结果进行整理,将所有商品按照所包含的化合物的ID进行分类,所包含的化合物的ID相同的所有商品为同一条反馈信息;
第二次搜索若匹配成功,则反馈至少一条反馈信息。
11.如权利要求1所述的基于化工行业的搜索方法,其特征在于,用户接收到反馈信息之后,若用户请求调取第二次搜索结果中商品所包含的化合物的所有属性,则对第二次搜索结果中商品所包含的化合物的所有属性进行调取并反馈。
12.如权利要求1所述的基于化工行业的搜索方法,其特征在于,所述品牌库、所述店铺库、所述化合物库以及所述商品库以集群的方式存储包括以下步骤:
通过中间件获取店铺系统、品牌系统、商品系统、化合物系统以及营销系统中数据;
所述中间件将所述数据传输至所述搜索引擎
所述搜索引擎根据规定格式对接收到的数据进行整合;
将整合后的数据发送至集群中的所述品牌库、所述店铺库、所述化合物库以及所述商品库。

说明书全文

一种基于化工行业的搜索方法

技术领域

[0001] 本发明涉及数据搜索技术领域,特别涉及一种基于化工行业的搜索方法。

背景技术

[0002] 随着社会的发展,搜索技术已经遍布于各个网站,无论是专有的搜索网站,还是各个电商网站,甚至公司内部系统,都离不开搜索技术。搜索的速率直接影响用户的体验,由于业务的增多以及时间的累加,后台数据量持续增长,由开始一两百万数据扩展到后面几千万甚至上亿的数据时,传统的基于磁盘存储的数据库已经不能及时的响应模糊搜索了。
[0003] 并且,对于化工行业的搜索更是不同于普通的数据搜索,化工行业中的化合物等有其独特的书写方式,例如化合物的分子式、分子量、INCHI串以及SMILES串等都有可能参与搜索,而目前普通搜索方式大多都是文字性的搜索,与化工行业的搜索有着巨大的差别,且现有技术中目前并无如何对化工行业进行搜索的介绍,也无相关技术对化工行业搜索的速率进行提升。
[0004] 因此有必要提供一种基于化工行业的搜索方法,实现化工行业的搜索,并且有效的提高搜索速率以及缓解存储压

发明内容

[0005] 本发明的目的在于提供一种基于化工行业的搜索方法,实现化工行业的搜索,并且有效的提高搜索速率以及缓解存储压力。
[0006] 为了解决现有技术中存在的问题,本发明提供了一种基于化工行业的搜索方法,包括以下步骤:
[0007] 数据准备,建立集群存储的品牌库、店铺库、化合物库以及商品库;
[0008] 接收输入的搜索描述,并将所述搜索描述拆分为多个关键词;
[0009] 进行第一次搜索,搜索所述品牌库和所述店铺库中与所述多个关键词匹配的品牌和/或店铺;若所述第一次搜索为有至少一个匹配成功的品牌和/或店铺,则缓存匹配成功品牌的ID和/或店铺的ID,并将匹配成功的品牌及其所有属性和/或店铺及其所有属性作为搜索结果;
[0010] 进行第二次搜索,第二次搜索采用化合物CAS号搜索或非化合物CAS号搜索,搜索所述商品库中与所述多个关键词匹配的商品;若第二次搜索为有与所述多个关键词匹配成功的商品,则缓存匹配成功的商品以及商品中所包含的化合物,并将匹配成功的商品的所有属性作为搜索结果;
[0011] 若第一次搜索匹配成功,则将缓存的品牌的ID和/或店铺的ID带入第二次搜索,若第二次搜索匹配成功,则反馈由第二次搜索结果整理得到的反馈信息;若第二次搜索匹配不成功,则反馈第一次搜索结果,包括匹配成功的至少一个品牌及其所有属性和/或至少一个店铺及其所有属性;
[0012] 若第一次搜索匹配不成功,则进行第二次搜索,若第二次搜索匹配成功,则反馈由第二次搜索结果整理得到的反馈信息;若第二次搜索匹配不成功,则反馈搜索无结果。
[0013] 可选的,在所述基于化工行业的搜索方法中,所述品牌库、所述店铺库、所述化合物库以及所述商品库以集群的方式存储;
[0014] 所述品牌库包括多个品牌及其属性,所述品牌的属性包括品牌ID、品牌名称、品牌标识以及品牌黑名单;
[0015] 所述店铺库包括多个店铺及其属性,所述店铺的属性包括店铺ID、店铺名称、店铺营销数据、店铺类型、店铺积分、店铺等级、店铺所在地区、店铺联系人以及店铺黑名单;
[0016] 所述化合物库包括多种化合物及其属性,所述化合物的属性包括化合物ID、化合物名称、化合物别名、化合物CAS号、化合物的分子式、化合物的分子量、化合物的INCHI串、化合物的SMILES串、化合物的标签、化合物所属的分类以及化合物的属性组;
[0017] 所述商品库包括多个商品及其属性,所述商品的属性包括商品ID、商品名称、商品货号、商品营销数据、商品所属的品牌的ID及搜索属性、商品所属的店铺的ID及搜索属性、商品所包含的化合物的ID及搜索属性、商品规格、商品价格、商品纯度、商品积分以及商品货期。
[0018] 可选的,在所述基于化工行业的搜索方法中,搜索过程中,所述多个关键词与所述品牌库、所述店铺库、所述化合物库以及所述商品库中的搜索属性进行匹配;
[0019] 所述品牌的搜索属性包括品牌名称;
[0020] 所述店铺的搜索属性包括店铺名称;
[0021] 所述化合物的搜索属性包括化合物名称、化合物别名、化合物CAS号、化合物的分子式、化合物的分子量、化合物的INCHI串和化合物的SMILES串;
[0022] 所述商品的搜索属性包括商品名称和商品货号。
[0023] 可选的,在所述基于化工行业的搜索方法中,在将所述搜索描述拆分为多个关键词之后,进行第一次搜索之前,还包括以下步骤:
[0024] 对关键词进行转义和第一次过滤,转义用于将关键词转义成能与所述搜索属性相匹配的关键词,第一次过滤用于过滤掉无法与所述搜索属性相匹配的关键词。
[0025] 可选的,在所述基于化工行业的搜索方法中,若第一次过滤之后没有与所述搜索属性相匹配的关键词,则反馈搜索无结果。
[0026] 可选的,在所述基于化工行业的搜索方法中,在第一次搜索之后,对关键词进行第二次过滤,第二次过滤将运用于第一次搜索的关键词过滤掉,若第二次过滤之后没有与所述搜索属性相匹配的关键词,则反馈第一次搜索结果,包括匹配成功的至少一个品牌及其所有属性和/或至少一个店铺及其所有属性。
[0027] 可选的,在所述基于化工行业的搜索方法中,若品牌和/或店铺名称中包含商品或化合物的搜索属性时,则所述品牌和/或所述店铺设置黑名单,所述黑名单包括所述品牌和/或所述店铺名称中所包含商品或化合物的搜索属性;
[0028] 进行第一次搜索时,若黑名单与所述多个关键词中任一关键词匹配成功,则与关键词匹配的黑名单所属的品牌和/或店铺不能被搜索到,且与所述黑名单相匹配的关键词在第二次过滤时不被过滤掉。
[0029] 可选的,在所述基于化工行业的搜索方法中,进行第一次搜索时,若与所述多个关键词匹配成功品牌和/或店铺不止一个,则匹配成功的品牌和/或店铺根据匹配评分的降序依次展示。
[0030] 可选的,在所述基于化工行业的搜索方法中,进行第二次搜索时,包括以下步骤:
[0031] 若进行第二次搜索的关键词中仅含有格式正确的化合物的CAS号时,采用化合物CAS号搜索,若搜索到化合物CAS号对应的化合物所属的所有商品,则缓存所有商品,并将搜索到的所有商品及其所有属性作为搜索结果,若没有匹配到化合物,则第二次搜索匹配不成功;
[0032] 若进行第二次搜索的关键词中含有化合物名称、化合物别名、化合物的分子式、化合物的分子量、化合物的INCHI串、化合物的SMILES串、商品名称以及商品货号搜索属性中的一种或多种时,采用非化合物CAS号搜索,若关键词为商品的搜索属性并匹配到多个商品,则缓存多个商品及其包含的化合物,并将所有商品的所有属性作为搜索结果;若关键词为化合物的搜索属性并匹配到多种化合物及其所属的所有商品,缓存所有商品,并将搜索到的所有商品及其所有属性作为搜索结果,若没有匹配到商品和化合物,则第二次搜索匹配不成功;
[0033] 若进行第二次搜索的关键词中既含有化合物CAS号搜索的搜索属性,又含有非化合物CAS号搜索的搜索属性,则进行化合物CAS号搜索和非化合物CAS号搜索,同时反馈两种搜索的结果,若其中任意一种搜索方式没有搜索结果,则仅反馈搜索到的搜索结果,若两种搜索方式都没有结果,则第二次搜索匹配不成功。
[0034] 可选的,在所述基于化工行业的搜索方法中,第二次搜索若匹配成功,在得到搜索结果之后,反馈信息之前,还包括以下步骤:
[0035] 对搜索结果进行整理,将所有商品按照所包含的化合物的ID进行分类,所包含的化合物的ID相同的所有商品为同一条反馈信息;
[0036] 第二次搜索若匹配成功,则反馈至少一条反馈信息。
[0037] 可选的,在所述基于化工行业的搜索方法中,用户接收到反馈信息之后,若用户请求调取第二次搜索结果中商品所包含的化合物的所有属性,则对第二次搜索结果中商品所包含的化合物的所有属性进行调取并反馈。
[0038] 可选的,在所述基于化工行业的搜索方法中,所述品牌库、所述店铺库、所述化合物库以及所述商品库以集群的方式存储包括以下步骤:
[0039] 通过中间件获取店铺系统、品牌系统、商品系统、化合物系统以及营销系统中数据;
[0040] 所述中间件将所述数据传输至所述搜索引擎
[0041] 所述搜索引擎根据规定格式对接收到的数据进行整合;
[0042] 将整合后的数据发送至集群中的所述品牌库、所述店铺库、所述化合物库以及所述商品库。
[0043] 在本发明所提供的基于化工行业的搜索方法中,通过集群的方式存储各个数据库,缓解了存储压力,并且,采用两次分步式搜索的方式,降低了各数据库的搜索压力,提高了搜索速率;另外在第二次搜索中主要采用了化合物CAS号搜索或非化合物CAS号搜索,从而能匹配到与所述多个关键词匹配的化合物或商品,实现了化工行业的搜索;且本发明用于搜索化合物相关的商品、店铺以及品牌,为各化学品供应商和服务商提供全面的查询。附图说明
[0044] 图1为本发明实施例提供的基于化工行业的搜索方法的流程图
[0045] 图2为本发明实施例提供的基于化工行业的搜索流程图。

具体实施方式

[0046] 下面将结合示意图对本发明的具体实施方式进行更详细的描述。根据下列描述,本发明的优点和特征将更清楚。需说明的是,附图均采用非常简化的形式且均使用非精准的比例,仅用以方便、明晰地辅助说明本发明实施例的目的。
[0047] 在下文中,如果本文所述的方法包括一系列步骤,本文所呈现的这些步骤的顺序并非必须是可执行这些步骤的唯一顺序,且一些所述的步骤可被省略和/或一些本文未描述的其他步骤可被添加到该方法。
[0048] 目前现有技术中并无如何对化工行业进行搜索的介绍,也无相关技术对化工行业搜索的速率进行提升。因此有必要提供一种基于化工行业的搜索方法,如图1所示,图1为本发明实施例提供的基于化工行业的搜索方法的流程图,所述基于化工行业的搜索方法包括以下步骤:
[0049] S1:数据准备,建立集群存储的品牌库、店铺库、化合物库以及商品库;
[0050] S2:接收输入的搜索描述,并将所述搜索描述拆分为多个关键词;
[0051] S3:进行第一次搜索,搜索所述品牌库和所述店铺库中与所述多个关键词匹配的品牌和/或店铺;若所述第一次搜索为有至少一个匹配成功的品牌和/或店铺,则缓存匹配成功品牌的ID和/或店铺的ID,并将匹配成功的品牌及其所有属性和/或店铺及其所有属性作为搜索结果;
[0052] S4:进行第二次搜索,第二次搜索采用化合物CAS号搜索或非化合物CAS号搜索,搜索所述商品库中与所述多个关键词匹配的商品;若第二次搜索为有与所述多个关键词匹配成功的商品,则缓存匹配成功的商品以及商品中所包含的化合物,并将匹配成功的商品的所有属性作为搜索结果;
[0053] S5:若第一次搜索匹配成功,则将缓存的品牌的ID和/或店铺的ID带入第二次搜索,若第二次搜索匹配成功,则反馈由第二次搜索结果整理得到的反馈信息;若第二次搜索匹配不成功,则反馈第一次搜索结果,包括匹配成功的至少一个品牌及其所有属性和/或至少一个店铺及其所有属性;
[0054] 若第一次搜索匹配不成功,则进行第二次搜索,若第二次搜索匹配成功,则反馈由第二次搜索结果整理得到的反馈信息;若第二次搜索匹配不成功,则反馈搜索无结果。
[0055] 本发明通过集群的方式存储各个数据库,缓解了存储压力,并且,采用两次分步式搜索的方式,降低了各数据库的搜索压力,提高了搜索速率;另外在第二次搜索中主要采用了化合物CAS号搜索或非化合物CAS号搜索,从而能匹配到与所述多个关键词匹配的化合物或商品,实现了化工行业的搜索;且本发明用于搜索化合物相关的商品、店铺以及品牌,为各化学品供应商和服务商提供全面的查询。
[0056] 进一步的,在搜索之前,还需要对数据进行准备,以通过服务器集群的方式进行数据存储,所述品牌库、所述店铺库、所述化合物库以及所述商品库以集群的方式存储包括以下步骤:
[0057] 通过中间件获取店铺系统、品牌系统、商品系统、化合物系统以及营销系统中数据;
[0058] 所述中间件将所述数据传输至所述搜索引擎;
[0059] 所述搜索引擎根据规定格式对接收到的数据进行整合;
[0060] 将整合后的数据发送至集群中的所述品牌库、所述店铺库、所述化合物库以及所述商品库。
[0061] 其中,所述店铺营销数据和所述商品营销数据通过营销系统获得。
[0062] 在存储过程中,所述搜索引擎将所述品牌库、所述店铺库、所述化合物库以及所述商品库中的数据按照规定格式进行整合,使所述品牌库、所述店铺库、所述化合物库以及所述商品库中的数据包括以下内容:
[0063] 所述品牌库包括多个品牌及其属性,所述品牌的属性包括品牌ID、品牌名称、品牌标识(例如品牌logo)以及品牌黑名单;
[0064] 所述店铺库包括多个店铺及其属性,所述店铺的属性包括店铺ID、店铺名称、店铺营销数据、店铺类型、店铺积分、店铺等级、店铺所在地区、店铺联系人以及店铺黑名单;
[0065] 所述化合物库包括多种化合物及其属性,所述化合物的属性包括化合物ID、化合物名称、化合物别名、化合物CAS号、化合物的分子式、化合物的分子量、化合物的INCHI串、化合物的SMILES串、化合物的标签、化合物所属的分类以及化合物的属性组(例如化合物属性的标题组);
[0066] 所述商品库包括多个商品及其属性,所述商品的属性包括商品ID、商品名称、商品货号、商品营销数据、商品所属的品牌的ID及搜索属性、商品所属的店铺的ID及搜索属性、商品所包含的化合物的ID及搜索属性、商品规格、商品价格、商品纯度、商品积分以及商品货期。
[0067] 其中,所述品牌、所述店铺、所述化合物以及所述商品的所有属性中包括有搜索属性,所述搜索属性用于与所述多个关键词进行匹配从而实现搜索;所述品牌、所述店铺、所述化合物以及所述商品的搜索属性如下:所述品牌的搜索属性包括品牌名称;所述店铺的搜索属性包括店铺名称;所述化合物的搜索属性包括化合物名称、化合物别名、化合物CAS号、化合物的分子式、化合物的分子量、化合物的INCHI串和化合物的SMILES串;所述商品的搜索属性包括商品名称和商品货号。
[0068] 进一步的,由于本发明中所述商品的属性中包含了部分品牌、店铺以及化合的属性,因此在存储的内容更新时采用分步式方法进行更新,且存储更新具有联动关系。存储更新包括以下步骤:若是店铺系统中数据更新,则更新店铺库中存储的内容,并且还更新商品库中的相关内容;若是品牌系统中数据更新,则更新品牌库中存储的内容,并且还更新商品库中的相关内容;若是化合物系统中数据更新,则更新化合物库中存储的内容,并且还更新商品库中的相关内容;若是营销系统中数据更新,则更新店铺库中存储的内容,并且还更新商品库中的相关内容;若是商品系统中数据更新,则更新商品库中的相关内容。
[0069] 在本发明所提供的基于化工行业的搜索方法中,搜索方法如图2所示,图2为本发明实施例提供的基于化工行业的搜索流程图,具体搜索流程如下:
[0070] 接收输入的搜索描述,并将所述搜索描述拆分为多个关键词;在将所述搜索描述拆分为多个关键词之后,还需要对关键词进行转义和第一次过滤,转义用于将关键词转义成能与所述搜索属性相匹配的关键词,例如关键词为用于洗衣服,则可以将关键词转义为洗衣粉、洗衣液或其他与搜索属性相匹配关键词,用于洗衣服是一种用途,不能与搜索属性进行匹配,而洗衣粉或洗衣液为商品的名称,能与所述搜索属性进行匹配。第一次过滤用于过滤掉无法与所述搜索属性相匹配的关键词,例如关键词为价格为XX元,地址在某某省,这类关键词不能与搜索属性相匹配,可以直接过滤掉。进一步的,若第一次过滤之后没有与所述搜索属性相匹配的关键词,则直接反馈搜索无结果。
[0071] 接着进行第一次搜索,用于搜索所述品牌库和所述店铺库中与所述多个关键词匹配的品牌和/或店铺;若所述第一次搜索为有至少一个匹配成功的品牌和/或店铺,则缓存匹配成功品牌的ID和/或店铺的ID,并将匹配成功的品牌及其所有属性和/或店铺及其所有属性作为搜索结果;若所述第一次搜索后没有与所述多个关键词匹配成功的品牌和店铺,则不缓存,且没有搜索结果。
[0072] 进一步的,若与所述多个关键词匹配成功品牌和/或店铺不止一个,则匹配成功的品牌和/或店铺根据匹配评分的降序依次展示。具体评分规则是完全匹配分值>包含匹配分值>变形匹配分值,具体评分机制可以采用TF/IDF(词频/逆文档频率)算法
[0073] 在第一次搜索之后,会对关键词进行第二次过滤,第二次过滤将运用于第一次搜索的关键词过滤掉,若第二次过滤之后没有与所述搜索属性相匹配的关键词,则反馈第一次搜索结果,包括匹配成功的至少一个品牌及其所有属性和/或至少一个店铺及其所有属性。
[0074] 优选的,若品牌和/或店铺名称中包含商品或化合物的搜索属性时,则所述品牌和/或所述店铺设置黑名单,所述黑名单包括所述品牌和/或所述店铺名称中所包含商品或化合物的搜索属性;
[0075] 进行第一次搜索时,若黑名单与所述多个关键词中任一关键词匹配成功,则与关键词匹配的黑名单所属的品牌和/或店铺不能被搜索到,且与所述黑名单相匹配的关键词在第二次过滤时不被过滤掉。
[0076] 接着进行第二次搜索时,第二次搜索采用化合物CAS号搜索或非化合物CAS号搜索,包括以下步骤:
[0077] 若进行第二次搜索的关键词中仅含有格式正确的化合物的CAS号时,采用化合物CAS号搜索,若搜索到化合物CAS号对应的化合物所属的所有商品,则缓存所有商品,并将搜索到的所有商品及其所有属性作为搜索结果,若没有匹配到化合物,则第二次搜索匹配不成功;
[0078] 若进行第二次搜索的关键词中含有化合物名称、化合物别名、化合物的分子式、化合物的分子量、化合物的INCHI串、化合物的SMILES串、商品名称以及商品货号搜索属性中的一种或多种时,采用非化合物CAS号搜索,若关键词为商品的搜索属性并匹配到多个商品,则缓存多个商品及其包含的化合物,并将所有商品的所有属性作为搜索结果;若关键词为化合物的搜索属性并匹配到多种化合物及其所属的所有商品,缓存所有商品,并将搜索到的所有商品及其所有属性作为搜索结果,若没有匹配到商品和化合物,则第二次搜索匹配不成功;
[0079] 若进行第二次搜索的关键词中既含有化合物CAS号搜索的搜索属性,又含有非化合物CAS号搜索的搜索属性,则进行化合物CAS号搜索和非化合物CAS号搜索,同时反馈两种搜索的结果,若其中任意一种搜索方式没有搜索结果,则仅反馈搜索到的搜索结果,若两种搜索方式都没有结果,则第二次搜索匹配不成功。
[0080] 进一步的,第二次搜索若匹配成功,在得到搜索结果之后,反馈信息之前,还包括以下步骤:
[0081] 对搜索结果进行整理,将所有商品按照所包含的化合物的ID进行分类,所包含的化合物的ID相同的所有商品为同一条反馈信息;
[0082] 第二次搜索若匹配成功,则反馈至少一条反馈信息。
[0083] 若是反馈多条信息,则根据化合物匹配评分的降序依次展示。具体评分规则是完全匹配分值>包含匹配分值>变形匹配分值,具体评分机制可以采用TF/IDF(词频/逆文档频率)算法。
[0084] 最后反馈第一次搜索和第二次搜索的搜索结果包括以下步骤:
[0085] 若第一次搜索匹配成功,则将缓存的品牌的ID和/或店铺的ID带入第二次搜索,若第二次搜索匹配成功,则反馈由第二次搜索结果整理得到的反馈信息;若第二次搜索匹配不成功,则反馈第一次搜索结果,包括匹配成功的至少一个品牌及其所有属性和/或至少一个店铺及其所有属性;
[0086] 若第一次搜索匹配不成功,则进行第二次搜索,若第二次搜索匹配成功,则反馈由第二次搜索结果整理得到的反馈信息;若第二次搜索匹配不成功,则反馈搜索无结果。
[0087] 进一步的,用户接收到反馈信息之后,若用户请求调取第二次搜索结果中商品所包含的化合物的所有属性,则对第二次搜索结果中商品所包含的化合物的所有属性进行调取并反馈。
[0088] 优选的,本发明中对于搜索无结果时,将“搜索无结果”的情况记录下来并分析,若类似的“搜索无结果”很多,且都是由于相同原因导致的,例如是搜索逻辑和/或数据原因导致的,则会对搜索逻辑和/或数据进行调整。
[0089] 综上,在本发明所提供的基于化工行业的搜索方法中,通过集群的方式存储各个数据库,缓解了存储压力,并且,采用两次分步式搜索的方式,降低了各数据库的搜索压力,提高了搜索速率;另外在第二次搜索中主要采用了化合物CAS号搜索或非化合物CAS号搜索,从而能匹配到与所述多个关键词匹配的化合物或商品,实现了化工行业的搜索;且本发明用于搜索化合物相关的商品、店铺以及品牌,为各化学品供应商和服务商提供全面的查询,还通过对搜索结果进行评分,最大限度返回用户感兴趣的数据。
[0090] 上述仅为本发明的优选实施例而已,并不对本发明起到任何限制作用。任何所属技术领域的技术人员,在不脱离本发明的技术方案的范围内,对本发明揭露的技术方案和技术内容做任何形式的等同替换或修改等变动,均属未脱离本发明的技术方案的内容,仍属于本发明的保护范围之内。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈