首页 / 专利库 / 商业 / 广告位 / 在网页上发布指定内容的方法和系统

在网页上发布指定内容的方法和系统

阅读:903发布:2024-01-04

专利汇可以提供在网页上发布指定内容的方法和系统专利检索,专利查询,专利分析的服务。并且本 发明 涉及在网页上发布 指定 内容的方法和设备。根据本发明,提供了一种用于在网页的指定 位置 上发布指定内容的方法,所述方法包括:对在其中发布指定内容的指 定位 置的周围上下文进行 情感分析 ,确定指定位置的周围上下文的情感倾向性;以及基于所确定的指定位置的周围上下文的情感倾向性,选择是否在该网页的指定位置上发布所述指定内容。根据本发明,提高了网页内容的相关性,增强了网页内容之间的情感匹配性,使网页布局变得更合理,改善了用户对网页内容的感受,增加了 网站 的点击率和网站收入。更具体地,本发明提供了能在网页上提供具有情感匹配的网络 电子 广告的有益效果。,下面是在网页上发布指定内容的方法和系统专利的具体信息内容。

1.一种用于在网页的指定位置上发布指定内容的方法,所述方法包括以下步骤:
对在其中发布指定内容的指定位置的周围上下文进行情感分析,确定指定位置的周围上下文的情感倾向性;以及
基于所确定的指定位置的周围上下文的情感倾向性,选择是否在该网页的指定位置上发布所述指定内容,
其中,确定指定位置的周围上下文的情感倾向性包括:确定指定位置的周围上下文相对于指定内容的情感倾向性,
其中所述方法还包括:响应于在其中已发布指定内容的指定位置的周围上下文的变化,重新确定变化后的指定位置的周围上下文相对于已发布指定内容的情感倾向性。
2.根据权利要求1所述的方法,其中,确定指定位置的周围上下文相对于指定内容的情感倾向性还包括:确定指定位置的周围上下文相对于指定内容的情绪倾向性,以及基于所述情绪倾向性将情感倾向性进一步细分为更加细粒度的多个类别。
3.根据权利要求1-2中任何一个所述的方法,进一步包括:
从指定位置的周围上下文中提取多个关键词;
基于与指定内容相关的预定关键词,对从指定位置的周围上下文中提取的多个关键词进行过滤,以确定该网页是否与指定内容相关。
4.根据权利要求1-2中任何一个所述的方法,进一步包括:
利用命名实体识别技术,抽取指定位置周围上下文中的实体对象;以及对所抽取的实体对象进行特征提取。
5.根据权利要求1-2中任何一个所述的方法,其中,确定指定位置的周围上下文的情感倾向性包括:
对网页进行分割以获得多个网页
提取指定位置所处的主网页块;以及
确定所提取的主网页块的网页内容的情感倾向性。
6.根据权利要求1-2中任何一个所述的方法,进一步包括:
对指定位置的周围上下文中处于不同位置的情感句子进行加权,计算指定位置的周围上下文的情感倾向性。
7.根据权利要求1-2中任何一个所述的方法,进一步包括:
基于与指定内容有关的实体所设定的有关指定内容的情感属性,确定指定位置的周围上下文的情感倾向性。
8.根据权利要求1-2中任何一个所述的方法,进一步包括:
记录多个观看者对指定位置所处的网页内容所做出的情感评价;以及
基于所述多个观看者所做出的情感评价记录,确定指定位置周围上下文的情感倾向性。
9.根据权利要求1-2中任何一个所述的方法,其中,所述指定内容是网络电子广告。
10.根据权利要求1-2中任何一个所述的方法,其中,基于确定出的指定位置的周围上下文的情感倾向性,自动分析找出适合当前周围上下文的情感倾向性的其他指定内容。
11.一种用于在网页的指定位置上发布指定内容的系统,所述系统包括:
情感分析装置,用于对在其中发布指定内容的指定位置的周围上下文进行情感分析,确定指定位置的周围上下文的情感倾向性;以及
指定内容发布选择装置,用于基于所确定的指定位置的周围上下文的情感倾向性,选择是否在该网页的指定位置上发布所述指定内容,
其中,所述情感分析装置包括情感分析模块,用于确定指定位置的周围上下文相对于指定内容的情感倾向性,
其中:所述情感分析装置还被配置成:响应于在其中已发布指定内容的指定位置的周围上下文的变化,重新确定变化后的指定位置的周围上下文相对于已发布的指定内容的情感倾向性。
12.根据权利要求11所述的系统,其中,所述情感分析模块还包括:用于确定指定位置的周围上下文相对于指定内容的情绪倾向性以及基于所述情绪倾向性将情感倾向性进一步细分为更加细粒度的多个类别的单元。
13.根据权利要求11-12中任何一个所述的系统,所述情感分析装置还包括:
关键词提取模块,用于从指定位置的周围上下文中提取多个关键词;以及关键词过滤及聚焦实体分析模块,用于基于关键词提取模块提取出的、与指定内容相关的预定关键词,对从指定位置的周围上下文中提取的多个关键词进行过滤,以确定该网页是否与指定内容相关。
14.根据权利要求11-12中任何一个所述的系统,所述情感分析装置还包括:
关键词过滤及聚焦实体分析模块,用于利用命名实体识别技术,抽取指定位置周围上下文中的实体对象;以及对所抽取的实体对象进行特征提取。
15.根据权利要求11-12中任何一个所述的系统,其中,所述情感分析装置还包括:
网页分割模块,用于对网页进行分割以获得多个网页块,并提取指定位置所处的主网页块;以及
所述情感分析模块确定网页分割模块所提取的主网页块的网页内容的情感倾向性。
16.根据权利要求11-12中任何一个所述的系统,所述情感分析装置还包括:
情感强度加权模块,用于对指定位置的周围上下文中处于不同位置的情感句子进行加权;以及
所述情感分析模块基于情感强度加权模块对不同位置的情感句子的加权,计算指定位置的周围上下文的情感倾向性。
17.根据权利要求11-12中任何一个所述的系统,进一步包括:
情感属性设定模块,用于允许与指定内容有关的实体对有关指定内容进行情感属性设定;以及
所述情感分析装置基于情感属性设定模块对指定内容的情感属性设定,确定指定位置的周围上下文的情感倾向性。
18.根据权利要求11-12中任何一个所述的系统,进一步包括:
情感评价记录模块,用于记录多个观看者对指定位置所处的网页内容所做出的情感评价;以及
所述情感分析装置基于所述情感评价记录模块记录的多个观看者所做出的情感评价记录,确定指定位置周围上下文的情感倾向性。
19.根据权利要求11-12中任何一个所述的系统,其中,所述指定内容是网络电子广告。
20.根据权利要求11-12中任何一个所述的系统,其中,所述指定内容发布选择装置还被配置成:基于确定出的指定位置的周围上下文的情感倾向性,自动分析找出适合当前周围上下文的情感倾向性的其他指定内容。

说明书全文

在网页上发布指定内容的方法和系统

技术领域

[0001] 本发明一般涉及在网页上发布指定内容的方法和系统。特别地,本发明涉及基于对网页内容的情感分析结果,在网页的指定位置上发布与指定位置周围上下文情感匹配的指定内容的方法和系统。更具体地,本发明涉及在网页的指定位置上发布与指定位置周围上下文情感匹配的网络电子广告的方法和系统。

背景技术

[0002] 互联网已经成为最主要的信息传播介质。而且,如同收音机、电视、报纸和杂志等传播的内容那样,在互联网上传播的内容变得越来越丰富,也越来越被人们所关注。在互联网上传播的内容体现在各网站所呈现的各种网页中。当前,开发了各种与网页规划、网页文档创建、网页布局等有关的网页制作技术。基于各类网页制作技术,一个主网页例如可以被设计为包括多个网页(每个网页块还可以进一步包括多个子网页块),每个网页块可以由网站的不同部进行单独维护,以提高网站对各类信息进行更新的实时性和快捷性。一种在网页的指定网页块上显示指定内容的情形是:在网页的固定位置上(例如网页上的指定网页块上)定期发布指定内容。在这种情形下,该网页上的其他网页块中的内容会随时更新,而不会影响该指定内容的显示。另一种在网页的指定网页块上显示指定内容的情形是在进行内容搜索时的网页搜索结果页面,这种情形下,当根据用户输入的查询关键字而在一网页上显示查询结果时,还会在当前网页的指定位置上显示与查询关键字、或查询结果相关、且由网站运营商预先设定的指定内容。在这两种情形下,由于在网页的指定位置上显示的指定内容是由单独的部门单独维护的,因此可能会造成指定内容与网页上其他内容之间相冲突的问题,这种冲突例如是情感上不相匹配的问题,由此造成网页内容布局不合适、网页浏览者感受不舒服的缺陷
[0003] 另外,使用传统的媒体,如电视、收音机、报纸、杂志等来提供广告服务已为公众所知。但是,随着互联网的迅速发展,越来越多的人意识到,通过互联网来提供各种各样广告的服务会越来越流行,网络广告的市场规模越来越大,并且由此得到的网络广告效果也越来越好。特别地,希望通过互联网做广告的商业实体(广告主)越来越多。同时,网站运营商意识到通过为商业实体(广告主)提供为其所做的电子广告的服务(也可将提供广告服务的网站运营商称为“广告服务供应商”),会在网站提供大量免费信息的同时,通过提供网络电子广告来增加网站的收入。甚至于,由于越来越多的网站运营商意识到网络电子广告的收益占网站收入的比例越来越大,因此网站投入了大量人和物力来进行网络电子广告的技术开发,以满足日益增长的网络电子广告的各种需求,例如如何选择要投放的电子广告,如何针对受众人群,投放更适合的电子广告等的技术。但是,作为可以在网页的指定网页块上单独发布的内容,由于网络电子广告是由单独的技术部门进行维护的,由此可能会造成广告与网页上其它网页块中发布的内容在情感感受方面相冲突的问题。
[0004] 本领域技术人员知道,互联网上支持广告服务的部分主要是利用超文本传输协议(HTTP)来显示在网页上发布的超文本标记语言(HTML)文档的环球网网页。本领域技术人员可以理解,网络电子广告与网络上传播的内容一样,都可以采取:文字、图片、视频、链接等形式。
[0005] 在互联网网页上提供网络电子广告主要分成两类。一类是被称为“买断型(buyout-based)”或“标题型(banner)”传统电子广告。另一种是被称为“搜索型”电子广告。
[0006] 对于“买断型”的传统电子广告来说,其示例参见图1所示。“买断型”电子广告是指那些在网页上占据特定位置的广告,并且这类广告通常可以是图像、视频剪辑或flash。通常,广告主会通过网站购买一定的时段来在该网页的特定位置上持续投放其广告,由此进行广告宣传。参见图1,其中示出了现有技术中带有“买断型”网络电子广告的网页示意图。其中,该网页可以被分成多个网页块,例如这些网页块分别涉及“社会新闻”、“经济新闻”、“体育新闻”等内容。在其中的一个网页块102中,示意性示出了一则显示内容,以及在该网页块102中投放的广告108。所显示的内容例如包括标题部分104以及正文部分106。
而且,标题部分104以及正文部分106主要都是文本形式的内容。所投放的广告108可以是图片、文字、视频、动画等。
[0007] 对于“搜索型”网络电子广告,其示例参见图2所示。“搜索型”网络电子广告是诸如由Google(谷歌)或Baidu(百度)这类的搜索引擎提供的广告。例如,一些网站提供信息搜索功能,该信息搜索功能基于查找信息的用户所输入的查询关键词。而用户的查询可以被用作用户感兴趣的某类信息。通过将用户查询与广告主指定的关键词列表相比较,就有可能为这些搜索服务的用户提供某些有针对性的目标广告。这类“搜索”类型的网络电子广告可以进一步分为两个子类,例如由Google(谷歌)公司提供的Adwords(关键词广告)系统或AdSense(内容联盟广告)系统。一旦用户点击了广告主所投放的广告,则广告服务提供商(例如Google、Baidu这样的网站)就可以对广告主进行收费,从而增加网站收入。
[0008] Adwords(关键词广告)是将广告直接投放在搜索引擎的搜索结果页面上,并使广告与用户的查询相关。这样,在用户搜索或阅读相关产品时,与用户搜索或阅读的产品相关的广告会在网站(例如谷歌及其与谷歌合作的内容网站)上展示出来。图2示意性示出了一个由Google公司提供的AdWords网络电子广告的示例200。当用户在查询关键词输入框202中输入查询关键词后,网站搜索引擎(Google)会在查询结果显示区域204中显示基于关键词而得到的多个查询结果,同时在网页的广告栏206中投放与查询关键词有关的多个相关广告的链接。
[0009] AdSense(内容联盟广告)是将搜索引擎(例如谷歌)提供的广告投放到相关网页中,并使广告与网页内容相关。这样,用户在某一网页上浏览时,可以点击搜索引擎在该网页上提供的与网页内容相匹配的广告。图3示意性示出了一个由Google公司提供的AdSense网络电子广告的示例300。当用户例如在图2所示的搜索引擎界面中输入关键词,并选择点击一个查询结果的链接后会进入一个新的网页,当用户在浏览该新的网页时,在该网页上除了显示网页内容的标题302和正文304的同时,由于该网页与查询关键词有关,因此搜索引擎还会在网页的广告栏306中同时投放与查询关键词有关的广告链接。
[0010] 从以上关于“买断型”网络电子广告和“搜索型”网络电子广告形式来看,作为在网页指定位置上发布的指定内容,这些网络电子广告都可能存在着与周围上下文不相匹配或冲突的问题。例如,对于“买断型”电子广告,广告主为投放其广告,会购买在网页固定位置上显示其广告预定时间,因此存在的问题是,当广告位置周围上下文发生变化时,所显示的广告与周围上下文所表达的情感不匹配。例如,假设当前网页显示了一则XX飞机制造公司的飞机广告,在显示该飞机广告的时候,由于飞机广告周围上下文的内容变为“XX飞机空难不断,民众对其质量心存疑虑”的新闻。在这种情形下,显然再显示该飞机制造公司的广告将是不恰当的。
[0011] 类似地,对于“搜索型”电子广告,当用户输入的关键词与广告主为投放其广告所购买的关键词一致时,如果利用AdSense类型的广告系统,就可能出现这样的情形,广告会被投放到一个对广告主的产品或服务有负面影响的网页上,这时出现的广告会对广告主产生不利的影响。
[0012] 也就是说,对于在网页上的不同网页块中显示的不同内容,存在不同网页块中的内容彼此之间相冲突,例如在情感方面表现出相反的感受,这种相反情感感受的显示结果会使网页布局失衡,网页内容的相关性变差,以及造成网络用户对该网站不好的印象

发明内容

[0013] 为解决现有技术中存在的上述问题,本发明的一个目的是提供一种能基于对网页内容的情感分析结果,在网页的指定位置上发布与指定位置周围上下文情感匹配的指定内容的方法和设备。更具体地,本发明涉及在网页的指定位置上发布与指定位置周围上下文情感匹配的网络电子广告的方法和设备。
[0014] 根据本发明的一个方面,提供了一种用于在网页的指定位置上发布指定内容的方法,所述方法包括:对在其中发布指定内容的指定位置的周围上下文进行情感分析,确定指定位置的周围上下文的情感倾向性;以及基于所确定的指定位置的周围上下文的情感倾向性,选择是否在该网页的指定位置上发布所述指定内容。
[0015] 根据本发明另一个方面,还提供了一种用于在网页的指定位置上发布指定内容的系统,所述系统包括:情感分析装置,用于对在其中发布指定内容的指定位置的周围上下文进行情感分析,确定指定位置的周围上下文的情感倾向性;以及指定内容发布选择装置,用于基于所确定的指定位置的周围上下文的情感倾向性,选择是否在该网页的指定位置上发布所述指定内容。
[0016] 根据本发明,由于能基于对网页内容的情感分析结果,在网页的指定位置上发布与指定位置周围上下文情感匹配的指定内容,因此提高了网页内容的相关性,使网页布局变得更合理,改善了用户对网页内容的感受,增加了网站的点击率和网站收入。另一方面,根据本发明,由于能基于对网页内容的情感分析结果,在网页的指定位置上发布与指定位置周围上下文情感匹配的广告内容,因此能在网页上提供更适当的广告,增加了网络电子广告的点击率,同时增加了网站收入和增强了广告主的社会影响力。附图说明
[0017] 以下通过结合附图阅读参考下述对说明性实施例的详细描述,将更好地理解本发明本身、优选实施方式、其它目的及其优点。在附图中:
[0018] 图1示意性示出了现有技术中带有“买断型”网络电子广告的网页示意图;
[0019] 图2示意性示出了一个由Google公司提供的AdWords网络电子广告的网页示意图;
[0020] 图3示意性示出了一个由Google公司提供的AdSense网络电子广告的网页示意图;
[0021] 图4示意性示出根据本发明的用于在网页的指定位置上发布与指定位置周围上下文相匹配的指定内容的方法的示意流程图
[0022] 图5示意性示出了根据本发明对与指定内容有关的目标网页进行情感分析的处理的流程图;以及
[0023] 图6示意性示出了根据本发明的用于在网页的指定位置上发布与指定位置周围上下文相匹配的指定内容的系统的示意结构图。

具体实施方式

[0024] 以下将参照附图对本发明的优选实施方式进行详细说明。
[0025] 根据本发明,提供了一种能在网页的指定位置上发布与指定位置周围上下文相匹配的指定内容的新的技术方案。特别是,本发明提供了一种能在网页的指定位置上发布与指定位置周围上下文情感匹配的指定内容的新的技术方案。更具体地,本发明对要在网页上发布的内容的周围上下文进行情感分析,以及根据周围上下文的情感分析结果选择性地发布指定内容,例如网络电子广告。
[0026] 根据本发明的在网页的指定位置上发布与指定位置周围上下文相匹配的指定内容的技术方案,首先对要在其中发布指定内容的指定位置的周围上下文进行情感分析,确定指定位置的周围上下文的情感倾向性;以及随后基于所确定的指定位置的周围上下文的情感倾向性,选择是否在该网页的指定位置上发布所述指定内容。
[0027] 以下将结合附图对本发明的具体实施方式进行详细说明。在以下的说明中,出于解释的目的,提出了一些特定实施例以提供对本发明的充分理解。但是,显然,对本领域技术人员来说,这些特定实施例或特定细节并不是实现本发明必须的。例如,尽管在本发明中,主要针对置于互联网的网页中的网络电子广告来描述本发明的实施方式,但是,相同的技术可以用来应用于其他类似的场合。特别地,本发明的技术可以用在需要将内容的情感属性与内容周围上下文的情感倾向性相匹配来确定是否显示内容的任何应用。因此,虽然以下以网络电子广告作为要发布的内容的示例来描述本发明,但是应该理解,本发明可以推广到网络电子广告以外的任何内容形式。
[0028] 以“买断型”网络电子广告为例,当前的现有技术是:当广告主在某一网站的网页上购买某一指定位置后,广告主的广告会在该指定位置持续投放一预定时段。并且在这一预定时段期间,无论所投放广告的周围上下文出现怎样的变化,该广告主的广告都不会有任何变化。但是,本发明的发明人注意到:当广告周围上下文的内容对该广告主或广告在情感上有不利影响时(例如,损害广告主的社会形象),广告主会非常希望避免在这种情形下继续做广告。同样,可以理解,对于在网页上指定位置发布的指定内容,当指定位置周围上下文内容被实时更新而指定内容没有变化时,由于指定内容可能会与更新后的指定位置周围上下文内容存在情感上的冲突或不匹配,会造成当前页面布局不合理、影响用户对网页的浏览感受、以及降低网站的吸引力。有鉴于此,本发明提出了一种基于对网页内容的情感分析结果来选择是否发布适当内容的技术。也就是说,对于网络电子广告应用情景,本发明提供了一种基于对网页内容的情感分析结果来选择发布网络电子广告或者临时更新或撤消不适当的网络电子广告的技术。
[0029] 图4是根据本发明的用于在网页的指定位置上发布指定内容的方法的示意流程图。首先,在步骤S401,对在其中发布指定内容的指定位置的周围上下文进行情感分析,确定指定位置的周围上下文的情感倾向性。所述情感倾向性是指该指定位置的周围上下文的内容所能表达出的情感倾向性。例如,在一种实施方式中,所述情感倾向性是指指定位置的周围上下文相对于指定内容的情感倾向性。所述情感倾向性例如包括:正面的、负面的、或中性的中的任何一个。进一步地,确定指定位置的周围上下文的情感倾向性还包括:确定指定位置的周围上下文的情绪倾向性或指定位置的周围上下文相对于指定内容的情绪倾向性,以及基于所述情绪倾向性将情感倾向性进一步细分为更加细粒度的多个类别。所述情绪倾向性例如可以是人们对周围上下文的内容所感受到的各种情绪,包括:喜、怒、哀、乐等。
[0030] 具体来说,根据本发明,可以对其中发布网络电子广告的网页的指定位置的周围上下文进行情感分析,由此确定网络电子广告的周围上下的情感倾向性。
[0031] 优选地,根据本发明的一个优选实施例,确定指定位置的周围上下文的情感倾向性包括:确定指定位置的周围上下文相对于指定内容的情感倾向性。在网络电子广告的情形下,本发明是通过确定投放网络电子广告的指定位置的周围上下文相对于网络电子广告的情感倾向性来完成对指定位置的周围上下文的情感倾向性的确定的。具体来讲,例如是通过对网络电子广告周围的文本内容进行情感分析,并结合与网络电子广告的情感属性有关的信息,例如网络电子广告的广告主本身,广告内容本身的情感属性等,来加权确定广告周围的上下文相对于该网络电子广告的情感倾向性。
[0032] 以以上XX飞机制造公司的飞机广告示例来说,如果“XX飞机制造公司的飞机广告”的周围上下文变成“XX飞机空难不断,民众对其质量心存疑虑”的新闻时,根据本发明,首先对新闻的正文进行情感分析,可以确定出:该则新闻所代表的情感倾向性是“负面的”,并且观看者对这则广告的情绪倾向性会是“悲伤的”。然后,以发布的内容,也就是所投放的网络电子广告(飞机广告)作为一个加权因子来进行考虑,可以得出,这则新闻涉及到广告主“XX飞机制造公司”,并且会对该飞机制造公司造成负面影响。由此可以判断出:该飞机广告周围上下文相对于该飞机制造公司的网络电子广告的情感倾向性为“负面”。在这里是以飞机广告的示例进行描述的,以下还会详细描述本发明如何确定指定位置的周围上下文相对于指定内容的情感倾向性的技术。
[0033] 优选地,根据本发明的一个优选实施例,对指定位置的周围上下文的情感倾向性的确定可以是基于一个要发布的新的指定内容来进行的。例如,对于要新投放的网络电子广告来说,可以首先确定要投放该新的网络电子广告的网页指定位置的周围上下文对要投放广告的广告主的情感倾向性。另一方面,根据本发明的一个优选实施例,对指定位置的周围上下文的情感倾向性的确定可以是基于一个已发布的指定内容来进行的。具体地,对于一个已发布的指定内容,响应于指定位置的周围上下文的变化,重新确定变化后的指定位置的周围上下文相对于已发布的指定内容的情感倾向性。例如,对于一个已经在网页的指定位置上投放的网络电子广告来说,当该网络电子广告的周围上下文发生变化后,重新确定广告周围变化后的周围上下文相对于该已发布的网络电子广告的广告主的情感倾向性。
[0034] 在确定出指定位置的周围上下文的情感倾向性后,该方法的步骤前进到步骤S403,在步骤S403,基于所确定的指定位置的周围上下文的情感倾向性,选择是否在该网页的指定位置上发布所述指定内容。
[0035] 举例来说,当对所投放的网络电子广告的周围上下文进行情感分析后,确定周围上下文相对于所述网络电子广告的情感倾向性是“正面的”或者是“中性的”,并且优选地,如果人们对周围上下文相对于所述网络电子广告的情绪感受是“高兴”或“喜欢”的,则保持该网络电子广告在该网页上的指定位置上持续投放。否则,如果判断出周围上下文相对于所述网络电子广告的情感倾向性是“负面的”,则可以暂时替换当前的电子广告,而代之以更适合当前投放的广告,例如公益广告等。
[0036] 由此,本发明提供了一种能在网页的指定位置上发布与指定位置周围上下文情感匹配的指定内容的新的技术方案。特别是,本发明能够提供一种在网页上投放与指定位置周围上下文情感匹配的网络电子广告的技术方案。
[0037] 以下结合图5来详细描述根据本发明的对与指定内容有关的目标网页进行情感分析的处理的流程图。
[0038] 本领域技术人员可以理解,现有技术中,已经开发了一些确定或识别情感的技术。情感被用来作为对内容进行分类和搜索的基础,因此,可以基于现有技术中对内容进行情感分析的技术来实现本发明。现有的情感分析技术主要分为两大类:一类是基于情感词典匹配的方法,另一类方法是基于统计学习的方法。基于情感词典匹配的方法通过人工或者半自动的方式建立正面倾向和负面倾向的情感词典,利用这样的情感词典可以简单地将一篇文档或者一个句子分为正面以及负面两个情感极性。但是基于情感词典匹配的方法的缺陷是不能处理文档中出现的新词,并且通过人工建立这样的情感词典需要耗费大量的人力和物力。因此,基于统计学习的方法试图采用一些机器学习的方法,从文章以及句子中提取出一些语言学特征,这些特征往往包括一些形容词、副词、以及一些语言学模式,利用这些特征可以训练出一些情感分类模型,随后将此情感分类模型应用到新的文章中进行情感倾向性的分类。
[0039] 但是,与现有技术中单纯的内容情感分析技术不同,本发明采用了聚焦实体分析技术以及情感强度加权技术。
[0040] 图5示意性示出了根据本发明对与指定内容有关的目标网页进行情感分析的处理的流程图。注意,在图5中关于对与指定内容有关的目标网页进行情感分析的处理,主要以“买断型”的网络电子广告为例进行描述。但是,应该理解,该情感分析处理同样适用于“内容搜索型”的网络电子广告。
[0041] 在步骤S501,选取发布指定内容的目标网页。可以理解,对于一个要发布的新内容来说,目标网页就是要发布该新内容的网页。而对于一个已经发布的内容来说,目标网页是该内容所在的当前网页。在网络电子广告的环境下,选取投放网络电子广告的目标网页。对于“买断型”广告来说,投放广告的目标网页是固定的,可以是要投放广告的页面或是已经投放广告所在的当前页面。对于“内容搜索型”广告,目标网页例如可以是AdSense广告系统中通过关键词查询搜索到的网页,或者是AdWord广告系统中关键词查询结果网页。
[0042] 在确定发布指定内容的目标网页后,可以直接对所确定的目标网页进行情感分析,该处理将进行到步骤S507。例如,对于网页布局或网页内容较简单的网页来说,可以直接对目标网页的全部内容进行分析。又例如,对于AdSense广告所呈现的搜索广告页面,也可以直接进行网页的情感分析。
[0043] 另一方面,当目标网页的布局较复杂,或者目标网页的内容较多时,根据本发明的优选实施例,本发明的方法可以包括对网页进行分块以找出指定内容所在的主网页块的步骤,如步骤S503所示。
[0044] 可选地,当在步骤503确定需要对目标网页内容进行分块时,该处理进行到步骤S505,在目标网页中找出发布内容的位置所处的主网页块。
[0045] 本领域技术人员可以理解,当前大部分的网页在视觉分布上是分块的,每个块具有各自确定的主题。因此,本发明采用对网页分块的技术,将发布内容的位置所在的内容块(或称网页块)从网页中分割出来,然后仅对发布内容的位置所在的网页块(主网页块)进行文本分析。对网页内容进行分块的技术主要是基于网页的DOM(Document Object Model,文档对象模型)树结构,并结合树中各个元素的视觉特征(例如长和宽,有无“Table”分隔符等等),将网页分割成大小不同、内容聚合的多个块。具体来讲,DOM树结构可以为网页设计者提供一些逻辑结构,利用这些逻辑结构,就可以将网页分为某些(frame)、某些标(table)以及某些段落(paragraph)。因此,网页分块技术首先试图从DOM树中提取网页逻辑结构的特征。另一方面,网页分块技术还会利用网页的视觉特征,从视觉特征中提取每个逻辑分块的长、宽以及面积等特征,并且试图去划分每个逻辑分块是否是横平竖直或者其它形状。最后,结合两个方面的特征,将网页分为多个逻辑上内敛并且在视觉上自然分割的多个模块。基于网页内容分块的技术为本领域技术人员所熟知,不再详细描述。
[0046] 在“买断型”网络电子广告的情形下,通过网页分块技术,可以容易地确定投放广告的位置所在的网页块。将对广告所在的目标网页的所有文本进行情感分析简化到对广告投放位置所在的网页块中的文本进行分析,可以进一步提高分析速度、屏蔽掉网页中与广告、或投放广告的广告主无关的内容(例如,网页中出现的噪音文本,其他广告文本等)。
[0047] 在步骤S507,对目标网页或者是对从目标网页中找出的主网页块,进行网页内容分析。网页内容分析可以包括聚焦实体分析、关键词分析或者是聚焦实体分析与关键词分析的组合。
[0048] 根据本发明的聚焦实体技术,能够将某个文章或者某段文本所谈的主要对象,包括:人、地点或者公司等通过机器学习的技术自动识别出来。通过采用“聚焦实体技术”,本发明能增强指定位置周围上下文相对于指定内容的情感倾向性的判断结果精度,提高寻找可能更适合的指定内容的精确度。对于网络电子广告,采用“聚焦实体技术”更有利于提高寻找适宜广告主对象的精度。
[0049] 根据本发明的“聚焦实体技术”首先利用命名实体识别技术将所要分析文本(指定位置周围上下文)中的实体对象抽取出来,然后对这些实体对象进行特征的提取,比如其出现的频率、其出现的位置、其在上下文中的语法类别(例如“主语”、“谓语”等)。命名实体识别技术为本领域技术人员所熟知,不再详细描述。利用这些实体对象的特征去训练一个聚焦实体分类的技术,由此将实体对象聚焦到特定实体对象上。另外,此模型也可以应用到未见样本上,以抽取出聚焦实体。
[0050] 以下描述根据本发明的关键词分析技术。通常,对目标网页或者是对从目标网页中找出的主网页块的内容文本进行句子分割,从每个被分割的句子中提取关键词。由此,可以从指定位置的周围上下文提取多个关键词。从网页上的文本内容中提取关键词的技术为本领域技术人员所知,不再详细描述。当提取的关键词与指定内容非常有关时,该处理进行到步骤S513,对网页内容进一步进行情感分析。
[0051] 否则的话,如果所提取的关键词较多或较复杂,根据本发明,可以对所提取的多个关键词进行关键词过滤处理。此时,当在步骤S509,判断需要进行关键词过滤处理后,该处理前进到步骤S511。
[0052] 在步骤S511,进行关键词过滤和/或聚焦实体分析处理。根据本发明的一种实施方式,基于与指定内容相关的预定关键词,对从网页上的指定位置的周围上下文文本内容中提取的多个关键词进行过滤,以确定该网页可能适合的指定内容。举例来说,与指定内容相关的预定关键词例如是网站预先设定或存储的关键词。再比如,与指定内容相关的预定关键词例如是与网络电子广告的广告主的公司名、广告主所提供的产品或服务相关的关键词,由此,可以将指定位置周围上下文的内容定位到是否与所投放广告相关。
[0053] 本领域技术人员可以理解,如果所提取的关键词较多或较复杂,本发明还可以基于所提取的多个关键词,进行聚焦实体分析处理。由此,可以将目标网页或者是对从目标网页中找出的主网页块中的内容聚焦到特定实体对象。
[0054] 本领域技术人员可以理解,当对目标网页或者是对从目标网页中找出的主网页块中的内容所提取的关键词直接与要发布内容相关时,也可以不对网页内容进行聚焦实体分析或关键词过滤处理,而直接进行网页内容的情感分析。
[0055] 在步骤S513,开始对目标网页或者是对从目标网页中找出的主网页块的内容文本进行情感分析。
[0056] 本领域技术人员可以理解,从自然语言处理的技术上讲,网页内容关键词提取主要关注的是文本中的名词或名词短语,旨在从中提取一些概念性的词语作为关键词。同时,本领域技术人员可以理解,网页内容中的文本除了传达显示的语义内容,更重要的是,它还蕴含着隐式的情感和情绪。本发明正是注意到这一点,通过对文本内容(目标网页或者是从目标网页中找出的主网页块的内容文本)中的一些形容词、副词、形容词短语以及包含感情色彩的名词、动词等的短语进行情感分析,来进一步确定网页内容的情感倾向性。确定网页内容的情感倾向性可以采用机器语言学习技术来实现,或者通过预先设定的情感库来实现,或者通过采用机器语言学习并结合设置情感库来实现。举例来说,根据本发明,可以对指定内容(例如广告)周围上下文中的形容词、副词或形容词短语(例如,空难、矿难、震灾)等词语进行情感分析,来确定该网页上下文的情感倾向性。
[0057] 进一步地,对网页内容的情感倾向性的确定还可以包括情绪倾向性的确定(如前所述)。这种对网页内容的情绪倾向性的判断例如是在“买断型”网络电子广告中,观看者对广告周围的上下文内容给出的评价。
[0058] 现有技术中,对文本中的所有句子进行情感倾向性判断后,再对文本整体进行抉择,以确定该文本是正面的、负面的、还是中性的。也就是说,最终的结果取决于文本中正面与负面句子的个数的比例,是一个简单的数量上的比较。但是,本发明的发明人注意到:实际上,在很多文章中,有一些正面或负面的句子会起到决定性的作用,从而能够从整体上扭转整个文本的情感倾向性结果。
[0059] 为此,本发明为了提高对网页内容的情感倾向性分析的精确性,还采用了对网页文本进行情感强度加权的优化步骤。根据本发明的情感强度加权技术,是在情感分析的基础上的进一步细化。本发明的发明人认识到,在某些时候,将情感仅仅分为正面和负面两个类别或者分为正面、负面和中性三个类别还有不足。因此,根据本发明,在建立训练文集的时候,对情感分析进一步细分为更加细粒度的多个类别,比如最好、好、中立、差、最差等五个类别,本发明不限于此。在这个时候,可以抽取出每个类别中最为明显的特征。利用这些特征就可以执行文档或者句子的情感强度加权分析。
[0060] 此时,该处理进行到步骤S515。当步骤S515判断有必要进行情感强度加权时,处理进行到步骤S517。在步骤S517进行加权计算,以精确确定目标网页或从目标网页中找出的主网页块的内容文本的情感倾向性。优选地,根据本发明的一些实施例,通过对处于不同位置的情感句子进行加权,比如对于出现在文章开头或文章结尾,或者出现在段首以及段尾的句子加上更大的权重;或者由与指定内容有关的实体(例如,广告主)自己来决定,只要在当前文章中出现过不利于自身的句子(包括容忍的程度、容忍的句子的个数等),就放弃在当前页面发布内容(例如在当前页面做广告)。
[0061] 经过上述步骤后,在步骤S519中,可以最终确定目标网页或从目标网页中找出的主网页块的内容文本的情感倾向性。
[0062] 根据本发明,当判断出当前网页不适宜发布指定内容时,可以:1)基于确定出的指定位置的周围上下文的情感倾向性,自动分析并找出适合当前周围上下文的情感倾向性的其他指定内容;2)在当前指定位置发布与周围上下文的情感倾向性无关的内容等。
[0063] 根据本发明,通过把从广告周围上下文中提取的多个关键词聚焦到与广告或广告主有关的范围,来确定广告上下文是否与广告或广告主有关;并且进一步通过对广告周围上下文进行情感分析,由此可以给出广告周围上下文对广告或广告主的情感倾向性,可以实现增强的基于情感驱动的广告机制,可以选择出更适宜的广告主,提高广告选择的精准性。
[0064] 在实际的网络电子广告的情形中,通过对网页主题进行检测和情感分析,可以首先确定此网页可能适用的广告主对象。对整个网页内容,尤其是广告主对象的上下文进行情感情绪分析,判断出该网页对于广告主对象是正面消息还是负面消息;观看此网页的用户所反映的情绪是喜欢,是高兴,是厌恶,还是愤怒。综合对广告主对象所处的情感情绪信息确定是否适宜投放该广告主对象的广告。如果情感方面是正面的,情绪方面是喜欢的高兴的,那么就安全地投放此广告主的广告,或者说是中立的也可以安全地投放此广告主的广告。
[0065] 当判断出,当前网页不适宜投放广告主的广告时,可以通过以下途径选择广告次对象来做广告:1)如果广告主对象不适宜,网站可以选择广告主对象的竞争对手来做广告;2)匹配广告主本身定义的一些关键词,广告主可以根据自己产品的特点和功能定义一些关键词,比如安全气囊公司定义的关键词或许有“车祸”、“超速”;保险公司定义的关键词或许有“火灾”、“意外身亡”等等。通过这些关键词的匹配,可以寻找一些适合的广告主在这些负面新闻上做广告,并且在这种场合上,更能提升这些广告对象的社会形象和影响力。3)从所处负面的文本内容中通过情感分析自动分析出可能的广告次对象。比如一个关于空难的报道,对其的情感分析结果是该报道的上下文是“负面”的。通过情感分析处理后,发现在该报道中有这样的描述“幸亏购买了保险,该保险公司在很快的时间内进行了赔付”,这句话具有“正面的”情感倾向性。此时,通过对“幸亏购买了保险,该保险公司在很快的时间内进行了赔付”进行关键字(主题)或聚焦实体分析,发现其实体对象是“保险”,那么这个时候对某些保险公司做广告是非常适宜的,由此可以从广告主类别中抽取出一些保险公司作为广告次对象。或者,如果在该报道中恰好出现了“XX保险公司”(该保险公司在广告主数据库中),则通过聚焦实体技术,可以直接选取XX保险公司作为广告次对象。4)或者在此页面不做任何广告或者投放一些公益广告。
[0066] 图6示意性示出了根据本发明的用于在网页的指定位置上发布与指定位置周围上下文相匹配的指定内容的系统的示意结构图。
[0067] 图6中示出的在网页的指定位置上发布与指定位置周围上下文相匹配的指定内容的系统可以用来实现本发明的方法。参见图6,根据本发明的用于在网页的指定位置上发布指定内容的系统600包括:情感分析装置601,用于对在其中发布指定内容的指定位置的周围上下文进行情感分析,确定指定位置的周围上下文的情感倾向性;以及指定内容发布选择装置603,用于基于所确定的指定位置的周围上下文的情感倾向性,选择是否在该网页的指定位置上发布所述指定内容。进一步地,系统600还包括:指定内容发布或更新模块609,用于根据指定内容发布选择装置603的选择结果,在网页上发布指定内容或者更新网页上的指定内容。
[0068] 所述情感分析装置601包括:情感分析模块6011。所述情感分析模块6011用于确定指定位置的周围上下文相对于指定内容的情感倾向性。所述情感倾向性包括:正面的、负面的或中性的中的任意一种。进一步地,所述情感分析模块6011还包括:用于确定指定位置的周围上下文相对于指定内容的情绪倾向性的单元(未示出)。所述情绪倾向性包括:喜、怒、哀、乐中的任意一种。
[0069] 所述系统600中的所述情感分析装置601还被配置成:响应于在其中已发布指定内容的指定位置的周围上下文的变化,重新确定变化后的指定位置的周围上下文相对于已发布的指定内容的情感倾向性。
[0070] 其中,所述情感分析装置601还包括:关键词提取模块6015,用于从指定位置的周围上下文中提取多个关键词,以及关键词过滤及聚焦实体分析模块6017,用于基于关键词提取模块6015提取出的、与指定内容相关的预定关键词,对从指定位置的周围上下文中提取的多个关键词进行过滤,以确定该网页是否与指定内容相关。另一方面,所述关键词过滤及聚焦实体分析模块6017还可以利用命名实体识别技术,抽取指定位置周围上下文中的实体对象;以及对所抽取的实体对象进行特征提取。
[0071] 其中,所述情感分析装置601还可以包括:网页分割模块6013,用于对网页进行分割以获得多个网页块,并提取指定位置所处的主网页块;以及所述情感分析模块6011确定网页分割模块6013所提取的主网页块的网页内容的情感倾向性。
[0072] 所述情感分析装置601还包括:情感强度加权模块6019,用于对指定位置的周围上下文中处于不同位置的情感句子进行加权;以及所述情感分析模块6011基于情感强度加权模块6019对不同位置的情感句子的加权,计算指定位置的周围上下文的情感倾向性。
[0073] 所述系统600进一步包括:情感属性设定模块605,用于允许与指定内容有关的实体对有关指定内容进行情感属性设定;以及所述情感分析装置601基于情感属性设定模块对指定内容的情感属性设定,确定指定位置的周围上下文的情感倾向性。
[0074] 所述系统600进一步包括:情感评价记录模块607,用于记录多个观看者对指定位置所处的网页内容所做出的情感评价;以及所述情感分析装置601基于所述情感评价记录模块记录的多个观看者所做出的情感评价记录,确定指定位置周围上下文的情绪倾向性。
[0075] 根据本发明的一种实施方式,所述指定内容是网络电子广告。根据本发明的一种实施方式,所述网络电子广告是“买断型”网络电子广告。根据本发明的一种实施方式,所述网络电子广告是“AdWord”或“AdSense”类型的网络电子广告。
[0076] 根据本发明的一种实施方式,所述指定内容发布选择装置603还可以基于确定出的指定位置的周围上下文的情感倾向性,自动分析找出适合当前周围上下文的情感倾向性的其他指定内容。
[0077] 本领域技术人员会认识到,可以以方法、系统或计算机程序产品的形式提供本发明的实施例。因此,本发明可采取全硬件实施例、全软件实施例,或者组合软件和硬件的实施例的形式。硬件和软件的典型的结合可以是带有计算机程序的通用计算机系统,当程序被加载并被执行时,控制计算机系统,从而可以执行上述的方法。
[0078] 本发明可以嵌入在计算机程序产品中,它包括使此处描述的方法得以实施的所有特征。所述计算机程序产品被包含在一个或多个计算机可读存储介质(包括,但不限于,磁盘存储器、CD-ROM、光学存储器等)中,所述计算机可读存储介质具有包含于其中的计算机可读程序代码。
[0079] 已参考根据本发明的方法、系统及计算机程序产品的流程图和/或方框图说明了本发明。流程图和/或方框图中的每个方框,以及流程图和/或方框图中的方框的组合显然可由计算机程序指令实现。这些计算机程序指令可被提供给通用计算机、专用计算机、嵌入式处理器或者其他可编程的数据处理设备的处理器,以产生一台机器,从而指令(所述指令通过计算机或者其他可编程数据处理设备的处理器)产生用于实现在流程图和/或方框图的一个或多个方框中规定的功能的装置。
[0080] 这些计算机程序指令也可保存在一个或多个计算机的读存储器中,每个这种存储器能够指挥计算机或者其他可编程数据处理设备按照特定的方式发挥作用,从而保存在计算机可读存储器中的指令产生一种制造产品,所述制造产品包括实现在流程图和/或方框图的一个或多个方框中规定的功能的指令装置。
[0081] 计算机程序指令也可被加载到一个或多个计算机或者其他可编程数据处理设备上,使得在所述计算机或者其他可编程数据处理设备上执行一系列的操作步骤,从而在每个这样的设备上产生计算机实现的过程,以致在该设备上执行的指令提供用于实现在流程图和/或方框图的一个或多个方框中规定的步骤。
[0082] 以上结合本发明的优选实施方式对本发明的原理进行了说明,但这些说明只是示例性的,不应理解为对本发明的任何限制。本领域技术人员可以对本发明进行各种改变和变形,而不会背离由随附权利要求所限定的本发明的精神和范围。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈