用户地理位置的确定

申请号 CN201580000317.8 申请日 2015-03-25 公开(公告)号 CN105517679A 公开(公告)日 2016-04-20
申请人 北京旷视科技有限公司; 北京小孔科技有限公司; 发明人 周舒畅; 周昕宇; 吴育昕; 吴家楠;
摘要 公开了用于确定用户的地理 位置 的方法、设备和 计算机程序 产品。所述方法包括:提取在用户所在的地点处拍摄的图像中的文字或图标;分析所提取的文字或图标以确定所述文字或图标的含义;以及基于所述文字或图标的含义,确定用户的地理位置。利用所述方法、设备和计算机程序产品,可以在各种场景中准确地确定用户的地理位置。
权利要求

1.一种用于确定用户的地理位置的方法,包括:
提取在用户所在的地点处拍摄的图像中的文字或图标;
分析所提取的文字或图标以确定所述文字或图标的含义;以及
基于所述文字或图标的含义,确定用户的地理位置。
2.如权利要求1所述的方法,其中,所述图像是利用用户的便携式设备拍摄的。
3.如权利要求1所述的方法,其中,所述文字或图标是办公楼、店铺、住宅楼或街道的标识。
4.如权利要求1所述的方法,其中,提取在用户所在的地点处拍摄的图像中的文字或图标包括:
识别所述图像中的文字或图标,并且提取识别出的全部文字或图标、或识别出的全部文字或图标中置信度高于阈值的文字或图标。
5.如权利要求1所述的方法,其中,对所提取的文字或图标进行分析以确定所述文字或图标的含义包括:
将所提取的文字按照行或列的顺序组织为字符串;以及
分析所述字符串,以确定一个或多个具有具体含义的词语。
6.如权利要求1所述的方法,其中,对所提取的文字或图标进行分析以确定所述文字或图标的含义包括:
将所提取的图标与预先存储的具有特定含义的图标进行匹配,以确定所提取的图标的含义。
7.如权利要求1所述的方法,其中,基于所述文字或图标的含义,确定用户的地理位置包括:
使用在地图上的预定的地理区域中搜索到的、与所述文字或图标的含义相关联的地理位置作为候选地理位置;
基于所述候选地理位置确定用户的地理位置。
8.如权利要求7所述的方法,其中,所述预定的地理区域是根据用户的历史定位信息或指示所述用户所在的地理区域的定位信息确定的。
9.一种用于确定用户的地理位置的设备,包括:
处理器;
存储器;和
存储在所述存储器中的计算机程序指令,在所述计算机程序指令被所述处理器运行时执行以下步骤:
提取在用户所在的地点处拍摄的图像中的文字或图标;
分析所提取的文字或图标以确定所述文字或图标的含义;以及
基于所述文字或图标的含义,确定用户的地理位置。
10.如权利要求9所述的设备,还包括:
摄像头,被配置为拍摄所述图像。
11.如权利要求9所述的设备,其中,所述文字或图标是办公楼、店铺、住宅楼或街道的标识。
12.如权利要求9所述的设备,其中,提取在用户所在的地点处拍摄的图像中的文字或图标包括:
识别所述图像中的文字或图标,并且提取识别出的全部文字或图标、或识别出的全部文字或图标中置信度高于阈值的文字或图标。
13.如权利要求9所述的设备,其中,对所提取的文字或图标进行分析以确定所述文字或图标的含义包括:
将所提取的文字按照行或列的顺序组织为字符串;以及
分析所述字符串,以确定一个或多个具有具体含义的词语。
14.如权利要求9所述的设备,其中,对所提取的文字或图标进行分析以确定所述文字或图标的含义包括:
将所提取的图标与预先存储的具有特定含义的图标进行匹配,以确定所提取的图标的含义。
15.如权利要求9所述的设备,其中,基于所述文字或图标的含义,确定用户的地理位置包括:
使用在地图上的预定的地理区域中搜索到的、与所述文字或图标的含义相关联的地理位置作为候选地理位置;
基于所述候选地理位置确定用户的地理位置。
16.如权利要求15所述的设备,其中,所述预定的地理区域是根据用户的历史定位信息或指示所述用户所在的地理区域的定位信息确定的。
17.一种用于确定用户的地理位置的计算机程序产品,包括计算机可读存储介质,在所述计算机可读存储介质上存储了计算机程序指令,所述计算机程序指令可由处理器执行以使得所述处理器:
提取在用户所在的地点处拍摄的图像中的文字或图标;
分析所提取的文字或图标以确定所述文字或图标的含义;以及
基于所述文字或图标的含义,确定用户的地理位置。
18.如权利要求17所述的计算机程序产品,其中,所述图像是利用用户的便携式设备拍摄的。
19.如权利要求17所述的计算机程序产品,其中,所述文字或图标是办公楼、店铺、住宅楼或街道的标识。
20.如权利要求17所述的计算机程序产品,其中,基于所述文字或图标的含义,确定用户的地理位置包括:
使用在地图上的预定的地理区域中搜索到的、所述文字或图标的含义所指示的地理位置作为候选地理位置;
基于所述候选地理位置确定用户的地理位置。

说明书全文

用户地理位置的确定

技术领域

[0001] 本公开涉及定位技术,并且具体涉及一种用于确定用户的地理位置的方法、设备和计算机程序产品。

背景技术

[0002] 为了进行导航或者提供其他基于位置的服务(Location based service,LBS),需要准确地确定用户的地理位置。近年来,已经提出了很多用于确定用户的地理位置的方法,
例如全球定位系统(GPS)定位方法和WIFI定位方法。在GPS定位方法中,基于由用户携带
的便携式设备接收的GPS信号计算确定该便携式设备的地理坐标,从而确定用户的地理位
置。然而,GPS定位方法受限于便携式设备接收GPS信号的能。例如,当便携式设备处于
室内、地下和高楼间的位置时,该设备难以接收到高质量的GPS信号,导致定位精度下降甚
至无法定位。在WIFI定位方法中,在数据库中预先存储在各个地理位置处设置的WIFI设
备的服务集标识(SSID)列表与各个地理位置之间的映射关系。然后,在定位时,感测用户
所在的地点处的WIFI设备的SSID的列表,并且将该列表与数据库中预先存储的SSID列
表进行匹配,从而根据匹配的SSID列表所映射到的地理位置确定用户的地理位置。然而,
WIFI定位方法需要预先对各个地理位置的SSID列表进行实地采集,成本较高,而且,如果
某个地理位置的WIFI设备改变,数据库存储的SSID列表将过时,导致定位精度下降甚至无
法定位。
发明内容
[0003] 根据本公开的一个方面,提供一种用于确定用户的地理位置的方法,该方法包括:提取在用户所在的地点处拍摄的图像中的文字或图标;分析所提取的文字或图标以确定所
述文字或图标的含义;以及基于所述文字或图标的含义,确定用户的地理位置。
[0004] 根据本公开的另一方面,提供一种用于确定用户的地理位置的设备,该设备包括:处理器;存储器;和存储在所述存储器中的计算机程序指令,在所述计算机程序指令被所
述处理器运行时执行以下步骤:提取在用户所在的地点处拍摄的图像中的文字或图标;分
析所提取的文字或图标以确定所述文字或图标的含义;以及基于所述文字或图标的含义,
确定用户的地理位置。
[0005] 根据本公开的另一方面,提供了一种用于确定用户的地理位置的计算机程序产品,其包括计算机可读存储介质,在所述计算机可读存储介质上存储了计算机程序指令,所
述计算机程序指令可由处理器执行以使得所述处理器:提取在用户所在的地点处拍摄的图
像中的文字或图标;分析所提取的文字或图标以确定所述文字或图标的含义;以及基于所
述文字或图标的含义,确定用户的地理位置。
[0006] 根据本公开的另一方面,提供了一种用于确定用户的地理位置的设备,该设备包括:提取装置,被配置为提取在用户所在的地点处拍摄的图像中的文字或图标;分析装置,
被配置为分析所提取的文字或图标以确定所述文字或图标的含义;以及定位装置,被配置
为基于所述文字或图标的含义,确定用户的地理位置。
[0007] 利用根据本公开的上述方面的方法、设备和计算机程序产品,可以在各种场景中,尤其是在利用传统定位方法无法准确定位的场景中,可以准确地确定用户的地理位置。
附图说明
[0008] 通过结合附图对本公开示例性实施方式进行更详细的描述,本公开的上述以及其它目的、特征和优势将变得更加明显,在附图中,相同的参考标号通常指示相同的部件。
[0009] 图1示出了可用于实现本公开的实施例的示例性便携式设备的框图
[0010] 图2示出了根据本公开的实施例的用于确定用户的地理位置的方法的流程图
[0011] 图3示出了在用户所在的地点处拍摄的图像的示例;
[0012] 图4示出了在用户所在的地点处拍摄的图像的另一示例;
[0013] 图5示出了根据本公开的实施例的用于确定用户的地理位置的设备的框图。

具体实施方式

[0014] 首先,参照图1来描述可用于实现本公开的实施例的示例性便携式设备的框图。该便携式设备可以由用户随身携带,并且例如是移动电话个人数字助理(PDA)、平板计算
机、笔记本计算机等,所述移动电话例如可以是智能电话等。
[0015] 如图1所示,便携式设备100包括一个或多个处理器102、存储装置104、输入装置106、输出装置108、通信装置110和摄像头112,这些组件通过总线系统114和/或其它形
式的连接机构(未示出)互连。应当注意,图1所示的便携式设备100的组件和结构只是
示例性的,而非限制性的,根据需要,便携式设备100也可以具有其他组件和结构。
[0016] 处理器102可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其它形式的处理单元,并且可以控制便携式设备100中的其它组件以执行期望的功
能。
[0017] 存储装置104可以包括一个或多个计算机程序产品,所述计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。所述易失
性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非
易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在所述计算机可读存储介质
上可以存储一个或多个计算机程序指令,处理器104可以运行所述程序指令,以实现下文
所述的本公开的实施例的功能以及/或者其它期望的功能。在所述计算机可读存储介质中
还可以存储各种应用程序和各种数据,例如地图数据、图像数据以及所述应用程序使用和/
或产生的各种数据等。
[0018] 输入装置106可以是用户用来输入指令的装置,并且可以包括键盘鼠标、麦克触摸屏等中的一个或多个。所述指令例如是使用下述摄像头112拍摄图像的指令。输出
装置108可以向外部(例如用户)输出各种信息(例如图像或声音),并且可以包括显示
器、扬声器等中的一个或多个。通信装置110可以通过网络或其它技术与其它装置(例如
个人计算机、服务器、移动台、基站等)通信,所述网络可以是因特网、无线局域网、移动通
信网络等,所述其它技术例如可以包括蓝牙通信、红外通信等。摄像头112可以拍摄用户期
望的图像(例如照片、视频等),并且将所拍摄的图像存储在存储装置104中以供其它组件
使用。
[0019] 用户可以携带所述便携式设备去往各种地点,例如办公楼、店铺、住宅楼、街道等,因此可以通过确定所述便携式设备的地理位置来确定所述用户的地理位置。所述店铺可以
是独立的店铺,也可以是位于建筑物(例如购物中心)内部的店铺。
[0020] 下面,参照图2来描述根据本发明实施例的用于确定用户的地理位置的方法。该方法可以由所述便携式设备或者其他设备执行。
[0021] 如图2所示,在步骤S201中,可以提取在用户所在的地点处拍摄的图像中的文字或图标。
[0022] 具体地,可以利用例如所述便携式设备或其他拍摄设备(例如可向外部传送图像的照相机)在用户所在的地点处拍摄图像。所述图像可以是照片或视频,所述照片可以包
括一幅或多幅单一场景的照片,也可以是全景照片。所拍摄的图像可以反映用户所处的环
境,例如用户周围的建筑物(办公楼或住宅楼)、用户周围的店铺、用户所处的街道等。相
应地,所述图像可以包含文字和/或图标,所述文字和/或图标可以是诸如办公楼或住宅
楼的建筑物、店铺或街道的标识,也可以是其他类型的文字或图标,例如广告、路标、促销信
息等。图3示出了在用户所在的地点处拍摄的图像的示例,在该示例中,所述图像是照片,
用户位于 超市入口附近,该照片包含作为 超市的标识的文字“家乐福”和
“Carrefour”以及图标 ,并且还包含其他文字,例如指示文字“入口”等。图4示出了
在用户所在的地点处拍摄的照片的另一示例,在该示例中,所述图像是照片,用户位于店铺
附近,该照片包含作为店铺 的标识的文字“屈臣氏”和“Watsons’”,并且
还包含其他文字,例如宣传语句“更加关心你”等。
[0023] 在获得所拍摄的图像之后,可以提取该图像中的文字和图标。在本实施例中,可以识别所述图像中的文字或图标,并且提取识别出的全部文字或图标或识别出的全部文字或
图标中置信度高于阈值的文字或图标。可选地,在识别图像中的文字或图标之前,可以对所
述图像进行预处理,以利于所述识别。例如,在所述图像是照片的情况下,所述预处理可以
包括对照片进行缩放,在所述图像是视频的情况下,所述预处理可以包括提取视频的关键

[0024] 具体地,可以使用光学字符识别(OCR)方法来识别图像中的文字。在该方法中,可以扫描图像以检测图像中所有可能含有文字的字框的位置,然后可以将每个字框中的内
容识别为文字,并且输出识别结果。所述检测和识别例如可以通过本领域公知的神经网络
分类器来实现。所述识别结果可以包括所识别的文字和所述文字的位置,其中所述文字的
位置例如可以通过所述文字在建立于所述图像中的二维坐标系内的坐标来表示。所述识别
结果还可以包括所识别的文字的置信度。具体地,在利用OCR方法从图像中识别文字时,所
识别的文字的置信度可以根据图像的清晰度以及文字的复杂程度、尺寸、位置和形状等因
素而变化,使得有些文字的置信度较高,例如80%或100%,有些文字的置信度较低,例如
20%或5%。在通过OCR方法识别所述文字时,可以同时确定所识别的文字的置信度,并且
将其包含在识别结果中。这样,通过所述置信度,可以确定所识别的文字的准确性。由于通
过OCR方法来识别图像中的文字的具体方法是本领域公知的,因此在这里为简单起见而省
略其详细描述。在识别出图像中的文字之后,可以提取识别出的全部文字,或者识别出的
文字中置信度高于阈值的文字,以供后续操作使用。所述阈值可以是根据需要预先设定的
数值,例如50%或70%。与提取识别出的全部文字相比,提取识别出的文字中置信度高于
阈值的文字可以用更可靠的识别结果进行后续操作,从而提高最终获得的定位结果的准确
性。
[0025] 此外,可以使用本领域公知的图像识别方法来识别图像中的图标,并且输出识别结果。同样,所述识别结果可以包括检测出的图标及其置信度。然后,可以提取识别出的全
部图标或者识别出的图标中置信度高于所述阈值的图标。
[0026] 例如,在图3所示的示例中,至少可以识别出文字“欢”、“迎”、“来”、“到”、“家”、“乐”、“福”、“中”、“关”、“村”、“广”、“场”、“店”、“入”、“口”、“C”、“a”、“r”、“r”、“e”、“f”、“o”、“u”、“r”、“家”、“乐”、“福”(为简单起见,在这里没有列出能够识别出的全部文字),并且确定其置信度,此外,还可以至少识别出图标 (为简单起见,在这里没有列出能够
识别出的全部图标)并且确定其置信度。在图4所示的示例中,至少可以识别出文字“W”、
“a”、“t”、“s”、“o”、“n”、“s”、“屈”、“臣”、“氏”、“更”、“加”、“关”、“心”、“你”(为简单起见,在这里没有列出能够识别出的全部文字),并且确定其置信度。
[0027] 返回图2,在步骤S202中,可以分析所提取的文字或图标以确定所述文字或图标的含义。
[0028] 具体地,对于所提取的文字,可以将其按照行或列的顺序组织为字符串。例如,可以根据包含在所述识别结果中的所提取的各个文字的位置,将所提取的各个文字排列成一
行或多行,然后将所述文字按照行的顺序组织为字符串,或者可以根据所提取的各个文字
的位置,将所提取的各个文字排列成一列或多列,然后将所述文字按照列的顺序组织为字
符串。在本实施例中,可以根据用户所在国家和/或地区的书写习惯,确定应当将所提取的
文字排列成行还是列。如果用户所在国家和/或地区的书写习惯是逐行书写,则可以将所
提取的文字排列成行,反之,如果用户所在国家和/或地区的书写习惯是逐列书写,则可以
将所提取的文字排列成列。由于中国的书写习惯是逐行书写,因此,在图3所示的示例中,
所组织的字符串可以是“欢迎来到家乐福中关村广场店入口carrefour家乐福”,在图4所
示的示例中,所组织的字符串可以是“Watsons屈臣氏更加关心你”。
[0029] 然后,可以分析所述字符串,以确定一个或多个具有具体含义的词语。具体地,可以使用本领域公知的方法对所述字符串进行分析,并且对所述字符串进行分词,从而将所
述字符串划分为一个或多个具有具体含义的词语。所述一个或多个词语的含义可以作为
所提取的文字的含义。对所述字符串进行分析和分词的方法是本领域公知的,在这里为
了简单起见而省略其详细描述。在图3所示的示例中,通过上述分析和分词操作,例如可
以将字符串划分为以下词语“欢迎”、“来到”、“家乐福”、“中关村”、“广场”、“店”、“入口”、“Carrefour”、“家乐福”。可选地,可以在对所述字符串进行分析和分词之前,对所述字符串
进行预处理。所述预处理例如可以是拼写校正,以校正字符串中的拼写错误。例如,如果字
符串中出现“Carrefourr”,则可以对该字符串进行拼写校正,从而将“Carrefourr”修改
正确的拼写“Carrefour”。
[0030] 应当认识到,上文所述的确定应当将所提取的文字排列成行还是列的方法是示例性的,也可以采用其他方式来进行这一确定。例如,可以将所提取的文字排列成行,将所述
文字按照行的顺序组织为字符串,并且对该字符串进行分析和分词操作,以获得包含通过
划分该字符串而获得的词语的第一划分结果。然后,可以将所提取的文字排列成列,将所述
文字按照列的顺序组织为字符串,并且对该字符串进行分析和分词操作,以获得包含通过
划分该字符串所获得的词语的第二划分结果。然后,可以比较第一划分结果和第二划分结
果中包含的所划分的词语的正确率(或分词的成功率)。在这种情况下,可以将正确率(或
成功率)较高的划分结果所对应的排列方式(排列成行或列)确定为正确的排列方式,并
且将该划分结果包含的词语确定为所述具有具体含义的词语。
[0031] 另一方面,对于所提取的图标,可以将该图标与预先存储的具有具体含义的图标进行匹配,以确定所提取的图标的含义。例如,可以在数据库中预先存储具有具体含义的一
个或多个图标,例如办公楼、店铺、住宅楼或街道等的标识(例如上述表示家乐福超市的图
标 )。可以将所提取的图标与预先存储的图标进行图像匹配,以便从预先存储的图
标中找出与所提取的图标匹配(即,相同或相似)的图标,从而将所找出的匹配图标的含义
确定为所提取的图标的含义。在图3的例子中,通过上述匹配操作,可以确定所提取的图标
表示家乐福超市。
[0032] 继续参照图2,在步骤S203中,可以基于所提取的文字或图标的含义,确定用户的地理位置。
[0033] 在第一种实现方式中,可以使用在地图上搜索到的、与所述文字或图标的含义相关联的地理位置作为候选地理位置。这里,与所述文字或图标的含义相关联的地理位置可
以是具有所述文字或图标的含义所指示的建筑物、店铺或街道等的地理位置。具体地,可以
在数据库中预先存储所述地图(具体地,指示地图上的各个地理位置处的建筑物、店铺、街
道等的地图数据)。对于所提取的文字,由于其含义由在步骤S202获得的一个或多个具有
具体含义的词语来表示,因此,可以使用所述一个或多个词语中的一部分或全部词语作为
搜索关键字,在地图上(换言之,在所述数据库中)搜索与所述文字的含义相关联的地理位
置,作为所述候选地理位置。例如,可以使用倒排表法来在地图上或数据库中进行所述搜
索。可替换地,可以使用所述一个或多个词语中表示建筑物、店铺或街道的词语作为搜索关
键字,在地图上(换言之,在所述数据库中)搜索与所述文字的含义相关联的地理位置,作
为所述候选地理位置。例如,在图3的示例中,可以使用“家乐福”作为搜索关键字,或者可
以使用“家乐福”和“中关村”作为搜索关键字。在使用多个词语作为搜索关键字的情况下,
可以将分别使用各个词语作为搜索关键字进行搜索而获得的搜索结果(即,分别与各个词
语的含义相关联的地理位置)的交集作为最终的搜索结果(即,候选地理位置)。例如,在
使用“家乐福”和“中关村”作为搜索关键字的情况下,将使用“家乐福”作为搜索关键字进
行搜索而获得的搜索结果与使用“中关村”作为搜索关键字进行搜索而获得的搜索结果的
交集作为最终的搜索结果,即候选地理位置。此外,对于所提取的图标,可以使用具有与该
图标的含义相同的含义的词语作为搜索关键字,在地图上(换言之,在所述数据库中)搜索
与所述图标的含义相关联的地理位置,作为所述候选地理位置。例如,对于上述表示家乐福
超市的图标 ,可以用指示家乐福超市的文字“家乐福”作为搜索关键字,来在地图上
搜索设置了家乐福超市的地理位置,作为候选地理位置。
[0034] 如果在地图上没有搜索到与所述文字或图标的含义相关联的地理位置,即所述候选地理位置数量为0,则定位失败。反之,如果在地图上搜索到一个或多个与所述文字或图
标的含义相关联的地理位置,即存在一个或多个候选地理位置,则可以基于所述候选地理
位置确定用户的地理位置。具体地,如果只存在一个候选地理位置,则可以使用该候选地理
位置作为用户的地理位置。如果存在多个候选地理位置,则可以将所述候选地理位置以列
表的形式显示给用户,使得用户从所述列表中选择一个候选地理位置,作为用户的地理位
置。例如,在使用“家乐福”和“中关村”作为搜索关键字的情况下,尽管在地图上存在很多
设立了家乐福超市的地理位置以及很多与中关村相关联的地理位置,但是这两种地理位置
的交集只有一个元素,即,位于中关村的家乐福超市,因此,只存在一个候选地理位置,从而
可以使用该候选地理位置作为用户的地理位置。作为另一示例,在使用“屈臣氏”作为搜索
关键字的情况下,由于在中国设置了多个屈臣氏店铺,因此存在多个候选地理位置。在这种
情况下,可以将所述多个候选地理位置以列表的形式显示给用户,如下所示:
[0035] 1.屈臣氏(文三路店)
[0036] 2.屈臣氏(城东店)
[0037] 3.…
[0038] 然后,用户可以从所述列表中选择一个候选作为自己的地理位置。
[0039] 在第二种实现方式中,可以使用在所述地图上的预定地理区域中搜索到的、与所述文字或图标的含义相关联的地理位置作为候选地理位置。然后,可以基于该候选地理位
置确定用户的地理位置。同样,这里所述的与所述文字或图标的含义相关联的地理位置可
以是具有所述文字或图标的含义所指示的建筑物、店铺或街道等的地理位置。与第一实现
方式相比,第二种实现方式通过将搜索范围限制在地图上的预定地理区域而缩小了搜索范
围,从而减小该搜索操作的工作量,提高搜索速度和定位速度。如果所述候选地理位置数量
为0,则定位失败。如果所述候选地理位置是唯一的,则可以使用该候选地理位置作为用户
的地理位置。如果存在多个候选地理位置,则可以按照上文所述的方式,由用户从所述多个
候选地理位置中选择一个作为该用户的地理位置。例如,假设所述文字的含义为“家乐福超
市”,并且所述预定地理区域为北京市,则可以在地图上的北京市范围内搜索所有设置有家
乐福超市的地理位置作为候选地理位置,并且将其显示给用户。在这一示例中,由于在北京
市范围内设置有多个家乐福超市,因此,可以以列表的形式将这些家乐福超市的地理位置
作为候选地理位置显示给用户,使得用户从所显示的候选地理位置中选择一个作为该用户
的地理位置。
[0040] 在本实现方式中,所述预定地理区域可以根据用户的历史定位信息确定。具体地,每次对用户成功地进行定位,都可以存储与该定位操作相关的信息,例如该定位操作的时
间以及所确定的用户的地理位置(例如地理坐标)等,作为历史定位信息。在进行当前的
定位操作时,可以根据该历史定位信息确定用户所在的地理区域,作为所述预定地理区域。
需要注意的是,随着时间的过去,该历史定位信息指示的用户的地理位置的精度由于用户
的运动而逐渐降低,因此需要逐渐粗略地对于当前定位操作确定用户所在的地理区域。例
如,如果根据历史定位信息可知,在当前时刻的2分钟之前执行了一次定位操作,并且该定
位操作确定的用户的地理位置为北京市海淀区中关村某购物中心,则对于当前的定位操
作,可以确定用户所在的地理区域为北京市海淀区中关村;如果根据历史定位信息可知,在
当前时刻的1小时之前执行了一次定位操作,并且该定位操作确定的用户的地理位置为北
京市海淀区中关村某购物中心,则对于当前的定位操作,可以确定用户所在的地理区域为
北京市,而非北京市海淀区中关村,因为在1个小时内用户可能离开中关村。可替换地,可
以利用针对本次定位操作获得的指示所述用户所在的地理区域的定位信息来确定所述预
定地理区域,所述定位信息例如可以通过传统的GPS定位方法或WIFI定位方法获得。例
如,当用户处于室内时,尽管由于GPS信号接收质量不高而无法确定用户的准确地理位置,
但是根据该GPS信号足以确定用户所在的地理区域,则可以使用该地理区域作为所述预定
地理区域。
[0041] 需要说明的是,存储所述地图的数据库可以位于便携式设备中,在这种情况下,由便携式设备执行所述搜索。所述数据库也可以位于便携式设备可访问的服务器中,在这种
情况下,便携式设备可以将按照上述方式确定的搜索关键字、或搜索关键字和所述预定地
理区域发送给服务器,并且由该服务器执行所述搜索,然后将搜索结果(候选地理位置)发
送给便携式设备以显示给用户。
[0042] 这样,利用上述方法,在各种场景中,尤其在利用传统定位方法无法准确定位的场景中,可以准确地确定用户的地理位置,并且定位精度可以达到店铺级别,即达到几十米甚
至几米的级别。利用这样的用户的地理位置,可以进一步生成精确的导航信息,从而改善用
户体验。此外,如果用户将这样确定的其地理位置推送给商家,则商家可以提供更精准的
LBS,例如基于LBS的广告推送,从而提高商家的服务质量。
[0043] 下面,将参照图5来描述根据本公开的实施例的用于确定用户的地理位置的设备(以下可称为定位设备)的框图。该设备可以是用户携带的便携式设备,并且可以执行上述
方法。由于该设备执行的各个操作的细节与在上文中针对图2描述的方法基本相同,因此
为了避免重复,在下文中仅对所述设备进行简要的描述,而省略对相同细节的描述。
[0044] 如图5所示,用于确定用户的地理位置的设备500包括摄像头501、提取装置502、分析装置503、定位装置504和存储装置505。摄像头501可以由图1所示的摄像头112实
现。提取装置502、分析装置503、定位装置504可以由图1所示的处理器102实现,存储装
置505可以由图1所示的存储设备104实现。
[0045] 摄像头501可以用于在用户所在的地点处拍摄图像。如上文所述,所述图像可以是照片或视频,所述照片可以包括一幅或多幅单一场景的照片,也可以是全景照片。所拍摄
的图像可以反映用户所处的环境,例如用户附近的建筑物(办公楼或住宅楼)、用户附近的
店铺、用户所处的街道等。相应地,所述图像可以包含文字和/或图标,所述文字和/或图
标可以是诸如办公楼或住宅楼的建筑物、店铺或街道的标识,也可以是其他类型的文字或
图标,例如广告、路标、促销信息等。当然,也可以利用其他拍摄设备拍摄所述图像,并且将
拍摄的图像发送给定位设备500。在这种情况下,可以省略摄像头501。
[0046] 提取装置502可以提取所拍摄的图像中的文字和图标。具体地,提取装置502可以识别所述图像中的文字或图标,并且提取识别出的全部文字或图标、或识别出的全部文
字或图标中置信度高于阈值的文字或图标。所述阈值可以是根据需要预先设定的数值。可
选地,提取装置502在识别图像中的文字或图标之前,可以对所述图像进行预处理,以利于
所述识别。例如,在所述图像是照片的情况下,所述预处理可以包括对照片进行缩放,在所
述图像是视频的情况下,所述预处理可以包括提取视频的关键帧。
[0047] 在本实施例中,提取装置502可以使用OCR方法来识别图像中的文字。具体地,提取装置502可以扫描图像以检测图像中所有可能含有文字的字框的位置,然后可以将每个
字框中的内容识别为文字,并且输出识别结果。如上文所述,所述识别结果可以包括所识别
的文字和所述文字的位置。所述识别结果还可以包括所识别的文字的置信度。此外,提取装
置502可以使用本领域公知的图像识别方法来识别图像中的图标,并且输出识别结果。同
样,所述识别结果可以包括检测出的图标及其置信度。
[0048] 分析装置503可以分析提取装置502提取的文字或图标以确定所述文字或图标的含义。具体地,对于所提取的文字,分析装置503可以将其按照行或列的顺序组织为字符
串。分析装置503可以根据包含在所述识别结果中的所提取的各个文字的位置,将所提取
的各个文字排列成一行或多行,然后将所述文字按照行的顺序组织为字符串,或者可以根
据所提取的各个文字的位置,将所提取的各个文字排列成一列或多列,然后将所述文字按
照列的顺序组织为字符串。在本实施例中,分析装置503可以按照在上文中针对图2描述
的方式确定应当将所提取的文字排列成行还是列。
[0049] 然后,分析装置503可以分析所述字符串,以确定一个或多个具有具体含义的词语。具体地,分析装置503可以使用本领域公知的方法对所述字符串进行分析,并且对所述
字符串进行分词,从而将所述字符串划分为一个或多个具有具体含义的词语。所述一个或
多个词语的含义可以作为所提取的文字的含义。分析装置503对所述字符串进行分析和分
词的方法是本领域公知的,在这里为了简单起见而省略其详细描述。可选地,分析装置503
可以在对所述字符串进行分析和分词操作之前,对所述字符串进行预处理。所述预处理例
如可以是拼写校正,以校正字符串中的拼写错误。
[0050] 此外,对于所提取的图标,如上所述,分析装置503可以将该图标与预先存储的具有具体含义的图标进行匹配,以确定所提取的图标的含义。
[0051] 定位装置504可以基于所提取的文字或图标的含义,确定用户的地理位置。
[0052] 在第一种实现方式中,定位装置504可以使用在地图上搜索到的、与所述文字或图标的含义相关联的地理位置作为候选地理位置。这里,与所述文字或图标的含义相关
联的地理位置可以是具有所述文字或图标的含义所指示的建筑物、店铺或街道等的地理位
置。如上文所述,可以在数据库中预先存储所述地图(即,指示地图上各个地理位置处的建
筑物、店铺、道路等的地图数据)。对于所提取的文字,定位装置504可以使用所述一个或多
个词语中的一部分或全部词语作为搜索关键字,在地图上(换言之,在所述数据库中)搜索
与所述文字的含义相关联的地理位置,作为所述候选地理位置。可替换地,定位装置504可
以使用所述一个或多个词语中表示建筑物、店铺或街道的词语作为搜索关键字,在地图上
(换言之,在所述数据库中)搜索与所述文字的含义相关联的地理位置,作为所述候选地理
位置。在使用多个词语作为搜索关键字的情况下,定位装置504可以将分别使用各个词语
作为搜索关键字进行搜索而获得的搜索结果(即,分别与各个词语的含义相关联的地理位
置)的交集作为最终的搜索结果(即,候选地理位置)。此外,对于所提取的图标,定位装置
504可以使用具有与该图标的含义相同的含义的词语作为搜索关键字,在地图上(换言之,
在所述数据库中)搜索与所述图标的含义相关联的地理位置,作为所述候选地理位置。
[0053] 如果在地图上没有搜索到与所述文字或图标的含义相关联的地理位置,即所述候选地理位置数量为0,则定位失败。反之,如果在地图上搜索到一个或多个与所述文字或图
标的含义相关联的地理位置,即存在一个或多个候选地理位置,则定位装置504可以基于
所述候选地理位置确定用户的地理位置。具体地,如果只存在一个候选地理位置,则定位装
置504可以使用该候选地理位置作为用户的地理位置。如果存在多个候选地理位置,则定
位装置504可以将所述候选地理位置以列表的形式显示给用户,并且将用户从所述列表中
选择的一个候选地理位置作为用户的地理位置。
[0054] 在第二种实现方式中,定位装置504可以使用在所述地图上的预定地理区域中搜索到的、与所述文字或图标的含义相关联的地理位置作为候选地理位置。然后,定位装置
504可以基于该候选地理位置确定用户的地理位置。如上文所述,与所述文字或图标的含义
相关联的地理位置可以是具有所述文字或图标的含义所指示的建筑物、店铺或街道等的地
理位置。同样,如果所述候选地理位置数量为0,则定位失败。如果所述候选地理位置是唯
一的,则定位装置504可以使用该候选地理位置作为用户的地理位置。如果存在多个候选
地理位置,则可以按照上文所述的方式,定位装置504将由用户从所述多个候选地理位置
中选择的一个候选地理位置作为用户的地理位置。在本实现方式中,如上文所述,定位装置
504可以根据用户的历史定位信息确定所述预定地理区域。可替换地,如上文所述,定位装
置504可以利用针对本次定位操作获得的指示所述用户所在的地理区域的定位信息来确
定所述预定地理区域,所述定位信息例如可以通过传统的GPS定位方法或WIFI定位方法获
得。
[0055] 同样,在本实施例中,所述数据库可以位于设备500中,在这种情况下,由设备500执行所述搜索。所述数据库也可以位于设备500可访问的服务器(例如地图服务器)中,
在这种情况下,设备500可以将按照上述方式确定的搜索关键字、或者所述搜索关键字和
所述预定地理区域发送给该服务器,使得服务器基于这些信息执行所述搜索,并且将搜索
结果返回给设备500以便显示给用户。
[0056] 这样,利用上述设备,在各种场景中,尤其在利用传统定位方法无法准确定位的场景中,可以准确地确定用户的地理位置,并且定位精度可以达到店铺级别。由此,可以改善
用户体验,并且/或者提高商家的服务质量。
[0057] 除了上述方法和设备以外,本公开的实施例还可以是计算机程序产品,用于确定用户的地理位置。该计算机程序产品包括计算机可读存储介质,在所述计算机可读存储介
质上存储了计算机程序指令,所述计算机程序指令可由处理器执行以使得所述处理器提取
在用户所在的地点处拍摄的图像中的文字或图标;分析所提取的文字或图标以确定所述文
字或图标的含义;以及基于所述文字或图标的含义,确定用户的地理位置。在本实施例中,
所述图像是利用用户的便携式设备拍摄的,所述文字或图标可以是办公楼、店铺、住宅楼或
街道的标识。此外,当基于所述文字或图标的含义,确定用户的地理位置时,可以使用在地
图上的预定的地理区域中搜索到的、所述文字或图标的含义所指示的地理位置作为候选地
理位置,然后基于所述候选地理位置确定用户的地理位置。
[0058] 尽管已经示出和描述了本发明的示例实施例,本领域技术人员应当理解,在不背离权利要求及其等价物中限定的本发明的范围和精神的情况下,可以对这些示例实施例做
出各种形式和细节上的变化。
QQ群二维码
意见反馈