专利汇可以提供一种通过上下文相关的图嵌入表示人群移动模式的方法专利检索,专利查询,专利分析的服务。并且本 发明 提出了一种新的通过上下文相关的图嵌入模型来表示人群移动的方法。该方法首先根据用户的历史轨迹生成一个全连通的上下文相关图,并首次实现了将词嵌入技术应用于图模型,学得融合了上下文语义信息的签到点向量表示,进而通过循环神经网络得到每条轨迹的向量表示,然后引入 强化学习 的方法找出当前轨迹的产生者。在整个模型的训练过程中,本发明利用带标签的轨迹和不带标签的轨迹同步进行训练,与此同时,本发明还利用对抗学习中的策略梯度方法更新模型参数,进一步增强了模型性能。,下面是一种通过上下文相关的图嵌入表示人群移动模式的方法专利的具体信息内容。
1.一种通过上下文相关的图嵌入表示人群移动模式的方法,其特征在于包括以下步
骤:
S1,数据预处理:将原始轨迹依据特定的时间间隔切割,并划分训练集DL与测试集DU;
S2,合成上下文相关图:根据DL与DU中用户的历史轨迹分别构建签到点空间图Gspatial和访问序列图Gvisit,然后通过上述两种图合成一个全连通的上下文相关图Gtotal;
S3,对于S31,S32,S33定义的模型,执行反向传播,直到模型收敛:
S31,上下文相关的图嵌入:对于DL与DU中每一个签到点lτ,基于上述上下文相关图Gtotal生成签到点的低维分布表示C(lτ),然后,引入非线性变换协同训练签到点的分布表示,进而得到初始化签到点的嵌入表示C′(lτ)。接着,本发明将该签到点对应的时间向量u(lτ)与初始化签到点的嵌入表示C′(lτ)拼接起来,即可得到签到点的最终表示Cτ;
S32,轨迹编码:基于前一步得到的签到点的最终表示即可利用循环神经网络对轨迹进
行编码。在此,本发明用RNN的最后一个隐含状态归一化后的结果X来表示当前这条轨迹;
S33,预训练轨迹分类器,判别器:基于前一步得到的轨迹嵌入表示,利用加标轨迹,即正样本{(Tl,Ul)∈DL}预训练轨迹分类器Ρθ,其中Tl为用户的子轨迹,Ul为轨迹对应的标签,DL代表正样本集合。紧接着,利用该分类器为未标记轨迹,即负样本 预测其对应的标
签 然后通过最小化上述分类器在正负样本上的交叉熵来预训练判别器Fε;
S4,使用小批量训练方法更新模型参数,重复该步骤直至此模型遍历所有的数据:从正
样本DL中采集B组数据对,从负样本DU中也采集B组数据,并通过分类器Ρθ为这些未标记轨迹预测其对应的标签;利用判别器Fε判定分类器预测的标签的可信度,随之更新判别器的行为价值函数a(·);计算期望奖励的梯度 通过策略梯度更新模型中的参数{θ,ω,
φ},其中θ为轨迹分类器的参数,ω为嵌入表示签到点的参数,φ为嵌入表示轨迹的参数;
S5,给出一条未标记轨迹 利用上述训练好的分类器Ρθ与判别器Fε预测出该轨迹对应
的概率分布向量 中每一维代表这一维对应的用户是本次预测结果的概率值,
本发明选择概率值最大的那一维对应的用户作为最终的预测结果。
2.根据权利要求1所述通过上下文相关的图嵌入表示人群移动模式的方法,其特征在
于步骤S1包括以下分步骤:
S11,依据固定的时间间隔,如6小时,将一条完整轨迹划分为连续的子轨迹,每条子轨
迹为基于该时间间隔分割后的签到点序列。若已知当前轨迹由用户uk产生,则将此轨迹记为 其中N代表用户的个数,每一个lτ(τ∈[1,n])代表时间戳
tτ时的签到点,而且每一个lτ都有与之对应的地理坐标 分别代表经
度值和纬度值。对于不知道是谁产生的轨迹,即未标记轨迹,则将其记为
S12,为了进一步挖掘用户的移动模式,本发明加入了时间因素。具体而言,将一天划分为24个离散的时间戳且这24个基于密度的时间表示采样于高斯分布,即在tτ时签到的节点其相应的时间向量可以被表示为 其中d*代表时间向量的维度;
S13,划分训练集与测试集,本发明选取每个用户子轨迹的50%Tl以及其对应的标签Ul
作为训练集{(Tl,Ul)∈DL},剩余的50%作为测试集
S14,获得已知标签的向量表示:对于训练集数据的已知标签,本发明将使用0-1向量编
码表示该标签;
S15,按照轨迹长度对其进行排序,这样能使同一个批次的轨迹长度尽可能相似。此操
作可以减少了处理轨迹过程中不必要的填充。
3.根据权利要求1所述通过上下文相关的图嵌入表示人群移动模式的方法,其特征在
于步骤S2包括以下分步骤:
S21,构建签到点空间图,根据签到点集合中两点之间的距离是否大于给定的阈值来决
定是否应将这两点连接起来,即可构建出无向的空间图Gspatial{V,Es},其中,V是从训练集和测试集的签到记录中采样的签到点集合,Es代表节点之间的边的集合,但是如果给定的阈值太小,则有些离的比较远的签到点会变为孤立点,导致此图不连通。为了避免孤立点的出现,本发明引入了三个虚拟节点,即起点sp、终点ep以及补全节点cp,进而将V中所有的节点分别与此三个节点一一连接;
S22,构建访问序列图,为了融合用户的访问意向以及序列化移动模式,本发明进一步
构建了有向图Gvisit{V,A,Evisit},其中Evisit代表用户访问过的地点的转换,A是Gvisit中子轨迹的集合,例如:若 则它所包含的任一签到点vi∈V;
S23,合成全连通的上下文相关图Gtotal{V,E},首先利用Gspatial初始化Gtotal,然后将Evisit中的边逐一加入E中,进而得到用于学习签到点表示的无向图Gtotal,该图既考虑了签到点地理位置信息又考虑了签到的序列模式。
4.根据权利要求1所述通过上下文相关的图嵌入表示人群移动模式的方法,其特征在
于步骤S31包括以下分步骤:
S311,在上述上下文相关图Gtotal上随机游走获取签到点的上下文Con(lτ)=lτ-a:lτ+a,其中lτ-a:lτ+a代表签到点lτ附近连续的2a+1个签到点序列,a为固定的滑动窗口的大小,τ为当前签到点在这条轨迹中的索引位置;
S312,使用连续词袋模型得到签到点lτ的低维分布表示C(lτ)∈Rd,d为低维向量空间的维数;
S313,引入非线性变换协同训练每个签到点的表示,进而得到初始化签到点的嵌入表
示C'(lτ)=Relu(W'C(lτ)+b'),其中C(lτ)为签到点lτ的低维向量表示,Relu为特定的激活函数,记ω={W',b'}为签到点嵌入表示过程中可学习的参数;
S314,将每一个签到点的初始化嵌入表示C'(lτ)和时间信息u(lτ)拼接起来可得签到点的最终表示Cτ,形式化地表示为Cτ=[C'(lτ),u(lτ)]。
5.根据权利要求1所述通过上下文相关的图嵌入表示人群移动模式的方法,其特征在
于步骤S32包括以下分步骤:
S321,对于每条子轨迹T={l1,l2,...,ln},设hτ-1和hτ(τ∈{1,2,...,n})分别代表该轨迹的前一步和当前的隐藏状态,其中初始状态h0为一个全0的矢量。RNN的输入门,遗忘门,输出门分别可由如下计算获得:iτ=σ(WiCτ+Uihτ-1+Vicτ-1+bi),fτ=σ(WfCτ+Ufhτ-1+Vfcτ-1+bf),oτ=σ(WoCτ+Uohτ-1+Vocτ-1+bo),其中b*为偏差向量,σ为logistic激活函数,Cτ代表签到点lτ的最终表示,矩阵W*,U*,V*为不同的门参数。记忆单元cτ的更新规则为:cτ=fτcτ-1+iτtanh(WcCτ+Uchτ-1+bc),其中tanh(·)为双曲正切函数,初始状态c0亦为一个全0矢量,隐藏状态ht更新规则如下:hτ=tanh(cτ)oτ;
S322,本发明在此选用当前轨迹的最后一个隐藏状态归一化之后的结果作为这条轨迹
的最终表示: 其中 为最后一个隐藏状态hn的
第i维向量,d′为隐藏状态hn的维度,[,]代表向量元素之间的拼接操作。
6.根据权利要求1所述通过上下文相关的图嵌入表示人群移动模式的方法,其特征在
于步骤S33包括以下分步骤:
S331,利用加标轨迹,即正样本{(Tl,Ul)∈DL}预训练轨迹分类器Ρθ,其训练目标为最大化期望奖励Rθ=∑u∈UΡθ(u|X)a(X,u),其中,Ρθ(u|X)代表为轨迹X预测的标签为u的概率,a(·)为选择u作为当前预测的标签所对应的行为价值函数,该函数被用来衡量或评估预测
的标签的真实性,若X为从带标记的轨迹中采样的数据,则a(X,u)=1,否则,a(X,u)=Fε(X,u),令 作为未加标轨迹的奖励去影响分类器,W”和b”为学习参数,o=
Relu(XTWru),Relu为激活函数,Wr为学到的参数矩阵;
S332,利用分类器Ρθ为未标记轨迹,即负样本 预测其对应的标签
S333,最小化上述分类器在正负样本上的交叉熵来预训练判别器Fε,即
7.根据权利要求1所述通过上下文相关的图嵌入表示人群移动模式的方法,其特征在
于步骤S4包括以下分步骤:
S41,划分小批量数据:从训练数据{(Tl,Ul)∈DL}中采集B组真实的加标轨迹和其对应
的标签,从测试数据 中也采集B组未加标的轨迹数据和该模型为之预测的标签
B为每个小批量的样本大小;
S42,更新判别器的行为价值函数,即通过判别器Fε(X,u)计算出分类器预测的标签Ρθ(u|X)为真实标签的概率;
S43,计算期望奖励的梯度:将策略参数的向量记为θ,则策略参数的更新可表示为:
其中, 即U为真实标签Ul与预测的标签 的并
集,上述分类器的训练目标可重写为
在此训练过程中,本发明使用了小批量训练方法更新参数θ,其近似梯度可通过下式求
得: 其中,B为批次大
小,ul,Xl, 分别代表真实标签,带标记的轨迹,预测的标签,未标记的轨迹。故,参数θ的更新规则为: 其中,β为学习率,θnew和θold分别代表更新后的参数
和当前参数;
S44,在本发明中,为了更好地对签到点和轨迹编码,此处同时更新了嵌入表示签到点
的参数ω和嵌入表示轨迹的参数φ,故参数更新公式可重写为 其
中γ={θ,ω,φ}。
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
一种疾病概率决策方法及其系统 | 2020-05-08 | 252 |
一种基于深度学习的轨道扣件缺陷识别算法 | 2020-05-08 | 934 |
一种基于深度学习的遥感影像自动标注方法 | 2020-05-08 | 685 |
一种基于脑-机接口系统辅助评估视觉定位的方法 | 2020-05-11 | 34 |
基于特征期望子图校正分类的异常视频清洗方法 | 2020-05-13 | 134 |
基于支持向量机的天气雷达电磁干扰回波识别方法 | 2020-05-13 | 570 |
一种基于互相关特征的乳腺超声图像多元分类系统及方法 | 2020-05-13 | 23 |
基于结构化语义表示的视觉问答方法 | 2020-05-13 | 822 |
一种基于多模态关系的网络谣言检测方法 | 2020-05-11 | 204 |
一种基于心率变异性的睡眠分期方法 | 2020-05-11 | 381 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。