一种基于词嵌入语义表征学习的室内轨迹识别分类方法
文献发布时间:2024-04-18 20:02:40
技术领域
本发明属于自然语言处理与人工智能领域,特别涉及一种基于词嵌入语义表征学习的室内轨迹识别分类方法。
背景技术
近年来,随着移动通信技术和位置感知技术的快速发展,具备位置服务功能的智能移动终端在各个生活场景广泛应用,如博物馆GPS导航和超市RFID定位服务,这些服务能够收集到大量准确且丰富的客流运动轨迹数据。通过对这些轨迹数据进行深度挖掘,可以揭示出客流的移动行为模式,并提取出有意义的客流轨迹序列模式,对城市规划、轨迹预测及目标研究对象分组等领域具有重要价值。尤其是在零售业中,研究对象室内轨迹的分类与预测研究愈发关键。早期研究主要关注购物时间这一特征,通过RFID数据识别研究对象购物模式;后续研究开始结合情境感知信息,如访问模式和路径序列等,利用文本挖掘技术分析室内轨迹,尽管如此,语义轨迹分析与上下文感知建模之间仍存在差距,有待进一步探索。
针对上述问题,当前针对室内运动轨迹的智能分析研究中,学者们致力于将实际采集到的室内移动轨迹数据与所涉及功能区域的具体属性相结合,创新性地将研究对象的移动路径表达为一种按时间序列组织的功能区域标签序列,借此来揭示和解析研究对象随时间变化的行为模式及空间偏好。然而,为了充分挖掘这些时序文本信息背后隐藏的行为规律和语义特征,有必要进一步开发先进的方法,将室内轨迹转化为蕴含丰富语义信息的表示形式,并构建能够捕捉深层次语义结构的模式识别模型,从而实现对室内轨迹行为的精确分类。因此,亟待研发一套基于语义表征学习的室内轨迹识别分类方法,通过有效识别和分类轨迹数据,为管理者提供更准确的洞察力,助力其根据特定群体的行为特性制定相应的服务策略或管理方案,并在此基础上优化室内空间布局设计,提高商品摆放与推广的针对性,最终推动零售环境及其他室内应用场景的智能化发展。
发明内容
为了解决现有技术存在的上述问题,本发明要提出一种词嵌入语义表征学习的室内轨迹识别分类方法,首先,定义室内布局、区域功能和行为状态的文本表示,并结合研究对象的时间序列轨迹集将轨迹进行文本转义,其次,通过词嵌入将转义后文本转为词向量,并设计基于时空注意力的室内轨迹识别分类模型,将通过词嵌入将转义后文本转为词向量用于识别和分类轨迹,该方法能够有效的识别不同群体的行为特征,以提供有效准确的定制化服务。
为了实现上述目的,本发明采用的技术手段如下:一种词嵌入语义表征学习的室内轨迹识别分类方法,包括以下步骤:
S1、定义基于词嵌入的室内轨迹词向量
对研究对象的室内轨迹进行词向量的定义,具体步骤如下:
S11、定义室内轨迹
通过RFID技术获取研究对象在室内的运动轨迹序列,并结合基础信息构建轨迹定义框架,所述基础信息包括室内布局、区域功能和行为状态;具体方法如下:
S111、定义室内布局
所述室内布局包括各类商品区域、走廊和出入口的结构特征,根据室内布局图,将各类商品区域细化分区,并根据其属性对每个商品区域定义唯一文本表示,得到室内布局如下:
L={l
其中,l
S112、定义功能区域
在“功能区域”的维度上,对某一个商品区域内的空间根据其设计用途和承载活动的特性进行分类,将商品区域划分成若干功能区域,将功能区域表示为如下唯一的字符代码:
F={f
其中,f
S113、定义行为状态
室内研究对象的运动轨迹和停留时间展示了研究对象的室内行为状态。根据研究对象运动轨迹和停留时间信息,将研究对象的所有的行为状态定义如下:
S={s
其中,s
S12、轨迹文本表示
将通过RFID技术获取的研究对象运动轨迹和研究对象行为状态信息转换为时间序列轨迹集,并将时间序列轨迹与步骤S1中词向量定义相关联,将研究对象的室内运动轨迹文本向量化,具体步骤如下:
S121、轨迹的时间序列表示
将通过RFID技术收集到的时间序列轨迹集表示为如下:
P={p
其中,p
S122、轨迹文本化表示
根据步骤S1中对室内布局、功能区域和行为状态的定义,结合时间序列轨迹集,将研究对象在t时刻的轨迹信息p
w
根据t时刻的轨迹信息p
W={w
S13、词向量转义
利用连续词袋模型即COBW模型将研究对象在室内的轨迹文本序列转化为具有语义编码的词向量,通过词的One-hot编码、COBW模型训练和词向量语义表示得到轨迹序列词向量语义表示,具体步骤如下:
S131、对词的One-hot编码
One-hot编码就是对词典中每个词建立索引,根据步骤S111-S113中对室内布局、功能区域和行为状态的定义,设词典大小为M=m×n×z。按照one-hot编码映射到向量空间,得到向量如下:
…
根据上述one-hot编码映射规则,t时刻轨迹信息p
w
S132、根据轨迹的文本集合W构建轨迹的连续词袋模型Model
Model
在输入层至隐藏层的运算中,Model
根据输入层至隐藏层的输出,计算隐藏层至输出层的输出,公式如下:
u=W″
这里,u表示在给定上下文文本序列集合w
式中,v
S133、将每个文本向量w
S2、生成基于上下文语义相关的室内轨迹表征向量
S21、生成室内布局嵌入特征向量
将室内轨迹词向量集合Ver输入室内布局嵌入层,得到如下室内布局嵌入特征向量e
e
式中,W
S22、生成功能区域嵌入特征向量
将室内轨迹词向量集合Ver输入功能区域嵌入层,得到如下功能区域嵌入特征向量e
e
式中,W
S23、生成行为状态嵌入特征向量
将室内轨迹词向量集合Vet输入行为状态嵌入层,得到如下行为状态嵌入特征向量e
e
式中,W
S24、生成时序嵌入特征向量
将室内轨迹词向量集合Ver输入时序嵌入层,得到如下时序嵌入特征向量e
e
式中,W
S25、构造室内轨迹识别分类模型的输入表征向量
根据步骤S21-S24,将基于上下文语义相关的室内轨迹特征向量进行组合,形成了室内轨迹识别分类模型所需的输入表征向量,公式表达如下:
E=[e
S3、建立基于时空注意力的室内轨迹识别分类模型
S31、构建室内轨迹识别分类模型输入矩阵
对于输入表征向量E中的各向量e
e
e
e
e
任意时刻t,在空间关系上的转置矩阵表示成如下形式:
E(t)=[e
S32、构造时间注意力卷积
在输入矩阵中的时间卷积中,采用注意力机制将时间序列上的特征实现自适应权重分配。时间自注意力层分别对输入表征向量在时间维度上进行一维卷积,通过计算得到注意力输入特征Q、K和V。Q作为任务向量,K表示不同时间感受野的动态信息向量,V为保留原表征向量信息的新表示。在单个输入表征向量的时间维度上进行卷积的计算如下:
式中,f(·)表示卷积操作。
式中,函数g(·)表示一维的最大池化操作,令池化窗大小为k
式中,flatten(·)表示把多维的输入一维化。根据上述计算公式将池化后的
根据上述计算公式得到在时间维度卷积后的注意力输入特征Q、K和V值。将Q和K的转置进行矩阵相乘,并经过归一化指数函数softmax进行归一化计算,得到时间维度注意力输入特征Q、K之间表示相关性大小的权重值α
其中,D
式中,A
S33、空间注意力卷积
在输入矩阵中的空间卷积中,采用注意力机制将空间关系上的特征实现自适应权重分配。空间注意力卷积层对轨迹在每一时刻的表征向量单独进行空间卷积注意力增强,对不同时刻的空间卷积注意力层使用参数共享的方式。这种共享参数方式迫使空间卷积注意力学习到需要关注的同一类目标。将在空间维度上的输入向量表示为
式中,
然后,将多维的
根据上述计算公式得到在空间上维度卷积后的注意力输入特征Qs、Ks和Vs值。将Qs和Ks的转置进行矩阵相乘,并经过归一化指数函数softmax进行归一化运算,得到空间注意力信息特征
最后,将得到的空间注意力信息特征与特征向量Vs相乘,得到有助于信息识别的空间关系全局语义信息如下:
式中,Q
S34、拼接融合语义信息
在经过时间和空间注意力卷积后,采用concat(·)函数把时间特征和空间特征拼接成新的融合特征
O
V
式中,
S35、室内轨迹识别分类模型输出
将拼接融合后的语义信息通过线性映射,并将映射后得到的输出向量通过归一化指数函数softmax后得到室内轨迹识别分类模型最后的输出,并与目标向量进行匹配。对于产生的损失loss,通过反向传播算法更新室内轨迹识别分类模型中的权重值W
式中,
与现有技术相比,本发明具有以下有益效果:
第一,本发明将室内轨迹转换为具有语义的词向量矩阵,并设计了时空注意模型对室内进行轨迹识别分类。本发明从室内布局、功能区域、行为状态和轨迹时序信息生成轨迹的上下文语义相关表征向量,使轨迹点转义为具有行为信息的语义表征向量,便于对室内轨迹信息的信息挖掘和模式识别。
第二,本发明基于注意力机制和卷积神经网络并对其加以改进,设计了一个可同时从时间维度和空间维度视角关注表征向量的语义信息,能学习到更有效的时空特征表示进行识别轨迹行为模式和类别。提出的时空卷积注意力模型能够有效地捕捉语义表征向量的关联信息,本发明结合了注意力的全局联系和卷积局部联系的优势,提升了在室内轨迹的语义表征学习上信息挖掘的能力。
附图说明
图1是本发明的整体流程图。
图2是本发明对室内轨迹的定义图。
图3是本发明对将轨迹转义为词向量的模型结构图。
图4是本发明轨迹向量上下文表征模型结构图。
图5是本发明时空注意模型结构图。
图6是本发明全连接拼接模型结构图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,一种基于词嵌入语义表征学习的室内轨迹识别分类方法,包括如下步骤:
S1、基于词嵌入的室内轨迹词向量定义
对研究对象的室内轨迹进行词向量的转义,包括室内轨迹定义、轨迹文本表示、文本词向量转义三部分。在室内轨迹定义部分,如图2所示,将室内布局表示为L={l
S2、基于上下文语义相关的室内轨迹表征向量生成。
将轨迹的词向量集合Ver分别输入室内的布局、区域功能、行为状态和时序嵌入层,分别得到e
S3、基于时空注意力的室内轨迹识别分类模型建立。
首先,根据输入表征向量E构建模型输入矩阵,流程如图4所示。将任意时刻t,在空间关系上的转置矩阵表示为t时刻的输入E(t)=[e
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
- 一种基于语义元语的词向量表征学习方法及系统
- 一种基于无偏嵌入零样本学习的电芯缺陷分类方法
- 一种基于词嵌入语义映射的事件短语学习方法及装置
- 一种基于词嵌入语义映射的事件短语学习方法及装置