掌桥专利:专业的专利平台
掌桥专利
首页

基于ChatGPT的联合推荐和边缘缓存模型训练方法

文献发布时间:2024-04-18 19:58:30


基于ChatGPT的联合推荐和边缘缓存模型训练方法

技术领域

本发明属于通信技术领域,具体涉及一种基于ChatGPT的联合推荐和边缘缓存模型训练方法和一种基于ChatGPT的联合推荐和边缘缓存方法。

背景技术

随着移动通信技术的蓬勃发展和用户设备的海量接入,爆发式的移动网络流量给通信链路带来了很大的负担,降低了用户服务质量QoS(Quality of Service)。边缘缓存技术是解决这一问题的有效手段,因为网络中数据流量很大一部分是由许多用户重复请求的,冗余的内容传输会造成链路拥塞等问题,而边缘缓存通过将部分流行的内容,如文件,多媒体内容等缓存在离用户更近的网络边缘,从而降低用户获取内容的时延,能够进一步缓解通信链路的拥塞问题。

目前的边缘缓存方法集中在从大量数据中总结普遍规律,比如基于上下文感知的缓存方案通过分析用户地理位置或移动模式等信息更新缓存。但是上述方法并没有考虑到用户的个性化兴趣偏好,对用户来说,缓存的命中率并不高。

发明内容

为了解决现有技术中存在的上述问题,本发明提供了一种基于ChatGPT的联合推荐和边缘缓存模型训练方法和一种基于ChatGPT的联合推荐和边缘缓存方法。本发明要解决的技术问题通过以下技术方案实现:

第一方面,本发明实施例提供了一种基于ChatGPT的联合推荐和边缘缓存模型训练方法,应用于初始化后的边缘缓存场景中的边缘服务器,初始化后的边缘缓存场景包括一个云服务器、多个边缘服务器和用户设备,所述云服务器存储有若干视频;所述方法包括:

步骤1,针对当前轮训练过程中的当前次训练,获取用户设备发送的测试样本,包括用户请求和作为真值的符合视频;其中,用户请求包括用户历史记录或用户显式意图;

步骤2,基于当前轮训练前获取的最新的视频访问记录建立群体兴趣模型,得到当前轮训练中表征视频流行度的流行度列表;

步骤3,基于已获取的训练集中的用户请求并基于ChatGPT模型调整prompt指令,建立用户兴趣模型,基于所述用户兴趣模型和所述测试样本中的用户请求得到当前次训练的个性化推荐列表;

步骤4,利用权重系数将所述流行度列表和所述个性化推荐列表进行联合推理,得到当前次训练中所述测试样本对应的最终推荐列表,根据所述最终推荐列表确定缓存决策,并从所述云服务器缓存对应的视频;

步骤5,根据所述测试样本判断缓存视频是否命中请求;计算对应的用户总服务时延,并基于当前次训练中测试样本内存在的用户历史记录更新视频访问记录;

步骤6,判断来自测试样本的用户请求数量是否累计达到预设数量,若是,执行步骤7,若否,返回步骤1;

步骤7,结束当前轮训练,计算当前轮训练中用户总服务时延的均值;

步骤8,基于所述用户总服务时延的均值判断是否满足停止迭代条件;若是,执行步骤9,结束训练,得到训练完成的边缘服务器模型,若否,执行步骤10,调整权重系数,并返回步骤1开始新一轮训练。

在本发明的一个实施例中,所述用户历史记录含有用户已观看的视频信息;所述用户显式意图含有用户期望观看的视频要素;所述视频要素包括视频类型。

在本发明的一个实施例中,基于当前轮训练前获取的最新的视频访问记录建立群体兴趣模型,得到当前轮训练中表征视频流行度的流行度列表,包括:

所述边缘服务器获取当前轮训练前最新的视频访问记录,其中任一视频的访问记录表示预设时间段内该视频被请求或缓存的次数;

所述边缘服务器利用奇普洛夫分布构建群体兴趣模型为:

对每个视频利用群体兴趣模型确定对应的流行度,根据获得的所有视频的流行度,得到流行度列表为P={p

在本发明的一个实施例中,基于已获取的训练集中的用户请求并基于ChatGPT模型调整prompt指令,建立用户兴趣模型,包括:

基于训练集中的用户历史记录,选取1个正样本和L

基于训练集中的用户显式意图,选取1个正样本和L

利用构建的第一数据集和第二数据集,对ChatGPT模型制定的Prompt进行多次修正调试,以使得ChatGPT模型的输入数据格式与两个数据集中的数据对一一对应,且使得ChatGPT模型的输出格式满足prompt要求,以及确保ChatGPT模型的输出结果在候选池中,将调试完成的ChatGPT模型作为用户兴趣模型。

在本发明的一个实施例中,利用权重系数将所述流行度列表和所述个性化推荐列表进行联合推理,得到当前次训练中所述测试样本对应的最终推荐列表,根据所述最终推荐列表确定缓存决策,并从所述云服务器缓存对应的视频,包括:

对所述流行度列表和所述个性化推荐列表中的对应元素,依据获取的流行度列表的权重系数和个性化推荐列表的权重系数进行加权求和,得到该元素的求和结果;对所有元素的求和结果按照高低顺序排序,得到当前次训练中所述测试样本对应的最终推荐列表;

根据所述最终推荐列表,以二进制决策变量x

根据所述缓存决策从所述云服务器缓存对应的视频。

在本发明的一个实施例中,根据所述测试样本判断缓存视频是否命中请求;计算对应的用户总服务时延,包括:

判断测试样本中作为真值的符合视频是否在所述边缘服务器缓存的视频中,若在表示命中请求,否则表示未命中请求;

在命中时计算所述用户设备从所述边缘服务器获取符合视频的服务时延T

在未命中时计算所述用户设备从所述云服务器获取符合视频的服务时延T

在本发明的一个实施例中,基于当前次训练中测试样本内存在的用户历史记录更新视频访问记录,包括:

根据当前次训练中测试样本内用户请求中存在的用户历史记录所含有的视频,对视频访问记录中相应视频对应的数值进行加一处理,实现视频访问记录的更新。

在本发明的一个实施例中,根据所述测试样本判断缓存视频是否命中请求后,所述基于ChatGPT的联合推荐和边缘缓存模型训练方法还包括:计算当前次训练的命中率;

相应的,结束当前轮训练,计算当前轮训练中用户总服务时延的均值后,所述基于ChatGPT的联合推荐和边缘缓存模型训练方法还包括:计算本轮训练的平均命中率。

第二方面,本发明实施例提供了一种基于ChatGPT的联合推荐和边缘缓存方法,应用于初始化后的边缘缓存场景中的边缘服务器,其中,所述边缘缓存场景包括一个云服务器、M个边缘服务器和N个用户设备;所述方法包括:

获取用户设备发送的用户请求,包括用户历史记录或用户显式意图;所述用户历史记录含有用户已观看的视频信息;所述用户显式意图含有用户期望观看的视频要素,所述视频要素包括视频类型;

基于建立的边缘服务器模型中的群体兴趣模型,得到表征视频流行度的流行度列表;

基于所述用户请求和预先建立的边缘服务器模型中的用户兴趣模型,得到个性化推荐列表;

利用权重系数将所述流行度列表和所述个性化推荐列表进行联合推理,得到所述用户请求对应的最终推荐列表,根据所述最终推荐列表确定缓存决策,并从所述云服务器缓存对应的视频;其中,若所述边缘服务器的缓存内容命中所述用户请求,所述用户设备从所述边缘服务器获取请求的视频,若所述边缘服务器的缓存内容未命中所述用户请求,所述用户设备从所述云服务器获取请求的视频。

在本发明的一个实施例中,若所述用户请求包括用户历史记录,所述基于ChatGPT的联合推荐和边缘缓存方法,还包括:利用所述用户请求更新流行度列表。

本发明的有益效果:

1、将推荐引入边缘缓存,推荐系统可以通过挖掘用户兴趣偏好以预测用户的请求行为,也可以通过识别用户和请求内容之间的关联以重塑用户的内容请求行为,从而提高用户对推荐内容的请求概率和缓存命中率,并进一步推动边缘缓存满足用户的个性化需求。

2、基于ChatGPT的推荐系统可以处理比现有推荐系统更大的数据集,该模型主要依赖于上下文信息进行推理,可以实时生成个性化内容,并在每次交互后迭代用户偏好,更新候选推荐列表;可以把该模型作为一个通用工具,利用其强大的泛化能力和多样性,为用户提供更加个性化和精准的推荐结果。另外,基于ChatGPT的推荐可以根据推荐结果生成内容的推荐热度,作为先验知识辅助边缘缓存决策,即尽可能地把热度高且符合用户个性化需求的内容保留在缓存中,从而提高用户的服务质量。

3、要实现交互式的个性化缓存,就必须实时收集用户请求,而边缘设备就很适合用来感知和收集用户信息,通过联系边缘设备和基于ChatGPT的推荐系统,不断生成新的推荐内容进行缓存,而缓存的数据又会作为边缘设备收集的信息的一部分,这样就可以实现推荐缓存的循环和迭代更新,从而减轻中央云服务器的压力,降低缓存服务的响应延迟。

本发明实施例方案能够尽可能地将满足用户偏好且热度较高的内容保留在缓存中,提高缓存命中率并降低用户时延,使得边缘设备的缓存资源能够得到充分利用,从而减轻系统的传输负担和链路拥塞,能够在使用时为用户推荐与其需求匹配度更高的视频内容,并且使得用户可以直接从边缘服务器获取视频,从而降低用户获取视频的传输时延,因此能够避免网络拥塞,提高用户服务质量。

附图说明

图1为本发明实施例所提供的一种基于ChatGPT的联合推荐和边缘缓存模型训练方法的流程示意图;

图2为本发明实施例所提供的一种基于ChatGPT的联合推荐和边缘缓存方法的流程示意图;

图3为本发明实施例的基于ChatGPT的联合推荐和边缘缓存方法的仿真实验图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

为了便于理解本发明实施例方案,首先结合现有技术对发明构思进行简要说明。

由于目前的边缘缓存方法并没有考虑到用户的个性化兴趣偏好,导致缓存命中率并不高。因此,本发明考虑将推荐的思想引入边缘缓存问题。

具体来讲,推荐系统可以通过挖掘用户兴趣偏好以预测用户的请求行为,也可以通过识别用户和请求内容之间的关联以重塑用户的内容请求行为,从而提高用户对推荐内容的请求概率和缓存命中率,并进一步推动边缘缓存满足用户的个性化需求。

而现有的推荐系统面临着诸多缺陷,例如需要大量的数据来进行训练,不具有泛化性,缺少交互性和反馈机制等,这些局限性使得现有推荐系统往往会消耗大量的计算资源和时间成本,且无法实时处理用户数据并及时做出优化调整,这也导致了其生产力和适用场景的有限性。

随着大模型的崛起,ChatGPT开始展现出强大的市场潜力,基于ChatGPT的推荐系统主要依赖于上下文信息进行推理,不仅可以根据用户历史交互信息或意图学习用户画像和兴趣偏好,实时生成个性化内容,还可以在每次交互后迭代用户偏好,更新候选推荐列表;甚至可以把该模型作为一个通用工具,利用其强大的泛化能力和多样性,为用户提供更加个性化和精准的推荐结果。因此,本发明考虑将基于ChatGPT的推荐系统和边缘缓存方法结合,ChatGPT建立的用户兴趣模型,可以和边缘服务器建立的群体兴趣模型相结合,两者进行联合推理生成最终推荐内容的推荐热度,即尽可能地把热度高且符合用户个性化需求的内容保留在缓存中,从而提高用户的服务质量。由于边缘设备很适合用来感知和收集用户信息,本发明实施例通过联系边缘设备和基于ChatGPT的推荐系统,可以不断生成新的推荐内容进行缓存,从而减轻中央云服务器的压力,降低缓存服务的响应延迟,同时满足用户的个性化需求。

基于上述考量,本发明实施例提出了一种基于ChatGPT的联合推荐和边缘缓存模型训练方法和一种基于ChatGPT的联合推荐和边缘缓存方法,以利用边缘缓存缓解网络拥塞,提高用户服务质量,且考虑用户兴趣的个性化边缘缓存技术,以在较低的推荐要求下实现较高的缓存命中率。

第一方面,如图1所示,本发明实施例提供了一种基于ChatGPT的联合推荐和边缘缓存模型训练方法,应用于初始化后的边缘缓存场景中的边缘服务器,初始化后的边缘缓存场景包括一个云服务器、M个边缘服务器和N个用户设备,云服务器存储有若干视频;

本发明实施例在步骤1之前可以进行边缘缓存场景的初始化,初始化后,该场景中的云服务器、M个边缘服务器和N个用户设备构成一个网络。具体的:

初始化后的边缘缓存场景中,云服务器存储的若干视频可以表示为V={V

M个边缘服务器可以表示为E={e

约束条件一:γ

约束条件二:∑a

并且,针对边缘服务器的缓存决策,可以用二进制决策变量x

边缘服务器管理缓存容量的分配需要满足以下约束条件:

约束条件三:∑x

该基于ChatGPT的联合推荐和边缘缓存模型训练方法可以包括如下步骤:

步骤1,针对当前轮训练过程中的当前次训练,获取用户设备发送的测试样本,包括用户请求和作为真值的符合视频;

针对每轮训练,步骤1是其中当前一次训练的开始,一轮训练包括重复的多次训练,关于该部分请参见后文相关说明。

其中,测试样本是已知数据,其中的用户请求包括用户历史记录或用户显式意图。

可选的一种实施方式中,用户历史记录含有用户已观看的视频信息;比如可以包含用户已观看的视频名称、视频类型等。

用户显式意图含有用户期望观看的视频要素;视频要素包括视频类型,比如为恐怖片、喜剧片等,或者,视频要素还可以包括视频的演员名称、上映年份等。

测试样本中还包括用户请求对应的符合视频,作为训练过程的真值,该符合视频是事先已知用户一定会选择观看的、最符合请求的视频,符合视频可以包括视频的相关信息,比如视频名称等,在训练过程中可以利用该真值判断边缘服务器缓存的推荐视频是否符合用户预期。

其中,假设整个通信周期被划分为T个时隙,在时隙t∈{1,…,T-1}用户请求到达。本发明实施例步骤1即针对当前时隙的用户请求。

步骤2,基于当前轮训练前获取的最新的视频访问记录建立群体兴趣模型,得到当前轮训练中表征视频流行度的流行度列表;

可以理解的是,云服务器中的视频可能已经被用户设备请求或者被边缘服务器缓存过,若是一个视频被多次请求或者缓存,很大概率表示该视频的热度较高,即被群体用户需要的程度较高,表示了一种较高的群体兴趣。因此,本发明实施例基于上述构想,基于内容流行度建立群体兴趣模型。

而且,本发明实施例针对一轮训练,在其中第一次训练时,利用当前获取的最新的视频访问记录,建立群体兴趣模型,从而得到针对当前轮训练保持恒定的流行度列表,也就是说,针对当前轮训练中的所有次训练,该流行度列表在第一次训练时确定后,本轮训练中保持不变。具体的,基于当前轮训练前获取的最新的视频访问记录建立群体兴趣模型,得到当前轮训练中表征视频流行度的流行度列表,包括:

1)边缘服务器获取当前轮训练前最新的视频访问记录;

视频访问记录中任一视频的访问记录表示预设时间段内该视频被请求或缓存的次数;本发明实施例中,预设时间段可以根据需要设置,比如24小时等。第k个视频的访问记录可以用q

针对首轮首次训练,边缘服务器是从云服务器中获取视频访问记录,并且在每次训练后可能对视频访问记录进行更新,具体在后文中说明。

边缘服务器可以记录视频访问记录,具体可以用一个矩阵A

2)边缘服务器利用奇普洛夫分布构建群体兴趣模型为:

其中,q

3)对每个视频利用群体兴趣模型确定对应的流行度,根据获得的所有视频的流行度,得到流行度列表为P={p

可以理解的是,将每个视频的访问记录代入上述公式(1)可以得到对应的流行度,所有视频的访问记录代入后可以得到p

需要说明的是,本发明实施例中从步骤1至步骤6完成的是一次训练,而一轮训练过程是由多次训练过程组成的。针对本发明实施例,在一轮训练中的首次训练得到流行度列表后,当前轮训练过程中流行度列表保持不变,而是在新一轮训练执行至步骤2的时候,利用上一轮结束时得到的最新的视频访问记录重新得到流行度列表,由于一轮训练过程中从开始到结束视频访问记录原则上不会一直不变,那么此时就会实现对流行度列表的更新。针对每次训练后视频访问记录的更新过程请见后文描述。

综上,针对一次迭代过程,步骤2可以从建立的群体兴趣模型得到一个流行度列表,表示针对群体的视频兴趣程度。

步骤3,基于已获取的训练集中的用户请求并基于ChatGPT模型调整prompt指令,建立用户兴趣模型,基于用户兴趣模型和测试样本中的用户请求得到当前次训练的个性化推荐列表;

在步骤3中,需要先获取训练集,基于训练集对ChatGPT模型调整prompt指令,调整完成后即对ChatGPT模型训练完成,得到用户兴趣模型,然后再基于测试样本中的用户请求得到用户兴趣模型的输入,送入用户兴趣模型,输出个性化推荐列表。其中,ChatGPT模型可以包括ChatGPT-3.5模型等。以下具体说明。

本发明实施例步骤3使用的训练集可以包括大量作为训练样本的用户请求,同样的,用户请求包括用户历史记录或用户显式意图。作为训练样本的用户请求并不能直接输入到ChatGPT模型中进行使用,需要先对prompt(中文意为提示,具体见ChatGPT相关解释)进行微调以规范ChatGPT模型的输入和输出数据格式。

其中,作为训练样本的用户请求中可以包含视频编号M

本发明实施例假定ChatGPT模型需要测试的用户请求的数据形式包含两种:用户历史记录P

1)基于训练集中的用户历史记录,选取1个正样本和L

先构建用户历史记录数据对,具体的,边缘服务器收集到的一个用户历史记录为

其中,由于ChatGPT模型的输入长度限制,本发明实施例将用户历史记录的长度假定为L

2)基于训练集中的用户显式意图,选取1个正样本和L

该步骤是构建用户显式意图数据对,具体的,边缘服务器收集到的一个用户显式意图为

其中,由于ChatGPT模型的输入长度限制,本发明实施例将用户显式意图的长度假定为L

需要说明的是,第一数据集和第二数据集代表用户的两种不同交互方式,上文中

其中,可选的实施方式中,为了扩展数据样本,第一数据集中的每个数据对可以依据用户历史记录的不同组合进行重复实验得到,第二数据集中的每个数据对可以依据用户显式意图的不同组合进行重复实验得到,具体过程在此不做详细说明。

3)利用构建的第一数据集和第二数据集,对ChatGPT模型制定的Prompt进行多次修正调试,以使得ChatGPT模型的输入数据格式与两个数据集中的数据对一一对应,且使得ChatGPT模型的输出格式满足prompt要求,以及确保ChatGPT模型的输出结果在候选池中,将调试完成的ChatGPT模型作为用户兴趣模型。

具体的,利用上面构建的两个数据集,对ChatGPT模型制定的Prompt进行多次修正调试。Prompt的设计必须简单明确,本发明实施例为ChatGPT模型制定中间执行步骤,其需要的输入形式要与这两个数据集中的数据对一一对应,需要保证ChatGPT模型的输出结果,即个性化推荐列表所列出的视频必须在候选池中,同时还要考虑到用户历史记录在对应候选池中的情况以及推荐视频不在候选池的情况,具体的,由于前文描述第一数据集的正样本可以是在用户历史记录内的视频,因此当用户请求中的历史记录视频刚好作为其候选池中的正样本时,ChatGPT模型需要尽可能地找到该正样本。考虑到ChatGPT模型推荐的内容也可能超出候选池的范围,即推荐视频在候选池外,因此针对这种情况,prompt中需明确指出其推荐的不合理性并要求模型重新进行推荐。该过程也需要保证ChatGPT模型的输出格式满足prompt要求。在调试过程中,如果满足要求,则按照TOP-K策略直接生成个性化推荐列表,否则重新进行推荐,直至得到调试完成的ChatGPT模型作为用户兴趣模型。

以下给出ChatGPT关于推荐视频为电影的一个prompt具体指令描述,以帮助理解prompt的设计方式,具体指令的中文实例如下:

“我希望你现在扮演电影推荐器的角色,我会提供给你关于我的历史观影记录和一个包含30部电影的候选池,你需要根据我的观影记录判断出我喜欢观看的电影类型,同时在候选池中为我推荐一些电影,如果推荐的电影在候选池外,请为我重新推荐直至满足要求,不要给出多余的解释,仅按照概率降序列出概率最高的3部电影并标明他们的推荐概率。

我的历史观影记录:A,B,C,D

候选池:a,b,c,d,M,e,f……”

其中候选池中的M为正样本,其他电影均为负样本,ChatGPT模型需要在不同的TOP-K策略下找到这个正样本,如果推荐的结果中含有该正样本,则视为模型预测正确,则可以停止优化,否则视为预测不正确,则继续优化。已经调好的prompt指令可根据输入的用户请求中的历史记录或者显式意图为用户尽可能高地推荐正样本电影。

在用户兴趣模型建立完成后,可以用于推荐视频,具体的,基于用户兴趣模型和测试样本中的用户请求得到个性化推荐列表是指,将测试样本中的用户请求处理成ChatGPT模型的输入格式后送入ChatGPT模型,具体是填入prompt相应的槽位中,则可以实时生成个性化推荐列表,个性化推荐列表中包含要求推荐个数(ChatGPT中的指令会给出推荐个数)的推荐视频,这些视频含名称或者编号等,以在后续来查找该条视频,个性化推荐列表中还包括这些被推荐视频被用户请求的概率,没有被推荐得到的视频对应的推荐概率默认为0,即针对所有视频集合,个性化推荐列表外的视频经个性化推荐的请求概率默认为0。

综上,针对一次迭代过程,步骤3可以建立用户兴趣模型,输入测试样本中的用户请求得到一个个性化推荐列表,表示针对用户个体的视频兴趣程度。

步骤4,利用权重系数将流行度列表和个性化推荐列表进行联合推理,得到当前次训练中测试样本对应的最终推荐列表,根据最终推荐列表确定缓存决策,并从云服务器缓存对应的视频;

可选的一种实施方式中,步骤4可以包括:

1)对流行度列表和个性化推荐列表中的对应元素,依据获取的流行度列表的权重系数和个性化推荐列表的权重系数进行加权求和,得到该元素的求和结果;对所有元素的求和结果按照高低顺序排序,得到当前次训练中测试样本对应的最终推荐列表;

如前描述,流行度列表中含有所有视频的流行度,即被请求的概率。个性化推荐列表可能含有部分视频的被请求的概率。本发明实施例针对流行度列表和个性化推荐列表可以在首次训练之前,各自初始化一个权重系数,在第一次执行步骤4时,将流行度列表和个性化推荐列表中同一视频对应的两个元素分别利用各自的权重系数加权,再求和,得到的求和结果为该视频最终的数值,即最终推荐列表中的元素数值。具体以视频总数为5,流行度列表和个性化推荐列表的权重系数分别为W

表1

针对上述表1,各流行度列表元素值∈(0,1),且所有流行度列表元素值的和为1;各个性化推荐列表元素值∈[0,1),具体来说,表1第三列包括步骤3实际得到的个性化推荐列表元素值,也包括没有被个性化推荐列表推荐而默认为0的视频的请求概率。所有最终推荐列表是按照加权求和结果由大到排列得到的。

2)根据最终推荐列表,以二进制决策变量x

其中,x

3)根据缓存决策从云服务器缓存对应的视频。

边缘服务器根据自身确定的缓存决策将最终推荐列表中的视频内容从云服务器缓存下来存储。

可以理解的是,由于本发明实施例是结合群体兴趣模型中的流行度列表和用户兴趣模型中的个性化推荐列表进行联合推理,因此最终推荐列表内推荐的视频内容最大程度的满足既符合群体兴趣也符合用户个人的兴趣,因此,推荐的视频符合用户预期的概率会明显提高。

步骤5,根据测试样本判断缓存视频是否命中请求;计算对应的用户总服务时延,并基于当前次训练中测试样本内存在的用户历史记录更新视频访问记录;

其中,根据测试样本判断缓存视频是否命中请求,可以包括:

判断测试样本中作为真值的符合视频是否在边缘服务器缓存的视频中,若在表示命中请求,否则表示未命中请求。

可以理解的是,在训练过程中,用户想看的视频是已知的,即作为真值的符合视频,而通过上述步骤,边缘服务器已经联合推荐完成了最终推荐列表中视频的缓存,这时,若是边缘服务器缓存的视频中有作为真值的符合视频则表示边缘服务器推荐的视频命中用户请求,否则,则表示未命中用户请求。

可选的一种实施方式中,根据测试样本判断缓存视频是否命中请求后,基于ChatGPT的联合推荐和边缘缓存模型训练方法还包括:

计算当前次训练的命中率。

具体的,针对一次迭代,边缘服务器推荐的视频命中用户请求则命中率为1,边缘服务器推荐的视频未命中用户请求则命中率为0。命中率可以作为一项观测或者评估指标来衡量训练效果。

本发明实施例中,针对当前次训练,根据测试样本判断缓存视频是否命中请求之后,计算对应的用户总服务时延,包括:

1)在命中时计算用户设备从边缘服务器获取符合视频的服务时延T

具体的,如果边缘服务器推荐的视频命中用户请求,用户可以从边缘服务器就近获得视频内容,此时的服务时延的计算公式为T

其中,v

2)在未命中时计算用户设备从云服务器获取符合视频的服务时延T

具体的,如果边缘服务器推荐的视频未命中用户请求,用户需要从云服务器获得视频内容,此时的服务时延的计算公式为T

其中,R

在当前次训练结束后,基于当前次训练中测试样本内存在的用户历史记录更新视频访问记录,包括:

根据当前次训练中测试样本内用户请求中存在的用户历史记录所含有的视频,对视频访问记录中相应视频对应的数值进行加一处理,实现视频访问记录的更新。

由于本发明实施例步骤1中获取用户设备发送的测试样本中的用户请求可以包括用户历史记录或用户显式意图,因此,意味着在一次训练中,用户请求可以为用户历史记录或用户显式意图之一,那么针对一次训练,有可能测试样本中的用户请求为用户历史记录或用户显式意图之一,因此,在一次训练结束后,需要首先确定该次训练中测试样本内用户请求中是否存在用户历史记录,若存在,再确定用户历史记录所含有的视频,对目前的视频访问记录中的视频进行遍历,如果遍历到的当前视频出现在这次训练的用户历史记录中,则对视频访问记录中的该当前视频的数值加一,按照该方式处理直至视频访问记录中的视频全部遍历完成,则实现了视频访问记录的更新。但是,虽然每次训练结束后都会更新视频访问记录,仅在每轮训练开始的首次训练执行至步骤2时,才会基于建立的群体兴趣模型更新得到表征视频流行度的流行度列表。

本发明实施例的优化目标是优化缓存命中率以达到最小化系统时延性能的目标,最终提高用户满意度。因此,以一次训练为例,优化目标可以表示为:

步骤6,判断来自测试样本的用户请求数量是否累计达到预设数量,若是,执行步骤7,若否,返回步骤1;

具体的,一次训练对应一个测试样本的用户请求数量,当来自测试样本的用户请求数量累计达到预设数量时,说明已经训练预设数量次,此时完成了一轮训练。其中预设数量可以根据训练需求设置,比如可以为200等,在此不做限制。

步骤7,结束当前轮训练,计算当前轮训练中用户总服务时延的均值;

如果训练次数达到预设数量次则结束当前轮训练。可以理解的是,在当前轮训练中,每次训练都会得到一个用户总服务时延。那么,可以根据当前轮训练得到的各用户总服务时延求和后求取均值。

因此相应于前文,进一步的,结束当前轮训练,计算当前轮训练中用户总服务时延的均值后,基于ChatGPT的联合推荐和边缘缓存模型训练方法还包括:计算本轮训练的平均命中率。

具体的,一次训练的命中率可以为0或1,平均命中率是将该轮训练中所有的命中率数值1求和,结果可以用C

如前描述,本发明实施例的优化目标是优化缓存命中率以达到最小化系统时延性能的目标,最终提高用户满意度。因此,当用户总服务时延的均值满足停止迭代条件时,迭代训练就可以停止。

步骤8,基于用户总服务时延的均值判断是否满足停止迭代条件;若是,执行步骤9,结束训练,得到训练完成的边缘服务器模型,若否,执行步骤10,调整权重系数,并返回步骤1开始新一轮训练。

基于用户总服务时延的均值判断是否满足停止迭代条件可以是当前的用户总服务时延的均值小于一个预设值,也可以是多轮训练得到的用户总服务时延的均值的变化量小于一个预设的变化量数值,则表示用户总服务时延的均值不再继续减小,意味着已经达到优化目标,用户总服务时延达到了最小。此时,满足停止迭代条件,可以停止训练,得到训练完成的边缘服务器模型,其可以包括群体兴趣模型、用户兴趣模型,也可以包括个性化推荐列表的联合推理过程。

如果不满足停止迭代条件,则调整步骤4中使用的权重系数,再返回步骤1开始新一轮训练。

具体的,针对权重系数的调整,假设流行度列表中的元素为A,权重系数为W

然后计算目标函数关于权重系数的梯度:gradient_W

本发明实施例中,可以将没有被缓存的用户请求记录到缓存,没有被命中的视频内容记录在边缘服务器,再次输入到边缘服务器模型中进行迭代优化。

为解决由网络中冗余内容传输造成的网络拥塞问题并提高用户服务质量,本发明实施例提出一种基于ChatGPT的联合推荐和边缘缓存模型训练方法。具体的,边缘服务器获取用户设备发送的测试样本,包括用户请求和作为真值的符合视频,用户请求包括用户历史记录或用户显式意图。一方面边缘服务器建立群体兴趣模型得到表征视频流行度的流行度列表;另一方面,边缘服务器利用训练集中的用户请求建立用户兴趣模型,再将测试样本中的用户请求输入用户兴趣模型通过ChatGPT进行上下文推理实时生成个性化推荐列表。最后综合考虑群体兴趣模型和用户兴趣模型,将两者进行联合推理,得到最终推荐列表和边缘缓存决策。根据是否缓存命中用户请求,计算对应的用户总服务时延,通过调整命中率以用户总服务时延最小化的目标不断迭代训练,直至得到满足要求的边缘服务器模型。通过上述训练得到的边缘服务器模型,能够尽可能地将满足用户偏好且热度较高的内容保留在缓存中,提高缓存命中率并降低用户时延,使得边缘设备的缓存资源能够得到充分利用,从而达到减轻系统的传输负担和链路拥塞,能够在使用时为用户推荐与其需求匹配度更高的视频内容,并且使得用户可以直接从边缘服务器获取视频,从而降低用户获取视频的传输时延,因此能够避免网络拥塞,提高用户服务质量。

在第一方面提供的基于ChatGPT的联合推荐和边缘缓存模型训练方法的基础上,第二方面,本发明实施例还提供了一种基于ChatGPT的联合推荐和边缘缓存方法,应用于初始化后的边缘缓存场景中的边缘服务器,其中,边缘缓存场景包括一个云服务器、M个边缘服务器和N个用户设备;本发明实施例是利用第一方面提供的基于ChatGPT的联合推荐和边缘缓存模型训练方法得到的边缘服务器模型实现的。可以将以下S1~S4均视为由边缘服务器中的边缘服务器模型执行。

如图2所示,该基于ChatGPT的联合推荐和边缘缓存方法可以包括以下步骤:

S1,获取用户设备发送的用户请求,包括用户历史记录或用户显式意图;用户历史记录含有用户已观看的视频信息;用户显式意图含有用户期望观看的视频要素,视频要素包括视频类型;

该部分内容可以参见第一方面步骤1的相关内容理解,在此不做赘述。

S2,基于建立的边缘服务器模型中的群体兴趣模型,得到表征视频流行度的流行度列表;

针对第一方面最后得到的边缘服务器模型,其内的群体兴趣模型含有最终的流行度列表,在本发明实施例的S2步骤中,直接利用边缘服务器模型已有的流行度列表即可。关于流行度列表的相关内容请参见第一方面的对应部分,在此不做赘述。

S3,基于用户请求和预先建立的边缘服务器模型中的用户兴趣模型,得到个性化推荐列表;

预先建立的边缘服务器模型中的用户兴趣模型即为第一方面最后得到的边缘服务器模型中建立的用户兴趣模型,是基于ChatGPT模型训练得到的。本发明实施例可以将S1获取的用户请求处理成ChatGPT模型的输入格式后送入用户兴趣模型,可以直接得到个性化推荐列表。关于边缘服务器模型中的用户兴趣模型的相关内容请参见第一方面的对应部分,在此不做赘述。

S4,利用权重系数将流行度列表和个性化推荐列表进行联合推理,得到用户请求对应的最终推荐列表,根据最终推荐列表确定缓存决策,并从云服务器缓存对应的视频;

该步骤可以参见第一方面步骤4的对应内容,在此不做赘述。

至此,针对边缘服务器而言,其针对用户请求进行视频推荐和缓存已经实现。

其中,若边缘服务器的缓存内容命中用户请求,用户设备从边缘服务器获取请求的视频,这样能够降低用户服务时延;若边缘服务器的缓存内容未命中用户请求,用户设备从云服务器获取请求的视频。

为了使得该边缘服务器模型不断得到优化改进,可选的一种实施方式中,若用户请求包括用户历史记录,基于ChatGPT的联合推荐和边缘缓存方法,还包括:

利用用户请求更新流行度列表。

如前,针对一次S1~S4的推荐缓存过程,用户请求包括用户历史记录或用户显式意图之一,那么在优选的实施方式下,若该次推荐缓存过程的用户请求包括用户历史记录,可以利用该用户请求更新流行度列表,即更新视频访问记录从而更新流行度列表,关于流行度列表的更新过程请参见第一方面步骤7的相关内容,在此不做赘述。

而且,针对该次的用户请求,如果不满足用户需求,可以在S4结束后返回S1再进行一次推荐缓存。

本发明实施例提供的基于ChatGPT的联合推荐和边缘缓存方法,具有以下

有益效果:

1、将推荐引入边缘缓存,推荐系统可以通过挖掘用户兴趣偏好以预测用户的请求行为,也可以通过识别用户和请求内容之间的关联以重塑用户的内容请求行为,从而提高用户对推荐内容的请求概率和缓存命中率,并进一步推动边缘缓存满足用户的个性化需求。

2、基于ChatGPT的推荐系统可以处理比现有推荐系统更大的数据集,该模型主要依赖于上下文信息进行推理,可以实时生成个性化内容,并在每次交互后迭代用户偏好,更新候选推荐列表;可以把该模型作为一个通用工具,利用其强大的泛化能力和多样性,为用户提供更加个性化和精准的推荐结果。另外,基于ChatGPT的推荐可以根据推荐结果生成内容的推荐热度,作为先验知识辅助边缘缓存决策,即尽可能地把热度高且符合用户个性化需求的内容保留在缓存中,从而提高用户的服务质量。

3、要实现交互式的个性化缓存,就必须实时收集用户请求,而边缘设备就很适合用来感知和收集用户信息,通过联系边缘设备和基于ChatGPT的推荐系统,不断生成新的推荐内容进行缓存,而缓存的数据又会作为边缘设备收集的信息的一部分,这样就可以实现推荐缓存的循环和迭代更新,从而减轻中央云服务器的压力,降低缓存服务的响应延迟。

本发明实施例这种考虑用户兴趣的个性化边缘缓存方法,能够尽可能地将满足用户偏好且热度较高的内容保留在缓存中,可以在较低的推荐要求下实现较高的缓存命中率并降低用户时延,使边缘设备的缓存资源能够得到充分利用,从而减轻系统的传输负担和链路拥塞,实现提高用户服务质量的目的。

下面结合仿真实验对本发明实施例方案作进一步说明,结果如图3所示。

本发明实施例的硬件平台为:Intel Core i7-6700 CPU@3.40GHz、8GB RAM、Nvidia Quadro P2000 GPU;软件平台为:Linux16.04操作系统、Python3.6,Pytorch0.4.0。

本发明实施例的仿真实验采用MovieLens 10M数据集中的电影数据,数据文件中包含电影编号、电影名称、相应年份以及电影所属的类型,其中一部电影可能属于多种不同的类型,这里主要按照电影类型进行偏好的学习和意图的区分。图3显示了采用基于ChatGPT的联合推荐和边缘缓存方法下的缓存命中率情况,从图3中可以看到,依据用户显式意图进行联合推荐得到的缓存命中率折线始终在依据用户历史记录进行联合推荐得到的缓存命中率折线之上,这说明用户的显式意图对ChatGPT的推荐性能起到了一定的提升作用,这可能是因为ChatGPT在对用户历史记录进行偏好分析时,用户历史记录中所涵盖的电影类型比较多样,并不能完全用一种类型进行分析。尽管如此,在ChatGPT基于Top10的推荐策略下,依据用户历史记录进行联合推荐的最终缓存命中率达到了70%以上,而在ChatGPT基于Top3的推荐策略下,依据用户显式意图进行联合推荐的最终缓存命中率已经超过70%。因此,如果用户希望边缘设备为他们推荐符合他们明确偏好的电影,那么在边缘服务器留下他们的显式意图是合理的;而如果他们希望利用ChatGPT的多样性和个性化,那么他们可以在边缘服务器留下他们的历史交互记录,最终设备端返回的将是与他们之前交互过的电影类型相似的新电影。

因此本发明实施例充分考虑到了不同用户的推荐需求,提出的缓存方案可以在满足用户的个性化需求的同时降低用户服务时延,使得边缘设备的缓存资源能够得到充分利用,从而达到减轻系统的传输负担和链路拥塞,最终提高用户的服务质量的目的。

以上仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

相关技术
  • 基于云平台和模型推荐的神经网络自动训练方法和装置
  • 基于目标推荐模型的产品推荐及模型训练方法和装置
  • 推荐模型训练方法、基于推荐模型的预测方法及装置
技术分类

06120116499749