掌桥专利:专业的专利平台
掌桥专利
首页

模型训练方法、语义通信传输方法及模型训练装置

文献发布时间:2024-04-18 20:01:23


模型训练方法、语义通信传输方法及模型训练装置

技术领域

本发明涉及数据处理技术领域,尤其涉及一种模型训练方法、语义通信传输方法及模型训练装置。

背景技术

语义通信是一种用于解决无线通信中无线频谱资源瓶颈的有效方案。传统的通信技术主要关注物理层的改进,通过利用技术如非正交多址技术或增大物理通信带宽容量等手段来提高通信效率。然而,随着无线网络信号载体从毫米波信号向未来的太赫兹信号发展,通信技术面临缺乏可用无线频谱资源的瓶颈。

语义通信通过利用先验知识库,将待传输数据从比特流映射到语义空间。这种映射过程利用数据的语义信息,将数据转化为具有语义含义的形式。通过传输语义数据,可以大大减少传输所需的资源开销,并提高服务质量。通过语义通信,通信系统可以更好地理解和利用数据的内在含义。传统的通信方式通常将数据视为比特流,只关注数据的传输和接收。而语义通信则更注重数据的含义和语义,可以根据数据的语义信息进行更精确的传输和处理。这种方式可以有效地提高数据传输的效率和质量,同时降低通信系统对带宽和资源的需求。

语义通信的研究和应用具有广泛的意义。它可以支持超清流媒体、增强现实(AR)、虚拟现实(VR)等新型服务,这些服务对高吞吐量和低传输时延有着极高的要求。此外,语义通信还可以应用于智能物联网、大数据传输和智能交通等领域,为这些领域提供更高效、可靠的通信解决方案。

然而,现有的语义通信技术仍然存在以下两个问题:1)传统语义通信的语义码率适应性较差。2)传统语义通信的资源使用灵活性较差。

发明内容

本发明旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本发明提出一种模型训练方法、语义通信传输方法及模型训练装置,能够高效进行模型训练,以使得训练网络模型精准高效进行语音通信传输。

一方面,本发明实施例提供了一种模型训练方法,包括:

获取训练数据集合,对训练数据集合进行打乱和分批操作,得到第一数量个批次数据;初始化迭代次数为1;

将迭代次数对应的批次数据输入语义提取神经网络进行语义提取,得到第一语义数据;

对第一语义数据进行分块操作,得到第一语义块集合;第一语义块集合包括第二数量个语义块:

基于预设计算方式确定语义块的重要性;

对第一语义块集合中重要性处于最前面的语义块进行随机保留;

对随机保留的语义块进行量化处理,整理得到第二语义数据;

将第二语义数据输入数据重建神经网络进行数据恢复,得到恢复数据;

根据迭代次数对应的批次数据与恢复数据计算损失函数,根据损失函数对语义提取神经网络和数据重建神经网络的模型参数进行更新;

将迭代次数加1,然后返回将迭代次数对应的批次数据输入语义提取神经网络进行语义提取,得到第一语义数据这一步骤,直至迭代次数等于第一数量,得到训练完成的语义提取神经网络和数据重建神经网络。

可选地,基于预设计算方式确定语义块的重要性,包括:

对语义块中所有的单个语义数据进行范数运算和求和运算,得到语义块的重要性;

其中,重要性的表达式为:

式中,S

可选地,对第一语义块集合中重要性处于最前面的语义块进行随机保留,包括:

获取随机正整数;随机正整数小于或等于第二数量;

对第一语义块集合中重要性处于最前面的随机正整数个的语义块进行保留,并对第一语义块集合中剩余的语义块进行置零处理。

可选地,根据迭代次数对应的批次数据与恢复数据计算损失函数,包括:

根据迭代次数对应的批次数据与恢复数据进行均方差计算,得到损失函数;

其中,损失函数的表达式为:

式中,

另一方面,本发明实施例提供了一种语义通信传输方法,包括:

获取待发送数据,配置发送端的初始化参数;初始化参数包括总分块数和发送语义块数;

将待发送数据输入语义提取神经网络进行语义提取,得到第三语义数据;

对第三语义数据进行分块操作,得到第二语义块集合;第二语义块集合包括总分块数个语义块:

基于预设计算方式确定语义块的重要性;

对第二语义块集合中重要性处于最前面的发送语义块数个的语义块进行保留;

对保留的语义块进行量化处理,将量化处理的结果发送到接收端;以使得接收端根据所有保留的语义块的量化处理的结果整理得到第四语义数据,并将第四语义数据输入数据重建神经网络进行数据恢复,得到目标恢复数据;

其中,语义提取神经网络和数据重建神经网络,通过前面的模型训练方法训练得到。

可选地,语义通信传输方法还包括:对第二语义块集合中未保留的语义块进行置零处理;对保留的语义块进行量化处理,将量化处理的结果发送到接收端,包括:

初始化计数器数值为1;

获取第二语义块集合中计数器数值对应的语义块作为目标语义块;

当目标语义块不为0,对目标语义块进行量化处理,进而将目标语义块的量化处理的结果传输到接收端;当目标语义块为0,跳过目标语义块;

将计数器数值加1,然后返回获取第二语义块集合中计数器数值对应的语义块作为目标语义块这一步骤,直至计数器数值等于总分块数。

另一方面,本发明实施例提供了一种模型训练装置,包括:

第一模块,用于获取训练数据集合,对训练数据集合进行打乱和分批操作,得到第一数量个批次数据;初始化迭代次数为1;

第二模块,用于将迭代次数对应的批次数据输入语义提取神经网络进行语义提取,得到第一语义数据;

第三模块,用于对第一语义数据进行分块操作,得到第一语义块集合;第一语义块集合包括第二数量个语义块;

第四模块,用于基于预设计算方式确定语义块的重要性;

第五模块,用于对第一语义块集合中重要性处于最前面的语义块进行随机保留;

第六模块,用于对随机保留的语义块进行量化处理,整理得到第二语义数据;

第七模块,用于将第二语义数据输入数据重建神经网络进行数据恢复,得到恢复数据;

第八模块,用于根据迭代次数对应的批次数据与恢复数据计算损失函数,根据损失函数对语义提取神经网络和数据重建神经网络的模型参数进行更新;

第九模块,用于将迭代次数加1,然后返回将迭代次数对应的批次数据输入语义提取神经网络进行语义提取,得到第一语义数据这一步骤,直至迭代次数等于第一数量,得到训练完成的语义提取神经网络和数据重建神经网络。

另一方面,本发明实施例提供了一种语义通信传输装置,包括:

第十模块,用于获取待发送数据,配置发送端的初始化参数;初始化参数包括总分块数和发送语义块数;

第十一模块,用于将待发送数据输入语义提取神经网络进行语义提取,得到第三语义数据;

第十二模块,用于对第三语义数据进行分块操作,得到第二语义块集合;第二语义块集合包括总分块数个语义块;

第十三模块,用于基于预设计算方式确定语义块的重要性;

第十四模块,用于对第二语义块集合中重要性处于最前面的发送语义块数个的语义块进行保留;

第十五模块,用于对保留的语义块进行量化处理,将量化处理的结果发送到接收端;以使得接收端根据所有保留的语义块的量化处理的结果整理得到第四语义数据,并将第四语义数据输入数据重建神经网络进行数据恢复,得到目标恢复数据;

其中,语义提取神经网络和数据重建神经网络,通过前面的模型训练装置训练得到。

可选地,语义通信传输装置,还包括:

第十六模块,用于对第二语义块集合中未保留的语义块进行置零处理。

另一方面,本发明实施例提供了一种电子设备,包括:处理器以及存储器;存储器用于存储程序;处理器执行程序实现上述模型训练方法或语义通信传输方法。

另一方面,本发明实施例提供了一种计算机存储介质,其中存储有处理器可执行的程序,处理器可执行的程序在由处理器执行时用于实现上述模型训练方法或语义通信传输方法。

本发明实施例首先获取训练数据集合,对训练数据集合进行打乱和分批操作,得到第一数量个批次数据;初始化迭代次数为1;将迭代次数对应的批次数据输入语义提取神经网络进行语义提取,得到第一语义数据;对第一语义数据进行分块操作,得到第一语义块集合;第一语义块集合包括第二数量个语义块;基于预设计算方式确定语义块的重要性;对第一语义块集合中重要性处于最前面的语义块进行随机保留;对随机保留的语义块进行量化处理,整理得到第二语义数据;将第二语义数据输入数据重建神经网络进行数据恢复,得到恢复数据;根据迭代次数对应的批次数据与恢复数据计算损失函数,根据损失函数对语义提取神经网络和数据重建神经网络的模型参数进行更新;将迭代次数加1,然后返回将迭代次数对应的批次数据输入语义提取神经网络进行语义提取,得到第一语义数据这一步骤,直至迭代次数等于第一数量,得到训练完成的语义提取神经网络和数据重建神经网络。本发明实施例通过对各个批次训练数据的分块操作,进而基于语义分块重要性的语义分块筛选法,优先传输重要性较高的语义分块,在实际应用中,可根据传输任务的精度要求动态调节,通过对语义数据进行分块、重要性筛选和量化操作,实现了对数据的高效传输。本发明实施例能够精确高效进行语音通信传输。

附图说明

附图用来提供对本发明技术方案的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明的技术方案,并不构成对本发明技术方案的限制。

图1是本发明实施例提供的进行模型训练的一种实施环境示意图;

图2是本发明实施例提供的一种模型训练方法的流程示意图;

图3为本发明实施例提供的模型训练方法的整体流程原理示意图;

图4为本发明实施例提供的一种语义通信传输方法的流程示意图;

图5为本发明实施例提供的语义通信传输方法的整体流程原理示意图;

图6为本发明实施例提供的语义通信传输方法的应用场景架构原理示意图;

图7为本发明实施例提供的语义通信传输的实例流程原理示意图;

图8为本发明实施例提供的语义通信传输的应用效果示意图;

图9为本发明实施例提供的一种模型训练装置的结构示意图;

图10为本发明实施例提供的一种电子设备的结构示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。

需要说明的是,虽然在系统示意图中进行了功能模块划分,在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于系统中的模块划分,或流程图中的顺序执行所示出或描述的步骤。说明书和权利要求书及上述附图中的术语“第一/S100”、“第二/S200”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。

在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本发明的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。

可以理解的是,本发明实施例提供的模型训练方法,是能够应用于任意一种具备数据处理计算能力计算机设备,而这一计算机设备可以是各类终端或是服务器。当实施例中的计算机设备是服务器时,该服务器是独立的物理服务器,或者,是多个物理服务器构成的服务器集群或者分布式系统,或者,是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN(Content Delivery Network,内容分发网络)、以及大数据和人工智能平台等基础云计算服务的云服务器。可选地,该终端是智能手机、平板电脑、笔记本电脑以及台式计算机等,但也并不局限于此。

如图1所示,是发明实施例提供的一种实施环境示意图。参照图1,该实施环境包括至少一个终端102和服务器101。终端102和服务器101之间可以通过无线或者有线的方式进行网络连接,完成数据传输交换。

服务器101可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN(Content Delivery Network,内容分发网络)、以及大数据和人工智能平台等基础云计算服务的云服务器。

另外,服务器101还可以是区块链网络中的一个节点服务器。其中,区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。

终端102可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等,但并不局限于此。终端102以及服务器101可以通过有线或无线通信方式进行直接或间接地连接,本发明实施例在此不做限制。

示例性地基于图1所示的实施环境,本发明实施例提供了一种模型训练方法,下面以该模型训练方法应用于服务器101中为例子进行说明,可以理解的是,该模型训练方法也可以应用于终端102中。

参照图2,图2为本发明实施例提供的应用于服务器的模型训练方法的流程图,该模型训练方法的执行主体可以是前述的任意一种计算机设备。参照图2,该方法包括以下步骤:

S100、获取训练数据集合,对训练数据集合进行打乱和分批操作,得到第一数量个批次数据:初始化迭代次数为1;

示例性地,一些具体实施例中,首先进行初始化准备,包括如下步骤:对包含I个训练数据的训练数据集合

S200、将迭代次数对应的批次数据输入语义提取神经网络进行语义提取,得到第一语义数据:

示例性地,一些具体实施例中,进行语义提取前向传播,将第j批数据输入语义编码器,计算对应的语义信息(即第一语义数据)

S300、对第一语义数据进行分块操作,得到第一语义块集合;

需要说明的是,第一语义块集合包括第二数量个语义块;

示例性地,一些具体实施例中,语义数据分块的处理步骤如下:将语义数据根据语义的维度进行分块,得到

S400、基于预设计算方式确定语义块的重要性;

需要说明的是,一些实施例中,步骤S400可以包括:对语义块中所有的单个语义数据进行范数运算和求和运算,得到语义块的重要性;其中,重要性的表达式为:

式中,S

示例性地,一些具体实施例中,计算语义分块重要性可以通过如下步骤实现:计算每个语义块的重要性,其中第l个语义块的重要性计算方式为

S500、对第一语义块集合中重要性处于最前面的语义块进行随机保留;

需要说明的是,一些实施例中,步骤S500可以包括:获取随机正整数;随机正整数小于或等于第二数量;对第一语义块集合中重要性处于最前面的随机正整数个的语义块进行保留,并对第一语义块集合中剩余的语义块进行置零处理。

示例性地,一些具体实施例中,随机保留重要语义块,具体实现步骤如下:取随机正整数K,且K≤L。仅取重要性最大的前K个分块,剩余的L-K个分块的语义数据全置零。得到仅包含K个语义块的语义信息。

S600、对随机保留的语义块进行量化处理,整理得到第二语义数据;

示例性地,一些具体实施例中,语义量化可以通过如下步骤实现:对未置零的K个语义分块的数据进行量化(此处量化可采用传统的8位量化机制,将32位的浮点数量化为8位浮点数,现有的训练框架可直接支持该操作),然后重新组合得到量化后的语义数据

S700、将第二语义数据输入数据重建神经网络进行数据恢复,得到恢复数据;

示例性地,一些具体实施例中,将

S800、根据迭代次数对应的批次数据与恢复数据计算损失函数,根据损失函数对语义提取神经网络和数据重建神经网络的模型参数进行更新;

需要说明的是,一些实施例中,根据迭代次数对应的批次数据与恢复数据计算损失函数,包括:根据迭代次数对应的批次数据与恢复数据进行均方差计算,得到损失函数;其中,损失函数的表达式为:

式中,

示例性地,一些具体实施例中,可以采用反向传播更新网络模型参数,具体实现步骤可以为:计算损失函数,即均方差的值

S900、将迭代次数加1,然后返回将迭代次数对应的批次数据输入语义提取神经网络进行语义提取,得到第一语义数据这一步骤,直至迭代次数等于第一数量,得到训练完成的语义提取神经网络和数据重建神经网络。

为详细解释本发明技术方案的原理,下面结合一些具体实施例对本发明的模型训练的整体流程进行说明,容易理解的是,下述为对本发明技术原理的解释,不能看做对本发明的限制。

首先需要说明的是,在现有语义通信框架中,存在两个主要问题。①传统语义通信的语义码率适应性较差。传统基于固定神经网络模型的语义通信框架在语义编码和解码模型训练完成后,传输的质量仅取决于无线信道的质量,用户无法通过调节神经网络模型的计算策略来改变语义数据的码率。②传统语义通信的资源使用灵活性较差。语义通信通常依赖于神经网络进行语义编码和解码,该计算过程会消耗较大的开销。用户无法在使用过程中调整计算和通信的开销。

基于上述问题,本发明旨在提供一种可伸缩编码方案,以改善语义通信的性能。可伸缩编码可以根据可用的带宽或存储容量进行自适应。它允许数据以多个精度要求或分辨率进行编码,发送端和接收端双方可以根据其带宽限制的调节通信的质量。这种机制有利于异构网络环境下的设备进行灵且活动态的数据传输。具体地,本发明实施例可以进行可伸缩语义编解码模型训练,该步骤的目的是通过设计特定的训练机制,得到支持可伸缩编解码的语义提取神经网络和数据重建神经网络。若缺乏该步骤仅采用传统的训练方法得到语义神经网络模型,在后续弹性化通信中,接收端恢复出来的数据精度与原始待传输数据的差异会十分之大。本发明提出的模型训练方法能有效提高数据的恢复质量。注:以下符号中,X,Y分别表示单个输入数据或者语义数据;花体符号(如

给定训练数据

以下将描述在第t个训练轮次的模型更新操作。具体地,需要将整个数据集切分成

第1步(初始化准备):对包含i个训练数据的训练数据集合

第2步(语义提取前向传播):将第j批数据输入语义编码器,计算对应的语义信息

第3步(语义数据分块):将语义数据根据语义的维度进行分块,得到

第4步(计算语义分块重要性):计算每个语义块的重要性,其中第L个语义块的重要性计算方式为

第5步(随机保留重要语义块):取随机正整数K,且K≤L;仅取重要性最大的前K个分块,剩余的L-K个分块的语义数据全置零;得到仅包含K个语义块的语义信息;

第6步(语义量化及数据恢复前向传播):对未置零的K个语义分块的数据进行量化(此处量化可采用传统的8位量化机制,将32位的浮点数量化为8位浮点数,现有的训练框架可直接支持该操作),然后重新组合得到量化后的语义数据

第7步(反向传播更新参数):计算损失函数,即均方差的值

第8步(判断是否完成当轮更新):若j=J,退出当前轮次迭代,否则返回第2步进入下一个批次数据的迭代。

示例性地基于图1所示的实施环境,本发明实施例另一方面提供了一种语义通信传输方法,下面以该模型训练方法应用于服务器101中为例子进行说明,可以理解的是,该模型训练方法也可以应用于终端102中。

参照图4,图4为本发明实施例提供的应用于服务器的语义通信传输方法的流程图,该语义通信传输方法的执行主体可以是前述的任意一种计算机设备。参照图4,该方法包括以下步骤:

T100、获取待发送数据,配置发送端的初始化参数;初始化参数包括总分块数和发送语义块数;

示例性地,一些具体实施例中,初始化准备包括:总分块数L,实际发送语义块数K,每块语义数据的维度N,待发送数据X。

T200、将待发送数据输入语义提取神经网络进行语义提取,得到第三语义数据;

示例性地,一些具体实施例中,语义提取实现可以为:发送端利用语义提取神经网络对待传输数据进行语义提取

T300、对第三语义数据进行分块操作,得到第二语义块集合;

需要说明的是,第二语义块集合包括总分块数个语义块;

示例性地,一些具体实施例中,将语义数据切分成L块,得Y=[y

T400、基于预设计算方式确定语义块的重要性;

示例性地,一些具体实施例中,计算每一个语义分块的重要性S

T500、对第二语义块集合中重要性处于最前面的发送语义块数个的语义块进行保留;

示例性地,一些具体实施例中,根据向量S挑选出前K个最重要的语义块。

需要说明的是,一些实施例中,语义通信传输方法还可以包括:对第二语义块集合中未保留的语义块进行置零处理。

示例性地,一些具体实施例中,可以用一个L维二元向量M={m

T600、对保留的语义块进行量化处理,将量化处理的结果发送到接收端;以使得接收端根据所有保留的语义块的量化处理的结果整理得到第四语义数据,并将第四语义数据输入数据重建神经网络进行数据恢复,得到目标恢复数据;

其中,语义提取神经网络和数据重建神经网络,通过前面的模型训练方法训练得到;一些实施例中,对保留的语义块进行量化处理,将量化处理的结果发送到接收端,包括:初始化计数器数值为1;获取第二语义块集合中计数器数值对应的语义块作为目标语义块;当目标语义块不为0,对目标语义块进行量化处理,进而将目标语义块的量化处理的结果传输到接收端;当目标语义块为0,跳过目标语义块;将计数器数值加1,然后返回获取第二语义块集合中计数器数值对应的语义块作为目标语义块这一步骤,直至计数器数值等于总分块数。

为详细解释本发明技术方案的原理,下面结合一些具体实施例对本发明的语义通信传输的整体流程进行说明,容易理解的是,下述为对本发明技术原理的解释,不能看做对本发明的限制。

为了规范基于可伸缩语义通信模型的数据传输流程,使得数据传输可以高效、有序地进行。待完成模型训练后,可获得经过T轮训练的模型参数

第1步(初始化准备):总分块数L,实际发送语义块数K,每块语义数据的维度N,待发送数据X;

第2步(语义提取及分块):发送端利用语义提取神经网络对待传输数据进行语义提取

第3步(语义块筛选):发送端计算每一个语义分块的重要性S

第4步(发送配置数据):发送端用一个L维二元向量M={m

第5步(语义块发送):若m

第6步(语义块接收):若m

第7步(数据重建):接收端根据M的索引值,对K个量化后的语义数据块进行重组,得到

为进一步解释本发明技术方案的应用原理,下面结合具体应用场景对本发明实施例的方法流程进行说明。

区别于传统通信方法,语义通信是一种基于语义的新型通信范式。它借助一个先验知识库(如预训练神经网络模型),可以有效地提取出数据中的必要信息、去除冗余部分。在语义通信中,首先需要对待传输数据进行语义编码,常用做法是数据发送方利用语义编码模块将该数据映射到一个紧凑的向量空间(即语义数据),然后将语义数据发送到接收端。当接收端完成语义数据接收后将会采用语义解码模块恢复出原始的待传输数据。与传统的信源编码相比,语义通信可在低信噪比的通信条件下,大大提高通信服务的质量。

特别的,语义通信是将数据映射到紧凑的向量空间。即使在传输过程中语义数据发生误传,接收端仍能较好地恢复出原始数据,抗干扰性是语义通信与生俱来的优点。通常,语义数据的向量空间大小是固定的,当语义提取神经网络完成训练之后,在通信过程中无法实时调整语义数据的特征空间向量大小。

可伸缩编码语义通信的目标就是为了突破以上难点,实现在通信过程中灵活地调整语义空间维度的大小,从而改变通信所需的开销,实现弹性化的语义通信。

特别地,本发明的可伸缩语义通信方案可以基于动态神经网络的特性实现的。动态神经网络的特点是允许神经网络模型的输入或者输出的空间维度大小在运行时动态调节。值得一提的是,动态神经网络的实现方式有多种,且尚未有将动态神经网络与语义通信相结合的研究方案。本方案并不是语义通信与动态神经网络的简单拼凑。两者之间需要有机的联合设计才可实现可伸缩语义通信。

以下将针对语义通信的特点,设计面向可伸缩语义通信的动态神经网络(具体包括语义提取神经网络和数据重建神经网络)训练方案。待模型完成训练后,本发明设计了一个传输协议实现语义通信传输方法,使得可伸缩数据传输有序、高效地进行。

如图6所示,为本发明实施例应用场景的数据传输系统的示例,数据传输系统包含数据发送端与数据接收端两个物理实体。如图6所示,数据发送端包含了语义编码模块和发送模块;数据接收端包含接收模块和语义解码模块。发送方的目标是将待发送数据X传输到接收方。为了提高数据传输的性能,语义通信中通过一对语义提取神经网络和数据重建神经网络,完成语义提取和数据重建。具体地,语义提取神经网络的参数可表示为w

在执行数据传输之前,数据发送方需要对待发送数据进行语义提取得到语义数据Y,该过程可表示为Y=E(w

在现有语义通信系统中,当语义提取神经网络和数据重建神经网络确定后,语义数据的维度大小不可以动态改变。无法实现弹性化的语义通信传输系统。为了突破该限制,本发明设计了一种基于语义分块的语义通信训练方法,通过特定的神经网络模型训练机制,得到支持可伸缩编码的一对语义提取神经网络和数据重建神经网络。进一步地,本发明设计了一种传输协议,确保基于可伸缩编码的语义通信系统可靠高效运行。

具体地,设原始语义数据Y的维度为N,即

需要说明的是,本发明的方案适用于图像、视频、语音等多媒体数据的语义传输。其中原始语义特征维度的取值一般为500至10000之间,可根据任务的复杂度进行配置;语义分块数一般设置为4至32之间。语义提取神经网络和数据重建神经网络的选取包括但不限于全连接神经网络(MLP),卷积神经网络(CNN)、及Transformer架构等。

示例性地,一些具体实施例中,如图7所示,展示了一个N=512,L=4,K=2的案例。经过语义提取和分块操作,可得到4个语义分块Y=[y

在数据传输过程中,发送端先发送配置数据向量M={0,1,0,1}到发送端,然后再依次对第2个语义块y

接收端获取到配置数据向量M={0,1,0,1}和

其中,以图像传输为例,确定分块数L=4、采样不同取值的K∈[1,2,3]的实际应用效果如图8所示。

综上所述,和现有技术相比,本发明实施例的技术优势在于:1.语义码率适应性:可伸缩编码赋能上层应用根据实时信道状态进行码率适应,用户可自定义语义的提取和传输质量,从而提供更个性化的体验;2.资源利用灵活性:可伸缩编码方法可以在不同的资源限制下进行灵活的资源利用。在异构无线网络环境中,可伸缩编码方法允许用户根据不同设备状态灵活切换传输模式,以提高用户的体验度。具体地,在低电量模式下,用户可以切换到低质量传输模式,提高电池的续航时间。

和现有技术相比,本发明至少包括如下有益效果:

1.基于语义分块法的可伸缩语义通信。发送端可以指定特定的分块数,动态调整语义数据的空间维度大小。该设计保证系统的灵活性。

2.基于语义分块重要性的语义分块筛选法,优先传输重要性较高的语义分块。该设计保证了系统的有效性。

3.结合配置数据的二元向量和量化后的语义分块的传输方法。接收端需要根据二元向量重建语义数据。该设计保证了系统的高效性。

4.接收端的补零操作。当重要性较低的语义分块未传输到接收端时,接收端采用补零操作,然后再进行数据重建操作。该设计保证了系统的高效性。

此外,本发明实施例在实际应用中,至少可以提供如下价值:

1.面向社会的价值:

①提供更高质量的语义通信服务:可伸缩编码方法能够在异构通信场景下提供更好的通信质量。②个性化用户体验:可伸缩编码方法使得上层应用能够根据实时信道状态进行码率适应和自定义语义的提取和传输质量,从而提供更个性化的用户体验。

2.面向通信企业的价值:

①提供灵活的资源利用方式:可伸缩编码方法允许在不同的资源限制下进行灵活的资源利用。这对于通信企业在异构无线网络环境中提供性能优化和资源管理具有重要意义。②改善网络容量和效率:通过在通信过程中灵活地调整语义空间维度的大小,从而改变通信所需的开销。这有助于提高网络的容量和效率。

3.面向消费者的价值:

提高用户体验:可伸缩编码方法允许用户在低电量模式下切换到低质量传输模式,从而提高设备的续航时间,对于移动设备用户尤为重要。

另一方面,如图9所示,本发明实施例提供了一种模型训练装置90,包括:第一模块91,用于获取训练数据集合,对训练数据集合进行打乱和分批操作,得到第一数量个批次数据;初始化迭代次数为1;第二模块92,用于将迭代次数对应的批次数据输入语义提取神经网络进行语义提取,得到第一语义数据;第三模块93,用于对第一语义数据进行分块操作,得到第一语义块集合;第一语义块集合包括第二数量个语义块;第四模块94,用于基于预设计算方式确定语义块的重要性;第五模块95,用于对第一语义块集合中重要性处于最前面的语义块进行随机保留;第六模块96,用于对随机保留的语义块进行量化处理,整理得到第二语义数据;第七模块97,用于将第二语义数据输入数据重建神经网络进行数据恢复,得到恢复数据;第八模块98,用于根据迭代次数对应的批次数据与恢复数据计算损失函数,根据损失函数对语义提取神经网络和数据重建神经网络的模型参数进行更新;第九模块99,用于将迭代次数加1,然后返回将迭代次数对应的批次数据输入语义提取神经网络进行语义提取,得到第一语义数据这一步骤,直至迭代次数等于第一数量,得到训练完成的语义提取神经网络和数据重建神经网络。

另一方面,本发明实施例提供了一种语义通信传输装置,包括:第十模块,用于获取待发送数据,配置发送端的初始化参数;初始化参数包括总分块数和发送语义块数;第十一模块,用于将待发送数据输入语义提取神经网络进行语义提取,得到第三语义数据;第十二模块,用于对第三语义数据进行分块操作,得到第二语义块集合;第二语义块集合包括总分块数个语义块;第十三模块,用于基于预设计算方式确定语义块的重要性;第十四模块,用于对第二语义块集合中重要性处于最前面的发送语义块数个的语义块进行保留;第十五模块,用于对保留的语义块进行量化处理,将量化处理的结果发送到接收端;以使得接收端根据所有保留的语义块的量化处理的结果整理得到第四语义数据,并将第四语义数据输入数据重建神经网络进行数据恢复,得到目标恢复数据;其中,语义提取神经网络和数据重建神经网络,通过前面的模型训练装置训练得到。

一些实施例中,语义通信传输装置还可以包括:第十六模块,用于对第二语义块集合中未保留的语义块进行置零处理。

本发明方法实施例的内容均适用于本装置实施例,本装置实施例所具体实现的功能与上述方法实施例相同,并且达到的有益效果与上述方法达到的有益效果也相同。

另一方面,如图10所示,本发明实施例还提供了一种电子设备100,该电子设备包括至少一个处理器110,还包括至少一个存储器120,用于存储至少一个程序,处理器执行所述程序实现上述的模型训练方法或语义通信传输方法;以一个处理器110及一个存储器120为例。

处理器110和存储器120可以通过总线或者其他方式连接。

存储器120作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序以及非暂态性计算机可执行程序。此外,存储器120可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件或其他非暂态固态存储器件。在一些实施方式中,存储器120可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至该装置。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

以上所描述的电子设备实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。

本发明方法实施例的内容均适用于本电子设备实施例,本电子设备实施例所具体实现的功能与上述方法实施例相同,并且达到的有益效果与上述方法达到的有益效果也相同。

本发明实施例的另一方面还提供了一种计算机可读存储介质,存储介质存储有程序,程序被处理器执行实现前面的模型训练方法或语义通信传输方法。

本发明方法实施例的内容均适用于本计算机可读存储介质实施例,本计算机可读存储介质实施例所具体实现的功能与上述方法实施例相同,并且达到的有益效果与上述方法达到的有益效果也相同。

本发明实施例还公开了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器可以从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行前面的方法。

附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块,但是这种划分并非强制性的。实际上,根据本发明的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。

通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本发明实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、触控终端、或者网络设备等)执行根据本发明实施方式的方法。

在一些可选择的实施例中,在方框图中提到的功能/操作可以不按照操作示图提到的顺序发生。例如,取决于所涉及的功能/操作,连续示出的两个方框实际上可以被大体上同时地执行或方框有时能以相反顺序被执行。此外,在本发明的流程图中所呈现和描述的实施例以示例的方式被提供,目的在于提供对技术更全面的理解。所公开的方法不限于本文所呈现的操作和逻辑流程。可选择的实施例是可预期的,其中各种操作的顺序被改变以及其中被描述为较大操作的一部分的子操作被独立地执行。

此外,虽然在功能性模块的背景下描述了本发明,但应当理解的是,除非另有相反说明,的功能和/或特征中的一个或多个可以被集成在单个物理装置和/或软件模块中,或者一个或多个功能和/或特征可以在单独的物理装置或软件模块中被实现。还可以理解的是,有关每个模块的实际实现的详细讨论对于理解本发明是不必要的。更确切地说,考虑到在本文中公开的装置中各种功能模块的属性、功能和内部关系的情况下,在工程师的常规技术内将会了解该模块的实际实现。因此,本领域技术人员运用普通技术就能够在无需过度试验的情况下实现在权利要求书中所阐明的本发明。还可以理解的是,所公开的特定概念仅仅是说明性的,并不意在限制本发明的范围,本发明的范围由所附权利要求书及其等同方案的全部范围来决定。

功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行装置、装置或设备(如基于计算机的装置、包括处理器的装置或其他可以从指令执行装置、装置或设备取指令并执行指令的装置)使用,或结合这些指令执行装置、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行装置、装置或设备或结合这些指令执行装置、装置或设备而使用的装置。

计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得程序,然后将其存储在计算机存储器中。

应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行装置执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。

在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。

以上是对本发明的较佳实施进行了具体说明,但本发明并不限于实施例,熟悉本领域的技术人员在不违背本发明精神的前提下还可做出种种的等同变形或替换,这些等同的变形或替换均包含在本发明权利要求所限定的范围内。

相关技术
  • 一种动态量化固态硬盘数据可靠性的方法
  • 一种固态硬盘处于低温情况下的启动方法及其系统
  • 启动电路、核心电路、耗材芯片、耗材、带隙基准电路的启动方法、核心电路的工作方法
  • 提升芯片启动可靠性的方法及其固态硬盘
  • 提升芯片启动可靠性的方法及装置
技术分类

06120116550833