掌桥专利:专业的专利平台
掌桥专利
首页

对GPU核内存储器执行写操作的数据压缩及处理方法

文献发布时间:2024-04-18 20:02:18


对GPU核内存储器执行写操作的数据压缩及处理方法

技术领域

本发明属于数据处理技术领域,更具体地,涉及一种对GPU核内存储器执行写操作的数据压缩及处理方法。

背景技术

GPU(Graphics Processing Unit,图形处理器)是一种并行计算处理器,其核内具有多个运算单元,每个运算单元都是相互独立的,因此在进行计算时,每个运算单元都会对核内存储器进行频繁的读写操作,从而实现不同运算单元的数据交互和同步。一般来说,GPU作为大型芯片,面积较大,运算单元访问核内存储器的路径很长,同时,GPU作为计算处理器,对计算的速度有着较高的要求,这就要求其工作在较高的频率下。考虑到实际物理的布局布线问题,运算单元访问核内存储器时要经过多级的寄存器,以满足电路对高频率时序的要求,因此,寄存器数量的减少对于整个芯片面积的控制就显得格外的重要。

芯片面积的减小有助于减少单个芯片的成本,提高市场竞争力。面对运算单元对核内存储器进行大量数据访问的情况,通常的做法是优化运算单元与存储器之间的位置关系,通过减少两者之间的寄存器级数达到减少寄存器的目的。但是,由于GPU的运算单元较多、访问的路径较长、且数据位宽较大,优化位置关系后,两者之间依旧存在着大量的寄存器,显著影响整体的芯片面积。

发明内容

针对现有技术的以上缺陷或改进需求,本发明提供了一种对GPU核内存储器执行写操作的数据压缩及处理方法,能够有效减小写操作中的信号位宽,减少寄存器的使用,在减小了芯片面积的同时给后端布局布线留出了更大的空间。

为实现上述目的,按照本发明的一个方面,提供了一种对GPU核内存储器执行写操作的数据压缩方法,包括:

将写操作的数据信号划分为多个数据段;

设置数据段有效信号dword_active,dword_active信号的一个比特数据对应一个数据段,用于标记对应的数据段中是否存在数据有效的字节;

设置数据段部分有效信号dword_partial,dword_partial信号的一个比特数据对应一个数据段,用于标记对应的数据段中是否为部分字节的数据有效;

对任一数据段,根据该数据段在dword_active信号中对应的一个比特的值以及在dword_partial信号中对应的一个比特的值,判断该数据段中数据的有效性;

根据判断结果,对该数据段执行数据压缩操作,得到最终压缩数据段,进而得到压缩后的数据信号;

将压缩后的数据信号、dword_active信号和dword_partial信号传输至核内存储器。

在一些实施方式中,根据判断结果,对该数据段执行数据压缩操作包括:在该数据段中所有字节的数据均有效时,将该数据段作为最终压缩数据段。

在一些实施方式中,根据判断结果,对该数据段执行数据压缩操作包括:在该数据段中所有字节的数据均无效时,将该数据段作为最终压缩数据段。

在一些实施方式中,根据判断结果,对该数据段执行数据压缩操作包括:

在该数据段中部分字节的数据有效时,利用该数据段中无效的字节空间对该数据段进行更新,使得更新后的数据段包含掩膜信号中与该数据段对应的数据以及原始数据段的有效数据,将更新后的数据段作为最终压缩数据段;其中,掩膜信号的一个比特数据对应数据信号的一个字节数据,用于标记数据信号的对应字节的数据是否有效。

在一些实施方式中,掩膜信号的一个比特为第一数值表示该比特在数据信号中对应的字节的数据无效,掩膜信号的一个比特为第二数值表示该比特在数据信号中对应的字节的数据有效。

在一些实施方式中,在该数据段中部分字节的数据有效时,利用该数据段中无效的字节空间对该数据段进行更新包括:

用掩膜信号中与该数据段对应的所有比特的数据替换掉该数据段的byteX中相同比特的数据,得到第一压缩数据段;

将第一压缩数据段作为最终压缩数据段;其中,byteX为一个或多个字节,且该数据段的byteX的数据全部无效。

在一些实施方式中,在该数据段中部分字节的数据有效时,利用该数据段中无效的字节空间对该数据段进行更新包括:

用掩膜信号中与该数据段对应的所有比特的数据替换掉该数据段的byteX中相同比特的数据,得到第一压缩数据段;

将该数据段的byteX中被替换掉的所有比特的数据写入第一压缩数据段中无效的byteY,替换掉无效的byteY中相同比特的数据,得到第二压缩数据段;

将第二压缩数据段作为最终压缩数据段;其中,byteX为一个或多个字节,且该数据段的byteX中至少部分字节的数据有效,byteY为一个或多个字节。

在一些实施方式中,dword_active信号的一个比特为第三数值表示该比特对应的数据段中有至少一个字节的数据有效,dword_active信号的一个比特为第四数值表示该比特对应的数据段中所有字节的数据均无效;

dword_partial信号的一个比特为第五数值表示该比特对应的数据段中所有字节的数据均有效;dword_partial信号的一个比特为第六数值表示该比特对应的数据段中有至少一个字节的数据无效。

在一些实施方式中,对任一数据段,根据该数据段在dword_active信号中对应的一个比特的值以及在dword_partial信号中对应的一个比特的值,判断该数据段中数据的有效性包括:

dword_active信号中与该数据段对应的一个比特为第三数值以及dword_partial信号中与该数据段对应的一个比特为第五数值时,判断该数据段中所有字节的数据均有效;

dword_active信号中与该数据段对应的一个比特为第四数值以及dword_partial信号中与该数据段对应的一个比特为第五数值或者第六数值时,判断该数据段中所有字节的数据均无效;

dword_active信号中与该数据段对应的一个比特为第三数值以及dword_partial信号中与该数据段对应的一个比特为第六数值时,判断该数据段中部分字节的数据有效。

根据本发明的另一方面,提供了一种对GPU核内存储器执行写操作的数据处理方法,包括数据压缩方法及数据解压方法;

数据压缩方法包括:

将写操作的数据信号划分为多个数据段;

设置数据段有效信号dword_active,dword_active信号的一个比特数据对应一个数据段,用于标记对应的数据段中是否存在数据有效的字节;

设置数据段部分有效信号dword_partial,dword_partial信号的一个比特数据对应一个数据段,用于标记对应的数据段中是否为部分字节的数据有效;

对任一数据段,根据该数据段在dword_active信号中对应的一个比特的值以及在dword_partial信号中对应的一个比特的值,判断该数据段中数据的有效性;

根据判断结果,对该数据段执行数据压缩操作,得到最终压缩数据段,进而得到压缩后的数据信号;

将压缩后的数据信号、dword_active信号和dword_partial信号传输至核内存储器;

数据解压方法包括:

根据原始数据段在dword_active信号中对应的一个比特的值以及在dword_partial信号中对应的一个比特的值,判断原始数据段中数据的有效性;

根据判断结果,得到掩膜信号中与原始数据段对应的数据以及解压的数据段,进而得到解压的数据信号及原始数据信号对应的掩膜信号;

其中,掩膜信号的一个比特数据对应原始数据信号的一个字节数据,用于标记原始数据信号的对应字节的数据是否有效。

在一些实施方式中,根据判断结果,对该数据段执行数据压缩操作包括:在该数据段中所有字节的数据均有效时,将该数据段作为最终压缩数据段;

根据判断结果,得到掩膜信号中与原始数据段对应的数据以及解压的数据段包括:在原始数据段中所有字节的数据均有效时,得到掩膜信号中与原始数据段对应的所有比特位均为第二数值,以及将最终压缩数据段作为解压的数据段。

在一些实施方式中,根据判断结果,对该数据段执行数据压缩操作包括:在该数据段中所有字节的数据均无效时,将该数据段作为最终压缩数据段;

根据判断结果,得到掩膜信号中与原始数据段对应的数据以及解压的数据段包括:在原始数据段中所有字节的数据均无效时,得到掩膜信号中与原始数据段对应的所有比特位均为第一数值,以及将最终压缩数据段作为解压的数据段。

在一些实施方式中,根据判断结果,对该数据段执行数据压缩操作包括:

在该数据段中部分字节的数据有效时,利用该数据段中无效的字节空间对该数据段进行更新,使得更新后的数据段包含掩膜信号中与该数据段对应的数据以及原始数据段的有效数据,将更新后的数据段作为最终压缩数据段;其中,掩膜信号的一个比特数据对应数据信号的一个字节数据,用于标记数据信号的对应字节的数据是否有效。

在一些实施方式中,在该数据段中部分字节的数据有效时,利用该数据段中无效的字节空间对该数据段进行更新包括:

用掩膜信号中与该数据段对应的所有比特的数据替换掉该数据段的byteX中相同比特的数据,得到第一压缩数据段;

将第一压缩数据段作为最终压缩数据段;

根据判断结果,得到掩膜信号中与原始数据段对应的数据以及解压的数据段包括:

在原始数据段中部分字节的数据有效时,将最终压缩数据段的byteX中相应位置的数据取出,得到掩膜信号中与原始数据段对应的所有比特位;

将最终压缩数据段作为解压的数据段;

其中,byteX为一个或多个字节,且原始数据段的byteX的数据全部无效。

在一些实施方式中,在该数据段中部分字节的数据有效时,利用该数据段中无效的字节空间对该数据段进行更新包括:

用掩膜信号中与该数据段对应的所有比特的数据替换掉该数据段的byteX中相同比特的数据,得到第一压缩数据段;

将该数据段的byteX中被替换掉的所有比特的数据写入第一压缩数据段中无效的byteY,替换掉无效的byteY中相同比特的数据,得到第二压缩数据段;

将第二压缩数据段作为最终压缩数据段;

根据判断结果,得到掩膜信号中与原始数据段对应的数据以及解压的数据段包括:

在原始数据段中部分字节的数据有效时,将最终压缩数据段的byteX中相应位置的数据取出,得到掩膜信号中与原始数据段对应的所有比特位;

将最终压缩数据段的byteY中相应位置的数据取出,替换最终压缩数据段的byteX中相应位置的数据,得到解压的数据段;

其中,byteX为一个或多个字节,且原始数据段的byteX中至少部分字节的数据有效,byteY为一个或多个字节。

总体而言,通过本发明所构思的以上技术方案与现有技术相比,具有以下有益效果:在对核内存储器进行写操作的数据(data)信号和掩膜(mask)信号的基础上,进一步引入数据段有效信号dword_active和数据段部分有效信号dword_partial,对核内存储器的写操作路径上的data信号和mask信号进行压缩,使得写操作中需要传输的数据总位宽减少,进而减少运算单元访问核内存储器时寄存器的使用,核内存储器在收到压缩的数据后,只需要采用相应的算法进行解压即可获得有效的data信号和mask信号。本发明一方面减小了芯片面积,另一方面减少了实际物理连线,给布局布线留出了更大的空间,有利于后端的布局布线。

附图说明

图1是本发明实施例的data信号和mask信号的数据结构示意图;

图2是本发明实施例的data信号、dword_active信号和dword_partial信号的数据结构示意图;

图3是本发明实施例的情况三时,从原始dword数据段得到第一压缩dword数据段的示意图;

图4是本发明实施例的情况三时,从第一压缩dword数据段得到第二压缩dword数据段的示意图;

图5是本发明实施例的对GPU核内存储器执行写操作的数据压缩方法的流程示意图;

图6是本发明实施例的与数据压缩方法对应的数据解压方法的流程示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。正如本领域技术人员可以认识到的那样,在不脱离本申请的精神或范围的情况下,可通过各种不同方式修改所描述的实施例。因此,附图和描述被认为本质上是示例性的而非限制性的。

在GPU中,在对核内存储器进行写操作时,主要会有两组信号,分别为数据(data)信号和掩膜(mask)信号,其中,mask信号用于表示在这一次写操作中,需要写入data信号的哪一个字节(byte)。

在本发明实施例中,设定写操作中的data信号的位宽为M×2

在一些实施方式中,mask信号的某个bit为第一数值(例如为1)时,表示该bit 在data信号中对应的byte的数据不需要写入核内存储器之中;mask信号的某个bit不为第一数值(例如为第二数值0)时,表示该bit 在data信号中对应的byte的数据需要写入核内存储器之中。

在data信号和mask信号的基础上,进一步引入数据段有效信号(用dword_active表示)和数据段部分有效信号(用dword_partial表示),dword_active信号的位宽为M比特,dword_partial信号的位宽也为M比特。data信号中每个dword数据段都有一个bit的dword_active信号和一个bit的dword_partial信号对其进行标记。

在一些实施方式中,dword_active信号的某个bit为第三数值(例如为1)时,表示该bit在data信号中对应的dword数据段中有至少一个byte的数据需要写入核内存储器;dword_active信号的某个bit不为第三数值(例如为第四数值0)时,表示该bit在data信号中对应的dword数据段中的所有byte的数据均不需要写入核内存储器。

在一些实施方式中,dword_partial信号的某个bit为第五数值(例如为0)时,表示该bit在data信号中对应的dword数据段中的所有byte的数据均需要写入核内存储器;dword_partial信号的某个bit不为第五数值(例如为第六数值1)时,表示该bit在data信号中对应的dword数据段中有至少一个byte的数据不需要写入核内存储器。

以M = 8、N = 2为例,data信号的位宽为256bit,mask信号的位宽为32bit,dword_active信号和dword_partial信号的位宽均为8bit。

如图1所示,data信号的256bit由32个字节(byte)组成,分别表示为byte0至byte31,mask信号的32个bit分别表示为bit0至bit31,mask信号中的bit0至bit31分别对data信号中的byte0至byte31进行标记。以mask信号的bit1为例,bit1为1时,表示该bit 1在data信号中对应的byte1的数据不需要写入核内存储器之中;bit1为0时,表示该bit1在data信号中对应的byte1的数据需要写入核内存储器之中。

如图2所示,将data信号中4个byte的数据作为一个dword数据段,即,256bit的data信号被平均划分成8个dword数据段,分别表示为dword0至dword7,dword_active信号的8个bit分别表示为bit0至bit7,dword_partial信号的8个bit分别表示为bit0至bit7,dword_active信号中的bit0至bit7分别对data信号中的dword0至dword7进行标记,dword_partial信号中的bit0至bit7分别对data信号中的dword0至dword7进行标记,即,每个dword数据段都有一个bit的dword_active信号和一个bit的dword_partial信号对其进行标记。

以dword_active信号的bit1为例,bit1为1时,表示该bit1在data信号中对应的dword1数据段中有至少一个byte的数据需要写入核内存储器;bit1为0时,表示该bit1在data信号中对应的dword1数据段中的所有byte的数据均不需要写入核内存储器。

类似地,以dword_partial信号的bit1为例,bit1为0时,表示该bit1在data信号中对应的dword1数据段中的所有byte的数据均需要写入核内存储器;bit1为1时,表示该bit1在data信号中对应的dword1数据段中有至少一个byte的数据不需要写入核内存储器。

在本发明实施例的压缩算法中,以dword数据段为单位执行数据压缩操作,每个dword数据段是相对独立的,且每个dword数据段执行相同的数据压缩操作,将压缩前的dword数据段称为原始dword数据段,将压缩后的dword数据段称为最终压缩dword数据段。下面以其中一个dword数据段为例,对本发明的压缩算法进行详细描述。

情况一:一个dword数据段中的所有byte的数据均需要写入核内存储器。

根据前述规则,在情况一时,该dword数据段在mask信号中对应的2

以M = 8、N = 2为例,对dword0数据段,在情况一时:

mask信号的低4位mask[3:0] = 0;

dword_active信号的bit0为1;

dword_partial信号的bit0为0。

情况二:一个dword数据段中的所有byte的数据均不需要写入核内存储器。

根据前述规则,在情况二时,该dword数据段在mask信号中对应的2

以M = 8、N = 2为例,对dword0数据段,在情况二时:

mask信号的低4位mask[3:0] = 4’b1111;

dword_active信号的bit0为0;

dword_partial信号的bit0为0或者1。

显然,在上述情况一和情况二时,mask信号均不必传输至核内存储器,只需要通过dword_active信号和dword_partial信号即可判断该dword数据段中数据的写入情况。在上述情况一和情况二时,得到最终压缩dword数据段与原始dword数据段一致。

情况三:一个dword数据段中有部分byte的数据需要写入核内存储器。

根据前述规则,在情况三时,该dword数据段在mask信号中对应的2

以上述M = 8、N = 2的情况为例,对dword0数据段,在情况三时:

mask信号的低4位mask[3:0]中至少有一个bit为1且至少有一个bit为0;

dword_active信号的bit0为1;

dword_partial信号的bit0为1。

在上述情况三时,仅通过dword_active信号和dword_partial信号无法判断该dword数据段中数据的写入情况,因此,还需要将该dword数据段对应的mask信号的内容传输至核内存储器,

在一些实施方式中,在情况三时,按照如下方式对该dword数据段中的数据进行压缩处理:

将mask信号中与原始dword数据段对应的2

在原始dword数据段的byteX的数据全部无效时,表明byteX的该部分数据被替换掉不会影响第一压缩dword数据段中数据的有效性,因此,将第一压缩dword数据段作为最终压缩dword数据段。

在原始dword数据段的byteX中至少部分字节的数据有效时,表明byteX的该部分数据被替换掉会影响第一压缩dword数据段中的数据的有效性,因此,还需要对第一压缩dword数据段作如下处理:

将原始dword数据段的byteX中被替换掉的2

以上述M = 8、N = 2的情况为例,在情况三时,如图3所示,原始dword数据段的位宽为32bit,包含4个byte,从低位到高位可分别表示为byte0、byte1、byte2和byte3。原始dword数据段对应mask信号的位宽为4bit,将mask信号的4个bit写入原始dword数据段中byte0的低位4bit,得到第一压缩dword数据段。

进一步地,dword数据段中至少有一个byte的数据是无效的,如果正好byte0是无效的,则将mask信号中对应的4个bit写入原始dword数据段中byte0的低位4bit不会影响第一压缩dword数据段中数据的有效性,因此,将第一压缩dword数据段作为最终压缩dword数据段。

如果byte0是有效的,则将mask信号中对应的4个bit写入原始dword数据段中byte0的低位4bit会影响第一压缩dword数据段中数据的有效性,因此,如图4所示,需要进一步将原始dword数据段中byte0的低位4bit的数据写入第一压缩dword数据段中无效的byteY,得到第二压缩dword数据段,其中,Y = 1、2或3。由于byteY是无效的,byteY的数据被覆盖不会对第二压缩dword数据段中数据的有效性产生影响,因此,将第二压缩dword数据段作为最终压缩dword数据段,

通过上述方式对dword数据段的数据进行压缩之后,在运算单元与核内存储器进行写数据操作的交互时,运算单元只需要将各最终压缩dword数据段、dword_active信号和dword_partial信号传输到核内存储器即可。以上述M = 8、N = 2的情况为例,原本需要传输的数据位宽为256bit + 32bit = 288bit,数据压缩后需要传输的数据位宽为256bit +16bit = 272bit,因此,数据压缩后需传输数据的位宽较原来减小了16bit。

在上述M = 8、N = 2时,data信号中的每4个byte作为一个dword数据段。还可以使得M = 4、N = 3,即将data信号中的每8个byte作为一个dword数据段进行压缩,数据压缩后需要传输的数据位宽为256bit + 4bit + 4bit = 264bit,因此,数据压缩后需传输数据的位宽较原来减小了24bit。

因此,本发明通过引入数据段有效信号dword_active和数据段部分有效信号dword_partial,对核内存储器的写操作路径上的data信号和mask信号进行压缩,能够显著减少写操作中需要传输的数据总位宽,进而减少运算单元访问核内存储器时寄存器的使用,这对于减小芯片面积、提升后端布局布线的灵活度都具有非常重大的意义。

核内存储器接收到数据后,采用与前述压缩方式对应的解压方式,对接收到的数据进行解压,得到data信号和mask信号,核内存储器在对接收到的数据进行解压后,再对解压后的数据进行处理和利用。与前述数据压缩操作类似地,在解压时,以dword数据段为单位执行数据解压操作,每个dword数据段是相对独立的,且每个dword数据段执行相同的数据解压操作。下面以其中一个dword数据段为例对解压操作进行描述。

情况一:一个dword数据段中的所有byte的数据均需要写入核内存储器。

解压后得到mask信号中与该dword数据段对应的2

情况二:一个dword数据段中的所有byte的数据均不需要写入核内存储器。

解压后得到mask信号中与该dword数据段对应的2

情况三:一个dword数据段中有部分byte的数据需要写入核内存储器。

根据数据压缩时mask信号的2

进一步地,在原始dword数据段的byteX的数据全部无效时,得到解压的dword数据段即为最终压缩dword数据段;在原始dword数据段的byteX中至少部分字节的数据有效时,将最终压缩dword数据段的byteY中相应位置的数据取出,替换最终压缩dword数据段的byteX中相应位置的数据,得到解压的dword数据段。

在情况三时,解压的dword数据段与原始dword数据段并不完全相同,但解压的dword数据段完整保留了原始dword数据段中的全部有效数据,因此,并不影响后续数据的处理和利用。本发明充分利用了写操作中传输至核内存储器的data信号中可能存在无效字节的情形,将无效字节的空间用于传输mask边带信息,在保证有效数据正常传输的同时,显著减小了传输数据的位宽。

如图5所示,本发明实施例的对GPU核内存储器执行写操作的数据压缩方法,以dword数据段为单位进行数据压缩操作,包括:

步骤S501:根据dword数据段在dword_active信号中对应的一个bit的值以及在dword_partial信号中对应的一个bit的值,判断dword数据段中数据的有效性;

在一些实施方式中, dword_active信号中与dword数据段对应的一个bit为第三数值以及dword_partial信号中与dword数据段对应的一个bit为第五数值时,判断dword数据段中数据的有效性属于情况一。

在一些实施方式中, dword_active信号中与dword数据段对应的一个bit为第四数值以及dword_partial信号中与dword数据段对应的一个bit为第五数值或者第六数值时,判断dword数据段中数据的有效性属于情况二。

在一些实施方式中, dword_active信号中与dword数据段对应的一个bit为第三数值以及dword_partial信号中与dword数据段对应的一个bit为第六数值时,判断dword数据段中数据的有效性属于情况三。

在情况一和情况二下,执行步骤S503:将原始dword数据段作为最终压缩dword数据段。

在情况三下,执行如下步骤:

步骤S505:用mask信号中与原始dword数据段对应的2

在一些实施方式中,byteX为任意一个或多个字节。

判断原始dword数据段的byteX是否有效,在原始dword数据段中的byteX的数据全部无效时,执行步骤S507:将第一压缩dword数据段作为最终压缩dword数据段。

在原始dword数据段的byteX中至少部分字节的数据有效时,执行步骤S509:将原始dword数据段的byteX中被替换掉的2

在一些实施方式中,byteY为一个或多个字节。

步骤S511:将最终压缩dword数据段、dword_active信号和dword_partial信号传输到核内存储器。

本发明实施例还提供了一种对GPU核内存储器执行写操作的数据处理方法,包括上述数据压缩方法以及与上述数据压缩方法对应的数据解压方法。

如图6所示,数据解压方法以dword数据段为单位进行数据解压操作,包括:

步骤S601:根据原始dword数据段在dword_active信号中对应的一个bit的值以及在dword_partial信号中对应的一个bit的值,判断原始dword数据段中数据的有效性;

在一些实施方式中,原始dword数据段在dword_active信号中对应的一个bit为第三数值以及在dword_partial信号中对应的一个bit为第五数值时,判断原始dword数据段中数据的有效性属于情况一。

在一些实施方式中,原始dword数据段在dword_active信号中对应的一个bit为第四数值以及在dword_partial信号中对应的一个bit为第五数值或者第六数值时,判断原始dword数据段中数据的有效性属于情况二。

在一些实施方式中,原始dword数据段在dword_active信号中对应的一个bit为第三数值以及在dword_partial信号中对应的一个bit为第六数值时,判断原始dword数据段中数据的有效性属于情况三。

在情况一下,执行步骤S603:得到mask信号中与原始dword数据段对应的2

在情况二下,执行步骤S605:得到mask信号中与原始dword数据段对应的2

在情况三下,执行如下步骤:

步骤S607:将最终压缩dword数据段的byteX中相应位置的数据取出,得到mask信号中与原始dword数据段对应的2

在原始dword数据段的byteX的数据全部无效时,执行步骤S609:将最终压缩dword数据段作为解压的dword数据段;

在原始dword数据段的byteX中至少部分字节的数据有效时,执行步骤S611:将最终压缩dword数据段的byteY中相应位置的数据取出,替换最终压缩dword数据段的byteX中相应位置的数据,得到解压的dword数据段。

本发明在对核内存储器进行写操作的数据(data)信号和掩膜(mask)信号的基础上,进一步引入数据段有效信号dword_active和数据段部分有效信号dword_partial,对核内存储器的写操作路径上的data信号和mask信号进行压缩,使得写操作中需要传输的数据总位宽减少,进而减少运算单元访问核内存储器时寄存器的使用,核内存储器在收到压缩的数据后,只需要采用相应的算法进行解压即可获得有效的data信号和mask信号。本发明一方面减小了芯片面积,另一方面减少了实际物理连线,给布局布线留出了更大的空间,有利于后端的布局布线。

在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包括于本申请的至少一个实施例或示例中。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或隐含地包括至少一个该特征。在本申请的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。

流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或多个(两个或两个以上)用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分。并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能。

在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。

应理解的是,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。上述实施例方法的全部或部分步骤是可以通过程序来指令相关的硬件完成,该程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。

此外,在本申请各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。上述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读存储介质中。该存储介质可以是只读存储器,磁盘或光盘等。

以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到其各种变化或替换,这些都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

相关技术
  • 一种适用于晶圆的背面吸片装置及其实现方法
  • 一种晶圆吸附载台气路
  • 一种晶圆吸附载台气路
技术分类

06120116576919