掌桥专利:专业的专利平台
掌桥专利
首页

基于对数运算系统的小型浮点运算单元及其在FPGA中的应用

文献发布时间:2023-06-19 18:58:26


基于对数运算系统的小型浮点运算单元及其在FPGA中的应用

技术领域

本发明属于FPGA设计领域,尤其涉及一种基于对数运算系统的小型浮点运算单元设计及其在机器学习等容错性计算中的应用。

背景技术

随着多媒体技术、机器学习等技术的不断的发展,越来越多的应用领域具有较强的容错性,即适当的计算误差并不会影响最终的应用效果。在此背景下近似计算技术获得了学术界与工业界的广泛关注。近似计算不仅可以在模拟电路中实现(如:存内计算技术),也可以在数字电路中实现(如:近似逻辑综合算法,近似运算电路设计)。在近似运算电路设计领域,Xilinx在2021年提出了基于6输入查找表的7比特小型浮点乘法器,成功应用于ResNet-50神经网络。Xilinx提出的小型浮点乘法器具有以下特征:

(1)输入为两个7比特浮点数(含指数位3比特(E)、尾数位3比特(F)、指数位偏置为4;当指数位为0时,该浮点数为0;当指数位为7时,该浮点数依然按照(-1)

(2)输出为一个9比特浮点数(含指数位4比特、小数位4比特、指数位偏置为8;该浮点数格式记为SFP<4,4>)。

(3)该小型浮点乘法器的核心为将乘积的结果存在6输入查找表中。

该方案不但避免了神经网络的量化训练,而且相比传统的基于INT8的神经网络设计,将VU13P开发板上算力从25TOPS提升至40TOPS。在FPGA上实现该乘法器只需要10个6输入查找表。

然而当输入数字的尾数大于3位,所消耗的硬件资源将显著增加,例如,乘法器改用SFP<3,4>的格式输入,SFP<4,5>的格式输出,ResNet-50的精度将从98.8%提高到100.4%(32位浮点数乘法的精度为100%),但需要18个6输入查找表实现。因此,此方案在实现更高的计算精度时,将不适合硬件设计。

发明内容

有鉴于此,本发明提出了一种基于对数运算系统的小型浮点运算单元,旨在解决现有技术中,输入乘数的尾数多于3位时,硬件资源显著增加的问题。本发明提出的运算单元还可以实现除法和幂函数的运算。

为实现上述目的,本发明提供了一种基于查找表的小型浮点乘法运算单元,技术方案如下:

基于对数运算系统的小型浮点运算单元,包括对数转换器、尾数运算器、反对数转换器和指数运算器。

进一步地,当小型浮点运算单元为乘法运算单元时,乘法运算单元包括对数转换器、尾数加法器、反对数转换器和指数加法器。

所述的对数转换器用于将SFP格式数据的3~5位尾数F

所述的尾数加法器通过加法器实现,是将SLFP格式下的尾数K

所述的反对数转换器是将乘积结果在SLFP格式下的尾数K从SLFP格式转换为SFP格式,反对数转换器用于实现函数F=2

所述的指数加法器包括加法器和0判断模块,其中,加法器是将3位指数E

进一步地,当小型浮点运算单元为除法运算单元时,在乘法运算单元基础上进行调整,通过计算SLFP格式下尾数的差得到SFP格式下尾数的商,用对数域内的减法实现除法。

进一步地,当小型浮点运算单元为幂函数运算单元时,在乘法运算单元基础上进行调整,通过计算SLFP格式下指数和尾数的乘积得到SFP格式下指数和尾数的幂,用对数域内的乘法实现幂运算。

进一步地,SLFP格式数据的表示方法:使用动态指数偏置;当指数为0时,数值视为0。

上述的基于对数运算系统的小型浮点运算单元在FPGA中的应用,FPGA电路包括对数转换电路、尾数运算电路、指数运算电路和反对数转换电路;所述对数转换电路的输入端连接SFP浮点数输入,输出端连接尾数运算电路的一个输入;所述尾数运算电路的另一个输入端连接对数域内的权值,输出的进位信号连接指数运算电路,输出的尾数结果连接反对数转换电路的输入;指数运算电路的输出和反对数转换电路的输出共同构成所述运算单元的输出;对数转换和尾数运算电路同时完成对输入数据和权重的数据格式转换和加法运算。

本发明的设计原理:

将对数域内指数e位,尾数m位的浮点数表示为SLFP。当e等于0时,该浮点数视为0。使用动态指数偏置,等于2

所述的基于对数运算系统的小型浮点运算单元具有一个浮点数输入,一个对数域内的权重常数,一个浮点数输出,运算单元将完成输入和权重的乘法运算。其中,输入浮点数和权重常数的指数位长度为3位,尾数位长度为3~5位;输出数据的指数位长度为4位,尾数位长度为3~6位。

所述的基于对数运算系统的小型浮点运算单元,通过对数转换器将输入的SFP格式数据转换为对数域内的浮点数SLFP格式数据,并通过尾数加法器用加法实现两个输入的浮点数尾数部分的乘法。

所述的基于对数运算系统的小型浮点运算单元中的反对数转换器用于将经尾数加法器乘积得到的结果从SLFP格式转换回SFP格式。

在此乘法器的基础上,本发明提供的运算单元结构可以进一步应用于除法和幂函数技术方案如下:

将输入的浮点数转换到对数域内,对于除法运算单元,尾数除法可以通过对数域内的减法实现,用少量硬件资源即可完成除法运算;对于幂函数运算单元,尾数的幂可以通过对数域内的乘法实现。

表1SFP和SLFP乘法器的硬件消耗

表2SFP和SLFP乘法器的计算误差

本发明提出的乘法运算单元与Xilinx的SFP乘法器精度及消耗硬件资源情况对比见上表。其中,表2误差比的计算方法为:当前乘法器的平均绝对误差/SFP-1的平均绝对误差。由表可知,SLFP-5的计算误差小于SFP-2,且硬件资源消耗减少了12个6输入查找表。

本发明的优势在于:在实现较高精度乘法的同时大大减少硬件消耗,更适合在FPGA上实现;经测试,达到较高精度的同时,吞吐量不会减少;支持多种精度,可根据需要选取,应用于不同的卷积层;支持除法和幂函数,适用范围更广。

附图说明

图1是本发明实施例提供的小型浮点数和对数域内的小型浮点数的示意图。

图2是本发明实施例提供的一种基于对数系统的小型浮点数乘法运算单元的硬件结构示意图。

图3是本发明实施例提供的乘法器的一种电路示意图,3位K

图4是本发明实施例提供的乘法器的一种电路示意图,3位K

图5是本发明实施例提供的乘法器的一种电路示意图,4位K

图6是本发明实施例提供的乘法器的一种电路示意图,3位K

图7是本发明实施例提供的乘法器的一种电路示意图,4位K

具体实施方式

下面将结合实施例和附图,对本发明中的技术方案进一步描述。

在本发明实施例中,将对数域内,指数e位,尾数m位的小浮点数格式记为SLFP。其中,SLFP的指数位长度e为3或4;SLFP的尾数位长度m可以根据精度要求,在3~6之间选择。

图1是一个二进制浮点数,包括符号位,指数部分,尾数部分。在SFP或SLFP格式下,一个二进制数表示不同的值。以3位指数,4位尾数的浮点数为例,其中指数部分E是0~7的整数,尾数部分M是0~(1-2

图2是所提出的SLFP乘法器的硬件结构示意图。

其中,卷积神经网络中的权重W应预先量化为SLFP格式,为适应FPGA的内存资源,权重W应小于8位,含3位指数E

每个卷积层的输入具有3位指数E

输入SFP格式数据的尾数F

将SFP格式的输入L写成SLFP格式,也就是将

指数加法部分由加法器和0判断模块组成。其中,0判断模块的作用是,若检测到两个乘数的任意一个指数位为0,则产生清零信号Clear,将乘积结果置零。

两个乘数的指数部分有3位,偏置等于4;输出的指数部分4位,偏置等于8。两数相乘,其指数值等于(E

最后,如前所述,输出应通过反对数转换器将数据从SLFP格式转换为SFP格式,反对数转换器用于实现函数F=2

图7是本发明实施例提供的一个尾数计算和反对数转换模块的电路示意图,适用于具有5位尾数的输入L和具有4位尾数的权重W,通过使用6输入查找表和FPGA中的超前快速进位逻辑结构CARRY4实现,以降低延迟,提高运算单元的吞吐量。

对图3的详细说明如下:

(1)超前快速进位逻辑结构CARRY4的输入S为传输信号,来自6输入查找表的输出,应等于K

(2)将F

(3)每个6输入查找表由2个5输入查找表和一个多路选择器构成。在图3中,LUT_1~LUT_4上方的5输入查找表用于执行一个5输入函数:Log(F

(4)通过与(2)相似的方法,用6输入查找表LUT_5~LUT_7实现反对数转换器。其中,F[-1:-5]=2

根据此实施例,8个6输入查找表可以有效地实现4位尾数和5位尾数的乘法,并在两个查找表的延迟内完成计算。

图3~6为本发明实施例提供的其它精度下尾数计算和反对数转换模块的电路示意图。

图3~7是流水线结构,保证了SLFP乘法器的吞吐量。

该运算单元实现除法的过程如下:将浮点数输入X

该运算单元实现幂函数的过程如下:将浮点数X写成SLFP格式,也就是将2

以上所述仅为本发明的较佳实施例,凡依本发明申请专利范围所做的均等变化与修饰,皆应属本发明的涵盖范围。

技术分类

06120115758675