掌桥专利:专业的专利平台
掌桥专利
首页

一种降低IR Drop的存算阵列折叠布局方法

文献发布时间:2023-06-19 16:11:11



技术领域

本发明涉及一种降低IR Drop的存算阵列折叠布局方法,属于集成电路技术领域。

背景技术

传统计算机架构大多是冯-诺伊曼架构,即存储与计算分离架构,这种架构不仅会导致计算机在数据传输时消耗大量能量,也会导致存储速率和运算速率不同步,从而影响整体的运算速度。存内计算实现了存算一体化,打破了存算的“速度墙”和“功耗墙”;目前常采用非易失性器件作为存算单元(CIM),非易失性存算器件组成的存算阵列在工作时,可以通过改变器件的阈值电压从而改变权重,并且通过存算阵列中均工作在线性区的两列非易失性器件输出电流的减法实现输入数据与权重的乘累加运算,两列器件的输出电流经过电流减法电路之后的电流差值的大小代表了运算的结果。

非易失性存算单元由忆阻器、FLASH等类型,存算单元通常包含数据输入端、卷积结果输出端。由存算单元构成的存算阵列通常有字线WL、位线BL、源线SL等多个端口,字线WL端作为存算单元的数据输入端,位线BL端作为存算单元的数据输出端,源线SL端作为存算单元的源端;其中字线WL端连接多个存算单元的wl,位线BL端连接多个存算单元的bl,源线SL连接多个存算单元的sl,如图1所示为构成存算阵列的存算单元。

由于数据输入端与数据输出端在存算电源的连接方向上相互垂直,因此存算阵列的WL 端与BL端可互为数据输入端与数据输出端;存算阵列在工作时可分为卷积计算和权重擦写两个模式,在卷积计算模式下,通过字线WL端的驱动电路输入的数据作为一个运算量,再通过位线BL端的读出电路施加钳位电压使得在单个存算器件中预先编程的权重数据作为另一运算量与字线WL的输入数据完成乘法运算,单个存算器件的乘法运算的电流公式如下:

其中,I是单个存算器件乘法运算的电流值,V

进一步,在权重擦写模式下,存算阵列的所有端口均需驱动电路完成存算器件的权重擦写功能。因此,在存算阵列外需要大量的驱动电路和读出电路等外围电路来实现存内计算。

在细长金属线上的寄生电阻导致该条金属线在通过电流时存在电压降(IRdrop),电压降问题是影响存算阵列的计算精度的重要因素;并且随着存算阵列规模的扩大,BL端单条金属线所连接的存算器件数量也不断增多,存算阵列BL端单条金属线上的电压降问题也愈发显著,这将导致存算阵列BL端单条金属线上所有存算器件的V

以SMIC55nm工艺下1000×1000规模的存算阵列为例,存算器件之间距离(pitch)为 3um,存算器件之间使用宽度为0.5um的金属线连接,根据代工厂提供的金属线的方块电阻为0.05Ohm/Sqr,从而在该阵列中一条BL上由金属长度线带来的寄生电阻为300Ohm。若BL端的读出电流为50uA,则电压降为15mV,从而导致该条BL线上第一个存算器件的V

此外,在现有的存算芯片设计中,由于数据量在存算芯片中的逐层递增,从而各层的存算阵列规模也逐层递增,这将导致在芯片版图设计中由于存算阵列布局面积相差过大,难以形成标准的正方形芯片,造成大量的面积浪费。

发明内容

为了解决目前存在的上述问题,本发明对大规模存算阵列中的存算单元布局方式进行了优化,提供一种降低IR Drop的存算阵列折叠布局方法,改进了存算阵列的版图形状,有效缓解了细长金属线上的电压降(IR drop)问题。

本发明提供了一种存算阵列折叠布局的方法,所述技术方案如下:

为实现上述目的:本发明提供如下技术方案:如图3所示的m×n规模的存算阵列的传统布局方式,传统布局方式具有以下特征:所述存算阵列包括m行存算单元与n列存算单元,通常数据输入端与数据输出端方向相互垂直,因此规定字线端WL<1>至WL为m行存算单元的数据输入端,位线端BL<1>至BL为n列存算单元的数据输出端,源线端 SL<1>至SL为n列存算单元的源极。

本发明所述的一种降低IR Drop的存算阵列折叠布局方法,具体包括如下步骤:

步骤一:将如图3所示的m×n的存算阵列在WL处沿WL方向切断,形成两个 m/2×n规模的存算阵列;

步骤二:上述步骤得到的所述两个m/2×n的存算阵列中,将相同的位线BL与相同的源线SL进行跨线连接,如图4所示;

步骤三:将如图4所示的跨线连接的两个m/2×n规模的存算阵列交叉合并:将相同的位线BL合并由一条金属线引出,将相同的源线SL合并由一条金属线引出;

步骤四,字线WL端的WL<1>至WL由阵列左侧引出,WL至WL由阵列右侧引出。

根据本发明的一种降低IR Drop的存算阵列折叠布局方法,由所述步骤三进行交叉合并后的存算阵列中,位线BL端BL<1>至BL的每条金属线上连接有两列存算单元。

根据本发明的一种降低IR Drop的存算阵列折叠布局方法,可选地,所述方法还包括:将如图5所示交叉合并后的阵列中,位线BL端BL<1>至BL中n为偶数的位线BL相连接的两列存算单元以该位线BL的金属线为中心进行镜像对称,并将对称后相邻的两列存算单元的栅极互联,由一条字线WL引出。

根据本发明的一种降低IR Drop的存算阵列折叠布局方法,由于所述步骤二跨线连接的两个阵列中,相同BL、SL距离很远,这将带来BL端读出电路与驱动电路信号延时,导致 BL端电流读出精度下降;因此将两个阵列进行交叉合并,将相同的位线BL合并由一条金属线引出,将相同的源线SL合并由一条金属线引出。

根据本发明的一种降低IR Drop的存算阵列折叠布局方法,经过所述步骤四后形成的存算阵列中,WL端与存算单元的栅极之间连线复杂,WL端的连线上存算单元栅极的频繁跳线会导致各个存算单元栅极的一致性下降,增大存算单元的权重误差。因此,将存算阵列中的部分存算单元进行镜像对称处理,并且经过镜像对称处理后的相邻存算单元的栅极能够互联,能够保证存算单元栅极的局部一致性,降低权重误差。

根据本发明的一种降低IR Drop的存算阵列折叠布局方法,对比图3传统阵列布局,存算阵列的规模由m×n变为m/2×2n,在不改变阵列拓扑结构的情况下,实现对阵列长、宽的灵活调整,有效避免了在存算芯片中间层出现m远大于n的阵列的情况,以及与较小规模的存算阵列难以拼接成正方形版图的情况。

根据本发明的一种降低IR Drop的存算阵列折叠布局方法,对比图3传统阵列布局,BL 端一条金属线上的存算器件的数量由m个减少为m/2个,该条BL金属线的长度将为传统阵列布局的1/2。进一步的,根据电阻计算公式

本发明有益效果是:

本发明对存算阵列中互联的存算单元的布局方式进行了优化,提供一种降低IRDrop的存算阵列折叠布局方法。根据本发明的一种降低IR Drop的存算阵列折叠布局方法,在保证存算阵列原有存算单元互联关系的条件下,能够使存算阵列的列方向长度减小50%,并且使存算器件的漏极与存算阵列BL端的驱动电路和读出电路之间的走线距离减小50%,从而远距离金属走线的寄生电阻降低了50%,能够使BL端在卷积计算模式下由于长金属线导致的 IR drop降低50%。

进一步,根据本发明的一种降低IR Drop的存算阵列折叠布局方法,将存算阵列中的部分存算单元进行镜像对称处理,并且经过镜像对称布局后的相邻存算单元的栅极能够互联,以保证存算单元栅极的局部一致性。

此外,本发明的布局方式整体改进了存算阵列版图形状,提升了不同尺寸存算阵列的适配性,大幅降低了阵列布局时的面积浪费。

附图说明

为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明所述构成存算阵列的存算单元;

图2是本发明的一种降低IR Drop的存算阵列折叠布局方法的流程示意图;

图3为m×n的存算阵列的传统布局方式;

图4为根据本发明的叠布局方法,经过步骤一和二后形成的存算阵列示意图;

图5为根据本发明的叠布局方法,经过步骤三后形成的存算阵列示意图;

图6为根据本发明的叠布局方法,镜像对称后形成的存算阵列示意图;

图7为根据本发明的实施例的1024×256的存算阵列的示意图;

图8为1024×256的存算阵列,经过步骤一和二后形成的存算阵列示意图;

图9为两个512×256的存算阵列,经过步骤三后形成的存算阵列示意图;

图10为交叉合并后的存算阵列,进一步镜像对称后形成的存算阵列示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。

实施例一:

本实施例提供一种降低IR Drop的存算阵列折叠布局方法,结合图7所示,存算阵列具有以下特征:存算单元为浮栅存算管,所述存算阵列包括1024行存算单元与256列存算单元,子线WL端WL<1>至WL<1024>分别连接至1024行存算单元的栅极,位线BL端BL<1> 至BL<256>分别连接至256列存算单元的漏极,源线SL端SL<1>至SL<256>分别连接至256 列存算单元的源极。

本实例中所述的存算阵列,在实际的版图中阵列行与列的长度相差5倍,在BL、SL、WL增加驱动电路与读出电路后整体形状及不规律,难以与小阵列适配。因此可通过下述步骤,在不改变存算单元原本互连关系的情况下,合理改变存算阵列形状。

步骤一:将图7所示的1024×256规模的存算阵列在WL<512>处沿WL方向切断,形成两个256×512规模的存算阵列,

步骤二:将所述两个512×256规模的存算阵列中,相同的BL与相同的SL如图8所示跨线连接;跨线连接的两个阵列中,相同BL、SL距离很远,这将带来BL端读出电路与驱动电路信号延时,导致BL端电流读出精度下降;

步骤三:将图8所示的两个512×256规模的存算阵列交叉合并,相同的BL合并由一条金属线引出,相同的SL合并由一条金属线引出;

步骤四:WL<1>至WL<512>由阵列左侧引出,WL<513>至WL<1024>由阵列右侧引出,阵列布局如图9所示。

经过上述步骤形成阵列布局后的存算阵列在列方向的宽度增加了一倍,BL端的驱动电路与读出电路与每个存算单元的漏极之间的距离减小1/2,能够减小BL金属线上的电压降。

然而,这种布局的缺点为形成的存算阵列中,WL端与存算单元的栅极之间连线复杂, WL端的连线上存算单元栅极的频繁跳线会导致各个存算单元栅极的一致性下降,增大存算单元的权重w误差。

根据本实施例,将上述图9的存算阵列布局中的BL<1>至BL<256>中的偶数列的存算单元以BL金属线为中心镜像对称,得到如图10所示的阵列布局,其中相邻存算单元的栅极可互联,能够提高存算阵列中存算单元栅极的一致性,降低权重误差。

综上所述,本实施例所述一种降低IR Drop的存算阵列折叠布局方法,保证存算单元原有互联关系的条件下,可使存算阵列的列方向长度减小50%,并且使存算器件的漏极与存算阵列BL端的驱动电路和读出电路之间的走线距离减小50%,远距离金属走线的寄生电阻降低了50%,从而能够使BL端在卷积计算模式下由于长金属线导致的IR drop降低50%。并且,本发明的布局方式整体改进了存算阵列版图形状,提升了不同尺寸存算阵列的适配性,大幅降低了阵列布局时的面积浪费。

本发明实施例中的部分步骤,可以利用软件实现,相应的软件程序可以存储在可读取的存储介质中,如光盘或硬盘等。

以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

技术分类

06120114736436