首页 / 技术领域 / 点积 / 专利数据
序号 专利名 申请号 申请日 公开(公告)号 公开(公告)日 发明人
1 点积计算装置 CN202110456687.X 2021-04-27 CN112988112A 2021-06-18 不公告发明人
本公开的实施例涉及点积计算装置,涉及集成电路领域。该点积计算装置包括:具有预定输入位宽的4N个乘法单元,N为正整数;N个4:2压缩单元,与4N个乘法单元对应耦接,被配置为将4N个乘法单元的4N个乘法结果压缩成2N个压缩结果;2N个第一移位单元,与N个4:2压缩单元对应耦接,被配置为对2N个压缩结果进行移位,以生成2N个第一移位结果;加法树单元,与2N个第一移位单元相耦接,被配置为对所述2N个第一移位结果进行压缩,以生成加法树压缩结果;以及全加单元,与加法树单元相耦接,被配置为对加法树压缩结果求和,以生成点积计算结果。由此,能够降低点积计算装置的功耗和面积。
2 点积乘法器机制 CN202011024871.9 2020-09-25 CN112800388A 2021-05-14 N·马修; S·马瓦哈; A·加格
本公开的发明名称是“点积乘法器机制”。一种用于促进矩阵乘法运算的设备。该设备包括乘法硬件,所述乘法硬件用于在点积模式中操作,其中包含在乘法硬件中的乘法阶段被配置为多个位向量(N)的点积,以对多个被乘数执行N×N乘法运算,并且对NxN乘法运算的结果执行加法运算。
3 点积计算装置 CN202110456687.X 2021-04-27 CN112988112B 2021-08-10 不公告发明人
本公开的实施例涉及点积计算装置,涉及集成电路领域。该点积计算装置包括:具有预定输入位宽的4N个乘法单元,N为正整数;N个4:2压缩单元,与4N个乘法单元对应耦接,被配置为将4N个乘法单元的4N个乘法结果压缩成2N个压缩结果;2N个第一移位单元,与N个4:2压缩单元对应耦接,被配置为对2N个压缩结果进行移位,以生成2N个第一移位结果;加法树单元,与2N个第一移位单元相耦接,被配置为对所述2N个第一移位结果进行压缩,以生成加法树压缩结果;以及全加单元,与加法树单元相耦接,被配置为对加法树压缩结果求和,以生成点积计算结果。由此,能够降低点积计算装置的功耗和面积。
4 自修复点积引擎 CN202010130462.0 2020-02-28 CN111755062A 2020-10-09 A·S·沙玛; J·P·斯特罗恩; C·格雷夫斯; S·库玛; C·韦尔纳; M·福汀
本公开涉及自修复点积引擎。一种DPE忆阻器交叉开关阵列系统包括多个分区忆阻器交叉开关阵列。所述多个分区忆阻器交叉开关阵列中的每一个包括主忆阻器交叉开关阵列和后备忆阻器交叉开关阵列。所述后备忆阻器交叉开关阵列包括在数学上与所述主忆阻器交叉开关阵列内的值相关的值。另外,所述多个分区忆阻器交叉开关阵列包括耦接到所述多个分区忆阻器交叉开关阵列的共享模拟电路。所述共享模拟电路块用于确定由所述多个分区忆阻器交叉开关阵列中的至少一个分区忆阻器交叉开关阵列生成的电压值的点积值。
5 点积引擎、忆阻器点积引擎以及用于计算点积的方法 CN201680031688.7 2016-01-30 CN107636640B 2021-11-23 N·穆拉里曼诺亚; A·阿尔德斯塔尼
本文公开的示例包括点积引擎,其包括电阻存储器阵列,用于接收输入向量,对输入向量和存储在存储器阵列中的存储向量执行点积运算,并输出表示点积运算的结果的模拟信号。点积引擎包括存储的求反指示符,用于指示存储向量的元素是否已被求反,以及数字电路,用于基于模拟信号和存储的求反指示符来生成数字点积结果值。
6 基于点积的处理元件 CN201780049809.5 2017-09-11 CN109564585B 2023-11-03 A·C·林; D·查帕利亚; T·S·柴可夫斯基; A·M·哈杰斯库米里什特
公开了使用数字信号处理单元(140,142,144,146)计算点积的系统和方法,数字信号处理单元被组织成点积处理单元(100),用于使用数字信号处理单元(140,142,144,146)的乘法器(118,120,122,123)和加法器(124,126,128,137)进行点积处理。
7 一种点积运算装置 CN202211270781.7 2022-10-17 CN115544447A 2022-12-30 王中风; 李琼; 方超
申请提供一种点积运算装置,所述点积运算装置包括:译码模、符号与指数运算模块、指数比较求差模块、尾数乘法模块、加法器、有效数对齐模块、符号处理与尾数相加模块、尾数归一与指数调整模块和编码与舍入模块,由于采用融合操作,在加法器内无需进行中间结果的译码和编码与舍入功能,导致本申请所需译码模块和编码与舍入模块的数量减少,因此减小了硬件面积和硬件功耗;并且,由于减少了译码模块和编码与舍入模块,因此计算的关键路径缩短,从而减小了计算延迟;进一步的,由于每个编码与舍入模块在数据输出时均根据输出精度的限制进行舍入,因此编码与舍入模块减少导致整个计算过程需要舍入的次数减少,从而提升了点积结果的精度。
8 点积累加方法及装置 CN202011307771.7 2020-11-19 CN112463112B 2022-08-16 不公告发明人
发明实施例提供一种点积累加方法及装置,该方法包括:步骤S1:在第k时钟周期,将新进入的第n组浮点值进行点积运算,得到第n个非规格化浮点值;步骤S2:在第k+1时钟周期,将新进入的第n+1组浮点值进行点积运算,同时与所述第一寄存器中的第n个非规格化浮点值、第二寄存器中的规格化浮点值进行累加,将所述累加后的非规格化的浮点值存入第一寄存器中;步骤S3:在第k+2时钟周期,将新进入的第n+2组浮点值进行点积运算,得到第n+2个非规格化浮点值,同时对步骤S2中第一寄存器中累加后的非规格化的浮点值进行规格化操作,将规格化的浮点值存入所述第二寄存器,本发明减少了规格化的次数,缩短了流线长度,降低功耗。
9 忆阻点积引擎虚拟化 CN201910085074.2 2019-01-29 CN110097909A 2019-08-06 G·恩杜; D·米洛伊契奇; 赛·拉胡尔·萨拉萨蒂
发明涉及忆阻点积引擎虚拟化。示例系统包括具有至少一种资源的至少一个忆阻点积引擎(DPE),DPE进一步具有物理接口控制器,控制器通信地耦接到物理接口,物理接口用于与控制器通信以访问DPE;并且系统还包括至少一个复制接口,每个复制接口与虚拟DPE相关联,复制接口通信地耦接到控制器。控制器用于通过相关联的复制接口将时隙分配给虚拟DPE以允许虚拟DPE访问至少一种资源。
10 点积累加方法及装置 CN202011307771.7 2020-11-19 CN112463112A 2021-03-09 不公告发明人
发明实施例提供一种点积累加方法及装置,该方法包括:步骤S1:在第k时钟周期,将新进入的第n组浮点值进行点积运算,得到第n个非规格化浮点值;步骤S2:在第k+1时钟周期,将新进入的第n+1组浮点值进行点积运算,同时与所述第一寄存器中的第n个非规格化浮点值、第二寄存器中的规格化浮点值进行累加,将所述累加后的非规格化的浮点值存入第一寄存器中;步骤S3:在第k+2时钟周期,将新进入的第n+2组浮点值进行点积运算,得到第n+2个非规格化浮点值,同时对步骤S2中第一寄存器中累加后的非规格化的浮点值进行规格化操作,将规格化的浮点值存入所述第二寄存器,本发明减少了规格化的次数,缩短了流线长度,降低功耗。
11 基于点积的处理元件 CN201780049809.5 2017-09-11 CN109564585A 2019-04-02 A·C·林; D·查帕利亚; T·S·柴可夫斯基; A·M·哈杰斯库米里什特
公开了使用数字信号处理单元(140,142,144,146)计算点积的系统和方法,数字信号处理单元被组织成点积处理单元(100),用于使用数字信号处理单元(140,142,144,146)的乘法器(118,120,122,123)和加法器(124,126,128,137)进行点积处理。
12 基于点积的处理元件 CN202210320762.4 2017-09-11 CN114943057A 2022-08-26 A·C·林; D·查帕利亚; T·S·柴可夫斯基; A·M·哈杰斯库米里什特
公开了使用数字信号处理单元(140,142,144,146)计算点积的系统和方法,数字信号处理单元被组织成点积处理单元(100),用于使用数字信号处理单元(140,142,144,146)的乘法器(118,120,122,123)和加法器(124,126,128,137)进行点积处理。
13 多位点积运算逻辑方法、多位点积和并行异或计算电路 CN202211382884.2 2022-11-07 CN115691601A 2023-02-03 彭春雨; 郑健; 戴成虎; 卢文娟; 蔺智挺; 周永亮; 赵强; 李鑫; 吴秀龙
发明涉及位点积运算逻辑方法、多位点积和并行异或计算电路。该多位点积运算逻辑方法包括以下步骤:将一个4位操作数的电压信号通过字线WL1~WL4同步输入至预存有1位操作数的存储单元内;采集该存储单元的位线BL1~2和BLB1~2的电压信号,并分别转换成表征电压信号的二进制数;将表征BL1~2电压信号的1个二进制数作为被减数,与表征WL1~2中高电平个数的1个二进制数进行差值计算,得到1个表征BL1~2差值结果的二进制数;将表征差值结果的二进制数进行左移两位的移位操作后,并与表征BLB1~2运算结果的二进制数相加计算,得到所需运算结果。本发明可以同时对不同的字线进行多位点积运算实现4'b乘法。
14 利用四输入点积电路计算三函数 CN201710287583.4 2017-04-27 CN108182050B 2023-08-18 钟乐凡; 李国嵩; 王震宇; 赵芮
发明公开一种电路,其采用四元素点积电路(DP4)从输入值x近似计算自变量t=x/pi。然后将该自变量输入比如SinPi()或者CosPi()的三函数中。所述DP4电路将x与pi的倒数表达式相乘。根据x的指数的值来选择采用的pi的倒数的比特。DP4电路包括四个乘法器、两个中间加法器、以及末级加法器。对所述乘法器、中间加法器和末级加法器的输出值做出调整,使得末级加法器的输出为自变量t的值,即,当将t输入所述三角函数时会提供精确的输出值。
15 用于点积操作的系统、方法和装置 CN202210487117.1 2017-07-01 CN114816530A 2022-07-29 R·凡伦天; D·鲍姆; Z·斯波伯; J·考博尔; E·乌尔德-阿迈德-瓦尔; B·L·托尔; M·J·查尼; M·阿德尔曼; B·泽维; A·海内克; S·卢巴诺维奇
申请公开了用于点积操作的系统、方法和装置。本文中详述的实施例涉及矩阵操作。例如,详述了对矩阵(片)点积操作的指令支持的实施例。示例性指令包括:计算有符号字的点积,并利用饱和累加在双字中;计算字节的点积,并利用饱和累加到双字中,其中,输入字节可以是有符号或无符号的,并且双字累加具有输出饱和;等等。
16 具有正确舍入的浮点点积运算器 CN202010578649.7 2020-06-23 CN112130803A 2020-12-25 N.布鲁尼
发明涉及一种用于点积计算的硬件运算器,包括多个乘法器(10),每个乘法器接收以第一精度格式(fp16)编码的浮点数格式的两个被乘数(a,b);与每个乘法器相关联的对准电路(12),被配置为基于相应被乘数的指数,将乘法的结果转换成具有足够位数(80)以覆盖乘法的整个动态范围的相应固定点数;以及多加法器(30),被配置为将乘法器提供的固定点数无损失地相加,提供固定点数的格式的和。
17 用于点积操作的系统、方法和装置 CN201811443526.1 2018-11-29 CN109992300A 2019-07-09 R·萨德; S·卢巴诺维奇; A·格雷德斯廷; Z·斯波比尔; A·海内克; R·凡伦天; M·J·查尼; B·托尔; J·科巴尔; E·乌尔德-阿迈德-瓦尔; M·阿德尔曼
申请提供了用于点积操作的系统、方法和装置。本文中详述的实施例涉及矩阵操作。例如,详述了对矩阵(片)点积操作的指令支持的实施例。示例性指令包括:计算有符号字的点积,并累加在矩阵对的四字数据元素中。此外,在一些实例中,将矩阵对的非累加四字数据元素设置为零。
18 一种向量点积的OpenCL自动化实现方法 CN201510446624.0 2015-07-27 CN105068971B 2018-05-15 戚隆宁; 汪晨; 黄少珉
发明公开了一种向量点积的OpenCL自动化实现方法,适用于支持OpenCL的处理器,包括如下步骤:(一)输入OpenCL内核代码实现向量点积所需的参数信息;(二)根据所输入的参数信息生成OpenCL内核代码。本发明通过获取向量点积的数据类型、向量长度、向量内存分布位置、向量点积次数、点积参数的数据类型以及具体数值,自动生成向量点积的OpenCL内核代码,适用于向量点积的各种情况,并达到OpenCL内核自动化设计的目的。
19 用于执行点积运算的指令和逻辑 CN201710964492.X 2007-09-20 CN107741842A 2018-02-27 R.佐哈; M.塞科尼; R.帕塔萨拉蒂; S.钦努帕蒂; M.布克斯顿; C.德西尔瓦; M.阿卜杜拉
发明涉及一种用于执行点积运算的指令和逻辑。本发明提供了用于执行点积操作的方法、装置和程序部件。在一个实施例中,装置包括执行第一指令的执行资源。响应第一指令,所述执行资源将等于至少两个操作数的点积的结果值存储到某个存储单元中。
20 用于执行点积运算的指令和逻辑 CN201510348092.7 2007-09-20 CN105022605A 2015-11-04 R.佐哈; M.塞科尼; R.帕塔萨拉蒂; S.钦努帕蒂; M.布克斯顿; C.德西尔瓦
发明涉及一种用于执行点积运算的指令和逻辑。本发明提供了用于执行点积操作的方法、装置和程序部件。在一个实施例中,装置包括执行第一指令的执行资源。响应第一指令,所述执行资源将等于至少两个操作数的点积的结果值存储到某个存储单元中。
QQ群二维码
意见反馈