首页 / 专利库 / 物理 / 频率 / 频率和电压缩放架构

频率电压缩放架构

阅读:1050发布:2020-06-24

专利汇可以提供频率电压缩放架构专利检索,专利查询,专利分析的服务。并且一种用于缩放至少一个 微处理器 的时钟域的 频率 和操作 电压 的方法和装置。尤其,本 发明 涉及把微处理器划分成时钟域和单独控制每个时钟域的频率和操作电压的技术。,下面是频率电压缩放架构专利的具体信息内容。

1.一种处理器,包括:
具有第一时钟信号频率和第一操作电压的第一时钟域;
具有第二时钟信号频率和第二操作电压的第二时钟域;
具有第三时钟信号频率和第三操作电压的第三时钟域;
其中所述第一时钟域的时钟信号频率和操作电压通过最小化对应于第一时 间间隔和第二时间间隔的延迟的平方和能量的乘积的比率来选择,其中所述第 二时间间隔在所述第一时间间隔之前。
2.如权利要求1所述的处理器,其特征在于,所述第一时钟域包括指令解 码器、重命名单元、定序器、重新排序缓冲器、以及分支预测单元。
3.如权利要求1所述的处理器,其特征在于,所述第二时钟域包括执行单 元、寄存器文件、以及发出队列。
4.如权利要求1所述的处理器,其特征在于,所述第三时钟域包括二级高 速缓冲存储器
5.如权利要求1所述的处理器,其特征在于,每个时钟域包括先进先出队 列以帮助在时钟域之间的同步操作。
6.如权利要求1所述的处理器,其特征在于,进一步包括具有第四和第五 操作电压的第四和第五时钟域,其中所述第二、第四和第五时钟域能通过交叉 开关互相发送信息。
7.如权利要求6所述的处理器,其特征在于,所述第四或第五时钟域包括 一级高速缓冲存储器和存储器排序缓冲器。
8.一种用于缩放处理器的时钟信号频率和操作电压的方法,包括:
确定用于第一时间间隔的处理器时钟域的能量和延迟;
确定用于第二时间间隔的处理器时钟域的能量和延迟,其中所述第二时间 间隔在所述第一时间间隔之后;
调整处理器的第一组逻辑的操作电压和时钟信号,使得第二时间间隔的延 迟的平方和能量的乘积与第一时间间隔的延迟的平方和能量的乘积的比率被最 小化,其中所述处理器的第一组逻辑是该处理器的前端域。
9.如权利要求8所述的方法,其特征在于,对于多个时钟域中的每一个单 独地执行确定用于第一和第二时间间隔的能量和延迟以及调整操作电压和时钟 信号频率。
10.如权利要求9所述的方法,其特征在于,所述多个时钟域同步于参考 时钟信号。
11.如权利要求10所述的方法,其特征在于,所述多个时钟域至少部分地 通过对应于多个时钟域的多个先进先出队列被同步。
12.如权利要求11所述的方法,其特征在于,所述多个时钟域包括前端域、 后端域、以及二级高速缓冲存储器域。
13.如权利要求12所述的方法,其特征在于,所述前端域包括指令解码器、 重命名单元、定序器、重新排序缓冲器、以及分支预测单元。
14.如权利要求12所述的方法,其特征在于,所述后端域包括执行单元、 寄存器文件、和发出队列。
15.如权利要求12所述的方法,其特征在于,所述后端域包括存储器排序 缓冲器和一级高速缓冲存储器。
16.一种用于缩放处理器的时钟信号频率和操作电压的系统,包括:
存储多个指令的存储器;
处理器,所述处理器包括多个时钟域,所述多个时钟域具有取决于被处理 器执行的多个指令的一些指令的多个独立时钟频率和独立操作电压;
其中所述多个时钟域的时钟信号频率和操作电压通过最小化对应于随后时 间间隔和前一时间间隔的延迟的平方和能量的乘积的比率来选择。
17.如权利要求16所述的系统,其特征在于,所述多个独立时钟频率和独 立操作电压要被调整,使得对应于第一时间间隔的延迟的平方和能量的乘积与 对应于第二时间间隔的延迟的平方和能量的乘积之比针对多个时钟域中的每个 时钟域而被最小化,其中所述第二时间间隔在所述第一时间间隔之前。
18.如权利要求16所述的系统,其特征在于,所述多个时钟域包括多个功 能单元以在多个处理器管线级内执行多个功能。
19.如权利要求18所述的系统,其特征在于,所述多个时钟域包括前端域, 所述前端域包括指令解码器。
20.如权利要求19所述的系统,其特征在于,所述多个时钟域包括后端域, 所述后端域包括执行单元以执行多个指令。
21.如权利要求20所述的系统,其特征在于,所述多个时钟域包括存储器 域,所述存储器域包括二级高速缓冲存储器。
22.如权利要求19所述的系统,其特征在于,所述多个时钟域包括后端域, 所述后端域包括存储器排序缓冲器和一级高速缓冲存储器。
23.如权利要求22所述的系统,其特征在于,所述多个时钟域中的每个时 钟域包括至少一个先进先出队列,以暂时地存储与多个指令关联的存储数据直 到相应的域能操作数据为止。
24.如权利要求23所述的系统,其特征在于,所述后端域包括多个执行单 元以执行多个指令,以及多个交叉开关,通过所述多个交叉开关在多个执行单 元之间发送信息。
25.一种用于缩放处理器的时钟信号频率和操作电压的系统,包括:
用于确定对于第一时间间隔的处理器时钟域的能量和延迟的装置;
用于确定对于第二时间间隔的处理器时钟域的能量和延迟的装置,其中所 述第二时间间隔在所述第一时间间隔之后;
用于调整对应于处理器的前端域的该处理器的第一组逻辑的操作电压和时 钟信号频率的装置,使得所述第二时间间隔的延迟的平方和能量的乘积与所述 第一时间间隔的延迟的平方和能量的乘积被最小化。
26.如权利要求25所述的系统,其特征在于,所述第二时间间隔的延迟的 平方和能量的乘积与第一时间间隔的延迟的平方和能量的乘积的比率被最小 化。
27.如权利要求26所述的系统,其特征在于,对于多个时钟域中的每一个 单独地执行确定用于第一和第二时间间隔的能量和延迟以及调整操作电压和时 钟信号频率。

说明书全文

技术领域

发明实施例涉及微处理器架构领域。尤其,本发明的实施例涉及一种缩 放微处理器内的各种功能单元的频率和操作电压的技术。

背景技术

为了帮助降低微处理器的功率,同时最小化对性能的影响,已经开发了用于 降低处理器时钟频率的现有技术。在这些现有技术中,存在把处理器分成多个 时钟域的架构。例如,一种现有技术具有用于整数管线的单独时钟域、用于浮 点管线的单独时钟域、以及用于存储器存取逻辑的单独时钟域。
由于控制每个时钟域所需要的线路的开销,对每条管线和/或存储器存取群 集使用单独时钟域能引起维护处理器性能的挑战。
附图说明
通过示例来例示出实施例和发明,但不受附图的限制,附图中相同的引用指 示类似的元件,其中:
图1示出了根据本发明的一个实施例的时钟和电压缩放架构。
图2示出了能在其中使用本发明的一个实施例的前端总线计算机系统
图3示出了能在其中使用本发明的一个实施例的点对点计算机系统。
发明详述
本发明的实施例涉及用于微处理器的频率和电压控制架构。尤其,本发明的 实施例涉及在微处理器中多个时钟域之间分配和控制时钟和操作电压的技术, 以使每个域的频率和操作电压能被单独地控制。
图1示出了根据本发明的一个实施例的时钟和电压域架构。尤其,图1示出 了已经被划分成三个基本时钟域的处理器架构100:前端域101,具有跟踪高速 缓冲存储器102、分支预测器103、重命名单元104、解码单元105、定序器106、 自由表107、重命名表108、以及重新排序缓冲器(ROB)109;数个后端域110, 具有存储器排序缓冲器(MOB)111、一级高速缓冲存储器112、物理寄存器文 件113、发出队列(issue queue)114、总线接口116以及执行单元115;以及存 储器域,包括二级高速缓冲存储器119。在一个实施例中,总线接口是前端总线 接口,而在其他实施例中,它是点对点总线接口。
前端域、后端域和存储器域各具有至少一个先进先出(FIFO)队列117,用 以帮助同步各个时钟域之间的信息交换。在本发明的一个实施例中,至少某些 同步队列是在处理器内提供其他功能的队列,然而在其他实施例中,同步队列 专用于时钟域控制架构。除了时钟域,本发明的一个实施例把处理器分成彼此 可被单独控制的电压域。在至少一个实施例中,时钟域和电压域是相同的并且 包括相同的功能单元,然而,在其他实施例中,时钟域和电压域不是相同的并 且可包括不同的功能单元。
在本发明的一个实施例中,各个时钟域中的每个时钟能被同步于参考时钟。 然而,在其他实施例中,每个域时钟可不与其他域时钟同步。此外,在至少一 个实施例中,后端域可通过被称为“交叉开关(crossbar)”的信号相互通信。
为了控制每个时钟域和电压域,本发明的一个实施例试图通过在某些时间间 隔确定每个域的能量和性能来最小化每个域的能量和延迟的平方(delay2)的乘 积。在至少一个实施例中,可通过计算在第一时间间隔期间域的能量和延迟以 及估算在后一时间间隔域的能量和延迟,在两个时间间隔确定能量和性能。然 后,可通过最小化第一时间间隔的能量和延迟的平方(delay2)的乘积与后一时 间间隔的能量和延迟的平方(delay2)的乘积之间的比率,来选择所述后一时间 间隔的频率和电压对。
例如,在本发明的一个实施例中,对于间隔n+1,处理器能量“E”根据以 下的等式被估算:
E n + 1 E n = 1 + E FE , n E n × ( V n + 1 2 V n 2 - 1 )
在以上的等式中,“EFE,n”是在时间间隔“n”的前端域的能量,“En+1”是在 时间间隔n+1的前端的能量,“Vn+1”是在时间间隔n+1的前端域的操作电压, “Vn”是在时间间隔n的前端域的操作电压。
作为前端域的频率的函数的处理器的性能能通过使用给定的时间间隔的前 端域的时钟频率、前端取指令的速率、微操作(解码的指令)被送交后续管线 级的速率来估算。在一个实施例中,根据以下等式估算时间间隔n+1的性能估 算“Tn+1”:
T n + 1 T n = 1 + ( f n f n + 1 - 1 ) × 1 - p n 1 + b
在以上的等式中,“pn”是第n个时间间隔的前端队列中的输入项的平均数, “b”是分支错误预测率。值“1+b”是可被装载的取指令队列的速率的指示器, 而“1-pn”是队列中输入项的平均数的指示器。“Tn”是在间隔“n”的前端的 性能,“fn”是在间隔n的前端域的频率,以及“fn+1”是在下一时间间隔的前端 域的频率。
一旦处理器的能量和性能根据以上的等式被计算,在一个实施例中,前端域 频率和电压能在每个时间间隔n的末端为下一个时间间隔n+1被调整。在一个 实施例中,可根据以下比率做出频率和电压的选择:
R ( < f , V > ) = E n + 1 E n × T n + 1 T n × T n + 1 T n
被选择用于间隔n+1的频率和电压是那些最小化以上比率的频率和电压。如 果发现两对或两对以上的频率和电压产生相同的值R,那么在一个实施例中选 择具有最小频率的那对。然后,对于间隔n+1,前端域的频率和操作电压可被 设定成适当的值,并且对下一个间隔重复该过程。
每个后端频率和操作电压可通过与对前端相同的方式被估算,估算是通过按 照每个后端域的操作电压和频率的函数估算处理器的能量和性能,以及选择将 间隔n+1和间隔n之间的能量性能乘积的比率最小化的频率和操作电压而进行 的。在一个实施例中,处理器能量“En”作为后端域能量“EBE.n”的函数根据 以下等式被估算:
E n + 1 E n = 1 + E BE . n E n × ( V n + 1 2 V n 2 - 1 )
作为每个后端域的频率的函数的处理器的性能可在每个间隔n+1通过以下 等式被计算:
其中, T n + 1 T n = 1 + S × ( 1 - 2 m n ) 2 × p p = - L q , n + L q , n 2 + 4 L q , n 2
以及, S = ( f n f n + 1 - 1 ) × | f n + 1 - f n | f max - f min
在以上的等式中,mn是对于间隔n的二级高速缓冲存储器失败数除以调拨 的微操作数,Lq,n是对于包含执行单元的所有后端域的所有微操作发出队列的平 均使用。一旦处理器的能量和性能根据以上的等式被计算,在一个实施例中, 后端域频率和电压能在每个时间间隔n的末端为下一个时间间隔n+1被调整。 在一个实施例中,频率和电压的选择可根据以下的比率做出:
R ( f n + 1 , V n + 1 ) = E n + 1 E n × T n + 1 T n × T n + 1 T n
被选择用于间隔n+1的频率和电压是那些最小化以上比率的频率和电压。如 果发现两对或两对以上的频率和电压产生相同的值R,那么在一个实施例中选 择具有最小频率的那对。然后,对于间隔n+1,后端域的频率和操作电压可被 设定成适当的值,并且对下一个间隔重复该过程。
图2示出了本发明的一个实施例可在其中被使用的前端总线(FSB)计算机 系统。处理器205访问来自一级(L1)高速缓冲存储器210和主存储器215的 数据。在本发明的其他实施例中,高速缓冲存储器可以是二级(L2)高速缓冲 存储器或其他计算机系统存储器分级结构内的存储器。此外,在某些实施例中, 图2的计算机系统既可包括L1高速缓冲存储器也可包括L2高速缓冲存储器, 该计算机系统包括相容(inclusive)高速缓冲存储器分级结构,其中相干的数据 能在L1和L2高速缓冲存储器中共享。
在图2的处理器内示出的是本发明的一个实施例206。然而,本发明的其他 的实施例可在系统内诸如分离总线代理之类的其他设备内被实现,或者以硬件软件、或它们的组合的方式分布在系统中。
主存储器可以各种存储器源来实现,诸如动态随机存取存储器(DRAM)、 硬盘驱动器(HDD)220、或通过包括各种存储设备和技术的网络接口230从计 算机系统远程定位的存储源。高速缓冲存储器可位于处理器内或靠近处理器, 诸如在处理器的局部总线207上。此外,高速缓冲存储器可包括诸如6晶体管 (6T)单元的相对快的存储器单元,或其他具有接近相等的或更快的访问速度 的存储单元。
图2的计算机系统可以是诸如微处理器的总线代理的点对点(PtP)网络, 这些总线代理在PtP网络上通过用于每个代理的总线信号通信。在每个总线代 理中或者至少与之相关联的是是本发明的至少一个实施例206,使得存储操作 能在总线代理之间以迅速的方式被推动。
图3示出了以点对点(PtP)配置安排的计算机系统。尤其,图3显示了其 中处理器、存储器、以及输入/输出设备由多个点对点接口相互连接的系统。
图3的系统也包括多个处理器,为了清楚只显示其中的两个处理器370、380。 处理器370、380中的每个处理器可包括与存储器22、24连接的本地存储器控 制器集线器(MCH)372、382。处理器370、380可使用PtP接口电路378、388 通过点对点(PtP)接口350交换数据。处理器370、380中的每个处理器可使 用点对点接口电路376、394、386、398通过各PtP接口352、354与芯片组390 交换数据。芯片组390也可通过高性能图形接口339与高性能图形电路338交 换数据。
本发明的至少一个实施例可位于图3的每个PtP总线代理中的PtP接口电路 中。然而,本发明的其他实施例可存在于图3的系统内的其他电路、逻辑单元、 或设备中。此外,本发明的其他实施例可分布在图3示出的多个电路、逻辑单 元或设备中。
尽管已经结合示出的实施例描述了本发明,但是描述并没有限制的含义。各 种对于示出的实施例的更改以及对于本领域的技术人员显而易见的合适于本发 明的其他实施例都被认为在本发明的精神和范围内。
相关专利内容
标题 发布/更新时间 阅读量
数字频率计 2020-05-12 167
频率合成器 2020-05-12 395
频率合成器 2020-05-12 846
频率合成器 2020-05-13 397
频率估计 2020-05-11 543
频率校正 2020-05-11 225
频率调制器 2020-05-12 324
频率计划 2020-05-11 866
压电石英晶体频率片自动控温腐蚀机 2020-05-11 798
频率计 2020-05-11 133
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈