专利汇可以提供低功率可编程处理器专利检索,专利查询,专利分析的服务。并且一种图形处理器具有一可编程 算术逻辑单元 (ALU)级,所述可编程算术逻辑单元(ALU)级能够对处理 像素 包进行标量算术操作。可采用改进动态范围的S1.8格式或一不同的数据格式格式化像素包中的操作数。可将所述图形处理器建构为可配置图形管线。在一种建构方案中,分配器耦合一图形管线的元件以允许响应于来自主机的命令而重新配置通过所述管线的像素包的处理流。可配置测试点选择器可用于监视所述图形管线的分接点的一 选定 子集,并对与分接点的所述子集的每一分接点相关联的至少一个状态的统计数字进行计数。可将像素分配为偶数像素或奇数像素,且接着使奇数和偶数像素的像素包交错以考虑ALU等待时间。在一种建构方案中,数据包触发所述图形管线的一元件以发现一识别符。,下面是低功率可编程处理器专利的具体信息内容。
1.一种图形处理器,其包含:
一光栅级,其接收关于将被光栅化的图元的数据,所述光栅级针对将要处理的每 一像素产生复数个像素包,每一像素包包括识别将要处理的至少一个像素属性的有 效负载信息,且具有识别将要对所述像素包执行的至少一个指令的一序列的相关边 频带信息;和
一可编程算术逻辑单元(ALU)级,其用于处理所述像素包,所述ALU级包括 至少一个ALU,每一ALU经编程以具有至少一个对一具有一相应当前指令的引入 像素包执行的可能的标量算术操作的一集合;
其中对所述复数个像素包执行一序列的算术操作以执行一图形处理功能。
2.一种图形处理器,其包含:
至少一个级,其用于变换和设置将被光栅化的图元的顶点;
一光栅级,其接收关于将被光栅化的图元的数据,所述光栅级针对将要用一图形 操作进行处理的每一像素产生至少一行像素包,所述图形操作可表示为一序列的标 量算术操作;
一门监,其包括一用于追踪像素包的所述处理的记分板;
一数据获取级,其用于获取每一行像素包的数据;
一ALU级,其包含复数个用于处理每一所述行像素包的可编程算术逻辑单元 (ALU),每一ALU接收一输入行像素包并输出一输出行像素包,每一ALU从一 接收的行像素包中读取至少一个操作数,使用所述至少一个操作数执行一标量算术 操作,产生一结果,并执行将所述结果写入一临时值和用所述结果更新所述输出行 的一像素属性寄存器这两个操作中的至少一个操作;和
一数据写入级,其用于执行从所述复数个ALU接收的经处理像素包的像素数据 的一存储器写入;
其中对所述复数个像素包执行一序列的算术操作以执行所述图形处理功能。
3.一种图形系统,其包含:
一中央处理器,其具有一图形软件模块;
一可编程图形处理器,其从所述图形软件模块接收顶点信息并对指令编程以用于 对所述可编程图形处理器的级进行编程,所述可编程图形处理器包含:
一光栅级,其响应于来自所述图形软件模块的指令而针对将要处理的每一像素 产生复数个像素包,每一像素包包括识别将要处理的至少一个像素属性的有效负 载信息,且具有识别将要对每一所述像素包执行的至少一个指令的相关边频带信 息;和
一可编程算术逻辑单元(ALU)级,其包括复数个经配置以用于处理所述像素 包的ALU,所述图形软件模块分配每一ALU以从所接收的像素包中读取选定的 操作数,响应于一当前指令而执行一标量算术操作以产生一结果,并执行用所述 结果更新一像素属性寄存器和将所述结果存储为一临时值这两个操作中的至少一 个;
其中对所述复数个像素包执行一序列的标量算术操作以对每一所述像素执行 一图形处理功能。
4.一种嵌入式处理器,其包含:
一寄存器接口,其供一主机编程一图形核心的寄存器;
一主机接口,其供一主机与所述图形核心进行通信;
一存储器接口,其供所述图形核心读取和写入数据;
一可编程图形处理器,其安置在所述图形核心中,所述可编程图形处理器包含:
至少一个级,其用于设置和变换将被光栅化的图元的顶点;
一光栅级,其接收关于将被光栅化的图元的数据,所述光栅单元针对将用一图 形操作进行处理的每一像素产生一至少一行像素包,所述图形操作可表示为一序 列的标量算术操作,每一像素包包括识别将要处理的至少一个像素属性的有效负 载信息,且每一行具有识别将要对所述行的每一所述像素包执行的至少一个指令 的相关信息;
一门监,其包括一用于追踪像素包的所述处理的记分板;
一数据获取级,其用于获取每一行像素包的数据;
一ALU级,其包含复数个用于处理每一所述行像素包的可编程算术逻辑单元 (ALU),每一ALU接收一输入行像素包并输出一输出行像素包,每一ALU从 一接收的行像素包中读取至少一个操作数,使用所述至少一个操作数执行一标量 算术操作,产生一结果,并执行将所述结果写入一临时值和用所述结果更新所述 输出行的一属性寄存器这两个操作中的至少一个操作;和
一数据写入级,其用于执行从所述复数个ALU接收的经处理像素包的像素数 据的一存储器写入;
其中对所述复数个像素包执行一序列的算术操作以执行所述图形处理功能。
5.一种对一像素执行一图形处理操作的方法,其包含:
对于将要对一像素执行的至少一个图形功能,识别可对像素包执行以建构所述至 少一个图形功能的一序列的标量算术操作;
针对所述像素产生复数个像素包,每一像素包包括将被作为所述序列的标量算术 操作中的操作数来处理的像素属性的一子集,所述复数个像素包具有一相关指令序 列;
在至少一个算术逻辑单元(ALU)中,从所述像素包中读取操作数;
在所述至少一个ALU中,根据执行所述序列的标量算术操作的所述指令序列执 行标量算术操作以用于建构所述至少一个图形功能。
6.一种对一像素执行一图形处理操作的方法,其包含:
对于将要对一像素执行的一图形功能,识别可对像素包执行以建构所述图形功能 的一序列的标量算术操作;
针对将要在连续时钟周期中处理的所述像素产生至少一行像素包,每一像素包包 括至少一个用于将被作为所述序列的标量算术操作中的操作数来处理的像素属性 的一子集的字段,所述至少一行具有一相关指令序列;
在复数个算术逻辑单元(ALU)的每一者中,读取分配的操作数,所述操作数中 的至少一者对应于从一行像素包中的一像素包读取的一操作数;
在每一所述ALU中,根据执行所述序列的标量算术操作的所述指令序列来对所 述分配的操作数执行一标量算术计算以用于建构所述图形功能。
7.一种执行一图形处理操作的方法,其包含:
对复数个算术逻辑单元(ALU)进行编程,以从一行像素包中读取选定的操作数, 和响应于与所述行像素包相关联的一选定的当前指令来执行一选定的标量算术操 作;
对于将要对一像素执行的至少一个图形操作,识别将要对所述像素的属性的一子 集执行的至少一个对应的标量算术操作;
针对所述像素产生一行像素包,每一像素包包括多个用于与将被作为至少一个操 作数来处理的所述像素相关联的至少一个属性的字段,所述像素包具有一指示将要 执行的一序列的标量算术操作的相关当前指令;
在所述ALU中,读取所述行像素包中的所述选定的操作数,并执行对应于所述 相关当前指令的所述选定的标量算术操作。
8.一种对一像素执行图形处理操作的方法,其包含:
对于将要对一像素执行的至少一个图形功能,识别可对像素包执行以建构所述至 少一个图形功能的标量算术操作;
针对将要处理的所述像素产生至少一行像素包,每一像素包包括至少一个用于将 被作为操作数来处理的像素属性的一子集的字段,所述至少一行具有一相关指令序 列;
在复数个算术逻辑单元(ALU)的每一者中,读取分配的操作数,所述操作数的 至少一者对应于从一行像素包中的一像素包读取的一操作数;
在每一所述ALU中,根据所述指令序列来对所述分配的操作数执行一标量算术 计算;
其中对于需要范围[0,1]中一结果的一选定的标量算术操作,以对应于具有一8位 分数成分的范围[-2,+2)中的操作数的一基于二的表示法的一S1.8格式来格式化像素 包的对应操作数,并将所述选定的标量算术操作的一结果箝位在所述范围[0,1]中; 和
对于至少一个其他标量算术操作,以一不同的数据格式格式化对应的像素包。
9.一种对一像素执行一图形处理操作的方法,其包含:
对于将要对一像素的色彩成分执行的一第一图形功能,识别一用于建构所述第一 图形功能的第一序列的标量算术操作,所述第一图形功能要求一标量算术操作具有 一被箝位在所述范围[0,1]中的结果;
对于将要对与一像素相关联的纹理执行的一第二图形功能,识别一用于建构所述 第二图形功能的第二序列的标量算术操作;
针对所述像素产生至少一行像素包,每一像素包具有长度为至少16位的一固定 位尺寸,且包括至少一个用于将被作为操作数来处理的像素属性的一子集的字段, 所述至少一行具有一相关指令序列;
对于与所述第一图形功能相关联的每一像素包,以一S1.8格式封装至少两个色彩 成分,所述S1.8格式对应于具有一8位分数成分的范围[-2,+2)中的操作数的一基于 二的表示法;
对于与所述第二图形功能相关联的每一像素包,封装一需要多于8位的单个高精 度纹理;
在复数个算术逻辑单元(ALU)的每一者中,读取分配的操作数并根据所述指令 序列对所述分配的操作数执行一标量算术计算;
其中对于所述第一图形功能,以所述S1.8格式选择色彩成分作为操作数并将一结 果箝位在所述范围[0,1]中,而对于所述第二图形功能,以一精度高于8位的格式选 择所述纹理作为一操作数。
10.一种图形处理器,其包含:
至少一个级,其用于设置和变换将被光栅化的图元的顶点;
一光栅级,其接收关于将被光栅化的图元的数据,所述光栅单元对于将要针对每 一图形操作进行处理的每一像素产生至少一行像素包,所述图形操作可表示为一序 列的标量算术操作;
一门监,其包括一用于追踪像素包的所述处理的记分板;
一数据获取级,其用于获取每一行像素包的数据;
一ALU级,其包含复数个用于处理每一所述行像素包的可编程算术逻辑单元 (ALU),每一ALU接收一输入行像素包并输出一输出行像素包,每一ALU从一 接收行像素包中读取至少一个操作数,使用所述至少一个操作数执行一标量算术操 作,产生一结果,并执行将所述结果写入一临时值或用所述结果更新所述输出行的 一像素包这两个操作中的至少一个操作;和
一数据写入级,其用于执行从所述复数个ALU接收的经处理像素包的像素数据 的一存储器写入;
其中对所述复数个像素包执行一序列的算术操作以执行所述图形处理功能;
所述光栅级以一对应于具有一8位分数成分的一范围[-2,+2)中的操作数的一 基于二的表示法的S1.8格式来格式化用于一第一类型的标量算术操作的像素包, 且每一ALU通过将一结果箝位在所述范围[0,1]中来处理所述第一类型的标量操 作;
所述光栅级以一精度需要高于8位的格式来格式化用于一第二类型的标量算 术操作的像素包。
11.一种图形处理器,其包含:
一光栅级,其接收关于将被光栅化的图元的数据,所述光栅级针对将要处理的每 一像素产生复数个像素包,每一像素包包括识别将要处理的至少一个像素属性的有 效负载信息,且具有识别将要对每一所述像素包执行的至少一个指令的相关边频带 信息;
一可编程算术逻辑单元(ALU)级,其用于处理所述像素包,所述ALU级包括 复数个ALU,每一ALU具有至少一个对一具有一相应当前指令命令的引入像素包 执行的可能的算术操作的一集合;
一数据获取级,其用于获取所述像素包的数据;
一数据写入级,其用于执行从所述ALU级接收的经处理像素包的像素数据的一 存储器写入;
一第一分配器,其耦合到所述ALU级、所述数据获取级和所述数据写入级的各 自输入;和
一第二分配器,其耦合到所述ALU级、所述数据获取级和所述数据写入级的各 自输出;
所述第一分配器和所述第二分配器适于响应于来自一主机的一命令而重新配置 通过所述数据获取级、所述ALU级和所述ALU写入级的像素包的一处理流。
12.一种操作一图形管线的方法,所述图形管线具有一用于产生像素包的光栅处理器、 一用于获取像素包的数据的数据获取级、一具有至少一个用于对像素包执行标量算 术操作的ALU的ALU级、一用于写入像素数据的数据写入级和耦合所述数据获取 级、所述数据写入级和所述ALU级的分配器,所述方法包含:
响应于第一命令,编程所述分配器以界定通过所述数据获取级、所述ALU级和 所述数据写入级的像素包的一第一处理流;和
响应于一第二命令,编程所述分配器以界定通过所述数据获取级、所述ALU级 和所述数据写入级的像素包的一第二流;
其中一软件主机可在复数个处理流的任一者中配置所述管线。
13.一种操作一图形管线的方法,所述图形管线具有一用于产生像素包的光栅处理器、 一用于获取像素包的数据的数据获取级、一具有至少一个用于对像素包执行标量算 术操作的ALU的ALU级、一用于写入像素数据的数据写入级和耦合所述数据获取 级、所述数据写入级和所述ALU级的分配器,所述方法包含:
从一软件主机接收一命令以重新配置从通过所述数据获取级、所述ALU级和所 述数据写入级的像素包的一第一处理流到通过所述数据获取级、所述ALU级和所 述数据写入级的像素包的一第二流的所述管线;和
调整所述分配器以重新配置从所述第一处理流到所述第二处理流的所述管线。
14.一种图形处理器,其包含:
复数个级,其用于处理像素包;
一第一分配器,其耦合到所述复数个元件的各自输入;和
一第二分配器,其耦合到所述复数个元件的各自输出;
所述第一分配器和所述第二分配器适于响应于来自一主机的一命令而重新配置 通过所述复数个元件的像素包的一处理流。
15.一种操作一图形管线的方法,所述图形管线具有一具有复数个用于处理像素包的元 件的图形管线,所述方法包含:
响应于第一命令,编程分配器以界定通过所述复数个元件的像素包的一第一处理 流;和
响应于一第二命令,编程所述分配器以界定通过所述复数个元件的像素包的一第 二流;
其中一软件主机可在复数个处理流的任一者中配置所述管线。
16.一种对一像素执行一图形处理操作的方法,其包含:
对于将要对复数个像素执行的图形功能,识别可对像素包执行以建构所述图形功 能的一序列标量算术操作;
将像素分配为偶数像素或奇数像素;
针对每一所述像素产生至少两行像素包,每一像素包包括至少一个用于将被作为 所述序列的标量算术操作中的操作数来处理的像素属性的一子集的字段,所述至少 两行具有一相关指令序列和一用于指示所述像素包是用于一奇数像素还是一偶数 像素的识别符;
使像素包行的一群组中的一偶数像素和一奇数像素的像素包的行交错,其中所述 群组中的每一行经分配以用于在连续时钟周期中进行处理;
在一ALU级中的复数个算术逻辑单元(ALU)的每一者中,接收一当前时钟周 期的一行像素包,并根据所述指令序列执行对从所述行像素包中读取的至少一个操 作数的一标量算术计算;
其中在所述ALU中交错像素包的处理。
17.一种对一可配置图形管线的元件中的一识别符执行一寄存器写入的方法,所述图形 管线具有一个以上通过所述图形管线的元件的像素包的可能的处理流,所述方法包 含:
接收一数据包,所述数据包触发所述图形管线的所述元件以发现一用于每一元件 的指示所述元件在所述处理流中的位置的识别符;和
每一元件在一配置寄存器中写入一指示在所述处理流中的一相对位置的识别符。
18.一种图形处理器,其包含:
一光栅级,其接收关于将被光栅化的图元的数据,所述光栅级针对将要处理的每 一像素产生复数个像素包,每一像素包包括识别将要处理的至少一个像素属性的有 效负载信息,且具有识别将要对每一所述像素包执行的至少一个指令的相关边频带 信息;
一可编程算术逻辑单元(ALU)级,其用于处理所述像素包,所述ALU级包括 复数个ALU,每一ALU具有至少一个对一具有一相应当前指令命令的引入像素包 执行的可能的算术操作的一集合;
一数据获取级,其用于获取所述像素包的数据;
一数据写入级,其用于执行从所述ALU级接收的经处理像素包的像素数据的一 存储器写入;
一第一分配器,其耦合到所述ALU级、所述数据获取级和所述数据写入级的各 自输入;和
一第二分配器,其耦合到所述ALU级、所述数据获取级和所述数据写入级的各 自输出;
所述第一分配器和所述第二分配器适于响应于来自一主机的一命令而重新配置 通过所述数据获取级、所述ALU级和所述ALU写入级的像素包的一处理流;
其中所述ALU级的每一ALU适于接收由一软件识别起始的一识别包,每一ALU 将所述识别包的一识别符的一当前值写入一配置寄存器,使所述识别符递增,并将 所述识别包转送到下一ALU。
19.一种图形处理器,其包含:
一图形管线,其具有与所述图形管线的元件相关联的分接点的一集合;
一可配置测试点选择器,其从一软件主机接收命令,所述可配置测试点选择器适 于监视由一软件命令选择的分接点的一子集,并对与分接点的所述子集的每一所述 分接点相关联的至少一个状态的统计数字进行计数;
其中分接点的一子集的统计数字被收集用于所述软件主机。
20.一种监视一图形处理器的方法,其包含:
接收一选择与一能够将一有效负载发送到一第二元件的第一元件相关联的两个 测试点的命令;
监视所述两个测试点;和
收集与所述第一元件和所述第二元件相关联的至少两个状态的统计数字。
本发明一般来说涉及可编程处理器。更特定来说,本发明是针对用于图形应用的低 功率可编程处理器。
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
神经网络运算装置及运算方法 | 2020-05-12 | 146 |
一种水利自动化控制系统中现场总线信道加密方法 | 2020-05-12 | 953 |
访问多维张量中的数据 | 2020-05-13 | 401 |
用于进行超声流测量的装置和方法 | 2020-05-11 | 495 |
基于时钟时延调整的异步处理器的方法和设备 | 2020-05-14 | 82 |
基于现场可编程门阵列的处理器内核及其运行方法 | 2020-05-12 | 295 |
可编程平台上的加速器架构 | 2020-05-13 | 811 |
一种FIR滤波器组及滤波方法 | 2020-05-13 | 344 |
一种含有存储内计算的处理器 | 2020-05-11 | 489 |
半导体装置及半导体装置的制造方法 | 2020-05-11 | 953 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。