1 |
使用多图形处理单元的改进的图形去阶梯 |
CN201110414075.0 |
2007-05-01 |
CN102609975B |
2017-12-19 |
R·柯杜里; G·艾尔德; J·高尔德斯 |
一种用于在系统中执行基于多采样图形去阶梯的方法和设备,所述系统包括第一和第二图形处理单元(GPU),其减少在GPU之间所传送的数据量并且提高了这种数据传送的效率。所述第一GPU使用第一多采样模式绘制画面的第一版本,所述第二GPU使用第二多采样模式绘制第二GPU中的画面的第二版本。所述第二GPU在所述画面的所述第二版本中识别非边缘像素。然后在所述画面的所述第一版本中的所述像素与那些仅在所述画面的所述第二版本中已经被识别为边缘像素的像素结合起来以生成结合的画面。 |
2 |
多个阴影化引擎上3D计算机图形数据的处理 |
CN201180014821.5 |
2011-03-18 |
CN102822870B |
2016-10-05 |
J·雷德肖 |
提供了一种用于在多个阴影化引擎上纹理化和阴影化3D计算机图形图像的方法。首先,图像被细分成多个图块且每个图块被细分成多个微图块。对象列表被分配至每个图块,对象列表包含定义图块中可见的对象的数据。对于一个微图块,确定微图块中的哪些像素被对象列表中的对象A贯穿以及确定微图块中哪些像素被对象列表中的至少一个其他对象贯穿。在与确定步骤并行的步骤中,用于对象B的像素贯穿数据被输出,对于该对象B已经执行了对于选择的图块中的每个微图块的所有贯穿确定。像素贯穿数据被输出至多个阴影化引擎中的至少一个阴影化引擎。然后,针对所选择的存在可见对象的图块中的每个微图块重复这些步骤。与用于对象B的像素贯穿数据相对应的像素使用多个阴影化引擎中的至少一个阴影化引擎进行纹理化和阴影化。最后,存储通过纹理化和阴影化得到的数据。 |
3 |
图形处理器中SIMD单元的动态启用和禁用 |
CN201180035148.3 |
2011-07-11 |
CN103080899B |
2016-07-06 |
图沙尔·K·沙阿; 拉沙德·奥雷费基; 迈克尔·J·曼特; 布莱恩·恩贝林 |
本发明描述一种在图形处理单元中提高效能的系统和方法。实施方式通过在包含多个SIMD单元的着色器复合器中动态地激活/停用单个的SIMD实现在图形处理单元中的功率节约。单个SIMD的动态即时禁用和启用对于给定的处理应用中实现所需的效能和功率水平提供了灵活性。用这种方法,实施方式实现了图形处理单元的最优化使用。本发明的实施方式还在着色器复合器中实现SIMD的动态纹理(如中等纹理)时钟门控。实施方式通过按需提供时钟机制,关闭未使用的逻辑时钟树,以减少开关功率。用这种方法,实施方式增强时钟门控,以在SIMD为空闲(或未指派任何工作)时的持续时间内节约更多的开关功率。 |
4 |
具有可变刷新率的低功率显示设备 |
CN201480011082.8 |
2014-01-14 |
CN105103214A |
2015-11-25 |
P·纳姆比; J·N·戈麦斯; 郑丰华; P·萨凯托; S·H·品兹; 金太星; C·P·坦恩; M·阿尔布雷希特; D·W·卢姆 |
本公开描述了用于在消费电子设备的LCD显示器处动态采用可变刷新率的过程,消费电子设备诸如膝上型计算机、平板电脑、移动电话或音乐播放器设备。在一些配置中,消费电子设备可以包括:具有一个或多个处理器的主机系统部分,和具有定时控制器、缓冲电路、显示驱动器和显示面板的显示系统部分。显示系统可以从主机系统的GPU接收图像数据和图像控制数据,评估所接收的图像控制数据以确定降低的刷新率(RRR)以在显示面板处采用,并且然后在任何可行的时候过渡到RRR以节省功率。在一些情形中,过渡到RRR可以从50赫兹或更高的LRR过渡到40赫兹或更低的RRR。 |
5 |
软件光栅化优化 |
CN200980117830.X |
2009-04-15 |
CN102027446B |
2014-06-11 |
B·佩尔顿; A·格莱斯特; M·利亚普诺夫; S·希尔思林格; D·塔夫特 |
提供了用于优化仿真的固定功能和可编程图形运算的系统、方法和计算机可读介质。接收包括要渲染的图像或场景的固定功能和可编程状态的数据。将该图像的数据转换成运算。对这些运算应用一个或多个优化。实现经优化的运算以渲染场景。 |
6 |
用于图形处理器的并行阵列结构 |
CN200680047739.1 |
2006-12-18 |
CN101371247B |
2014-06-04 |
约翰·M·丹斯金; 约翰·S·蒙特里; 约翰·埃里克·林霍尔姆; 史蒂文·E·莫尔纳; 马克·J·弗伦奇 |
本发明提供一种用于图形处理器的并行阵列结构,其包括:多线程核心阵列,其包括多个处理群集,每一处理群集包括至少一个可操作以执行像素着色器程序的处理核心,所述像素着色器程序从覆盖数据产生像素数据;光栅化器,其经配置以针对多个像素的每一者产生覆盖数据;以及像素分配逻辑,其经配置以将所述覆盖数据从所述光栅化器传递到所述多线程核心阵列中的所述处理群集中的一者。所述像素分配逻辑至少部分基于第一像素在图像区域中的位置而选择将所述第一像素的所述覆盖数据传递到其的所述处理群集中的一者。 |
7 |
基于图块的3D计算机图形系统中的显示列表控制流分组 |
CN200980152369.1 |
2009-12-23 |
CN102265309B |
2014-05-07 |
X·杨 |
提供了一种用于绘制3D计算机图形图像的方法和装置。该图像被细分成多个矩形区域,并且在该图像中可见的原语被分配给多个原语块中的各个原语块。确定哪些原语块包含与每个矩形区域相交的原语。然后将矩形区域分组到多个固定大小的组中,并获得针对每个固定大小的组的控制流数据,该控制流数据包含用于确定绘制每个第一固定大小的组中的矩形区域需要哪些原语块的数据。该控制流数据之后用于绘制用于显示的图像。 |
8 |
用于存储和取回图像数据的技术 |
CN201010258172.0 |
2010-08-18 |
CN101996391B |
2014-04-16 |
N·加洛坡冯伯里斯; W·A·胡克斯; D·布考特 |
本申请提供了用于存储和取回图像数据的技术。在图形流水线中,在光栅化级期间或结束时,修剪后输出级存储图元,并且像素存储在存储器的一部分中。在光栅化级期间或结束时图元和像素的可用性允许实现处理图元和像素的各种方式。 |
9 |
用于逼真成像工作量分布的系统和方法 |
CN200980148614.1 |
2009-12-02 |
CN102239678B |
2014-04-09 |
乔奎恩.马德鲁加; 巴里.米诺尔; 马克.R.努特 |
图形客户端接收帧,该帧包括场景模型数据。设置服务器负载平衡因子和预期渲染因子。基于该服务器负载平衡因子和预期渲染因子将帧分割成多个服务器带。将服务器带分配给多个计算服务器。从该计算服务器接收处理后的服务器带。基于接收的处理后的服务器带组合处理后的帧。发送处理后的帧以作为图像显示给用户。 |
10 |
图形处理单元中的3D加速结构的完全并行适当地构造 |
CN201310076982.8 |
2013-03-11 |
CN103440238A |
2013-12-11 |
泰罗·卡拉斯 |
本发明涉及一种图形处理单元中的3D加速结构的完全并行适当地构造。一种用于并行地构造二叉基数树的系统和方法,该二叉基数树用作用于构造二级(secondary)树的构建块。公开了具有用于使计算机系统实施方法的计算机可执行指令的非暂时性计算机可读存储介质。该方法包括确定包括被索引化的基元节点的总数的多个基元,其中多个基元与层次树的叶节点相对应。该方法包括将多个基元排序。该方法包括以至多要求关于基元节点的总数成线性数量的临时存储的方式构建层次树。该方法包括与层次树的内部节点的祖先节点的一个或多个并行地构建该内部节点。 |
11 |
通过优化缓存重用在多处理器共享存储器系统上体积绘制 |
CN201310112494.8 |
2013-04-02 |
CN103365796A |
2013-10-23 |
R.施奈德 |
本发明涉及一种方法、系统和产品,用于在以多内核处理器(P)和多个末级缓存(LLC)实现在多插座主板中的共享存储器系统(10)上的医学图像的体积绘制。本方法包括:-把绘制所要使用的图像空间(MR)分解成多个区域(Re);-为每一个各分解后的区域(Re)分配两个插座(S);-为一个区域(Re)确定一种瓦片枚举方案;-在分配的两个插座(S)上根据确定的瓦片枚举方案绘制区域(Re)内的多个瓦片(T)的所有瓦片(T),直至完成各自区域(Re);-如果完成了一个区域(Re):将这两个插座(S)分配给另一区域(Re);-如果没有留下区域(Re):根据分割方案将未绘制瓦片的现有区域分割成子区域,并且对于该子区域重复地应用这些步骤。 |
12 |
颗粒流动仿真系统和方法 |
CN201310195595.6 |
2013-05-22 |
CN103324780A |
2013-09-25 |
杨磊; 齐记; 田园; 高笑菲 |
本发明公开了基于GPU的颗粒流动仿真系统及方法,包括:根据客户端输入的颗粒建模信息生成颗粒信息,并且生成几何体信息;接收颗粒信息和几何体信息,根据颗粒的数目及各个计算节点中空闲的GPU数目,确定使用哪些计算节点中的哪些GPU,然后根据确定的GPU的数目及颗粒在空间中的分布情况确定哪些颗粒由哪个计算节点的哪个GPU进行计算,并根据确定结果进行分配;在多个GPU中并行计算颗粒碰撞导致的每个颗粒的受力,进而计算出加速度,以仿真颗粒流动;展示仿真结果。根据本发明实施例,能够实现高密度颗粒虚拟实验仿真,并在降低能耗的同时提高运算效率。 |
13 |
用于多处理器系统中的输出的多级采集器 |
CN201210350398.2 |
2012-09-17 |
CN103198512A |
2013-07-10 |
J·A·麦康比; S·J·克洛塞特; J·R·雷格瑞芙; L·T·皮特森 |
本发明涉及用于多处理器系统中的输出的多级采集器。处理元件可以(每一个或整体上)包括多个群集,具有一个或多个ALU,可根据用于配置ALU的指令流对数据矢量执行SIMD操作并产生输出。多级采集器可包括替代组件,每一个具有至少一个输入队列、存储器、封装单元以及输出队列;这些组件可被调整尺寸以处理给定尺寸的输入元素的群组,并且可以具有多个输入队列和单个输出队列。某些组件耦合以接收来自ALU的输出,而其他接收来自其他组件的输出。最终,多级采集器可以输出输入元素的群组。每个元素群组(例如,在输入队列处,或被存储于组件的存储器)可以基于索引元素的匹配而被形成。 |
14 |
单通道镶嵌 |
CN200910177458.3 |
2009-09-29 |
CN101714247B |
2012-06-20 |
贾斯汀·S.·莱高凯斯; 埃米特·M.·凯高艾弗; 亨利·帕卡·莫尔顿 |
本发明公开了一种单通道镶嵌。通过图形处理器以单通道进行镶嵌的系统和方法将图形处理器中的处理资源分成组以进行不同镶嵌操作。顶点数据和镶嵌参数直接从一个处理资源发送到另一处理资源,而不是存储在存储器中。因此,表面面片描述提供给图形处理器,且通过图形处理器以不中断的单通道完成了镶嵌,而不将中间数据存储在存储器中。 |
15 |
在单片构造的硅芯片上采用多个图形核心的图形处理和显示系统 |
CN200680002976.6 |
2006-01-25 |
CN101849227A |
2010-09-29 |
R·巴卡拉什; O·雷默茨; E·弗格尔 |
一种在单片硅芯片上实现的高性能图形处理和显示系统,该系统支持多个图形处理单元(GPU)核心的群集,这多个图形处理单元核心的群集协作以提供支持用于不同应用的拟真图形能力的功能强大并高度可升级的可视化方案。本发明通过通过动态地管理各种并行渲染技术并使得能自适应地处理不同的图形应用来消除沿图形管道的渲染瓶颈。 |
16 |
用于图形处理器的并行阵列结构 |
CN200680047739.1 |
2006-12-18 |
CN101371247A |
2009-02-18 |
约翰·M·丹斯金; 约翰·S·蒙特里; 约翰·埃里克·林霍尔姆; 史蒂文·E·莫尔纳; 马克·J·弗伦奇 |
本发明提供一种用于图形处理器的并行阵列结构,其包括:多线程核心阵列,其包括多个处理群集,每一处理群集包括至少一个可操作以执行像素着色器程序的处理核心,所述像素着色器程序从覆盖数据产生像素数据;光栅化器,其经配置以针对多个像素的每一者产生覆盖数据;以及像素分配逻辑,其经配置以将所述覆盖数据从所述光栅化器传递到所述多线程核心阵列中的所述处理群集中的一者。所述像素分配逻辑至少部分基于第一像素在图像区域中的位置而选择将所述第一像素的所述覆盖数据传递到其的所述处理群集中的一者。所述处理群集可在没有交叉开关的情况下直接映射到所述帧缓冲器分区,使得将像素数据直接从所述处理群集传递到适当的帧缓冲器分区。或者,耦合到所述处理群集的每一者的交叉开关经配置以将像素数据从所述处理群集传递到具有多个分区的帧缓冲器。所述交叉开关经配置以使得由所述处理群集的任一者产生的像素数据可传递到所述帧缓冲器分区中的任一者。 |
17 |
顶点着色器、绘图处理单元及其相关的流程控制方法 |
CN200710129775.9 |
2007-07-25 |
CN101082982A |
2007-12-05 |
王科方; 黄启耕; 钟贤助 |
本发明提供一种顶点着色器、绘图处理单元及其相关的流程控制方法,特别涉及一种顶点着色器,包括一指令暂存器文件、一流程控制器、一线程仲裁器以及一算术逻辑单元管线。指令暂存器文件储存多个指令。流程控制器同时地执行多个线程、自线程的指令暂存器文件中依序读取指令以及存取线程的顶点数据。线程仲裁器检查在线程中的指令的关联性,并依据关联性检查的结果以及一线程执行优先权,选取一欲执行的线程。算术逻辑单元管线接收顶点数据,以执行线程仲裁器所选出的线程的指令,以进行三维绘图计算。本发明所述的顶点着色器、绘图处理单元及其相关的流程控制方法,当顶点着色器要执行的指令中存在关联性时,ALU管线的效能将被改善。 |
18 |
通过优化缓存重用在多处理器共享存储器系统上体积绘制 |
CN201310112494.8 |
2013-04-02 |
CN103365796B |
2017-10-20 |
R.施奈德 |
本发明涉及一种方法、系统和产品,用于在以多内核处理器(P)和多个末级缓存(LLC)实现在多插座主板中的共享存储器系统(10)上的医学图像的体积绘制。本方法包括:‑把绘制所要使用的图像空间(MR)分解成多个区域(Re);‑为每一个各分解后的区域(Re)分配两个插座(S);‑为一个区域(Re)确定一种瓦片枚举方案;‑在分配的两个插座(S)上根据确定的瓦片枚举方案绘制区域(Re)内的多个瓦片(T)的所有瓦片(T),直至完成各自区域(Re);‑如果完成了一个区域(Re):将这两个插座(S)分配给另一区域(Re);‑如果没有留下区域(Re):根据分割方案将未绘制瓦片的现有区域分割成子区域,并且对于该子区域重复地应用这些步骤。 |
19 |
用于三维重建在网络上的大量分发的系统和方法 |
CN201580021123.6 |
2015-03-09 |
CN106663330A |
2017-05-10 |
罗翰·马洛里·科夫马尔·阿伦 |
描述了用于分发目标空间的三维模型的系统和方法,包括但不限于:确定对象在目标空间内的位置;将对象的位置编码为与基础帧的至少一个像素相关联的RGB值;并且向用户设备传送基础帧用于解码对象的位置。 |
20 |
颗粒流动仿真系统和方法 |
CN201310195595.6 |
2013-05-22 |
CN103324780B |
2016-03-16 |
杨磊; 齐记; 田园; 高笑菲 |
本发明公开了基于GPU的颗粒流动仿真系统及方法,包括:根据客户端输入的颗粒建模信息生成颗粒信息,并且生成几何体信息;接收颗粒信息和几何体信息,根据颗粒的数目及各个计算节点中空闲的GPU数目,确定使用哪些计算节点中的哪些GPU,然后根据确定的GPU的数目及颗粒在空间中的分布情况确定哪些颗粒由哪个计算节点的哪个GPU进行计算,并根据确定结果进行分配;在多个GPU中并行计算颗粒碰撞导致的每个颗粒的受力,进而计算出加速度,以仿真颗粒流动;展示仿真结果。根据本发明实施例,能够实现高密度颗粒虚拟实验仿真,并在降低能耗的同时提高运算效率。 |