Plotting arithmetic processor专利检索-顶点缓存高速缓冲存储器资料储存系统专利检索查询-专利查询网

Plotting arithmetic processor

阅读：423发布：2021-01-18

专利汇可以提供Plotting arithmetic processor专利检索，专利查询，专利分析的服务。并且PROBLEM TO BE SOLVED: To provide a plotting arithmetic processor by which an application producer can freely control the speed and picture quality in a real-time three- dimensional CG and, moreover, picture generating technique with high definition, which is used in a non-real-time CG, is realized in real time. SOLUTION: A shape primitive expressing the surface shape of an object in a three-dimensional space is inputted to a shape dividing part 10 and divided into a plurality of sub-polygons which are two-dimensionally arrayed by optional size so that a polygon mesh is generated. Then a parameter required for plotting by pixel unit of the sub-polygon is calculated at every vertex in the polygon mesh by a vertex processing part 30 for reading data from an image memory 80 via an image memory reading route 60 and a cache 70. Then plotting data by pixel unit are calculated by a rendering processing part 40 and a picture memory access part 50 based on the data and written on the image memory 80.，下面是Plotting arithmetic processor专利的具体信息内容。

权利要求

【特許請求の範囲】

【請求項１】３次元空間に存在するオブジェクトの表面の単位形状を二次元に配列された任意の大きさの複数のサブポリゴンに分割してサブポリゴンメッシュを生成する形状分割部と、前記形状分割部により生成されたポリゴンメッシュの頂点毎にサブポリゴンに対するピクセル単位の描画に必要なパラメータを算出する頂点処理部と、前記頂点処理部により算出されたパラメータ及びテクスチュアマッピングのための画像データに基づいてピクセル単位の描画データを算出するレンダリング処理部と、前記描画データを画像データとして保持すると共に、前記レンダリング処理部で前記描画データの算出に必要な少なくともテクスチュアマッピングのためのデータを保持する画像メモリとを具備することを特徴とする描画演算処理装置。

【請求項２】３次元空間に存在するオブジェクトの表面の単位形状を二次元に配列された任意の大きさの複数のサブポリゴンに分割してサブポリゴンメッシュを生成する形状分割部と、前記形状分割部により生成されたポリゴンメッシュの頂点毎にサブポリゴンに対するピクセル単位の描画に必要なパラメータを算出する複数の頂点処理部と、前記形状分割部の出力と前記複数の頂点処理部の入力とを任意に交換接続する交換部と、前記頂点処理部により算出されたパラメータ及びテクスチュアマッピングのための画像データに基づいてピクセル単位の描画データを算出するレンダリング処理部と、前記描画データを画像データとして保持すると共に、前記レンダリング処理部で前記描画データの算出に必要な少なくともテクスチュアマッピングのためのデータを保持する画像メモリとを具備することを特徴とする描画演算処理装置。

【請求項３】３次元空間に存在するオブジェクトの表面の単位形状を二次元に配列された任意の大きさの複数のサブポリゴンに分割してサブポリゴンメッシュを生成する複数の形状分割部と、前記複数の形状分割部に対して前記単位形状のデータを振り分ける入力振り分け部と、前記形状分割部により生成されたポリゴンメッシュの頂点毎にサブポリゴンに対するピクセル単位の描画に必要なパラメータを算出する複数の頂点処理部と、前記形状分割部の出力と前記複数の頂点処理部の入力とを任意に交換接続する交換部と、前記頂点処理部により算出されたパラメータ及びテクスチュアマッピングのための画像データに基づいてピクセル単位の描画データを算出するレンダリング処理部と、前記描画データを画像データとして保持すると共に、前記レンダリング処理部で前記描画データの算出に必要な少なくともテクスチュアマッピングのためのデータを保持する画像メモリとを具備することを特徴とする描画演算処理装置。

【請求項４】前記画像メモリが保持する前記少なくともテクスチュアマッピングのためのデータを読み出して前記頂点処理部に伝達するための画像読み出し経路とをさらに具備し、前記頂点処理部は、前記生成されたポリゴンメッシュの頂点に対応する前記画像メモリ中の前記少なくともテクスチュアマッピングのためのデータを前記画像読み出し経路を介して読み込み、該読み込んだデータを用いて該ポリゴンメッシュの頂点毎にサブポリゴンのピクセル単位の描画に必要なパラメータを算出する特徴とする請求項１乃至３のいずれか１項に記載の描画演算処理装置。

【請求項５】前記画像読み出し経路を介して読み込んだデータを一時保持するためのキャッシュをさらに具備することを特徴とする請求項４に記載の描画演算処理装置。

【請求項６】前記頂点処理部は、前記ポリゴンメッシュの頂点毎にサブポリゴンのピクセル単位の描画に必要なパラメータを算出する演算をそれぞれ行う複数の演算部を有し、複数の頂点に対して同時に同一プログラムに従って該演算を行うことを特徴とする請求項１乃至５のいずれか１項記載の描画演算処理装置。

【請求項７】前記複数の演算部は、前記生成されたサブポリゴンメッシュの各行について前記演算を同時に行う処理を該ポリゴンメッシュの行数だけ繰り返すことを特徴とする請求項６に記載の描画演算処理装置。

【請求項８】前記複数の演算部は、一次元に配列されると共に、配列方向に隣接する演算部間がデータ転送経路により接続され、該データ転送路を介して全ての演算部が該配列方向に隣接する演算部に対して内部データの少なくとも一部を同時に転送することを特徴とする請求項６または７記載の描画演算処理装置。

【請求項９】前記複数の演算部による前記演算の結果を連続した三角形列に組み上げて、前記レンダリング処理部へ転送する三角形列組み上げ部をさらに有することを特徴とする請求項６乃至８のいずれか１項に記載の描画演算処理装置。

【請求項１０】前記複数の形状分割部は、処理プログラムを格納するプログラムメモリを共有することを特徴とする請求項３に記載の描画演算処理装置。

【請求項１１】前記レンダリング処理部は、頂点単位のマッピングとピクセル単位のマッピングを併用して前記描画データを算出することを特徴とする請求項１乃至１
０のいずれか１項に記載の描画演算処理装置。

说明书全文

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、３次元コンピュータグラフィックス（ＣＧ）をリアルタイムに、かつ高品位に描画する描画演算処理装置に関する。

【０００２】

【従来の技術】リアルタイム３次元ＣＧを用いたゲーム機のようなシステムでは、３次元空間に存在する物体、
すなわち３Ｄオブジェクト（以下、単にオブジェクトという）の表面の単位形状を表す形状プリミティブと呼ばれるデータを入力し、これに描画を行う描画演算処理が必要となる。この処理を高速に行うためには、ハードウェアとして実現される描画演算処理装置が用いられる。

【０００３】従来の描画演算処理装置では、ポリゴンと呼ばれる平面多角形をオブジェクトの形状プリミティブとして用い、これに描画を行うことで３次元空間を表現している。具体的には、従来の画像演算処理装置は大きく「ジオメトリ処理部」と「ラスタライズ処理部」及び「画像メモリ」の三つの要素からなっており、処理はパイプライン的に行われる。

【０００４】まず、ジオメトリ処理部は形状プリミティブであるポリゴンについて頂点単位に座標変換やライティング処理を行う。また、ジオメトリ処理部は必要に応じて頂点に対応するテクスチュア座標の計算も行うが、
テクスチュア画像そのものを画像メモリから読み込むことはない。ジオメトリ処理部では処理結果としてポリゴンの頂点のスクリーン座標値、色、及びテクスチュア座標値を求め、ラスタライズ処理部に引き渡す。

【０００５】ラスタライズ処理部は、ポリゴンを画像メモリ上でピクセル単位に描画する処理を行う。ピクセル単位の色は、スムーズ・シェーディングと呼ばれる手法により、各頂点に与えられた色を線形補間して決定される。また、ラスタライズ処理部で描画を行う際に、画像メモリ上に構成するＺバッファを用いたＺバッファ法と呼ばれる隠面消去アルゴリズムにより、あるオブジェクトに隠れて見えないオブジェクトを隠す（描画しない）
手法が用いられる。さらに、ラスタライズ処理部でピクセル単位の描画処理を行う際には、画像メモリに置かれたテクスチュア画像を用いてテクスチュア・マッピングと呼ばれる２次元画像を張り付ける技術が使われる。

【０００６】テクスチュア・マッピング処理では、ジオメトリ処理部からのテクスチュア座標値を基に、ピクセル単位に画像メモリ上のテクスチュア画像領域の対応するテクスチュア画素の位置を求め、その位置の色データをテクスチュア画像領域から読み込み、先の線形補間により決定されたピクセル単位の色と演算処理して、画像メモリに書き込む色を決定する。従来では、テクスチュア・マッピング処理でのピクセル単位の演算部はラスタライズ処理部にハードウェア回路で組まれており、非常に単純な演算処理しかできなかった。

【０００７】実際のシステムの構成例としては、例えば、ジオメトリ処理部の処理をＣＰＵでのプログラムが行うもの、ジオメトリ処理部をＣＰＵに含むもの、ジオメトリ処理部とラスタライズ処理部を一つのＬＳＩで構成したもの、ラスタライズ処理部と画像メモリ部を一つのＬＳＩで構成したものがある。しかし、いずれの構成でも、ジオメトリ処理部からラスタライズ処理部への処理は、一方通行パイプラインが基本である。

【０００８】一方、さらに進んだ３次元ＣＧ技術として、ピクセル演算型の並列型グラフィックス・アーキテクチャがある。その代表例として、Molnar,S.他、“Pix
elFlow: High-Speed Rendering Using Image Compositi
on,” Computer Graphics(Proc. of SIGGRAPH '92), Vo
l.26, No.2, pp.231-240.（文献１）や、米国特許明細書第4,590,465号（文献２）及び米国特許明細書第4,78
3,649（文献３）等に開示されたPixelFlow/PixelPlane
が知られている。

【０００９】このPixelFlow/PixelPlaneは、ポリゴンをラスタライズする際に、ピクセル単位に割り当てられたＳＩＭＤ型のプロセッサが入れ替え可能なプログラムを実行するにより、ピクセル単位で複雑な手続き型演算によって色を決定し、画像メモリに書き込むことを特徴とし、これにより高度な画像表現を可能とする技術である。しかし、ピクセル単位の処理であるがゆえに、単純な表面特性しか持たない大きなポリゴンを描画するのにも、多くのＳＩＭＤプロセッサによる演算が必要であり、これを高速に実行するためには多数のＳＩＭＤプロセッサを必要とし、システムが大がかりなものとなってしまう難点がある。また、この技術ではオブジェクトの表面の位置が変位することを特徴とする変位マッピング
(displace mapping)を実装するには困難が伴う。

【００１０】

【発明が解決しようとする課題】ゲームなどのリアルタイム３次元ＣＧでは、動きのスムーズなアニメーションを表示するために、１／６０秒に代表されるフレーム時間と呼ばれる決められた時間内で可能な限り高品位な画像を表示することが求められる。

【００１１】画像生成の高速性と高品位のバランスは、
ゲーム等のアプリケーション・ソフトウェア制作者にとって最も重要な点であり、リアルタイム３次元ＣＧのための描画演算処理装置には、アプリケーション制作者がより自由に速度と画質の制御ができる構成が求められている。

【００１２】しかし、従来の描画演算処理装置では、ジオメトリ処理部での手続き型でフレキシブルな頂点処理とラスタライズ処理部での画像メモリを用いたテクスチュア処理が分離分担され、それぞれの部分で可能な表現が決められているので、速度と画質の制御方法が限られている。

【００１３】また、リアルタイム３次元ＣＧにおいて従来よりも高品位な画像を提供するために求められている技法として、現在、映画などの「非リアルタイム３次元ＣＧ」の分野で非常に高品位な画像を生成するために用いられている技法がある。これらの技法には、例えば以下のものがある。 (1) 曲面定義によるモデリングで人物や生物などのオブジェクトをリアルに表示する (2) オブジェクトの表面形状を変位させる変位マッピング(displace mapping) (3) 影を計算して描画することで、空間のオブジェクトの配置を分かり易くする (4) 実写画像からの演算で３次元ＣＧを生成する、イメージ・ベースド描画(Image-Based Rendering)手法 (5) 手続き型シェーディングでスケッチ調やイラスト調といった、ノン・フォト・リアリスティック(Non-Photo
-Relistic Rendering)手法。

【００１４】なお、「非リアルタイムＣＧ」の分野では、スクリーンに画像が表示される時の時間は決められているが、表示する画像をあらかじめ１枚１枚計算で求める時点では、画像生成の処理時間に制限はない。従って、これらの技法をリアルタイム３次元ＣＧで実現するには、より高速に描画演算処理を行うための仕組みが必要である。

【００１５】しかし、従来の画像演算処理装置の構造では、前述のようにジオメトリ部での頂点処理とレンダリング部でのテクスチュア処理が分離分担され、それぞれの処理部で可能な表現が決められているので、上記技法を用いた高度でリアリティのある画像を効率よく描画できなかった。

【００１６】「非リアルタイムＣＧ」分野での上記技法が可能な公知例としては、Robert L. Cook他、“The Re
yes Image Rendering Architecture,”Computer Graphi
cs(Proc. of SIGGRAPH'87), Vol.21, No.4, pp.95-10
2.（文献４）で提案されたREYESアーキテクチャがある。これはソフトウェアで実装され、米PIXAR社から“P
HOTOREALISTIC RENDERMAN”ソフトウェアとして販売されている。このアーキテクチャは、入力された形状プリミティブをマイクロポリゴンと呼ぶ、ピクセルの大きさ以下の小さなポリゴンに分割し、変位マッピングを含めた高度な処理をマイクロポリゴンの頂点単位にプログラマブルに行っている。

【００１７】しかし、このREYESアーキテクチャは非常に高品位な画像を生成することのみに重点を置いている。従って、リアルタイム３次元ＣＧで厳しく要求される描画時間短縮のための工夫がなく、演算に時間がかかり、そのままではリアルタイムのハードウェアに向かないアーキテクチャである。特に、基本的には全ての形状プリミティブをピクセルの大きさ以下の小さなマイクロポリゴンに分割して処理するため、膨大なマイクロポリゴンが生成され、例えば上記文献４に掲載されている例では、マイクロポリゴンの数は６８０万個にもなり、このことがリアルタイム・ハードウェアへの適応性に欠ける原因となっている。

【００１８】本発明は、このような従来技術の問題点に鑑みてなされたものであって、リアルタイム３次元ＣＧ
において、アプリケーション制作者がより自由に速度と画質の制御ができ、さらには非リアルタイムＣＧで用いられている高品位な画像生成技法をリアルタイムに実現できる描画演算処理装置を提供することを目的としている。

【００１９】

【課題を解決するための手段】上記の課題を解決するため、本発明に係る描画演算処理装置は、３次元空間に存在するオブジェクトの表面の単位形状、具体的にはポリゴンや曲面などの形状プリミティブを二次元に配列された任意の大きさの複数のサブポリゴンに分割してサブポリゴンメッシュを生成する形状分割部と、この形状分割部により生成されたポリゴンメッシュの頂点毎にサブポリゴンに対するピクセル単位の描画に必要なパラメータを算出する頂点処理部と、この頂点処理部により算出されたパラメータ及びテクスチュアマッピングのための画像データに基づいてピクセル単位の描画データを算出するレンダリング処理部と、この描画データを画像データとして保持すると共に、レンダリング処理部で描画データの算出に必要な少なくともテクスチュアマッピングのためのデータを保持する画像メモリとを有する。

【００２０】すなわち、形状分割部で生成されたサブポリゴンメッシュは、サブポリゴンが２次元構造的に並んだ構成となり、頂点処理部では各サブポリゴンの３次元頂点毎にライティングなどの計算を行う。ここで、形状分割部での分割に際して、形状プリミティブをどの程度細かなサブポリゴンに分割するかを種々の方法で指定できるようにすることで、サブポリゴンの個数を制御し、
計算時間と画像の品質を制御することが可能となる。

【００２１】また、頂点処理部ではサブポリゴンの頂点毎にプログラマブルに処理を行うことができるために、
形状プリミティブの頂点単位より細かい処理が可能となる。具体的には、例えば頂点座標を変位させることで、
変位マッピング(displacement mapping)を適用した形状プリミティブに対する描画ができる。

【００２２】また、画像メモリが保持する少なくともテクスチュアマッピングのためのデータを読み出して頂点処理部に伝達するための画像読み出し経路とをさらに備え、頂点処理部ではポリゴンメッシュの頂点に対応する画像メモリ中の少なくともテクスチュアマッピングのためのデータを画像読み出し経路を介して読み込み、この読み込んだデータを用いてポリゴンメッシュの頂点毎にサブポリゴンのピクセル単位の描画に必要なパラメータを算出するようにしてもよい。

【００２３】このように画像メモリから頂点処理部への画像メモリ読み出し経路を持つことにより、頂点単位での演算においてテクスチュア、さらにはデプスマップなどの画像データを利用でき、粗い分割のサブポリゴンメッシュにおいては、粗くて高速なテクスチュアマッピングや影付け処理を可能とし、ピクセルより細かな分割のサブポリゴンメッシュにおいてはピクセル単位以上の高品質なテクスチュアマッピングや影付け処理を施すことを可能とする。この画像データ読み出し経路にキャッシュを付加してもよく、これにより画像メモリへのアクセス回数を減らして処理速度をさらに向上させることができる。

【００２４】頂点処理部は、ポリゴンメッシュの頂点毎にサブポリゴンのピクセル単位の描画に必要なパラメータを算出する演算をそれぞれ行う複数の演算部を有し、
複数の頂点に対して同時に同一プログラムに従って演算を行うようにしてよい。

【００２５】さらに、これら複数の演算部においてサブポリゴンメッシュの各行について演算を同時に行う処理をポリゴンメッシュの行数だけ繰り返すようにしてもよい。すなわち、頂点処理部において２次元構造であるサブポリゴンメッシュに対する頂点処理に際して１次元に配列された複数の演算部にサブポリゴンメッシュの各行を割り当て、各行毎に演算を行うことで演算部の利用効率を上げ、トータルの処理速度を向上させることが可能である。

【００２６】また、このように複数の演算部を一次元に配列し、かつ配列方向に隣接する演算部間をデータ転送経路により接続して、これらのデータ転送路を介して全ての演算部が配列方向に隣接する演算部に対して内部データの少なくとも一部を同時に転送するようにすれば、
頂点処理部において隣接頂点に対する演算結果を利用することにより、法線ベクトルの計算などを容易に行うことができる。

【００２７】さらに、複数の演算部による頂点単位の演算結果を連続した三角形列(Triangle Strip)に組み上げて、画像塗り潰し処理を行うレンダリング処理部へ転送する三角形列組み上げ部を設けることで、処理効率を上げることができる。

【００２８】このようにして本発明の描画演算処理装置によると、従来の描画演算処理装置では困難であった種々の高品質描画をフレキシブルに行うことが可能となると同時に、従来の描画演算処理装置と同様の高速描画も可能であり、これらのトレードオフを容易に制御することができる。

【００２９】本発明に係る他の描画演算処理装置では、
複数の頂点処理部を有し、さらに形状分割部の出力と複数の頂点処理部の入力とを任意に交換接続する交換部を有することにより、複数のサブポリゴンメッシュに対する処理を並列に行うことで処理効率を上げ、全体の処理をより高速化することができる。

【００３０】本発明に係る更に別の描画演算処理装置では、複数の形状分割部及び複数の頂点処理部を有し、さらに複数の形状分割部に対して形状プリミティブのデータを振り分ける入力振り分け部を備えることにより、複数の形状プリミティブをサブポリゴンメッシュへ分割する処理を並列に行うことで処理効率を上げ、全体の処理をさらに高速化することができる。

【００３１】

【発明の実施の形態】以下、本発明の実施の形態について図面を参照しながら説明する。本発明に係る描画演算処理装置は、例えば図１に示したようなゲーム機などのリアルタイム３次元グラフィックスシステムで用いられる。低速バスにコントローラ１、ＤＶＤドライブ２、ハードディスクドライブ３、通信ユニット４が接続されると共に、バス・ブリッジ５を介してＣＰＵ６が接続されている。ＤＶＤドライブ２にセットされる媒体（ＤＶ
Ｄ）に、ゲームなどのアプリケーションソフトウェアが格納されている。

【００３２】このアプリケーションソフトウェアは、Ｃ
ＰＵ６によってメインメモリ７を用いて実行され、コントローラ１から入力されるユーザの操作に応じて様々な処理が行われることにより、３次元空間データが更新される。これによりＣＰＵ６から描画演算処理装置８に形状プリミティブデータが送られ、描画処理が実行される。

【００３３】演算処理装置８から出力される描画結果の画像データは、例えばＤ／Ａコンバータ９を通してビデオ信号出力となり、図示しないディスプレイに送られて表示される。ディスプレイは専用ディスプレイであってもよいし、ＴＶ受像機やコンピュータなどのディスプレイであってもよい。ディスプレイ上の表示画面をスクリーンと呼ぶ。

【００３４】以下、本発明に基づく描画演算処理装置８
の実施形態について説明する。［第１の実施形態］図２に、本発明の第１の実施形態に係る描画演算処理装置の構成を示す。この描画演算処理装置８は、形状分割部１０、頂点処理部３０、レンダリング処理部４０、画像メモリアクセス部５０、画像メモリ読み出し経路６０と該画像メモリ読み出し経路６０に挿入されたキャッシュ７０、画像メモリ８０及び画像出力部９０からなる。

【００３５】描画演算処理装置８には、図１のＣＰＵ６
から形状プリミティブのデータが入力される。形状プリミティブは、３次元空間と３次元モデルを構成する要素であり、形状プリミティブデータは３次元空間内の物体（以下、オブジェクトという）の表面の単位形状を数値データで表したものである。オブジェクトが通常の物体の場合、形状プリミティブはポリゴン（平面多角形）であり、多数のポリゴンによりオブジェクトの表面形状が表されるが、球面体、立方体、円柱体などの場合は一つの形状プリミティブで表面形状が表される。すなわち、
従来の形状プリミティブは、ポリゴンを中心とした数種類に限られていたが、本発明はそれに限定されない。

【００３６】描画演算処理装置８に入力された形状プリミティブは、まず形状分割部１０によって処理される。
形状分割部１０では、入力された形状プリミティブを種々のプログラムに従って頂点処理部３０が処理できる二次元に配列された複数のサブポリゴンに任意の方法で分割し、メッシュ構造（これをサブポリゴンメッシュという）を生成する。この場合、形状分割部３０においては分割するサブポリゴンの大きさをプログラムに従って任意に変えられることが特徴である。形状分割部１０の詳細については、後に説明する。

【００３７】頂点処理部３０は、形状分割部１０で生成されたサブポリゴンメッシュの各頂点毎にサブポリゴンのピクセル単位の描画のための演算処理を種々のプログラムによって実行し、演算結果として頂点毎のピクセル単位の描画に必要なパラメータを三角形または三角形列
(Triangle Strip)などの形式で出力して、レンダリング処理部４０及び画像メモリアクセス部５０に送る。

【００３８】ここで、頂点処理部３０においては、画像メモリアクセス部５０と画像メモリアクセス部５０から頂点処理部３０へ向けて張られた画像読み出し経路６０
及びここに挿入されたキャッシュ７０を介して、画像メモリ８０からデータを適宜読み込み、それを描画に必要なパラメータの演算処理に使用することが可能となっていることが本発明の一つの特徴である。この頂点処理部３０についても、後に詳しく説明する。

【００３９】レンダリング処理部４０は、前述した従来の描画演算処理装置におけるラスタライズ処理部に相当するものであり、頂点処理部３０から送られてきた頂点単位のデータを用いて、画像メモリアクセス部５０によりアクセスされた画像メモリ部８０に記憶保持されている画像データに対して塗り潰し（レンダリング）の処理を行う。レンダリングとは、３次元ＣＧの分野で良く知られているように、テクスチュアマッピング、隠面消去、ライティング（照明の輝度計算）、シェーディング（影付け）、アンチエイリアシング、透視変換、クリッピングなどの処理をいう。

【００４０】以下、図２の各部についてさらに詳しく説明する。（画像メモリ８０について）画像メモリ８０は、画像データを保持するメモリであり、具体的には図３に示すように、画像表示用フレーム・バッファ８０１、隠面消去用デプス・バッファ８０２、ステンシル・バッファ８０
３、テクスチュア・マップ・メモリ８０４、光源デプス・バッファ８０５及びレンダリング用フレーム・バッファ８０６からなる。これら画像メモリ８０の各部は、以下の機能を有する。画像表示用フレーム・バッファ８０
１は、ディスプレイの画面上に表示される２次元画像のデータを保持するためのフレームメモリである。この画像表示用フレーム・バッファ８０１上の２次元画像の画素は、ピクセルと呼ばれる。隠面消去用デプス・バッファ８０２は、隠面消去のためのデプス値の２次元配列を保持するデプス・バッファであり、その内容は例えばＸ，Ｙ，Ｚ座標のＺ値や１／Ｚ値である。ステンシル・
バッファ８０３は、デプス・バッファを機能拡張したもので、画素単位にアプリケーションが利用できる属性情報を保持する。

【００４１】テクスチュア・マップ・メモリ８０４は、
テクスチュアマッピングで用いられる画像（テクスチュア画像）のデータを保持するメモリである。このテクスチュア・マップ・メモリ８０４上のテクスチュア画像の画素はテクセルと呼ばれる。光源デプス・バッファ８０
５は、影付け処理のために光源から描画されるデプス・
バッファである。マルチパス・レンダリング用フレーム・バッファ８０６は、その内容がテクスチュア画像等として次の描画に利用される作業用メモリ領域としてのフレームメモリである。

【００４２】この画像メモリ８０に対するデータの読み書きは、画像メモリアクセス部５０によって行われる。
画像メモリ８０内の画像表示用フレーム・バッファ８０
１から読み出された画像データは、画像出力部９０を介して図示しないディスプレイに送出される。

【００４３】（形状分割部１０について）図４に、形状分割部１０の具体的な構成例を示す。この形状分割部１
０はプロセッサコア２０１を持ち、プログラムメモリ２
０３に置かれたプログラムに従って、データメモリ２０
４を作業領域として用いて前述した分割処理を実行する。本実施形態では、プログラムメモリ２０３及びデータメモリ２０４へのアクセスを高速化するためにキャッシュ２０２を備えているが、キャッシュ２０２を必ずしも備えなくとも構わない。また、本実施形態ではプログラムメモリ２０３及びデータメモリ２０４が形状分割部１０に含まれているが、このような構成に限られない。

【００４４】形状分割部１０は、入力される形状プリミティブ毎に、それに適した分割方法のプログラムをプログラムメモリ２０３から選択して実行し、形状プリミティブを二次元に配列された任意の大きさの複数のサブポリゴンに分割する。入力される形状プリミティブには、
例えば、ポリゴン、NURBS曲面、Subdivision曲面、線分、点群がある。このような分割処理により、形状分割部１０は入力された形状プリミティブを一つまたは複数のサブポリゴンメッシュに変換し、このサブポリゴンメッシュを頂点処理部３０へ送る。

【００４５】図５は、形状分割部１０において四角形の形状プリミティブが複数のサブポリゴンメッシュに分割される様子を示している。サブポリゴンは、頂点処理部３０での処理単位である。図５に示されるように、サブポリゴンメッシュは一つまたは複数のサブポリゴンからなる。また、一つのサブポリゴンメッシュを構成するサブポリゴンは、隣接関係から２次元的に並んでおり、隣のサブポリゴンと共有する頂点をまとめたデータ構造になっている。これにより、サブポリゴンの頂点データを独立に保持するより効率が良くなる。

【００４６】この点について、図６を用いて説明する。
図６（ａ）は、縦４個×横４個の計１６個のサブポリゴンを持つサブポリゴンメッシュがスクリーン座標（ディスプレイの表示画面の座標）へ投影された様子を示している。このサブポリゴンメッシュは、縦５個×横５個の計２５の頂点を持っている。図６（ｂ）は、サブポリゴンメッシュに含まれる１６個のサブポリゴンの隣接関係を示している。図６（ｃ）の黒丸と白丸の合計２５個は、１６個のサブポリゴンが共有する頂点であり、これは１６個のサブポリゴンが独立に頂点データを持った場合の６４個より少ない。図６（ｃ）の１６個の黒丸は、
２５個の頂点のうちで、１６個のサブポリゴンを代表する頂点を示している。図６（ｄ）は、これらの丸の位置をずらし、黒丸の頂点がサブポリゴンと対応していることを分かりやすく示している。

【００４７】一般に、縦Ｐｍ個×横Ｐｎ個のサブポリゴンを保持するサブポリゴンメッシュには、縦（Ｐｍ＋１
個）×横（Ｐｎ＋１）個の頂点がある。以下、これを縦Ｖｍ個×横Ｖｎ個の頂点と称する。例えば、サブポリゴンメッシュの最小のメッシュ構造としては、１つのサブポリゴンのみからなるメッシュがあり、これは４つの頂点を持つ。形状分割部１０は、サブポリゴンメッシュの縦または横の頂点の個数が頂点処理部３０で処理できる個数以下になるような分割を行う。

【００４８】次に、図７に示すフローチャートを用いて、形状分割部１０での形状プリミティブの分割処理の流れについて説明する。まず、形状プリミティブのデータを読み込む（ステップＳ１０１）。次に、この形状プリミティブデータから、形状プリミティブがディスプレイの画面上に描画される可能性があるかどうかをテストする（ステップＳ１０２）。このテストは、例えば形状プリミティブを包む箱または球を計算し、これがスクリーン座標系でスクリーン（ディスプレイの表示画面）の範囲の内側にあるかどうかを調べることで行うことができる。

【００４９】ステップＳ１０２でのテストの結果、形状プリミティブが画面上に描画される可能性があるとき（ステップＳ１０３でＹＥＳのとき）には、その形状プリミティブを頂点処理部３０が処理できる数までのサブポリゴンを含むサブポリゴンメッシュに変換できるかどうかをチェックする（ステップＳ１０５）。頂点処理部３０が処理できるサブポリゴンの数の上限は、装置の構成に依存する。サブポリゴンは通常四角形で、４つの３
次元頂点を持ち、頂点処理部３０によって後述のように色情報が決定される。

【００５０】頂点処理部３０が処理できる数までのサブポリゴンを含むサブポリゴンメッシュに変換できる場合には、形状プリミティブをサブポリゴンに分割し、その集まりをサブポリゴンメッシュとして構成する（ステップＳ１０７）。このとき、座標変換処理、すなわちサブポリゴンメッシュの各頂点の座標をスクリーン座標系に変換する処理は行わず、後に頂点処理部３０で行う。

【００５１】形状プリミティブを頂点処理部３０が処理できる数までのサブポリゴンを含むサブポリゴンメッシュに変換できない場合には、その形状プリミティブをさらに複数の形状プリミティブに分割し、それぞれについてループを繰り返し（ステップＳ１０６）、再度、ステップＳ１０１により分割した形状プリミティブに関して同様の処理を行う。

【００５２】形状プリミティブが画面上に描画される可能性がないとき（ステップＳ１０３でＮＯのとき）には、その形状プリミティブのデータを廃棄して（ステップＳ１０４）、ステップＳ１０８に進む。

【００５３】形状分割部１０は、前述したように入力された形状プリミティブのサブポリゴンへの分割の細かさを任意に変更できるように構成されている。形状分割部１０での分割方法はプログラムメモリ１０３にプログラムで書かれているので、このプログラムによって以下のように様々な分割方法が可能である。 (1) 入力された形状プリミティブを各サブポリゴンの大きさが、ある数のピクセルの集合より大きくなるようなメッシュに変換するプログラムを用いる。これにより、
サブポリゴンの個数を減らすことが可能となるため、描画速度を上げることができる。 (2) 入力された形状プリミティブを各サブポリゴンの大きさが、ピクセルより小さくなるようなサブポリゴンメッシュに変換するプログラムを用いる。これにより、ピクセルより小さな間隔の頂点に対して処理できるので、
形状プリミティブを高品位な技法で描画できる。例えば、曲面定義の形状プリミティブについては、完全な曲面で画面に表示できる。 (3) 入力された形状プリミティブをスクリーン座標系に投影されたサブポリゴンがピクセルと１対１で対応するようなサブポリゴンメッシュに変換する。これは、頂点処理部３０がピクセル単位の処理を行うのと同様になる。このような変換と頂点処理部３０での画像メモリ８
０からの画像メモリ読み出し機能を用いると、様々な２
次元画像処理効果が可能になる。

【００５４】一方、サブポリゴンメッシュを構成するサブポリゴンの大きさ、すなわち形状分割部１０での分割の細かさを指定する方法には、以下のように幾つかの方法がある。 (1) 形状プリミティブのデータに分割の細かさの情報を添付する。 (2) 形状分割部１０のプログラムによって、分割の細かさを動的に判断する。具体的には、決められたフレーム時間の残り時間に応じて分割の細かさを変えることで、
フレーム時間内に描画を終えるように調節する。 (3) 画面上でのサブポリゴンの大きさが指定されたピクセルサイズ以下になるまで分割を行う。例えば、形状プリミティブから変換されるサブポリゴンメッシュを構成するサブポリゴンの数が指定した上限以下の間、分割を繰り返す。また、これらの（１）〜（３）の方法を組合せた方法もある。

【００５５】（頂点処理部３０について）頂点処理部３
０は、形状分割部１０からサブポリゴンメッシュを受け取り、そのサブポリゴンメッシュを構成するサブポリゴンの頂点単位に、頂点変位や座標変換や色付けや影付けの演算を様々なプログラムで行って、レンダリング処理部４０が画像メモリ８０上で描画を行うために必要なパラメータを計算し、そのデータをレンダリング処理部４
０へ送る。以下、この頂点処理部３０の処理の概略を説明する。

【００５６】サブポリゴンメッシュに含まれる縦Ｐｍ個×横Ｐｎ個のサブポリゴンについての頂点処理部３０の処理は、縦Ｐｍ＋１個×横Ｐｎ＋１個の頂点に対して行われる。この結果から、縦Ｐｍ個×横Ｐｎ個のサブポリゴンの頂点の色を決定する。この対応関係は、先に図６
を用いて説明した通りである。

【００５７】頂点処理部３０は頂点単位で演算を行うので、与えられた頂点座標値に対しプログラムまたはデータから求めた変位を加えて新しい座標値を計算することで、従来の技術では困難であった変位マッピング(displ
ace mapping)を容易に実現できる。また、後に説明する方法で、新しい座標値を基に法線ベクトル値も計算でき、変位マッピングの結果がライティングに反映されることによって、よりリアルな画像が生成できる。この処理例については、後に図９で説明する。

【００５８】頂点処理部３０は、画像メモリ読み出し経路６０及びキャッシュ７０を介して頂点単位の演算の際に画像メモリアクセス部５０により画像メモリ８０から読み出した画像データを読み込むことができる。これにより、従来の技術では不可能であった画像メモリ８０上の頂点単位のデータの利用が可能となる。すなわち、画像メモリ読み出し経路６０を備えることによって、従来はピクセル単位での処理しか出来なかった技法がサブポリゴンの頂点単位でプログラマブルに可能になる。

【００５９】このような画像メモリ８０上の頂点単位のデータの利用の一例としては、サブポリゴンの頂点の色決定処理における画像メモリ８０上のテクスチュアマップデータの利用が挙げられる。具体的には、形状分割部１０によってサブポリゴンメッシュの頂点が画面上で任意の間隔となるように形状プリミティブを分割できるので、頂点処理部３０での処理時間と描画される画像の画質とのバランスをコントロールしつつ、テクスチュアマッピングや、デプスマップを用いた影付けが可能となる。

【００６０】例えば、テクスチュアマッピングに関しては、従来はラスタライズ処理部が持つ単純な機構によるマッピング技法しかできなかったのに対し、頂点処理部３０ではプログラム処理で様々な技法が可能となる。そして、形状分割部１０による分割の細かさ（サブポリゴンの大きさ）が可変であるので、粗い分割を行ったメッシュは、処理する頂点の少なさから、少ない処理量での大まかなマッピングが可能である。また、サブポリゴンがスクリーン座標系でピクセルより小さくなるような細かい分割を行ったサブポリゴンメッシュに対しては、ピクセル単位でのテクスチュアマッピングより高品位なマッピングに劣らない高品位なマッピングが可能である。
このように処理時間や画質のコントロールが自由にできる。

【００６１】一方、デプスマップを用いた影付けでは、
緻密な影を投影したいオブジェクトについては、形状プリミティブのサブポリゴンへの分割を細かくし、おおまかな影を高速に投影したいオブジェクトについては、サブポリゴンの分割を粗くするといったコントロールが可能となる。この影付け処理の具体的な手順については、
後に図１０で説明する。

【００６２】また、画像メモリ８０への塗り潰しを行うレンダリング処理部４０においては、従来のラスタライズ部と同様に画像メモリ８０からテクスチュア画像データを読み込む機能を持たせることにより、さらに複雑なマッピングが可能となる。例えば、サブポリゴンの頂点単位の大まかな影付けにピクセル単位のテクスチュアマッピングを重ね合わせることができる。また、テクスチュア模様の低周波部分についてはサブポリゴン単位で計算し、高周波部分はピクセル単位で計算して描画することも可能である。

【００６３】また、画像メモリ８０内に図３に示したように階層構造を持った隠面消去用デプス・バッファ８０
２を構成することで、頂点処理部３０での頂点単位の処理の早い段階で、計算された頂点のデプス値と画像読み出し経路６０を用いて読み出した隠面消去用デプス・バッファ８０２の値との比較により、予備の隠面テストが可能となる。この予備の隠面テストは、頂点が代表するサブポリゴンが他のオブジェクトより手前に来ないことだけを検査するテストである。このテストにより、頂点が代表するサブポリゴンが他のオブジェクトより手前に来ないことが分かれば、頂点の色を決定する複雑で時間のかかる処理を行う必要がないことが分かり、このような無駄な処理を中断して効率を上げることができる。

【００６４】また、形状分割部１０においてサブポリゴンの頂点とピクセルが一致するような分割を行うと、頂点処理部３０が画像読み出し経路６０及びキャッシュ７
０を介して画像メモリ８０内の画像表示用フレーム・バッファ８０１上の各ピクセルのデータを読み込み、それを使った演算結果を画像メモリ８０内の画像表示用フレーム・バッファ８０１上の各ピクセルに戻すといった処理も可能である。この処理例については、後に図１１で説明する。この処理においても、読み込んだピクセルの位置と書き込むピクセルの位置が同一である必要はない。

【００６５】これにより様々な２次元画像処理効果が可能となり、例えば画像メモリ８０内の画像表示用フレーム・バッファ８０１上の複数の領域のピクセルのデータを頂点処理部３０に入力すると、頂点処理部３０の処理内容をプログラムによって幅広く記述できることになる。

【００６６】（頂点処理部３０の出力データ形式について）頂点処理部３０が処理したサブポリゴンメッシュのサブポリゴンをレンダリング処理部４０及び画像メモリアクセス部５０へ出力する際のデータ形式には、幾つかの形式がある。

【００６７】出力データ形式の一つは、従来のラスタライザ方式でも採用されている、三角形列(Triangle Stri
p)のデータ構成である。三角形列のデータ構成とは、複数の三角形を隣接した２つの三角形で一辺を共有するように連結して配置した構造において、隣接した２つの三角形で共有する頂点（共有する一辺の両端の頂点）のデータを省く構成であり、頂点処理部３０の頂点単位の処理に合っている。

【００６８】図８に、サブポリゴンメッシュが４×４個のサブポリゴンで構成される場合の三角系列の例を示す。まず、第１列の４つのサブポリゴンから、８個の三角形を含む１０個の頂点からなる三角形列が構成される。これは、図８の４つの黒丸の頂点において処理することで得られる。なお、第２列目の左端の頂点は、サブポリゴンを代表しない頂点である。

【００６９】頂点処理部３０の出力データ形式の他の例としては、一つのサブポリゴンを２つの独立した三角形として出力する形式や、一つのサブポリゴンを２つの三角形が連結された４個の頂点を有する三角形列として出力する形式がある。これらの出力データ形式のどれが適しているかは、レンダリング処理部４０及び画像メモリアクセス部５０の構成による。

【００７０】頂点処理部３０はプログラマブルであるので、任意の処理が可能である。ここで、いくつかの処理例について説明する。（頂点処理部３０の処理例１）図９に示すフローチャートを用いて、ポリゴンメッシュデータに対する頂点処理部３０での変位マッピングも含む頂点単位の処理について説明する。

【００７１】まず、頂点の座標値から、画像メモリ８０
内のテクスチュア・マップ・メモリ８０３上の変位マップのテクスチュア座標を求める（ステップＳ２０１）。
次に、画像メモリ読み出し経路６０により、画像メモリアクセス部５０を経由して画像メモリ８０内のから変位データを読み取る（ステップＳ２０２）。この変位データにより、頂点座標に変位を加える（ステップＳ２０
３）。次に、ステップＳ２０３で算出された変位後の座標値から法線ベクトルを求める（ステップＳ２０４）。
法線ベクトルを求める方法については、後に図１６を用いて詳しく述べる。次にステップＳ２０４で得られた法線ベクトルに基づライティング計算（輝度計算）を行い、それに基づき頂点の色を算出する（ステップＳ２０
５）。描画のために、頂点座標をスクリーン座標に変換し（ステップＳ２０６）、三角方程式の係数を求めることで、頂点が代表するサブポリゴンを構成する２つの三角形データを計算する（ステップＳ２０７）。

【００７２】ステップＳ２０７で得られた三角形データを画像メモリアクセス部５０に出力すれば（ステップＳ
２０８）、処理は終了する。

【００７３】（頂点処理部３０の処理例２）図１０に示すフローチャートを用いて、画像メモリ８０内の光源デプスマップを用いて影付けを行うときの頂点処理部３０
での頂点単位での処理について説明する。まず、光源デプスマップで計算するのに適するように、頂点の座標系を光源座標系に変換する（ステップＳ３０１）。次に、
この変換された光源座標系でのＸ，Ｙ座標値から、画像メモリ読み出し経路６０及びキャッシュ７０を介して画像メモリアクセス部５０により画像メモリ８０内の光源デプス・バッファ８０５上の光源デプス（奥行き）値を読み出す（ステップＳ３０２）。

【００７４】次に、読み出した光源デプス値と光源座標系でのＺ値を比較して影に入っているかどうかを判断し、その光源からの寄与率を求める（ステップＳ３０
３）。次に、頂点の座標値から法線ベクトルを求め（ステップＳ３０４）、この法線ベクトルを使ってライティング計算を行い、これとステップＳ３０３で求めた寄与率に基づいて頂点の色を決定する（ステップＳ３０
５）。法線ベクトルを求める方法については、後に図１
６を用いてより詳しく述べる。次に、描画のために頂点座標をスクリーン座標系に変換し（ステップＳ３０
６）、三角方程式の係数を求めることで、頂点が代表するサブポリゴンを構成する２つの三角形データを計算する（ステップＳ３０７）。そして、ステップＳ３０７で得られた三角形データをレンダリング処理部４０へ出力することにより（ステップＳ３０８）、処理は終了する。

【００７５】（頂点処理部３０の処理例３）図１１に示すフローチャートを用いて、２次元画像処理の例として頂点処理部３０によって画像メモリ８０内の作業メモリ領域（レンダリング用フレーム・バッファ８０６）上の画像を縦横共に半分にした画像を生成する処理の例を説明する。

【００７６】この処理を行うには、予め形状分割部１０
においてサブポリゴンがスクリーン座標系でピクセルと同じ大きさになるようにサブポリゴンメッシュを構成する必要がある。頂点処理部３０では、各頂点に対して図１１に従った処理を行う。

【００７７】まず、頂点の座標をスクリーン座標値（Ｘ，Ｙ）に変換する（ステップＳ４０１）。このスクリーン座標値（Ｘ，Ｙ）は、画像メモリ８０内の画像表示用フレームバッファ８０１上の書き込みピクセル位置を指定するとともに、レンダリング用フレーム・バッファ８０６上の画像データの読み出し位置を指定するのに用いられる。

【００７８】Ｘ，Ｙをそれぞれ２倍した値に差分を加えていくことにより、スクリーン座標値（Ｘ，Ｙ）を持つピクセル位置に書き込まれるデータの元になるレンダリング用フレーム・バッファ８０６上の４点のデータを読み込む（ステップＳ４０２〜Ｓ４０５）。

【００７９】次に、この４点のデータの平均を計算し、
レジスタＲ５に代入する（ステップＳ４０６）。レジスタＲ５の値を頂点の色として、描画のための三角方程式の係数を求め、頂点が代表するサブポリゴンを構成する２つの三角形データを計算する（ステップＳ４０７）。
そして、ステップＳ４０７で得られた三角形データをレンダリング処理部４０及び画像メモリアクセス部５０に出力すれば（ステップＳ４０８）、処理は終了する。

【００８０】（ＳＩＭＤアーキテクチャ）図１２を用いて、頂点処理部３０のより詳細な構成を説明する。この頂点処理部３０は、一つの制御部３１０と複数の演算部３２０，３２１，…，３２Ｍを有する。演算部３２０，
３２１，…，３２Ｍの数Ｍ＋１をＣｎとする。これらの演算部３２０，３２１，…，３２Ｍは、並列計算アーキテクチャ分類では、いわゆるＳＩＭＤ(Single instruct
ion,multiple data stream)アーキテクチャである。

【００８１】すなわち、演算部３２０，３２１，…，３
２Ｍは制御部３１０内のプログラムメモリ３１３で共有する同一プログラムの各命令を同時に同一のサイクルで実行する。ＳＩＭＤアーキテクチャには、全ての演算部が同じプログラムの同じ命令を実行しなくてはならない制約があるが、一つのメッシュの頂点は通常同じ特性を持つことから、同じプログラムを実行することは制約にならない。

【００８２】一方、このようなＳＩＭＤアーキテクチャ構成にすることで、命令読み込み機構など、個々の演算部３２０，３２１，…，３２Ｍで持たずに、制御部３１
０に一つあればよい部分が多くなり、装置の構成効率が良くなる。また、後述する法線ベクトルの計算などに際して隣接頂点データを同期的に使用できるのも、ＳＩＭ
Ｄアーキテクチャの利点である。さらに、演算部３２
０，３２１，…，３２Ｍは、本実施形態では論理的に１
次元に配列されており、２次元配列より装置の構成が容易である。

【００８３】制御部３１０は、共有レジスタ群３１１、
データメモリ３１２及びプログラムメモリ３１３を有する。本実施形態では、データメモリ３１２及びプログラムメモリ３１３を制御部３１０の中に含んでいるが、これには限定されない。

【００８４】共有レジスタ群３１１は、各演算部３２
０，３２１，…，３２Ｍで共通のデータ、あるいは共有するデータを格納する。データメモリ３１２には、形状分割部１０からのデータが溜められる。このため、形状分割部１０は頂点処理部３０にデータを送り終えれば、
次の形状プリミティブに対する分割処理に移ることができる。プログラムメモリ３１３には、制御部３１０と演算部３２０，３２１，…，３２Ｍを動作させるプログラムが格納される。

【００８５】演算部３２０，３２１，…，３２Ｍは、それぞれローカルレジスタ群３２０１，３２１１，…，３
２Ｍ１とローカルメモリ３２０２，３２１２，…，３２
Ｍ２を持ち、これらと共有レジスタ群３１１を用いて演算を行う。本実施形態では、ローカルメモリ３２０２，
３２１２，…，３２Ｍ２は演算部３２０，３２１，…，
３２Ｍの中に含まれているが、外に置かれる構成でもよいが。

【００８６】さらに、ローカルレジスタ群３２０１，３
２１１，…，３２Ｍ１の相互間はデータ転送路によって接続されている。これらのデータ転送路によって、ローカルレジスタ群３２０１，３２１１，…，３２Ｍ１のうちの３２１１，…，３２Ｍ１は、演算部３２０，３２
１，…，３２Ｍの１次元配列方向において一方の側（図では左側）に隣接する演算部３２０，３２１，…，３２
Ｍ-1内のローカルレジスタ群３２１０，…，３２Ｍ-1１
から転送されたデータを受け付けることが可能となっている。これにより演算部３２０，３２１，…，３２Ｍにおいて頂点単位の演算を行う際に、隣接する頂点に対する計算結果を利用することが可能となり、後述する法線ベクトル計算などを容易に行うことができる。

【００８７】演算部３２０，３２１，…，３２Ｍでは、
基本的には各頂点に関する演算がその頂点の座標値などのデータを用いてそれぞれ独立に行われる。演算部３２
０，３２１，…，３２Ｍは、通常は異なる頂点に対して演算を行うが、データの縮退などによって、複数の演算部が同一の頂点に対する演算を行うこともあり得る。

【００８８】頂点処理部３０は、演算部３２０，３２
１，…，３２Ｍを用いてサブポリゴンメッシュの各行について同時に演算を行う。図１３に、サブポリゴンメッシュの「行」を示す。演算部３２０，３２１，…，３２
Ｍは、まず白丸で示す第１行について同時に演算を行い、次に黒丸で示す第２行について同時に演算を行い、
以下、第３行、第４行…と順次１行ずつ同時に演算を行う。

【００８９】図１４に、一つのサブポリゴンメッシュに対する頂点処理部３０での処理の流れを示す。

【００９０】まず、形状分割部１０からのサブポリゴンメッシュのデータを読み込む（ステップＳ５０１）。このサブポリゴンメッシュの第１行を演算部３２０，３２
１，…，３２Ｍの演算対象の行とし（ステップＳ５０
２）、演算対象の行の全ての頂点についての演算を演算部３２０，３２１，…，３２Ｍで実行する（ステップＳ
５０３）。演算内容は、例えば先に図９や図１０で示したものである。

【００９１】演算対象の行の演算が終了したら、まだ処理すべき次の行があるかを調べ（ステップＳ５０４）、
全て処理し終えていたら終了する。まだ処理すべき次の行があれば、それを演算対象とし（ステップＳ５０
５）、ステップＳ５０３に戻って演算を行う。

【００９２】このように頂点毎の計算は、頂点毎に独立に行われる。しかし、例えば法線ベクトルの計算と三角形方程式の係数の計算においては、隣接頂点の計算結果が必要となる。本実施形態における法線ベクトルと三角形方程式の係数の計算方法について説明する。

【００９３】（法線ベクトルの計算について）ライティング計算には法線ベクトル値が必要なので、サブポリゴンメッシュの各頂点で法線ベクトル計算が必要な場合がある。例えば、形状プリミティブが曲面の場合や、頂点にバンプマッピングや変位マッピングを加える場合である。一般に、法線ベクトルは平面や曲面の平行でない２
つの接線ベクトルの外積として求められる。

【００９４】図１５を用いて、サブポリゴンを平面とみなした場合の法線ベクトルの計算方法を説明する。なお、以下のＰＯ，ＰＬ，ＰＵ，ＰＵＬは３次元座標値である。

【００９５】一つのサブポリゴンを代表する頂点の法線ベクトルＮＯは、ＮＯ＝normalize（（ＰＬ−ＰＯ）×（ＰＵ−ＰＯ））である。

【００９６】ここで、normalize関数はベクトルの長さが１となるように正規化する演算関数である。また、×
はベクトル外積計算である。ＰＬ−ＰＯは、対象としている頂点の座標値ＰＯとその「左」に隣接する頂点の座標値ＰＬの差分である。ＰＵ−ＰＯは、対象としている頂点の座標値ＰＯと、その「上」に隣接する頂点の座標値ＰＵの差分である。

【００９７】次に、図１６に示すフローチャートを用いて、本実施形態における法線ベクトルの計算手順を説明する。図１６において、Ｒ１〜Ｒ１０は各演算部３２
０，３２１，…，３２Ｍの３次元要素または４次元要素を持つベクトル型のローカルレジスタを示す。

【００９８】まず、各演算部３２０，３２１，…，３２
Ｍが共有するプログラムは、次のようなものになる。Ｒ
３に、Ｒ１の内容を代入する（ステップＳ６０１）。Ｒ
４に、Ｒ２の内容を代入する（ステップＳ６０２）。ここで、頂点の変位された座標値の計算をＲ３とＲ４のデータを破壊しないように計算し、Ｒ１に代入する（ステップＳ６０３）。なお、Ｒ１の値は、ここ以外では書き込まないようにプログラミングする。

【００９９】ここで、「左」隣の演算部のローカルレジスタＲ１の値を読み出し、Ｒ２に代入する（ステップＳ
６０４）。なお、Ｒ２の値は、ここ以外では書き込まないようにプログラミングする。

【０１００】以上で、各ローカルレジスタにおいては、
Ｒ１に頂点の変位された座標値ＰＯ、Ｒ２に「左」の頂点の変位された座標値ＰＬ、Ｒ３に「上」の頂点の変位された座標値ＰＵ、Ｒ４に「左上」の頂点の変位された座標値ＰＵＬがそれぞれ入っているので、これらからＲ
１とＲ２のデータを破壊しないように外積を求めて正規化する。例えば、Ｒ７に、Ｒ２からＲ１をベクトル引き算する（ステップＳ６０５）。Ｒ８に、Ｒ３からＲ１をベクトル引き算する（ステップＳ６０６）。Ｒ９に、Ｒ
７とＲ８の外積を代入する（ステップＳ６０７）。Ｒ１
０に、Ｒ９ベクトルの長さが１になるように正規化演算したものを代入する（ステップＳ６０８）。というプログラムとなる。

【０１０１】その後も、Ｒ１とＲ２のデータを破壊しないようにして、頂点処理プログラムを終了まで実行する。

【０１０２】以上により、頂点単位に法線ベクトルが計算される。この図１６で説明した法線ベクトル計算は、
図９で説明した処理例１または図１０で説明した処理例２に含まれる。次に、これらの頂点毎の処理をサブポリゴンメッシュの全頂点に対して行う場合の流れについて、再度図１４と図１６を用いて説明する。

【０１０３】図１４において、ステップＳ５０３の処理は各行毎に繰り返し実行される。まず、ステップＳ５０
２からステップＳ５０３に進むとき、演算部３２０，３
２１，…，３２Ｍでは、メッシュの第１列の頂点に対して同時に頂点処理を実行する。

【０１０４】ここで、図１６の処理が開始される時点では、Ｒ１とＲ２の値は不定であり、ステップＳ６０１とステップＳ６０２でその不定値がＲ３とＲ４に入れられる。しかし、図６（ｃ）で示したように、第１行の頂点はメッシュのサブポリゴンを代表しないので、これらの値は使用されない。そして、次の行に必要な新しいＲ１
とＲ２は正常に求められる。この段階では、頂点処理部３０からサブポリゴンは出力されない。

【０１０５】次に、図１４のステップ２０５からステップ２０３に進んでくる。今度は、演算部３２０，３２
１，…，３２Ｍはメッシュの第２行の頂点に対して同時に頂点処理を実行する。ここでは、「上」列である第１
列の演算結果Ｒ１とＲ２が残っており、これらＲ３とＲ
４に代入することで、Ｒ３は「上」の頂点、Ｒ４は「左上」の頂点の座標値となる。これと新たに計算されるＲ
１とＲ２を用いて法線ベクトルが求められ、サブポリゴンの頂点の色情報が計算されて出力される。

【０１０６】なお、各行の左端の頂点においても、
「左」頂点からのＲ１の値が不定となるが、図６（ｃ）
に示すように、各行の左端の頂点もサブポリゴンを代表しないので問題ない。これら左端の頂点でも、必要な演算結果Ｒ１は求められるので、その「右」の頂点は結果を利用できる。

【０１０７】これをメッシュの全ての列に繰り返すことで、メッシュの全てのサブポリゴンの頂点に対しての法線ベクトルが求められることになる。これらの法線ベクトルからライティングの計算が正しく行える。

【０１０８】（サブポリゴンの三角方程式の係数計算について）一つのサブポリゴンのデータをレンダリング処理部４０が処理するには、例えば、従来技術のラスタライズ技術を用いる方法がある。これは図８で示したように、一つのサブポリゴンから２つの三角形を生成し、それらを三角形ラスタライズ方法で画像メモリに描画することになる。これらの三角形は、独立した三角形として処理してもよいし、図８で示すような三角形列として処理されてもよい。

【０１０９】このサブポリゴンを分割した２つの三角形は、図１５で示した代表頂点に対して、「左」の頂点と「上」の頂点と「左上」の頂点からなる三角形Ａ及び、
この代表頂点と「上」の頂点と「左」の頂点からなる三角形Ｂの２つとなる。

【０１１０】従って、法線ベクトルの計算と同様の方法で、ある頂点の「左」「上」「左上」の各頂点の頂点情報が利用できるので、それらを用いて従来の三角形ラスタライズ処理で必要な係数、例えば、三角形の各辺の傾き、デプス情報や色情報のＸ方向変位とＹ方向変位を求めることができる。

【０１１１】（レンダリング処理部４０及び画像メモリアクセス部５０について）図１７に示すように、レンダリング処理部４０は一つまたは複数の単位レンダリング処理部４００から構成され、画像メモリアクセス部５０
も一つまたは複数の単位アクセス部５００から構成される。単位レンダリング処理部４００は、基本的に頂点処理部３０からの三角形または三角形列をピクセル単位で描画する機能を有する。この機能を実現するには例えば次の２つの方法があり、単位レンダリング処理部４００
は、これらのうちの少なくとも一つの方法を実行できる。 (1) 従来のラスタライズ部と同等の頂点処理部３０から送られて来た三角形または三角形列について、それぞれの三角形を塗り潰す処理。 (2) ピクセルより小さい三角形を効率よくサンプリングして描画する。

【０１１２】一方、単位アクセス部５００は、頂点処理部３０からのデータ読み出し要求に答えて画像メモリ８
０上のデータを画像メモリ読み出し経路６００を介して頂点処理部３０に転送する機能を有する。

【０１１３】図１７における単位レンダリング処理部４
００は、上記(1)の処理を実現する三角形ラスタライザ部４１０を有する。この三角形ラスタライザ部４１０
は、入力された三角形データから三角形の塗り潰しのためのピクセル単位の繰り返し処理を行い、単位アクセス部５００を構成する画像メモリアドレス計算部５１０を使って画像メモリ８０のメモリアドレスを指定し、画像メモリ８０にピクセルデータを書き込む。この際には、
従来型アーキテクチャで用いられているスムーズ・シェーディング手法やテクスチュア・マッピング手法を適宜用いる。

【０１１４】ピクセル単位のテクスチュア・マッピング処理では、繰り返し処理において画像メモリアドレス計算部５１０を使ってテクセルのメモリアドレスを指定し、画像メモリ８０上のテクスチュアマップのテクセルデータを読み込む。

【０１１５】次に、単位アクセス部５００について説明する。本実施形態では、三角形セットアップ処理を頂点処理部３０で行う方法をとっているので、この単位アクセス部５００は比較的単純な構成となり、図１７に示すように画像メモリアドレス計算部５１０のみで実現される。

【０１１６】すなわち、単位アクセス部５００においては、頂点処理部３０からの要求によって、画像メモリ８
０上の指定された位置を画像メモリアドレス計算部５１
０を使ってメモリアドレスで指定し、画像メモリ８０からデータを読み込んで頂点処理部３０に返す。

【０１１７】（頂点処理部３０とレンダリング処理部４
０／画像メモリアクセス部５０との接続形態について）
頂点処理部３０と、図１７に単位構成を示したレンダリング処理部４０／画像メモリアクセス部５０との接続形態については、幾つかの形態がある。図１８及び図１９
にその例を示す。

【０１１８】図１８に示す形態は、レンダリング処理部４０及び画像メモリアクセス部５０が頂点処理部３０内の各演算部３２０，３２１，…，３２Ｍと同じ個数の単位レンダリング処理部４００，４０１，…，４０Ｍ及び単位アクセス部５００，５０１，…，５０Ｍをそれぞれ有し、頂点処理部３０からのデータを並列に処理する形態である。画像メモリ８０からのデータの読み出しも、
頂点処理部３０内の各演算部３２０，３２１，…，３２
Ｍと同じ個数の画像メモリ読み出し経路６００，６０
１，…，６０Ｍ及びこれらに挿入された単位キャッシュ７００，７０１，…，７０Ｍを介して並列に行われる。

【０１１９】図１９に示す形態は、レンダリング処理部／画像メモリアクセス部４０／５０が一つの単位レンダリング処理部／単位アクセス部４００／５００を有し、
頂点処理部３０からのデータを順次時分割で処理する形態である。この場合には、演算部３２０，３２１，…，
３２Ｍから出力される三角形データは、三角形組み上げ部３３を用いて三角形列に構成され、レンダリング処理部／画像メモリ４０／５０内の単位レンダリング処理部４００に送られる。

【０１２０】また、読み出し順序制御部／キャッシュ３
４は、演算部３２０，３２１，…，３２Ｍから同時に発生する画像メモリ８０に対するデータの同時読み出し要求を順次読み出し要求に変換して、レンダリング処理部／画像メモリ４０／５０内の単位アクセス部５００に送り、画像メモリ８０から順次読み出されてきた画像データを蓄え、全てが揃った時点で演算部３２０，３２１，
…，３２Ｍに同時に転送する処理を行う。従って、この構成では画像メモリ８０のアクセスには時間がかかるが、レンダリング処理部／画像メモリ４０／５０の構成が簡単になるという利点がある。

【０１２１】また、本実施形態ではキャッシュ７０（単位キャッシュ７００，７０１，…，７０Ｍ）を画像メモリ読み出し経路６０（６００，６０１，…，６０Ｍ）に備えるか、または読み出し順序制御部／キャッシュ３４
内に備えることにより、画像メモリ８０に対するアクセスを減らすことができ、画像データの読み込み速度を上げることが可能となる。

【０１２２】なお、キャッシュの位置は画像メモリ読み出し経路６０（６００，６０１，…，６０Ｍ）や読み出し順序制御部／キャッシュ３４の内部に限られるものではなく、例えば頂点処理部３０や画像メモリアクセス部５０の内部等、他の位置でも構わない。

【０１２３】［第２の実施形態］図２０は、本発明の第２の実施形態に係る描画演算装置を示している。図２と同一部分に同一符号を付して説明すると、本実施形態では複数（Ｎ＋１）個の頂点処理部３０，３１，…，３Ｎ
と、同じくＮ＋１個のレンダリング処理部／画像メモリアクセス部４０／５０，４１／５１，…，４Ｎ／５Ｎを有し、さらに形状分割部１０の出力と頂点処理部３０，
３１，…，３Ｎの入力とを任意に交換接続するための交換部２０を備えている点が第１の実施形態と異なっている。

【０１２４】各頂点処理部３０，３１，…，３Ｎは独立に動作し、互いに異なるプログラムを実行することができる。また、各頂点処理部３０，３１，…，３Ｎ間に依存関係はないため、高速に動作する回路を設計することが容易になる。

【０１２５】本実施形態においては、複数の頂点処理部３０，３１，…，３Ｎが同一個数の演算部を持つ必要は必ずしもない。例えば、頂点処理部３０，３１，…，３
Ｎの少なくとも一つが第１の実施形態で説明したような複数の演算部を持つ構成であり、他の少なくとも一つがライン型プリミティブ専用の２個の演算部を持つような構成であってもよいもよい。その場合には、交換部２０
の制御に工夫が必要になる。

【０１２６】本実施形態のように複数の頂点処理部３
０，３１，…，３Ｎを備えた構成によれば、単純に演算部を多く持つ一つの頂点処理部のみを備えた構成に比較して、より効率が向上する。

【０１２７】例えば、幅の頂点数が少ない複数のメッシュが連続して形状分割部１０から送られて来た場合を考える。このような場合、第１の実施形態のように多数の演算部３２０，３２１，…，３２Ｍを有する一つの頂点処理部３０を用いた構成では、一つのメッシュについて幅の頂点数分の演算部しか有意な演算をせず、かつ、このメッシュの処理が終わるまで、次のメッシュの処理に移ることができない。

【０１２８】これに対して、本実施形態では頂点処理部３０，３１，…，３Ｎのうちの一つの頂点処理部がある一つのメッシュの処理を行っていても、他の頂点処理部が次のメッシュの処理を行うことができるので、複数のメッシュに対して並列に演算が可能である。

【０１２９】次に、本実施形態で新たに追加された交換部２０について説明する。図２１に概略構成を示すように、交換部２０は形状分割部１０の出力と頂点処理部３
０，３１，…，３Ｎの入力との間の接続を形状分割部１
０からの要求と頂点処理部３０，３１，…，３Ｎの動作状態に応じて切り替える。図２１において形状分割部１
０からの出力線と頂点処理部３０，３１，…，３Ｎの入力線との交差部の白丸と黒丸で示すノードにスイッチが挿入され、黒丸で示すノードのスイッチがオンになっている。これにより、この黒丸で示すノードを介して形状分割部１０の出力と頂点処理部３Ｎの入力との間にデータ転送路が形成される。

【０１３０】次に、図２２に示すフローチャートを用いて、交換部２０の処理の流れを説明する。形状分割部１
０から頂点処理部３０〜４Ｎへの接続要求が起こるまで待機し（ステップＳ７０１）、形状分割部１０から接続の切断要求をうけたなら（ステップＳ７０２）、接続を解除する（ステップＳ７０３）。次に、頂点処理部３
０，３１，…，３Ｎのうちアイドル状態にあるもの（処理中でないもの）を探し、なければステップＳ７０２へ戻る（ステップＳ７０４）。頂点処理部３０，３１，
…，３Ｎに処理中でないものがあれば、形状分割部１０
の出力と処理中でない頂点処理部の入力との間のノードのスイッチをオンにして、両者を接続する（ステップＳ
７０５）。

【０１３１】［第３の実施形態］図２３は、本発明の第３の実施形態に係る描画演算処理装置を示している。図２０と同一部分に同一符号を付して説明すると、本実施形態では複数（Ｌ＋１）個の形状分割部１０，…，１Ｌ
と、これらの形状分割部１０，…，１Ｌに入力を振り分ける入力振り分け部１００を有する。

【０１３２】入力振り分け部１００は、複数の形状分割部１０，…，１Ｌのうち処理を行っていないものを探し、その形状分割部に対して描画演算処理装置に入力されたデータ及びプログラムを送り込む。

【０１３３】交換部２１は、第２の実施形態における交換部２０に複数の形状分割部１０，…，１Ｌからの接続要求を制御できる機能を追加し、一つの形状分割部の出力と一つの頂点処理部の入力との間にデータ転送路を形成するものであり、図２４に示すように形状分割部１
０，…，１Ｌからの出力線と頂点処理部３０，３１，
…，３Ｎの入力線との交差部の白丸と黒丸で示すノードにスイッチが挿入され、黒丸で示すノードのスイッチがオンになっている。これにより図２４の例では、黒丸で示すノードを介して形状分割部１０の出力と頂点処理部３Ｎの入力との間、及び形状分割部１Ｌの出力と頂点処理部３０の入力との間にそれぞれデータ転送路が形成される。

【０１３４】形状分割部１０，…，１ＬがＳｎ個ある場合には、データ転送路としては同時に最大Ｓｎ個のデータ転送路を構成でき、形状分割部１０，…，１Ｌを効率良く動作させることが可能となる。交換部２１の処理の流れとしては、先に説明した図２２に示すフローチャートのステップＳ７０１，Ｓ７０２において、複数の形状分割部１０，…，１Ｌからの接続要求及び切断要求の有無を検査するように変更すればよい。

【０１３５】本実施形態において、複数の形状分割部１
０，…，１Ｌは独立にプログラムを実行して独立に動作し、同一または異なるプログラムに従って、入力された形状プリミティブを分割する。形状分割部１０，…，１
Ｌの一つの構成例としては、各形状分割部１０，…，１
Ｌが独立したインストラクション・メモリを持つ構成である。形状分割部１０，…，１Ｌの別の構成例としては、大型の共有プログラムメモリを持ち、各形状分割部１０，…，１Ｌがインストラクション・キャッシュを持つ構成であり、プログラムメモリを効率的に持つことができる。

【０１３６】第２の実施形態では、形状分割部１０が一つであったため、一つの形状プリミティブの処理が終了するまで、次の形状プリミティブは処理できなかった。
従って、複数の頂点処理部３０，３１，…，３Ｎの全てが動作しない場合がある。これに対し、この第３の実施形態では複数の形状分割部１０，…，１Ｌが並列に動作することで、単位時間当たりに頂点処理部３０，３１，
…，３Ｎへ送ることができるメッシュデータが増えることにより、処理性能を上げることができる。

【０１３７】また、ある形状分割部で分割演算に時間がかかる形状プリミティブを処理している場合、分割演算に時間がかからない後続の形状プリミティブを他の形状分割部が先に分割して頂点処理部に送ることで、さらに効率を上げることができる。

【０１３８】

【発明の効果】以上説明したように、本発明の描画演算処理装置によれば、形状プリミティブを複数のサブポリゴンに分割してサブポリゴンメッシュを生成する際の分割の細かさを任意に可変とすることにより、アプリケーション制作者が描画の速度と画質の制御を容易に行うことが可能となる。

【０１３９】また、画像メモリに格納されたテクスチャアデータなどを用いたより高度な描画技法を頂点単位で用いることが可能であり、さらに効率よく頂点単位の処理を行うことができる。

【０１４０】また、複数の頂点処理部を用いて複数のポリゴンメッシュに対する頂点処理を同時に行うことにより、頂点処理の能力を上げ、同じ時間内により高画質な画像の生成が可能となる。

【０１４１】さらに、複数の形状分割部を用いて複数の形状プリミティブに対する分割処理を同時に行うことにより、形状プリミティブの処理能力を上げ、同じ時間内により高画質な画像の生成を可能とすることができる。

【図面の簡単な説明】

【図１】本発明に係る描画演算処理装置が適用されるリアルタイム３次元コンピュータグラフィクスシステムの構成を示すブロック図

【図２】本発明の一実施形態に係る描画演算処理装置の構成を示すブロック図

【図３】描画演算処理装置内の画像メモリの構成を示すブロック図

【図４】描画演算処理装置内の形状分割部の構成を示すブロック図

【図５】形状分割部で四角形の形状プリミティブが複数のサブポリゴンメッシュに分割される様子を示す図

【図６】サブポリゴンメッシュがスクリーン座標への投影された様子とサブポリゴンメッシュに含まれるサブポリゴンの隣接関係とサブポリゴンの頂点及び頂点とサブポリゴンの対応について示す図

【図７】形状分割部での形状プリミティブの分割処理の流れを示すフローチャート

【図８】４×４のサブポリゴンメッシュと三角形列の関係を示す図

【図９】描画演算処理装置内の頂点処理部での頂点単位の処理の流れの一例を示すフローチャート

【図１０】頂点処理部での頂点単位の処理の流れの他の例を示すフローチャート

【図１１】頂点処理部での２次元画像処理の頂点単位の処理の流れの一例を示すフローチャート

【図１２】頂点処理部の構成を示すブロック図

【図１３】サブポリゴンメッシュの「行」を説明する図

【図１４】一つのサブポリゴンメッシュに対する頂点処理部での処理の流れを示すフローチャート

【図１５】一つのサブポリゴンの代表頂点と「左」
「上」及び「左上」頂点について示す図

【図１６】頂点処理部での頂点単位の法線ベクトル計算の流れの一例を示すフローチャート

【図１７】描画演算処理装置内のレンダリング処理部及び画像メモリアクセス部の構成単位を示すブロック図

【図１８】頂点処理部とレンダリング処理部及び画像メモリアクセス部の接続形態の一例を示すブロック図

【図１９】頂点処理部とレンダリング処理部及び画像メモリアクセス部の接続形態の他の例を示すブロック図

【図２０】本発明の第２の実施形態に係る描画演算処理装置の構成を示すブロック図

【図２１】同実施形態に係る描画演算処理装置内の交換部の構成を示す図

【図２２】図２１の交換部の処理の流れを示すフローチャート

【図２３】本発明の第３の実施形態に係る描画演算処理装置の構成を示すブロック図

【図２４】同実施形態に係る描画演算処理装置内の交換部の構成を示すブロック図

【符号の説明】

１０，１Ｌ…形状分割部１０１…プロセッサコア１０２…キャッシュ１０３…プログラムメモリ１０４…データメモリ２０，２１…交換部３０，３１，…，３Ｎ…頂点処理部３１０…制御部３１１…共有レジスタ群３１２…データメモリ３１３…プログラムメモリ３２０，３２１，…，３２Ｍ…演算部３２０１，３２１１，…，３２Ｍ１…ローカルレジスタ群３２０２，３２１２，…，３２Ｍ２…ローカルメモリ４０…レンダリング処理部４００，４０１，…，４０Ｍ…単位レンダリング処理部４１０…三角形ラスタライズ部５０…画像メモリアクセス部５００，５０１，…，５０Ｍ…単位アクセス部５１０…画像メモリアドレス計算部６０，６００，６０１，…，６０Ｍ…画像メモリ読み出し経路７０…キャッシュ７００，７０１，…，７０Ｍ…単位キャッシュ８０…画像メモリ８０１…画像表示用フレーム・バッファ８０２…隠面消去用デプス・バッファ８０３…ステンシル・バッファ８０４…テクスチュア・マップ・メモリ８０５…光源デプス・バッファ８０６…レンダリング用フレーム・バッファ９０…画像出力部１００…入力振り分け部

标题	发布/更新时间	阅读量
基于LOD的web端室内场景轻量化加载方法	2020-05-12	855
一种无人机任意图形禁飞区识别导航系统	2020-05-13	798
一种图形绘制方法、装置及计算机可读介质、设备	2020-05-16	471
视频切换方法、装置及显示控制设备	2020-05-08	460
一种大规模倾斜摄影模型组织与调度方法	2020-05-12	1028
基于位置信息的无线局域网认证方法	2020-05-16	724
3D文字渲染方法、介质、设备及装置	2020-05-17	779
一种显示控制方法	2020-05-15	172
基于图计算的大数据处理方法和装置	2020-05-17	928
地图实时纠偏方法、电子设备及存储介质	2020-05-11	811

Plotting arithmetic processor

【発明の詳細な説明】

该功能需要专业版企业版VIP权限，您可以：