首页 / 专利库 / 电脑零配件 / 计算机系统 / 高可用性计算机系统 / Radial arm memory bus for high-availability computer system

Radial arm memory bus for high-availability computer system

阅读:956发布:2020-07-09

专利汇可以提供Radial arm memory bus for high-availability computer system专利检索,专利查询,专利分析的服务。并且PROBLEM TO BE SOLVED: To provide a high-availability function and an improved disconnection together with a memory configuration for minimizing the capacitive load of board trace while suppressing the influence of capacitive load by a memory device at a minimum.
SOLUTION: This memory is configured with a memory controller, a signal central switch, a data bus electrically coupled to the memory controller and the central switch and plural N memory modules. In this case, each of plural N memory modules is radially connected to the central switch by a correspondent memory modules bus. The central switch is physically located on a memory board and made effective for providing a point-to-point bus between the memory controller and a memory device on the memory module in the combination with the parallel connection of the memory module. For use with a high- availability fault allowance system, the memory modules are units exchangeable on the job site and are electrically disconnected.
COPYRIGHT: (C)2001,JPO,下面是Radial arm memory bus for high-availability computer system专利的具体信息内容。

【特許請求の範囲】
  • 【請求項1】メモリコントローラと、 データバスによって前記メモリコントローラに電気的に結合された単一の中央スイッチと、 それぞれが少なくとも1つのメモリデバイスを含む、複数のN個のメモリモジュールとを含み、 前記単一の中央スイッチと前記メモリコントローラとがマザーボードに取り付けられ、 前記複数のN個のメモリモジュールのそれぞれが、その対応するメモリモジュールバスによって前記単一の中央スイッチに放射状に接続される、メモリ構成。
  • 说明书全文

    【発明の詳細な説明】

    【0001】

    【発明の属する技術分野】本発明は、メモリシステム用の高速バスの提供に関し、より具体的には、バスの実効キャパシタンスを減少させることによってバス上のトランザクション速度を高め、メモリモジュール間の分離を改善することによって高稼働率の機能を使用可能にする高稼働率サーバ用のメモリシステムを提供することに関する。

    【0002】

    【従来の技術】コンピュータとその中央処理装置「CP
    U」が命令をより高速で実行できるようになるにつれて、メモリ命令の処理速度を高めることが同時に必要になっている。 メモリデバイスの代表的なデータ読取り動作を実行する際、メモリコントローラ(通常はCPU、
    またはより大きなシステムでは専用メモリコントローラ)は、特定のメモリチップに読取りコマンドを送る。
    このコマンドは、コマンドバスの1つまたは複数の線に沿ってチップに伝えられる。 特定のチップがコマンドを受け取ると、そのコマンドにより、チップは、メモリコントローラ用のリターンデータ信号として内部メモリアレイからの出をデータバス上に位置づけて送る。 次に、この出力は、データバスに沿って伝わる。 この出力は、コマンドバスと同じ経路を移動する場合、または同じ経路を移動しない場合がある。 前述の例において、コントローラからチップへの読取りコマンドの伝播時間、
    チップがその内部レジスタに電力を供給してデータバス上に適切な出力を伝えるのに必要な時間、およびコントローラに出力が戻るのに必要な伝播時間を含む3つの時間遅延の原因がある。

    【0003】同様に、メモリデバイスに典型的なデータ書込み動作を行う際、メモリコントローラは、特定のメモリチップに、書き込まれるべきデータと一緒に書込みコマンドを送る。 このコマンドは、コマンドバスの1つまたは複数の線に沿ってチップに伝えられ、データは、
    データバスの1つまたは複数の線に沿ってチップに伝えられる。 特定のチップがコマンドを受け取ると、チップは、そのコマンドにより、データバスからその内部メモリアレイの指定場所にデータを伝える。 データバスに沿って伝わるデータは、コマンドバスに沿って伝わるコマンドと同じ経路を進むか、または同じ経路を進まないことがある。 前述の例では、コントローラからチップへの書込みコマンドの伝播時間、データがコントローラから伝わるのに必要な時間、およびチップがその内部レジスタに電力を供給しデータバスからデータを伝えるのに必要な時間を含む3つの時間遅延の原因がある。

    【0004】一般に、設計努力は、主にメモリチップ内の命令の内部経路指定および命令処理の改善に傾けられてきた。 しかしながら、そのような設計努力は、より応答の速いメモリデバイスを提供し続けるが、データバスに沿った伝播遅延の主な原因であるデータバスの固有キャパシタンスには対処していない。 その結果、多くのシステムは、データバスを介してCPUの動作速度よりもはるかに低い転送速度でデータを送っている。

    【0005】図1Aと図1Bを参照して、データバスの固有キャパシタンスの問題をさらに詳しく説明する。 図1Aと図1Bは、メモリシステム100内のデータ経路を示す。 図示されたメモリシステム100は、SDR
    (Single Data Rate:シングルデータレート)またはD
    DR(Double Data Rate:ダブルデータレート)のSD
    RAMメモリシステム用に構成される。 データ経路は、
    メモリコントローラ102、マザーボード103、メモリチップ104、メモリモジュール105、およびデータバス106を含む。 データバス106は、ボードトレース部分107、モジュールトレース部分108、コネクタ109および終端器110を含む。

    【0006】メモリコントローラは、マザーボードに取り付けられ、メモリモジュールが並列に接続されるようにデータバスを介してメモリチップに電気的に接続される。 メモリチップは、メモリモジュールに取り付けられる。 データバスのボードトレース部分が、マザーボードに取り付けられ、データバスのモジュールトレース部分が、メモリモジュールに取り付けられる。 コネクタ10
    9は、ボードトレース部分をモジュールトレース部分へ電気的に接続し、メモリモジュールをマザーボードに機械的に取り付ける。

    【0007】図1Bは、図1Aに示したデータ経路の電気的等価物111を示す。 参照を容易にするために、図1Aに示された構成要素を表す図1Bの各電気的等価物は、図1Aに示した構成要素に接尾文字「A」を付けた参照数字で示している。 ボードトレース部分107A
    が、1組のインピーダンス特性と伝送遅延特性を有する伝送線112として共に挙動する誘導要素と容量要素からなることに注意されたい。 同様に、各モジュールトレース部分108Aは、それ自体のインピーダンス特性と伝送遅延特性の組をそれぞれ有する伝送線113として共に挙動する誘導要素と容量要素からなる。

    【0008】ボードトレース部分107Aは、抵抗器1
    10Aによって適切に終端されたとき、固有キャパシタンスのないほぼ完璧な伝送線(図示せず)としての役割を果たし、それ自体はメモリシステムの動作速度を制限しない。 しかしながら、ボードトレース部分107Aがモジュールトレース部分108Aと結合されるとき、モジュールトレース部分108Aは、ボードトレース部分107Aから分かれる伝送線スタブとしてはたらく。 そのようなスタブは互いに、メモリシステムにおいて信号の完全性を低下させる著しい信号反射を含む「くし型フィルタ」効果を有する。 この「くし型フィルタ」効果は、データバスに負荷をかけ、実質的にボードトレース部分107Aを個々のボードトレース部分の伝送線11
    3に分割する。

    【0009】「くし型フィルタ」効果によってもたらされた負荷は、ボードトレース部分107Aとモジュールトレース部分108Aの両方にデータが伝わる最大伝送速度を制限する。 スタブによってもたらされる「くし型フィルタ」効果は、一般に、それぞれのモジュールトレース部分108Aの長さが長くなるほど大きくなる。 同様に、スタブによってもたらされる「くし型フィルタ」
    効果は、一般に、それぞれのモジュールトレース部分1
    08Aの長さが短くなるほど小さくなる。 メモリコントローラ102Aからメモリチップ104Aへ送られるデータ信号の伝播遅延の第2の原因は、各メモリチップに関連する誘導要素114と容量要素115である。 誘導要素と容量要素は共に、モジュールトレース部分108
    Aとボードトレース部分107Aの両方を含むデータバスに容量性負荷をかける。 「くし型フィルタ」効果によってもたらされる負荷およびメモリチップ素子によってもたらされる容量性負荷は一緒になって、メモリバス上に固有の分布キャパシタンス負荷を形成する。

    【0010】コンピュータメモリシステム用の別の一般的メモリ構成は、RAMBUSメモリ構成である。 図2
    は、従来のRAMBUSメモリシステムのデータ経路の電気的等価物を示す概略図を示す。 データ経路は、メモリコントローラ202、メモリモジュール205、およびデータバス206を含む。 データバスは、ボードトレース部分207、モジュールトレース部分208、コネクタ209、および終端抵抗器210を含む。 メモリモジュールが並列に接続された図1Aと図1Bに示したメモリ構成とは異なり、図2に示したRAMBUS構成では、メモリモジュールは、直列に接続される。 さらに、
    コネクタ誘導要素209は、図1Aと図1Bに示した同じ数のメモリモジュールを有する等価なメモリ構成の2
    倍の頻度で生じる。

    【0011】ボードトレース部分207は、1組のインピーダンス特性と伝送遅延特性を有する伝送線として共に作用する誘導要素と容量要素からなる。 同様に、各モジュールトレース部分208は、それぞれがインピーダンス特性と伝送遅延特性の組をそれ自体有する伝送線2
    13として共に作用する誘導要素と容量要素からなる。
    しかしながら、ボードトレース部分207がモジュールトレース部分208と結合されるとき、モジュールトレース部分208は、信号の速度と完全性を低下させるボードトレース部分207から分かれる伝送線スタブとしてはたらく。

    【0012】図1Aと図1Bに示した構成は、図2に示した構成と比べて、ボードトレース部分によるデータバス上への負荷の影響を減少させる。 しかしながら、図2
    に示した構成では、モジュールトレース部分213によるデータバス上への実効負荷が大きくなるため、一般に、バスのインピーダンスは減少しない。 実際に、RA
    MBUS構成のメモリモジュールは、並列ではなく直列に接続されるため、データバス上の実効負荷は、一般に、図1Aと図1Bに示した構成よりも実質的に大きくなる。

    【0013】一般に、図1Aと図1Bに示した並列構成は、部分的にはメモリデータバス上の容量性負荷が比較的小さいため、図2に示したRAMBUS構成よりも好ましい。 しかしながら、RAMBUS構成には他の問題がある。 1つの大きい問題は、有効なDIMM分離がないことである。 データバスに接続されるDIMMモジュールの数が多くなるほど、DIMMが故障する可能性が大きくなる。 図2に示した並列構成は、DIMM分離を提供するが、RAMBUS構成の直列の特徴は、事実上DIMM分離を提供しない。 したがって、たとえばスタック出力ビットで1つのDIMMモジュールが故障すると、RAMBUSメモリシステム全体が故障する。 同様に、直列RAMBUS構成でのコネクタの故障は、メモリシステムの故障の原因となる。 さらに、RAMBUS
    モジュールが取り外されると、バスが切断される。 故障の可能性があるため、RAMBUS構成は、企業顧客の人気のある選択肢になりつつある高稼働率システムの好ましい選択肢でなない。

    【0014】他のメモリ構成は、メモリバスにおける固有キャパシタンスの問題をいくつかの方法で解決しようとしている。 1つの解決策は、バスのモジュールトレース部分をボードトレース部分から電気的に分離するために、データバスのモジュールトレース部分に直列抵抗器を入れることである。 この技法は、66MHzまでの周波数には首尾良く使用されたが、それよりも高い周波数ではあまり良好ではない。 もう1つの解決策は、データバスをセクションに分割するFETスイッチをマザーボード上に提供することである。 たとえば、4つのメモリモジュールの1組を電気的に独立した2つのグループの2つのモジュールに分離するためにスイッチマルチプレクサが使用された。 この手法は、それぞれが元の大きいバスの固有キャパシタンスよりも小さい固有キャパシタンスを生じさせる2つの小さいメモリバスを作成する。
    しかしながら、そのような小さいバスのそれぞれは、依然としてデータバス上に固有のキャパシタンス負荷を有し、スイッチ自体が容量性負荷を増大させ、ひいては信号の伝播速度が制限されていた。

    【0015】図3Aと図3Bを参照して、メモリバスにおける固有のキャパシタンスに関する問題のもう1つの解決策について示し説明する。 図3Aは、1997年10月30
    日に出願された米国特許出願第08/960,940号の「Capacitance Reducing Memory System Device,and
    Method」と題する関連特許出願に記載されたスイッチ制御式メモリモジュール構成の側面図である。 図3Bは、
    図3Aに示したスイッチ制御式メモリモジュール構成の電気的等価物を示す概略図である。 分かりやすくするために、図3Bに示した項目の電気的等価物は、図3Aの項目と同じ参照番号に接尾文字「A」が付けられている。

    【0016】図3Aを参照すると、メモリデバイス32
    2とスイッチ329は、モジュールを単に追加するか、
    またはモジュールのうちのいくつかまたはすべてを交換することによりメモリシステム構成を容易に変更することができる脱着可能なメモリモジュール324に取り付けられることが好ましい。 各メモリモジュール324
    は、コネクタ326によってメインボード325に機械的に取り付けられる。 コネクタは、メモリコントローラとメモリデバイスとの間のすべての電気接続を提供する。 電気接続は、メインボード327上のデータバス部分とモジュール328上のデータバス部分との間の相互接続を含む。

    【0017】図3Bを参照すると、スイッチ329Aが開いた位置にある(端子335と336が電気的に切り離されている)場合、開いたスイッチと関連するメモリデバイス322Aは、スイッチとメモリデバイスとの間のデータバス部分であるようにデータバスから切り離される。 これは、データバスから電気的に切り離されたメモリデバイスが、データを送ったり受け取ったりすることができないということを意味する。 また、これは、スイッチとメモリデバイスとの間のデータバス部分がデータバスから切り離され、モジュール部分328Aのスタブの長さを増大させないことを意味する。 さらに、スイッチが開かれていることによりデータバスから切り離されたメモリデバイス322Aの容量性負荷は、データバス上の全体の容量性負荷にもはや奇与しなくなり(メモリコントローラおよび結合されたメモリデバイスから見たとき)、メモリコントローラと結合されたメモリデバイスとの間のデータ転送速度が速くなる。

    【0018】ボード部分327Aは、直列の伝送線33
    3を含む。 モジュール部分328Aはそれぞれ、ボード部分327Aから分かれる伝送線スタブを形成する伝送線334を含む。 そのように形成された各スタブは、ボード部分327Aとモジュール部分328Aを含むデータバス上に負荷をかける「くし型フィルタ」効果をデータバス上に生じさせる。 この「くし型フィルタ」効果によって生じる負荷は、通常、ボード部分327Aに取り付けられたモジュール部分328Aの数と各モジュール部分328Aの長さの両方に比例する。 図1A、図1B
    および図2に示したメモリ構成と比べて、図3Aと図3
    Bに示した各メモリモジュール上にFETスイッチを有するメモリ構成は、データバスから切り離されるかまたは電気的に結合されていないメモリデバイスの容量性負荷をなくすことによって、メモリモジュールによる容量性負荷を減少させるのに役立つ。 これにより、くし型フィルタ効果が減少し、それによりデータバスのデータ転送速度が速くなる。

    【0019】図3Aと図3Bに示した構成は、図2に示した実施態様よりも分離を改善するが、コネクタが故障した場合のシステムの故障を防ぐのに十分な分離をまだ提供していない。 さらに、図3Aと図3Bに示した実施態様は、2つ以上のメモリモジュールに同時の書き込みを行う能力を提供しない。 これらの特徴は両方とも、高稼働率コンピュータシステムにおいては望ましい。

    【0020】しかしながら、図3Aと図3Bに示した実施態様の問題は、図1Aと図1Bに示した実施態様と比べてくし型フィルタ効果を減少させるが、図3Aと図3
    Bに示した実施態様におけるアクティブDRAMへのトレースが、データバス上にスタブをまだ形成していることである。 図3Aと図3Bに示した実施態様のさらなる問題は、メモリシステムのボード部分327Aのために容量性負荷があまり減少しないことである。 しばしば、
    これは、信号遅延の最も大きな要因となり、図3Aと図3Bの構成によって大幅に減少するメモリデバイスの容量性負荷ではない負荷(327A)である。 ボード32
    7Aによる容量性負荷は、特にコンピュータシステム内のボードとDIMMの数が増えるほど大きな問題となる。 ハイエンドサーバにおける大容量メモリの顧客需要が増大しているため、小型サーバまたはローエンドサーバよりも大型サーバまたはハイエンドサーバの方が低いメモリシステム性能を有するという異常な挙動が見られることがある。 この低い性能は、おおくの場合大きいC
    PUキャッシュを追加することによって補償することができる。 しかしながら、大きいCPUキャッシュを追加すると、システムのコストが大幅に高くなることがある。

    【0021】

    【発明が解決しようとする課題】高稼働率機能を提供し、改善された分離を提供し、メモリデバイスへの容量性負荷の影響を依然として最小限に抑えつつボードトレースによる容量性負荷を大幅に最小にするメモリシステムが必要である。

    【0022】

    【課題を解決するための手段】本発明は、メモリデバイスによる容量性負荷の影響を依然として最小限に抑えつつボードトレースによる容量性負荷を最小にするメモリ構成を提供し、高稼働率機能を提供し、および改善された分離を提供する。 メモリ構成は、メモリコントローラと、データバス上の容量性負荷を減少させるようにメモリコントローラをN個のメモリモジュールに接続するために使用される単一の中央1:Nスイッチを含む。 このメモリ構成は、メモリコントローラ、中央スイッチ、メモリコントローラと中央スイッチに電気的に結合されたデータバス、および複数のN個のメモリモジュールを含み、複数のN個のメモリモジュールはそれぞれ、独立したメモリモジュールバスによって中央スイッチング手段に放射状に電気接続される。

    【0023】好ましいメモリ構成において、中央スイッチは、N個のメモリモジュールのすべてに対するスイッチとしてはたらく。 中央スイッチは、マザーボード上のメモリモジュールの中央とそのメモリモジュール間に物理的に配置されることが好ましい。 このメモリ構成により、事実上、メモリコントローラとメモリモジュール上のメモリデバイスとの間のポイントツーポイントバスが得られる。 このメモリ構成により、本質的に、データバスに電気的に接続されていないメモリモジュール間のボードトレースによるインピーダンスがなくなる。 この構成によってそのようなモジュール間のインピーダンスがなくなることは、メモリモジュールのアクティブDRA
    Mへのボードトレースがバス上にスタブを形成せず、くし型フィルタ効果がなくなることを意味する。

    【0024】メモリモジュール間のボードトレースの容量性負荷の影響が事実上なくなるため、データバスの速度を低下させることなく多数のメモリモジュールをシステムに追加することができる。 これは、メモリのニーズが高くなっている今日では特に重大である。 したがって、本発明の構成によれば、データバスの速度を低下させることなくシステムメモリサイズを実質的に大きくすることができる。

    【0025】このメモリ構成によって提供されるポイントツーポイントバスは、伝送線反射が大幅に減少されるため、メモリシステムの設計をより容易にする。 さらに、このメモリ構成の「スタブレス」ポイントツーポイントアームは、容量性負荷が大幅に減少するため、データ転送速度をより高速にする。 くし型フィルタ効果がなくなるため、システムは、メモリモジュールの最大周波数の近くで動作することができる。 したがって、ポイントツーポイントバス構成によって、コアDDR周波数の「近く」でクロッキングすることができる。 代替として、SDR周波数が使用される場合は、一定の速度でマージンを大幅に大きくすることができる。

    【0026】中央1:Nスイッチは、データ選択回路とデコーディング回路とを含むことが好ましい。 データ選択回路とデコーディング回路の組合せは、アクセスするメモリモジュールを選択するのに役立つ。 データ選択回路は、データフローの方向を決定し、アクティブなメモリチャネルを選択するトランシーバ回路を含むことが好ましい。

    【0027】このメモリ構成は、改善された分離を提供する。 一般に、モジュールのうちの1つまたはモジュールコネクタに関する問題は、主データバスに影響を及ぼさない。 たとえば、2つのコネクタピンが短絡した場合、故障したコネクタを有するメモリモジュールはメモリシステムにおいて使用できなくなるが、残りのメモリモジュールは、コネクタの短絡による影響を受けない。
    さらに、本発明のメモリ構成は、メモリモジュールを互いに分離するのに役立ち、その結果、適切なサポートにより、中央スイッチの1つのアーム(arm)に挿入されたモジュールが他のアームを妨害しないため、メモリボードを容易にホットスワップ(hot swap:通電状態で交換する)することができ、それにより、メモリシステムの高稼働率機能が高くなる。 各モジュールが、データバスの独立したアームまたはチャネル上に配置され、より高レベルの冗長性が実現可能なため、ホットスワップが部分的に実行可能になる。

    【0028】さらに、このメモリ構成は、冗長なメモリ機構を実現する際の柔軟性を可能にする。 メモリモジュール構成によって提供される分離は、実質的に性能に影響を及ぼすことなく直列バスまたは並列バスでは不可能な同時のメモリ動作(読取り、書込み)を可能にする。
    メモリ構成は、システムが、同一のデータを複数のメモリモジュールに同時に一度に書き込むことを可能にする。 これは、メモリのミラーリングのとき、冗長系において「予備」モジュール上にデータを再構築するとき、
    あるいは複数のメモリチャネルに同一のデータが同時に書き込まれるメモリ初期化(ECCメモリ初期化など)
    を実行するときに有効である。 また、より高い性能の用途では、中央スイッチにレジスタが使用される場合に、
    一度に複数のメモリモジュールから中央スイッチに読み取ることができ、また、コントローラからメモリチップまでの遅延が2つに分断されるためより高いクロック周波数で動作することができる。 また、CMOS SST
    L−2中央スイッチは、通過するデータバス信号の信号レベルを復元する。

    【0029】本発明の特徴と利点は、本明細書の残りの部分と図面を参照してさらによく理解することができる。

    【0030】

    【発明の実施の形態】図4Aは、本発明による放射状アームメモリバス構成400の側面図である。 本発明のメモリ構成400は、メモリコントローラ421と、データバス427上の容量性負荷を減少させるようにメモリコントローラ421をメモリモジュール424上のメモリデバイス422に接続するために使用されるインテリジェント中央1:Nスイッチ429とを含む。 図4Bを参照すると、メモリ構成は、メモリコントローラ42
    1、中央スイッチ429、メモリコントローラと中央スイッチング手段に電気的に結合されたデータバス、および複数のN個のメモリモジュール424を含み、複数のN個のメモリモジュール424はそれぞれ、その対応するメモリモジュールバス460a、460b、460
    c、460dによって中央スイッチに放射状または個別に電気接続される。

    【0031】好ましい実施態様において、メモリモジュール424は、データバスに放射状に接続される。 図5
    Aは、図3Aと図3Bに示したような並列バス構成の高レベルな代表図を示す。 図5Bは、図4A〜図4Cに示したような放射状アームバス構成の高レベルな代表図を示す。 図5Aを参照すると、並列構成は、データバスに沿った分布負荷を有し、図示した構成では、メモリモジュール間のボードトレースの長さはqである。 これと対照的に、放射状構成は、各負荷に接続されたアームを有する中央ハブまたはスイッチを含み、メモリコントローラから見た図5Aのボードトレースqの有効長はゼロであり、ポイントツーポイントバスを提供する。

    【0032】図4Aを参照すると、中央スイッチング手段429は、マザーボード425に取り付けられることが好ましく、様々なメモリモジュールへの接続のトレース密度を小さくするためにメモリモジュールの中心位置にあることが好ましい。 メモリデバイス422は、メモリモジュールを単に追加するか、またはメモリデバイスのうちの一部またはすべてを交換することによりメモリシステムの構成を容易に変更することができる脱着可能なメモリモジュール424に取り付けられることが好ましい。 各メモリモジュール424は、コネクタ426によってマザーボード425に機械的に結合される。 コネクタ426もメモリコントローラとメモリデバイスとの間のすべての電気接続を提供する。 電気接続は、メモリモジュール上のデータバス部分428の間の相互接続を含む。 電気接続はまた、アドレスバス接続(図示せず)
    とスイッチ制御線接続(図示せず)を含む。

    【0033】図4Aを参照すると、メモリコントローラ421(CPUでも専用メモリコントローラでもどちらでもよい)は、データバス427に電気接続される。 コントローラ421は、メモリモジュール上の多数のメモリデバイス422に選択的にアクセスする。 メモリモジュール上のデバイス422は、データバス427に沿って、直列、並列、またはその2つのなんらかの組合せで接続されてもよい。 メモリデバイスは、読取り専用メモリ(ROM)またはランダムアクセスメモリ(RAM)
    を含むことができ、ダイナミックランダムアクセスメモリ(DRAM)であることが好ましい。 メモリコントローラはまた、中央スイッチング手段を使用して、それぞれのメモリデバイスを、個別にまたは小さいグループで、データバスから選択的に電気的に結合し分離する。
    中央スイッチは、データバスに電気接続される他に、制御線(図4Aには図示せず)によってコントローラに電気的に接続される。

    【0034】図4Bは、図4Aに示した放射状アームメモリバス構成の電気的等価物を示す概略図である。 図4
    Bは、データバスが一連の伝送線と電気的に等価であることを示すのに役立つ。 分かりやすくするために、図4
    Aに示した項目の電気的等価物を、図4Bに、接尾文字「A」を付けて図4Aの項目と同じ参照番号で示す。 さらに、分かりやすくするために、データバスは、1つのデータ線として示す。 実際には、データバスは、一般に、並列に延びる多数のデータ線を含む。

    【0035】図4Bを参照すると、中央スイッチ429
    Aに電気的に結合されたメモリコントローラ421Aが示される。 終端抵抗463は、コントローラ402Aと中央スイッチ429に電気的に直列に接続される。 図4
    Bに示した実施態様において、中央スイッチは、各メモリモジュールが2つのメモリデバイスを含む4つ(N=
    4)のメモリモジュールに電気接続される。 しかしながら、代替の実施態様において、メモリモジュールの数と各メモリモジュール上のメモリデバイスの数は、システム要件を満たすように変更することができる。

    【0036】本発明によるメモリ構成は、拡大縮小が可能であり、したがって、Nが小さいほど必要なトレース面積が小さくなるため、メモリシステムが小さくなるほどシステムの複雑さとそれによるシステムコストは少なくなる。 各チャネルからの同じデータビット(すなわち、データビット0チャネル460a〜460d)を一緒に経路指定することによって使用される面積をさらに小さくするためにトレース密度が高められる。 図4Bに示した実施態様において、メモリ構成は、4つのスポークまたはアームを有する。 すなわち、メモリバスは、4
    つの異なるデータメモリチャネルを有し、また4つの異なるメモリモジュールに結合される。 しかしながら、アームの数は、システム要件により容易に修正することができる。

    【0037】現在のコンピュータシステムの場合、ローエンドシステムは、2〜4つのアームを有することが好ましく、ハイエンドシステムは、4〜8つのアームを有することが好ましい。 しかしながら、この数は9以上に拡大されることが可能である。 本発明の1つの実施態様において、サーバシステムは、9つのDIMM(対)を含むハイエンドシステムである。 64GBのメモリの場合、9対のDIMMの実施態様は、16個の4GB S
    DRAM DIMMを使用して実現される。 あるいは、
    32GBのメモリの場合、8対のDIMMの実施態様は、16個の2GB SDRAMを使用して実現される。 冗長系における予備メモリとして、64GBメモリにおいて72ビットバスセクションごとに2つの追加のDIMMが使用されることがある。

    【0038】インピーダンス428Aは、中央スイッチ429からメモリデバイス422への伝送負荷を表す。
    したがって、インピーダンス428Aは、中央スイッチからコネクタまでのボードトレースによるインピーダンスと、コネクタによるインピーダンスと、コネクタからアクセスされているメモリデバイスまでのボードトレースのインピーダンスとを含む。 一般に中央スイッチからメモリモジュールのコネクタまでのボードトレースの長さ(ひいてはそれに対応する遅延)が異なるため、様々なメモリモジュール434a、434b、434c、4
    34dまでの伝送線遅延は異なることがあるが、4つのデータビットの各グループ内のデータおよびデータストローブの長さは同じである。

    【0039】図4Bと図3Bに示したメモリ構成のスイッチング要素とメモリコントローラの接続を比較すると、図4Bに示したメモリ構成には、メモリモジュール間のボードトレースを表すインピーダンスであるインピーダンス333b、333c、および333dがないことが明らかである。 これらのインピーダンス333b、
    333cおよび333dの除去により、データバス上の容量性負荷が明らかに減少し、一般にバスのデータ伝播速度が実質的に速くなる。 このモジュール間インピーダンス(333b、333c、333d)の除去は、ボードに接続されたメモリモジュールの数が増えるほど大幅に大きくなり、過去においてはシステムメモリサイズを制限する要因であった。

    【0040】さらに、モジュール間インピーダンスの除去は、図3Aと図3Bに示したメモリ構成において重大な問題であった「くし型フィルタ」効果をなくすのに役立つ。 前に説明したように、くし型フィルタ効果は、ボード部分427Aから分かれるモジュール部分428A
    によって形成される伝送線スタブによるものである。 図3Aと図3Bに示した実施態様において、ボード部分3
    27Aは、要素333a、333b、333c、333
    dから構成される。 図4Bの構成からモジュール間要素333b、333cおよび333dの除去により、モジュール部分が分かれるボード部分がなくなり、本質的にくし型フィルタ効果がなくなる。 アクティブDRAMまでのトレースがバス上にスタブを形成しないため、くし型フィルタ効果がなくなる。

    【0041】図4A〜図4Dに示したメモリ構成によって提供されるポイントツーポイントバスは、伝送線反射を大幅に減少させるためメモリシステム設計をより容易にする。 さらに、このメモリ構成の「スタブレス」ポイントツーポイントアームは、容量性負荷を大幅に減少させるため、より高速なデータ転送速度を可能にする。 くし型フィルタ効果がなくなるため、システムをメモリモジュールの最大周波数の近くで動作させることができる。 したがって、ポイントツーポイントバス構成は、コアDDR周波数「近く」でのクロッキングを可能にする。 あるいは、SDR周波数が使用される場合は、一定の速度でマージンを大幅に大きくすることができる。

    【0042】中央スイッチからコントローラまでの直接リンクと中央スイッチからメモリデバイスまでの直接リンクの組合せ(メモリモジュールの中央スイッチへの放射または接続による)は、ポイントツーポイントバスを提供する。 コントローラと中央スイッチの接続によるインピーダンスについては、前の節で説明した。 中央スイッチは、単一のメモリモジュール上のメモリデバイスをデータバスに選択的に結合するために、メモリコントローラと協働で動作する。 メモリデバイスがアクセスされていないとき、メモリモジュールは、データバスから切り離される。 アクセスされているメモリモジュールだけがデータバスに電気的に結合されるため、スイッチング手段と並列に接続された他のメモリモジュールの容量性負荷は、データバスに負荷をかけない。 このデータバスへのメモリデバイスの選択的な結合により、個別のメモリモジュールによるデータバス上の容量性負荷の影響が減少する。

    【0043】図4に示した単一の中央スイッチ構成により、バスは、図1〜図3に示した分布負荷システムではなく事実上ポイントツーポイント接続になることを可能にする。 さらに、データバスの1つのアームに何かが生じる場合に、基本的に各アームが互いに独立しているという簡単な理由により、他のモジュールに影響を及ぼすことはない。 これは、システムの信頼性を高める。 これは、サーバが大量のメモリを必要とするためサーバシステムにおいて特に重要であり、したがって、これは、多くのメモリモジュールのうちの1つが故障してもシステムの残りの部分が依然として機能できる場合に大きな利益となる。 一般に、モジュールのうちの1つに関する問題は、主データバスに影響を及ぼさない。 たとえば図2
    および図3A〜図3Bに示した構成では、2つのコネクタピンが短絡するとバス全体が短絡する。 しかしながら、図4A〜図4Cのメモリ構成において、故障したコネクタを有するメモリモジュールは、メモリシステムにおいて利用できなくなるが、残りのメモリモジュールは、コネクタ短絡による影響を受けないままである。

    【0044】さらに、本発明のメモリ構成は、メモリモジュールを互いに分離するのに役立ち、したがって適切なサポートにより、メモリモジュールを容易にホットスワップすることができ、これによりメモリシステムの高稼働率機能が高くなる。 各モジュールが、データバスの独立したアームまたはチャネル上に配置され、より高レベルの冗長性が可能になるため、ホットスワップが部分的に実現可能である。 ホットスワップを可能にするデータバスと同じようにコマンドアドレスバスを修正し、またはサポートしなければならないことがある。

    【0045】図4Cの中央スイッチ構成が、メモリモジュールバス460a、460b、460c、460d間の分離を提供するため、冗長なメモリ機構を柔軟に実現することができる。 メモリモジュール構成の分離は、実質的に性能に影響を及ぼすことなしに、直列または並列バスでは不可能である冗長システムまたはより高性能なシステムにおいて使用することができる同時のメモリ動作(読取り、書込み)を可能にする。 図4Cに示した構成により、システムは、複数のメモリモジュールに同時に同じデータを一度に書き込むことができる。 これは、
    メモリミラーリングのとき、冗長システムにおいて「予備」モジュール上にデータを再構築するとき、あるいは複数のメモリチャネルに同じデータを同時に書き込むメモリ初期化(ECCメモリ初期化など)を実行するときに有効である。 また、より高い性能の用途の場合、複数のメモリモジュールから中央スイッチへ一度に読み取ることができる。

    【0046】中央の1:Nスイッチング手段429A
    は、データ選択手段444とデコーディング手段442
    とを含むことが好ましい。 中央スイッチング手段は、好適には中央スイッチが従来のメモリコントローラまたはCPUで実行されていた論理機能の一部を実行するインテリジェントスイッチである。

    【0047】図4Cを参照し、スイッチング手段の好ましい実施態様をより詳細に示す図4Bに示された放射状アームメモリバス構成の概略図を示す。 中央スイッチング手段は、デコーディング手段442とデータ選択手段444とを含む。 デコーディング手段442は、一般に、デコーダへの入力が、アクセスされるモジュールを示す2ビットアドレスである2:4デコーダである。 デコーディング手段への入力443は、アクセスされるべきメモリモジュールをスイッチに示す2ビットアドレスである。 好ましい実施態様において、複数のメモリモジュールに同時にアクセスすることができる。

    【0048】デコーディング手段の出力は、クロック信号460とチャネルイネーブル信号462の2つの信号を含むことが好ましい。 データ選択回路444は、一般に、(この場合はN=4の)複数のチャネル選択回路4
    45を含む。 クロック信号460とチャネルイネーブル信号462は両方とも、チャネル選択回路445への入力である。 各チャネル選択回路は、双方向のデータフローを可能にするトランシーバ回路を含む。 トランシーバは、2つのCMOSバッファ回路465、467を含むことが好ましい。 一方のCMOSバッファ回路にデータが流れているとき、他方のCMOSバッファ回路は高レベルである。

    【0049】例として、高レベル信号がイネーブルされていると仮定する。 チャネルイネーブル信号が高レベルのとき、両方のCMOSバッファ回路がイネーブルになる。 特定のアームまたはチャネルが選択された場合、クロック信号とチャネルイネーブル信号は両方とも、その特定のメモリモジュールに関して高レベルでなければならない。

    【0050】中央スイッチ回路の各チャネルは、1対の刻時レジスタ466を含んでもよいが必ずしも必要ではない。 待ち時間をきわめて少なくしなければならない場合は、実施において刻時レジスタ466はなくてもよい。 刻時レジスタ466は、データバス427とメモリモジュールバス460a、460b、460c、460
    dのデータ転送速度に差があるときに、データをバッファリングするのに有効である。 さらに、中央スイッチは、1対の終端抵抗器463を含むことが好ましい。 したがって、メモリ構成は、基本的に、終端抵抗器463
    aから463bへの一方のポイントツーポイントバスと、終端抵抗器463cから463dへの他方のポイントツーポイントバスの2つのポイントツーポイントバスで説明することができる。

    【0051】図4Dを参照すると、図4Bに示した放射状アームメモリバス構成の代替の実施態様の概略図が示される。 図4Dに示した実施態様は、複数のFETスイッチを中央スイッチの実施に使用する。 示された4つのアームメモリチャネル構成の場合、デコーディング手段442は、2:4デコーダであることが好ましい。 デコーダ442への入力は、4つのFETスイッチ451
    a、451b、451cおよび451dのうちのどのスイッチがオンであるかをスイッチに示す2ビットアドレスである。 本発明の中央スイッチによる制御は、デコーディングがDIMMモジュール上のDIMMレジスタの前に実行されるため、図3Aと図3Bに示した実施態様よりも好ましい。 この早期のデコーディングは、このデコーディングが一般にタイミングのクリティカルパスにおいて生じるため重要である。

    【0052】図4Dに示した実施態様において、中央スイッチのデータ選択回路は、複数(一般にN個)のFE
    Tスイッチ451a〜451dを含む。 各FETスイッチ451a〜451dは、電気的に結合された状態と電気的に切り離された状態に切り換えることができる2つの端子450、454と、データ選択端子452の3つの端子を含む。 データ選択端子は、デコーダの出力に電気接続される。 好ましい実施態様において、1つのデコーダ出力だけが高レベルであり、これは、結合されたメモリデバイスと共にメモリ動作中に4つのFETスイッチのうちのどのスイッチが閉じられているかを示す(電気的に結合された端子450と454)。 FETスイッチが開いている場合(デコーダ出力が低レベルであり、
    端子450および454が電気的に切り離されている)、開いたスイッチと関連したメモリデバイス422
    Aは、中央スイッチ429Aとメモリデバイス422A
    との間のデータバス部分であるようにデータバスから切り離される。 すなわち、データバスから電気的に切り離されたメモリデバイスは、データを送ったりまたは受け取ったりすることができない。 さらに、データバスから切り離されたメモリデバイス422Aの容量性負荷は、
    スイッチが開いているためデータバスの全体の容量性負荷に奇与しなくなる(メモリコントローラおよび結合されたメモリデバイスから見たとき)。

    【0053】図4Dに示したスイッチング手段の実施態様では、複数のFETスイッチが使用されることが好ましい。 しかしながら、代替の実施態様が可能である。 たとえば、好ましい実施態様において、最大の通し遅延(through delay)を2.0ナノ秒未満に制限できる場合は、SSTL−2論理スイッチを使用することができる。 一般に、SSTL−2論理スイッチは、一般に方向制御用に追加のピンを必要とする場合でも好ましく、追加の高稼働率機能をサポートする。 さらに、SSTL−
    2論理の実施は一般に、バスをセグメント化することになり、内蔵VTTターミネータの備えを必要とする。 図4Dに示した代替の実施態様の場合、メモリモジュールバス460a、460b、460c、460dが分離されていないため一度に1つのメモリモジュールからしか読み取ることができず、したがってメモリチャネルバスによって速度、ひいてはシステムの性能が制限される。
    さらに、図4Dに示した実施態様では、同時の読み書きを行うことができない。

    【0054】好ましい実施態様において、各ビットスライス中央スイッチングデバイスは、長方形の96ボールJEDEC LF BGAロジックパッケージの内部に収まる。 96ボールLFBGAパッケージはそれぞれ、
    9×5ビットデータ部分に割り振られた50個のボールと、SSTL−2クロックおよびクロックに割り振られた2個のボールと、選択制御線に割り振られた10個のボールと、リセット制御線に割り振られた1個のボールを含む。 パッケージ内の残りのボールは、電源とアースに割り振られたものである。 チェックビット、データおよびストローブを含む72ビット幅バスを提供するのに18個の装置で十分である。 18のDIMMを有する1
    44ビット幅のシステムには、36個のデバイスを必要とすることになる。 さらに、内部スイッチ444制御部を駆動する前に外部選択ロジックの同期をとりなおすことができるように、各デバイスには、CLKおよびCL
    K_INPUTによって駆動されるSEL線上の内部レジスタがなけばならない。

    【0055】この放射状メモリデータバス構造の総合的な目標は、各アームのメモリモジュールが現場交換可能ユニット(field replaceable unit)すなわちFRUであり他のモジュールから独立しているように小さいメモリシステムと同じ待ち時間および帯域幅を有する大きいメモリシステム(すなわち、64GB)をサポートすることである。 有利な目標は、様々なメモリチャネルまたはアームが144ビット幅バス(ポイントツーポイント)において200MHzで動作することである。 これは、a)サーバ内の待ち時間を減少させ、b)グラフィックサブシステム性能を提供する7.2GB/秒のデータ転送速度を提供する。 この構成は、メモリデータバスの容量性負荷を減少させると、データがメモリコントローラからメモリデバイス(ダイナミックランダムアクセスメモリチップ等)へまたはその逆に伝わる全体の速度が速くなるという概念に基づく。 さらに、データバスの容量性負荷が小さいため、データバスを構成する各データ線は、状態をより速く変化させることができる。 データをより迅速にデータバスに流すことができるようにすることにより、CPU速度とメモリチップ速度の進歩をより有効に利用することができる。

    【0056】メモリ構成の好ましい実施態様において、
    各DIMMモジュールに終端回路が接続される。 終端回路の機能は、データバス上のインピーダンスをインピーダンス整合させて伝送線反射を最小にすることである。
    一般に抵抗器である終端回路は、データバスの端部に配置されることが好ましい。

    【0057】図4Cを参照すると、好ましい実施態様において、終端回路は、メモリデバイス422Aと直列に接続された抵抗器である。 代替の実施態様において、終端回路は、メモリデバイス422Aに最も近い各モジュール部分428Aの端部の間にあるポイントT1においてメモリデバイス422Aと並列に接続される。

    【0058】以上の説明が例示することを意図しており、制限することを意図していないことを理解されたい。 たとえば、RAMBUS構成において並列のメモリデバイスは、直列のメモリデバイスと置き換えられる。
    したがって、本発明の範囲は、以上の説明を参照して決定されるべきではなく、特許請求の範囲により権利が与えられる全範囲の等価物と共に特許請求の範囲を参照して決定されるべきである。

    【0059】以下においては、本発明の種々の構成要件の組み合わせからなる例示的な実施態様を示す。 1. メモリコントローラと、データバスによって前記メモリコントローラに電気的に結合された単一の中央スイッチと、それぞれが少なくとも1つのメモリデバイスを含む、複数のN個のメモリモジュールとを含み、前記単一の中央スイッチと前記メモリコントローラとがマザーボードに取り付けられ、前記複数のN個のメモリモジュールのそれぞれが、その対応するメモリモジュールバスによって前記単一の中央スイッチに放射状に接続される、メモリ構成。 2. 前記単一の中央スイッチが、デコーディング手段とデータ選択手段とを含む上記1に記載のメモリ構成。 3. 前記単一の中央スイッチが、双方向のデータフローを可能にするトランシーバ回路を含む上記2に記載のメモリ構成。 4. 前記トランシーバ回路が、並列に反対方向に向いて接続された一対のCMOSバッファ回路を含み、前記C
    MOSバッファ回路への入力が、クロック信号とチャネルイネーブル信号を含む上記3に記載のメモリ構成。 5. 前記CMOSバッファ回路と直列に接続された刻時バッファレジスタをさらに含む上記4に記載のメモリ構成。 6. 前記メモリコントローラと前記中央スイッチとの間に直列に接続された第1の終端回路と、前記中央スイッチと各メモリモジュール上の前記メモリデバイスとの間に直列に接続された、各メモリモジュール用の第2の終端回路とをさらに含む上記1に記載のメモリ構成。 7. 前記単一の中央スイッチが、各メモリモジュールごとに第3と第4の終端回路を含み、前記第3の終端回路が、前記メモリコントローラとチャネル選択回路のそれぞれの入力との間に直列に接続され、前記第4の終端回路が、前記チャネル選択回路のそれぞれの出力と各メモリモジュール上の前記メモリデバイスとの間に直列に接続された上記6に記載のメモリ構成。 8. 前記データ選択手段が、並列に接続された複数のF
    ETスイッチを含み、前記FETスイッチへの入力が、
    前記デコーディング手段の出力である上記2に記載のメモリ構成。

    【0060】

    【発明の効果】本発明により、メモリデバイスによる容量性負荷の影響を依然として最小限に抑えつつボードトレースによる容量性負荷を最小にするメモリ構成が提供される。 また、本発明により高稼働率の故障許容システムにおいて使用できるように、高稼働率機能も提供され、メモリモジュールの改善された分離も提供される。

    【図面の簡単な説明】

    【図1A】従来のDDRまたはSDR構成メモリシステムの側面図を示す。

    【図1B】図1Aに示したメモリシステムの電気的等価物を示す概略図である。

    【図2】従来のRAMBUSメモリシステムの電気的等価物を示す概略図である。

    【図3A】スイッチ制御式モジュール構成の側面図である。

    【図3B】図3Aに示したスイッチ制御式モジュール構成の電気的等価物を示す概略図である。

    【図4A】本発明の放射状アームメモリバス構成の側面図である。

    【図4B】図4Aに示した放射状アームメモリバス構成の電気的等価物を示す概略図である。

    【図4C】スイッチング手段の好ましい実施態様を詳細に示す図4Bに示した放射状アームメモリバス構成の概略図である。

    【図4D】スイッチング手段の代替実施態様をより詳細に示す図4Bに示した放射状アームメモリバス構成の概略図である。

    【図5A】図3Aと図3Bに示したような並列バス構成の高レベルの代表図である。

    【図5B】図4A〜図4Cに示したような放射状アームバス構成の高レベルの代表図である。

    【符号の説明】

    421 メモリコントローラ 422 メモリデバイス 424 メモリモジュール 425 マザーボード 426 コネクタ 429 中央スイッチ 442 デコーディング手段 444 データ選択回路 445 チャネル選択回路 463 終端抵抗器 465、467 CMOSバッファ回路 466 刻時レジスタ

    高效检索全球专利

    专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

    我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

    申请试用

    分析报告

    专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

    申请试用

    QQ群二维码
    意见反馈