新しい次元へ…3D Blaster GeForce

  1. 導入編
  2. ジオメトリエンジン?
  3. ベンチマーク
  4. 冷却強化に日本語化、そしてクロックアップ
  5. GeForce256 Technical Demo
  6. Windows2000で3DMark2000
  7. (非公式)BIOS書き換え
  8. DirectX8とDetonator7.x

1.導入編

 最近は金欠のため、もっとも技術革新が早く進んでいると思われるビデオカードも、必要に迫られないと買わない(買えない)状態で、うちでは1年近く変化がありませんでした。ただ、ずっと調子は悪かったんで、何とかしたいとは思ってたんですけど。

3DBlaster GeForce で、そんな時に、あのnVIDIAがついにハードウェアT&L(後で説明します)に対応したGPU(Graphics Processing Unit)、GeForce256を出してきました。で、それを搭載したビデオカードの第1弾、それがこの3DBlaster GeForceです。

 ちょうど今のビデオカード&余ってたパーツを売って手元にお金があった私は、買い取って貰った店に丁度中古で売ってた(発売2日後なのに…)これを買った訳です。どうせビデオカードは買うつもりだったんで、どうせなら最新のものをと。ホームページのネタにも十分なりますし。

 ただ、CREATIVEって所がネックだったのですが、他には選択肢はなかったし、画質は我慢できますから、割り切って買いました。

ボードの拡大写真 実際のボードはこんな感じ。最近の傾向と同じく、最初から冷却ファンが付いています。0.22μmプロセスで120MHz駆動なのですが、2300万トランジスタという集積度のために発熱は大きい様です。Pentium2が750万、Pentium3が950万、Athlonが2200万ですから、いかに凄いかが分かります。

 かなり余裕のあるカードデザインなのですが、これはこれはほぼリファレンスボードに近いものだとか。確かCREATIVEの過去のビデオカードもこんな感じでしたけど。

 もちろんAGPに差すのですが、AGPx4に対応しているのでバスが4つに切れています。まだ対応M/Bがほとんど無いし、効果もあまり無いとは思いますが。

200MHz(5ns)なメモリ 載っているメモリはSDRAM・32MB。容量的には標準的です。128MBまでいけるんだけど、それはまだ時期尚早かな…。徐々にAGPの意味が無くなってきてるのは確かですが。

 GeForce256自体はDDR-SDRAMにも対応しているので、今後はこちらを搭載したカードも出てきそうです。価格は高くなるはずなので、速度向上と価格増加をどこまで納得できるかですね。「早いがいいに決まってる」って人が多いような気もしますが。

 いちおう5ns品なので、デフォでは166MHzで動いているのですが200MHzまではいけるかも知れません。こちらについては後日すこし検証してみたいと思ってます。

GeForce256・表面 こちらは実際のGeForce256のチップです。普段は冷却ファンに覆われて見えないのですが、すでに冷却ファンを取り替えているので、その時に撮影してみました。 接着剤で張り付けてあったのでカッターの刃を差し込んで剥がした後、表面が見えるようにはぎ取っていったんですけど、キリがないのでこのぐらいで。綺麗に剥がした方が冷却効率はいいんですが。

 なかなか表面は格好良いです。金属で覆われてるってのは、熱伝導率も考えてのことなのかな?。やはり台湾で作ってたようで、今後の供給に若干不安があります。

2.ジオメトリエンジン?

 さて、このGeForce256がなぜ今までのビデオチップと違うのかというと、それはジオメトリエンジンを内蔵しているという点です。通常、ポリゴンを表示するには、

3D表示のプロセス
手順 説明 今まで GeForce256
(1) Transformation 3Dの物体の座標計算を行う CPU VIDEO
(2) Lighting 物体に光をあてて、日向と日陰の部分を計算する。 CPU VIDEO
(3) ラスタライズ その3Dモデルを、平面の画面で見える形に変換する。 VIDEO VIDEO
(4) テクスチャマッピング その表面に、画像を張り付けて模様をつける。 VIDEO VIFEO

 と言う4段階の手順を踏んでいます(上の説明はあまり正確とは言えませんが)。今までのビデオチップの場合、最後の2つ、つまりラスタライズとテクスチャマッピングのみを行っていて、その前2つの処理はCPUが行っていました。もちろんこれでもある程度のポリゴンを表示できるのですが、CPUは他にもそのソフト自体の処理も行う必要があり、また多機能なためにこれらの計算が得意というわけでもありません。

 そこで、その前半2つの処理もビデオチップ側で行うという考え方が出てきました。ハードウェアで行うわけですから、2つの処理の頭文字を取ってハードウェアT&Lと言う言い方をしたりします。以前からプロユースの製品ではこのようなものもあったのですが、ついにDirectX7でこれらのジオメトリエンジンに対応する動きが出てきたため、コンシュマー向けのビデオチップでもジオメトリエンジンを搭載したビデオチップが出てきました。

 その第1弾がこのnVIDIAのGeForce256です。今後は、S3のSavege2000、3DfxのNapalmなど、各社からこのようなビデオチップが登場します。 

3.ベンチマーク

 さて、実際にベンチマークを取ってみました。Pentium2/448MHzで動作させたときの3DMark99 MAXの結果です。解像度は800*600*16bit。GeForce256だけはDirectX7を使っていて、あとはDirectX6.1です。

3DMark99 MAX 800*600*16bit
3DMark99 MAX 800*600*16bit
3DMark99MAX 800*600 16bit G200 Voodoo2・12MB・SLI GeForce256
3DMark Result 2492 3874 3538
Rasterizer Score 811 1813 3328
Game 1 - Race 29.7 38.7 35.1
Game 2 - First Person 21.5 38.8 35.6
Fill Rate 69.9 137.4 255.8
Fill Rate With Multi-Texturing 70 269.4 430.6
2MB Texture Rendering Speed 153.3 379.7 323.8
4MB Texture Rendering Speed 130.2 18 237.1
8MB Texture Rendering Speed 90.5 9 154.3
16MB Texture Rendering Speed 69.4 4.4 103.2
32MB Texture Rendering Speed 4.3 2.2 47.9
Bump Mapping Emboss,3-pass 43 123.4 126
Bump Mapping Emboss,2-pass N/A 165.5 151.1
Bump Mapping Emboss,1-pass N/A N/A 212

 これだと、ちょっと意外な結果が出ています。数値的には早いのですが、実際のゲーム(Game1,Game2)には反映させていません。これはどうやら、この3DMark99ってのが、DirectX6対応のベンチマークのため、DirectX7で動作させた場合、何らかの理由でこのような結果になってしまうらしいです。詳しくはPC Watchをどうぞ。


 次に、nVIDIAが出した、GeForce256に最適化されたソフト、TreeMarkの結果です。こちらはGeForce256のスコアはこちらで出しましたが、RIVA TNT2 Ultraの値は余所から引っ張ってきました。

TreeMark

 こちらだと、圧倒的な大差が付きます。純粋にジオメトリエンジンが使えるか使えないかの差ですけど、実際に対応したソフトだとこのような差がでるかも知れません。CPU側の処理もなかなか多いので、このように大差になりにくいかも知れませんが。

 このように、GeForce256は現状でもほぼ最高レベルの能力を持っていて、そしてこのジオメトリエンジンを使うことによって、さらに強力になる、将来性の高いビデオチップだと言えそうです。今後はどんどんジオメトリエンジンの性能も上がってきて、さらに凄いことになるかも知れません。

 …ちなみに、画質ですけど、あんまりよろしくありません。1280*1024*32bit(85Hz)では、以前私が使っていた状態、Voodoo2でスルーしたG200より、おそらく悪いと思われます。色合いが違うのかも知れませんけど、ちょっとぼんやりした印象を受けます。これが我慢できない方は、こちらを買われた方がいいかも知れません。

(1999/10/19)

4.冷却強化に日本語化、そしてクロックアップ

冷却強化 次に、とりあえず冷却を山洋ファンに交換して強化。ファン用の電源をATX電源から直接繋ぐ形になるので、ボード上に電源コネクタをつけて外部電源を供給しているSPECTRA7400と考えようによっては同じ事になっているかもしれません。

 上ではチップ上についていた瞬間接着剤のカスを剥がすのに苦労していましたが、瞬間接着剤用はがし液というのがあるのを知って、それでもって綺麗にしてから、間にシリコングリスを塗って密着。これで準備は万端です。


レジストリの変更 オーバークロックにはPowerStripを使っても良いのですが、今回はnVIDIAリファレンスであるDetonator3.53ドライバを使いました。インストールしただけでは出てきませんが、レジストリのHKEY_LOCAL_MACHINE\Softwaer\NVIDIA Corporation\Global\NVTweakにCoolBitsと言う名前で、DWORDを3と設定してやると、以下の隠しメニューが追加されます。また、NVidia Detonator リファレンスドライバ Win95/98版日本語化のページ から、対応差分をDLして日本語化しておくと、処理がしやすいと思います…その後、リファレンスドライバーが各国語対応したので、上記のホームページは閉鎖されました。

隠しメニュー 上の手順を踏んでやると、右のメニューで、オーバークロックを行うことになります。コアは105〜150MHz(デフォルトは120MHz)、メモリは145〜210MHz(デフォルトは166MHz)まで設定できます。「起動時に設定を有効にする」のチェックをしてない場合、フリーズして再起動したら元の設定に戻るので、安定する設定を見つけるまではチェックしないで試して置いた方が良いと思います。

 で、うちで試してみた結果は以下の通り。Pentium2/440MHz・FW-6280BXDR/155・MEM256MB・DirectX7で試しています。AGPクロックは73MHz(2x)となっています。チップファンを交換した割には、あまりいい結果は出ませんでした。

3DMark99MAX OC時

3DMark99 MAX 800*600 16bit
コアクロック/メモリクロック
120/166 135/166 120/180 135/180
Game 1 - Race 35.3 35.3 35.4 35.4
Game 2 - First Person 38 38 38.1 38.5
Fill Rate 249.1 250.2 269.3 270.5
Fill Rate With Multi-Texturing 422 459.5 429.1 471.2
2MB Texture Rendering Speed 319.1 319 340.4 340.8
4MB Texture Rendering Speed 236.7 237.3 253.2 252.6
8MB Texture Rendering Speed 157.1 157 167.2 167.6
16MB Texture Rendering Speed 107.3 107.6 114.1 114.5
32MB Texture Rendering Speed 51.6 51.8 53.3 53.5
Bump Mapping Emboss,3-pass 126.3 127.6 135.1 135.9
Bump Mapping Emboss,2-pass 149.6 151.1 159.3 160
Bump Mapping Emboss,1-pass 216.8 219 229.3 230.1

 この結果を見ると、なかなか面白い事が分かります。コアクロックを上げるより、メモリクロックを上げた方が確実に性能アップしています。つまり、現在のメモリの帯域(データの転送速度)では能力不足であり、そのためにDDR・SDRAMを使った製品を出すという方針には、一理ありそうです。

 コアクロックを上げることで、唯一目立って性能アップしているのがFill Rate With Multi-Texturing。テクスチャのレンダリングエンジンを4つ積んでいるGeForce256ですが、この値だけはメモリの帯域などあまり関係無しに、まだまだ重い処理だということでしょう。


 結局コアクロックは135MHz(+15MHz)、メモリクロックは180MHz(+14MHz)までしか安定しませんでした(3DMark99MAXが最後まで走らない)。また、これも最初の一回だけで、2回目始めると画面にゴミが目立ち始め、やがてフリーズします。おそらく熱暴走なんでしょうけど、オーバークロックしての常用はとりあえず諦めました。

(1999/11/17)