さて、このGeForce256がなぜ今までのビデオチップと違うのかというと、それはジオメトリエンジンを内蔵しているという点です。通常、ポリゴンを表示するには、
3D表示のプロセス
| 手順 |
説明 |
今まで |
GeForce256 |
| (1) Transformation |
3Dの物体の座標計算を行う |
CPU |
VIDEO |
| (2) Lighting |
物体に光をあてて、日向と日陰の部分を計算する。 |
CPU |
VIDEO |
| (3) ラスタライズ |
その3Dモデルを、平面の画面で見える形に変換する。 |
VIDEO |
VIDEO |
| (4) テクスチャマッピング |
その表面に、画像を張り付けて模様をつける。 |
VIDEO |
VIFEO |
と言う4段階の手順を踏んでいます(上の説明はあまり正確とは言えませんが)。今までのビデオチップの場合、最後の2つ、つまりラスタライズとテクスチャマッピングのみを行っていて、その前2つの処理はCPUが行っていました。もちろんこれでもある程度のポリゴンを表示できるのですが、CPUは他にもそのソフト自体の処理も行う必要があり、また多機能なためにこれらの計算が得意というわけでもありません。
そこで、その前半2つの処理もビデオチップ側で行うという考え方が出てきました。ハードウェアで行うわけですから、2つの処理の頭文字を取ってハードウェアT&Lと言う言い方をしたりします。以前からプロユースの製品ではこのようなものもあったのですが、ついにDirectX7でこれらのジオメトリエンジンに対応する動きが出てきたため、コンシュマー向けのビデオチップでもジオメトリエンジンを搭載したビデオチップが出てきました。
その第1弾がこのnVIDIAのGeForce256です。今後は、S3のSavege2000、3DfxのNapalmなど、各社からこのようなビデオチップが登場します。
さて、実際にベンチマークを取ってみました。Pentium2/448MHzで動作させたときの3DMark99
MAXの結果です。解像度は800*600*16bit。GeForce256だけはDirectX7を使っていて、あとはDirectX6.1です。
3DMark99 MAX 800*600*16bit
| 3DMark99MAX 800*600 16bit |
G200 |
Voodoo2・12MB・SLI |
GeForce256 |
| 3DMark Result |
2492 |
3874 |
3538 |
| Rasterizer Score |
811 |
1813 |
3328 |
| Game 1 - Race |
29.7 |
38.7 |
35.1 |
| Game 2 - First Person |
21.5 |
38.8 |
35.6 |
| Fill Rate |
69.9 |
137.4 |
255.8 |
| Fill Rate With Multi-Texturing |
70 |
269.4 |
430.6 |
| 2MB Texture Rendering Speed |
153.3 |
379.7 |
323.8 |
| 4MB Texture Rendering Speed |
130.2 |
18 |
237.1 |
| 8MB Texture Rendering Speed |
90.5 |
9 |
154.3 |
| 16MB Texture Rendering Speed |
69.4 |
4.4 |
103.2 |
| 32MB Texture Rendering Speed |
4.3 |
2.2 |
47.9 |
| Bump Mapping Emboss,3-pass |
43 |
123.4 |
126 |
| Bump Mapping Emboss,2-pass |
N/A |
165.5 |
151.1 |
| Bump Mapping Emboss,1-pass |
N/A |
N/A |
212 |
これだと、ちょっと意外な結果が出ています。数値的には早いのですが、実際のゲーム(Game1,Game2)には反映させていません。これはどうやら、この3DMark99ってのが、DirectX6対応のベンチマークのため、DirectX7で動作させた場合、何らかの理由でこのような結果になってしまうらしいです。詳しくはPC Watchをどうぞ。
次に、nVIDIAが出した、GeForce256に最適化されたソフト、TreeMarkの結果です。こちらはGeForce256のスコアはこちらで出しましたが、RIVA TNT2
Ultraの値は余所から引っ張ってきました。

こちらだと、圧倒的な大差が付きます。純粋にジオメトリエンジンが使えるか使えないかの差ですけど、実際に対応したソフトだとこのような差がでるかも知れません。CPU側の処理もなかなか多いので、このように大差になりにくいかも知れませんが。
このように、GeForce256は現状でもほぼ最高レベルの能力を持っていて、そしてこのジオメトリエンジンを使うことによって、さらに強力になる、将来性の高いビデオチップだと言えそうです。今後はどんどんジオメトリエンジンの性能も上がってきて、さらに凄いことになるかも知れません。
…ちなみに、画質ですけど、あんまりよろしくありません。1280*1024*32bit(85Hz)では、以前私が使っていた状態、Voodoo2でスルーしたG200より、おそらく悪いと思われます。色合いが違うのかも知れませんけど、ちょっとぼんやりした印象を受けます。これが我慢できない方は、こちらを買われた方がいいかも知れません。
(1999/10/19)
次に、とりあえず冷却を山洋ファンに交換して強化。ファン用の電源をATX電源から直接繋ぐ形になるので、ボード上に電源コネクタをつけて外部電源を供給しているSPECTRA7400と考えようによっては同じ事になっているかもしれません。
上ではチップ上についていた瞬間接着剤のカスを剥がすのに苦労していましたが、瞬間接着剤用はがし液というのがあるのを知って、それでもって綺麗にしてから、間にシリコングリスを塗って密着。これで準備は万端です。
オーバークロックにはPowerStripを使っても良いのですが、今回はnVIDIAリファレンスであるDetonator3.53ドライバを使いました。インストールしただけでは出てきませんが、レジストリのHKEY_LOCAL_MACHINE\Softwaer\NVIDIA
Corporation\Global\NVTweakにCoolBitsと言う名前で、DWORDを3と設定してやると、以下の隠しメニューが追加されます。また、NVidia
Detonator リファレンスドライバ Win95/98版日本語化のページ から、対応差分をDLして日本語化しておくと、処理がしやすいと思います…その後、リファレンスドライバーが各国語対応したので、上記のホームページは閉鎖されました。
上の手順を踏んでやると、右のメニューで、オーバークロックを行うことになります。コアは105〜150MHz(デフォルトは120MHz)、メモリは145〜210MHz(デフォルトは166MHz)まで設定できます。「起動時に設定を有効にする」のチェックをしてない場合、フリーズして再起動したら元の設定に戻るので、安定する設定を見つけるまではチェックしないで試して置いた方が良いと思います。
で、うちで試してみた結果は以下の通り。Pentium2/440MHz・FW-6280BXDR/155・MEM256MB・DirectX7で試しています。AGPクロックは73MHz(2x)となっています。チップファンを交換した割には、あまりいい結果は出ませんでした。

3DMark99 MAX 800*600 16bit
コアクロック/メモリクロック |
120/166 |
135/166 |
120/180 |
135/180 |
| Game 1 - Race |
35.3 |
35.3 |
35.4 |
35.4 |
| Game 2 - First Person |
38 |
38 |
38.1 |
38.5 |
| Fill Rate |
249.1 |
250.2 |
269.3 |
270.5 |
| Fill Rate With Multi-Texturing |
422 |
459.5 |
429.1 |
471.2 |
| 2MB Texture Rendering Speed |
319.1 |
319 |
340.4 |
340.8 |
| 4MB Texture Rendering Speed |
236.7 |
237.3 |
253.2 |
252.6 |
| 8MB Texture Rendering Speed |
157.1 |
157 |
167.2 |
167.6 |
| 16MB Texture Rendering Speed |
107.3 |
107.6 |
114.1 |
114.5 |
| 32MB Texture Rendering Speed |
51.6 |
51.8 |
53.3 |
53.5 |
| Bump Mapping Emboss,3-pass |
126.3 |
127.6 |
135.1 |
135.9 |
| Bump Mapping Emboss,2-pass |
149.6 |
151.1 |
159.3 |
160 |
| Bump Mapping Emboss,1-pass |
216.8 |
219 |
229.3 |
230.1 |
この結果を見ると、なかなか面白い事が分かります。コアクロックを上げるより、メモリクロックを上げた方が確実に性能アップしています。つまり、現在のメモリの帯域(データの転送速度)では能力不足であり、そのためにDDR・SDRAMを使った製品を出すという方針には、一理ありそうです。
コアクロックを上げることで、唯一目立って性能アップしているのがFill Rate
With Multi-Texturing。テクスチャのレンダリングエンジンを4つ積んでいるGeForce256ですが、この値だけはメモリの帯域などあまり関係無しに、まだまだ重い処理だということでしょう。
結局コアクロックは135MHz(+15MHz)、メモリクロックは180MHz(+14MHz)までしか安定しませんでした(3DMark99MAXが最後まで走らない)。また、これも最初の一回だけで、2回目始めると画面にゴミが目立ち始め、やがてフリーズします。おそらく熱暴走なんでしょうけど、オーバークロックしての常用はとりあえず諦めました。
(1999/11/17)