## NVIDIA Rubinプラットフォーム公式発表:推論コスト10倍削減、GPU4倍縮小、2026年下半期に納品
NVIDIAはCES 2025でAIチップの次世代主要製品であるRubinプラットフォームを正式に発表しました。これは同社が毎年行っているイテレーション更新の伝統の一環です。CEOのJensen Huangによる現場発表によると、Rubinの六つのコアチップはファウンドリから戻り、重要なテスト検証を完了し、計画通りに展開できることが確認されました。これにより、NVIDIAはAIアクセラレータ分野で引き続き技術的リーダーシップを維持しつつ、ウォール街の競争圧力やAI投資の継続性に対する懸念にも応えています。
### 性能向上、コスト大幅削減
Rubinの価格(cena)については、NVIDIAは具体的な見積もりをまだ公表していませんが、そのコストパフォーマンスは大きく向上しています。前世代のBlackwellプラットフォームと比較して、Rubinのトレーニング性能は3.5倍、推論性能は5倍に向上しました。特に注目すべきは、Rubinが推論過程でのtoken生成コストを10倍削減できる点です。これは大規模モデル推論に依存する企業にとって、運用コストの大幅な削減を意味します。
さらに、Rubinはトレーニングに必要な混合専門家モデル(MoE)に必要なGPU数を4倍削減しま
原文表示