◆そういえば、一昨日記事が出ていたNVIDIAとmetaの提携について、影響が広がっている。データセンター分野にNVIDIAが大々的に参入してきたということで、インテルやAMDへの影響を懸念しているらしい。すでにmetaはNVIDIAの顧客としては2番目のボリュームらしいが、AI用途としてのGB300やVera Rubinの導入だけではなく、データセンターとしてArm CPUを導入するということで、x86への影響を気にしているようだ。NVIDIAのこの動きには、いろいろな側面があると思う。
少し詳細に述べてみたい。昨日はブログをお休みしたので。
ひとつはデータセンターとしての動きで、NVIDIAはAIファクトリーと呼んでいたが、実態はメガデータセンターそのものではないかということだ。もとはDGX-Super PODだったはずで、AI学習用だったものが推論も取り込み、トークン単価を下げることで普及・拡大を図った。それをラックで供給することでスケールアウトし、Arm CPU単体も供給することで、メガ・AIデータセンターのサプライヤーに至ったということかと思う。
つぎにCPUを見ると、Graceは72コア、Veraは88コアのArm CPUとなっている。ArmというとAWSのGrabviton5が196コアだが、Veraは1コア2スレッドなので172スレッドとなる。対x86ではXeon6Eが144コアx2ソケットで288コアだが、Veraはスーパーチップの構成では1トレーあたり2つのスーパーチップが乗るので、おそらく2ソケット構成が可能と考えると、344スレッドとなる。AMDのTurin(Zen5c)が2ソケットで768スレッドを実現しているので、上を見ればきりがないが、Veraは現行世代としてはデータセンター向けCPUとしては遜色ないと思われる。
そしてGPUだが、スーパーコンピュータでは、すでにCPUよりもGPUの方が搭載数が多い。2018年にIBMとNVIDIAでORNLのSummitを構築したときは、IBM POWER9 CPU2基に対してVolta GPU 6基の割合となっている。GB300やVera Rubinだけでなく、AMDのHeliosもCPU数よりGPU数の方が多い。こう考えると、AIデータセンターは、スーパーコンピュータの構成に近いものになったと言うことだろう。
もっとも大きな点は、サーバーとしての動きだと思う。富岳のA64FXで富士通がArm CPUにSVEを組込んだことで、Armがスパコンに使えることが示された結果、Armv9アーキからSVE2が入った。これで、それまでのスマホのCPUから、サーバーCPUとしてのプレゼンスが高まったように思われる。その後パソコン向けにはAppleのMシリーズやQualcommのEliteが存在感を増したものの、富士通のA64FXやAmpere ComputingのAltra-MaxやAmepreOneなどを載せたArmサーバーは、存在感が増すことはなかったと思う。つまり、NVIDIAの今回の動きは、AIデータセンター向けに、Arm CPUをベンダー(NVIDIA)が大量に供給するという意味になると思う。これは、アーキテクチャライセンスの販売とは、明らかに違う。
meta(旧Facebook)は、データセンター向けハードウェアの標準化団体OCP(Open Compute Project)を創設し、Google、MSとともに推進している。HPEやSupermicorはOCP準拠サーバーのサプライヤーである。去年の10月に、ArmとNVIDIAとAMDがOCPのボードメンバーに加入した。AMDのHeliosラックもOCPに準拠していたと思う。今回、metaがNVIDIAからArm CPUを購入し、OCPサーバーを構築するものと思われる。
以上がNVIDIAとmetaの話である。
以下、投資の話がたくさん。NVIDIAのOpenAIへの投資1000億ドルの行方が良くわからなくなっていたが、OpenAIの資金調達ラウンドで、NVIDIAが300億ドルで参加するらしい。ただし、先の1000億ドルの投資とは関係ないとの話もある。また、韓国では2030年までに26万台のNVIDIA GPUを導入する計画があり、昨年の1万3千台につづいて今年は1万5千台のGPUが入るらしい。
インドAIインパクトサミットが開催されているが、NVIDIAもインドへの投資を表明したようだ。 ムンバイやチェンナイに合計70MWのデータセンターを建設中で、そこに納入する見通しらしい。数日前に、AMDとタタ・コンサルタント・サービシィズ(TCS)の提携があったが、OpenAIもTCSと提携して、100MWから始めて最終的には1GWに達するAIデータセンターをつくると表明したとのこと。投資だけではなく、ヒューマノイドを展示していたQualcommは、タタ・エレクトロニクスと車載向け半導体製造で提携したらしい。アッサムにOSAT施設があるようだ。投資や提携ではないが、富士通の時田CEOが講演したとの記事が出ていた。専門スキルのAIへの過度な依存はリスキーであり、AIは、専門家と一般従業員や顧客を含む非専門家とのコミュニケーションを促進することで、より豊かな発想や創造性をサポートする存在であるべきだ、ということらしい。それが根底にあることで、どの業界もより発展し、仕事が増えていくと思う。NVIDIAのジェンスン・フアンや、AWSのマット・ガーマンも同じことを言っていると思う。AIが仕事を増やしていく構図が見えてきたような気がする。
AMDが、オハイオ州のデータセンター事業者Crusoe社の資金調達の保証人になっているという記事が出ていた。ゴールドマンサックス(GS)からの融資で、AMDのチップそのものが担保になっているらしい。AMDもGSも認めてはいないとのこと。
Googleは、クラウドコンピューティングの新興企業であるFluidstackに1億ドルの投資を持ち掛けているとのこと。同社のTPUの導入先を探しているらしい。AnthropicがTPUを導入しているが、AIコンピューティングパワー全体の中ではNVIDIAが1強なので、なんとか勢力を拡大したいということのようだ。作って売る時代ではなく、出資して使ってもらう時代なのかもしれない。
ここからやっとチップの話になる。AMDのZen6を用いたRyzenが、2027年に遅延するとの記事が出ている。Zen6はTSMC 2nmとみられている。社内テストでは6.5GHzで動いたとの記事が出ていた。2nmの試作チップがもうできているということだろう。Zen6を用いたEPYCのVeniceがHeliosに搭載されており、すでに製造と出荷が計画されているので、そちらを優先していると思われる。またコンシューマーではメモリの入手が絶望的との観測もあり、すくなくとも2026年にはZen6 Ryzenがデビューする環境が整わないようだ。
もうひとつAMDで、Radeon RX9060 XTが冷却を強化した環境で、4.769GHzで動作したとのこと。GPU OCの世界記録らしい。
ソフトウェア関連を少し。Linuxカーネル7.0でIntel 440BXチップセットのドライバーが削除されるという記事が出ていた。私事だが、2000年に組立てたパソコンのASUS製マザーボードが440Bを使っていたと思う。ちょっと懐かしい。CPUはPentium-III(Coppermine,0.18um)で、当時はソフトも無いのにデュアルCPU構成にしていた。自分でも何がしたかったのか、よくわからないが。
Intelが開発を中止したと言われているGitHub上にあるOpen-PGLは、アカデミックソフトウェアファウンデーション(ASWF)に収蔵されるようだ。ASWFはLF(Linux Foudation)がホストするプロジェクトのひとつ。
今日は少し早めに起きた。昨日はスイッチが落ちるみたいに眠ってしまった。コーヒーを飲んでようやく体が動き始めた。
まとめ仕事を頼まれていたものの、午前中は細かいタスクをひたすら捌いていたら時間が足りなくなった。そのまま昼休みに突入してしまう。午後イチでなんとか提出して、ひとまず義理は果たしたという感じ。
昨日、飛び込みで入ってきた仕事の下ごしらえをしていたら、少し残業になってそのままウェビナーに参加してから帰宅。疲れたけど、金曜だから良しとしよう。