2026年3月31日

そういえば、NVIDIAがMarvelに20億ドルを出資したという記事が出ている。両者はシリコンフォトニクス関連で提携したようだ。NVIDIA側はNVLINK Fusionを提供し、Marvelも採用することで、NVIDIAのCPU,GPU,DPU,NIC,Ether-SWに接続可能なカスタムXPUを開発するとのこと。また、AI-RAN, 5G, 6Gネットワークを拡張していく構想を、両社間で共有したと見られる。

次にインテル関連。インテルのPanther Lake-Hのダイフォトが出ているようだ。3月8日に出ていた記事とは別のダイ写真で、ハイエンド品種の写真となっている。Intel 18Aプロセスで製造されたコンピュートタイルに、Pコアx4, Eコアx8, LP-Eコアx4が搭載されている。背面給電(BSPD)を使っているので、信号面に電源配線が無い分回路の配置が密に詰まっているかが気になるが、高解像度な写真ではあるが、他のチップレットと見比べてもよくわからない。光学顕微鏡で見える回路の切れ目は、電源電圧が異なる場合やアナログ回路を保護する場合に必要なギャップであることが多く、これはプロセス世代とはあまり関係が無い。同じ機能ブロックで面積が比較できると、分析できるのかもしれない。写真には他に、Xe3コアx12を含むGPUタイルとIOタイルも写っているが、Panther Lake-Hでは、GPUタイルがTSMC N3Eプロセス, IOタイルがTSMC N6プロセスで製造されている。GPUタイルとIOタイルを合わせると、面積としてはコンピュートタイルよりも、少し大きいように見える。

CPUつながりで次の話題。Arm AGI CPUに対するインテルの見解を伝える記事と、インテルCPUに対するAMDの見解を伝える記事が出ていた。Arm AGI CPUは、AIデータセンター向けとしてアピールしていたように思うが、AIワークロードに適したCPUについての議論は、これから始まるのかもしれない。AI学習からAI推論に世間の注目が移っていく中で、CPUアーキテクチャの議論が久しぶりに活発になりつつあるような気がする。

CPUは計算機の発展とともに、その時代の要請に合わせていろいろな検討がなされてきた。1990年代には、パイプラインやスーパースカラーに加えて、マルチスレッド、アウトオブオーダー、投機実行、VLIW、キャッシュメモリなど、現在のCPUコアで用いられている技術は出そろっていたと思う。ちなみにこのころは、浮動小数点演算器がコプロセッサ扱いだった。1990年代の終わりに論理回路の組み方と消費電力の関係が整理されて、2000年代に入ってクロックゲーティングやパワーゲーティング、DVFS、バックゲートバイアスなどの省電力技術(電力制御技術)がたくさん出てきた。

2000年代に入ってトランジスタの微細化が進み、電源電圧が下がってオンチップマルチプロセッサが一般的になると、サーバーが並列化して大型化していった。このときの計算性能指標(SPECベンチマーク)は整数演算(Int)や浮動小数点演算(FP)がメインで、消費電力(Power)が追加された。スーパーコンピューターの性能はLINPACKで測られ、京などにみられるように、計算機というよりも建物になった。(2000年の地球シミュレータも体育館並みだったが) 現在はハイパースケーラーが、データセンターの建物にCPUを詰め込んでいる。データセンター向けCPUのベンチマークには、VMをいくつ動かせるかというSPECベンチマークがある。

今後、AIデータセンターになるとCPUとGPU・NPUが建物に詰め込まれることになるが、AIにとって理想的なCPUアーキテクチャについて議論が始まると思われる。どのような構成がAIワークロードに最適なのかまだよくわからないというか、AIワークロード自体が突然変わる可能性がある。とはいえ、AIワークロードそのものはNPUにオフロードされるので、その準備には汎用的な処理が可能なCPUを用いることになる。この汎用的な処理の守備範囲が、おそらく変わっていくのだろう。オフロードという意味では、画像処理や学習はすでにGPUにオフロードしている。また、現在のCPUにはベクトル演算器が入っており、HPC並みの計算性能を持っているが、こういった機能が今後も要求されるのか、意見が分かれる可能性があると思う。

AIワークロードの前処理に適したCPUという観点では、今のところCPU各社の設計思想は、さまざではないかと思う。いくつかのCPUの仕様について、現時点で要素別に整理してみたい。

まず基本的なところとして、半導体プロセスは、Intel 18A/INTEL3からTSMC 2nm/3nmあたりとなっている。コアの動作電圧は半導体プロセスに従う。コアの動作周波数は3GHz~4GHzと言ったところかと思う。電圧と周波数は発熱・冷却と密接な関係があり、いまは冷却能力にどれくらいコストをかけるかで周波数が決まると思う。昔は論理回路の段数(クリティカルパス)で周波数の上限が決まっていたが、今もそうなのだろうか。(トランジスタが十分小さくて速いので何段でも入りそうな気がするが、暴言だったら申しわけない) 発熱はワークロードとコア数と周波数によって変わり、コア単体の周波数とワークロードがどれくらいの発熱でおさまるかは、省電力技術も含めて設計次第である。

コア数は、物理コア数ではNVIDIAのVeraが88コアで少ない方、インテルのClearwater Forrestが288コアで最多となる。インテルのGranite Rapidsは128コア、Arm AGIは136コア、AMDのVenice(Zen6c)は推定だが256コアと思われる。コア数は、データセンター用としてはVM性能のうえでは多い方が良いと思われる。AIデータセンターでどのように作用するかは未知数と思う。コアが多ければ、AIエージェントの数も増えるかと思うが、スループットの観点では、他の要素の制約も受けるだろう。(以下、AIワークロードというときは推論を想定している)

スレッド数は、物理コア内に1つ(シングルスレッド)か、2スレッドとなっている。データセンター用ではノイジーネイバー問題やセキュリティ懸念があり、シングルスレッドの方が良いと言われている。シングルスレッド派はインテル Clearwater Forrest(Eコア)と、Arm AGIである。2スレッド派はAMD Zen6/6c、NVIDIA Vera、インテル Granite Rapids(Pコア)である。ただし、NVIDIA Veraは2スレッドだが空間分離スレッドと言っており、ノイジーネイバー等の問題は起きないと言っているようだ。また、AMDとインテルの2スレッドコアは、BIOSでシングルスレッドにできるようで、各社シングルスレッドを意識していると言ってよい。インテルの次期PコアであるDiamond Rapidsは、シングルスレッドではないかとのウワサもある。AIワークロードでは、どちらが良いかは未知数だと思う。ワークロード単体はシングルスレッド性能を上げて、ソケット当たりのスループットはコア数で稼ぐ、という方向のような気もするが、マルチスレッドの利点もありそうな気もする。

論理コア当たりのL3キャッシュ容量は、1MBクラスと2MBクラスに2分されているようだ。NVIDIA Veraが0.92MB(168MB/176論理コア)で、Arm AGIが0.94MB(128MB/136論理コア)となっている。AMD Venice(Zen6c)で2MB(CCD当り128MB/64論理コア)、インテルGranite Rapidsで1.97MB(504MB/256論理コア)、Clearwater Forrestで2MB(コンピュートタイル当り48MB/24論理コア)となる。Armアーキテクチャの方は1MB/論理コアのようだ。AWSのGraviton5も1MB(196MB/196論理コア)となっている。AIワークロード以前に、キャッシュメモリは単純に多い方が性能には有利かと思うが、L2$や主記憶との帯域のバランスもあるので一概には言えないかもしれない。(1MBあれば、ベンチマークプログラムが入ってしまうので、性能評価上は1MBで良いという事情もあるだろう)

DDR5チャネル数は、インテルのGranite Rapidsだけ世代が少し古いのでDDR5 8chとなっている。Clearwater Forrestと、Arm AGIはDDR5 12chとなっている。NVIDIA VeraはLPDDR5 8chだが、SOCAMMでメモリモジュールひとつが192GBを搭載できる。ソケット当たりのメモリ容量としては1.5TBになるので、他の12ch×128GBと同等となる。AMD VeniceはIOダイを拡張しており、DDR5 16chとなっている。AIワークロードはメモリがたくさん必要なので、後発のCPUほどメモリ搭載容量が大きくとる傾向にあると思われる。今後も増えていくのかもしれない。また、AIワークロードの方では、省メモリ化に注力する流れも出てくると思われる。

CPU内蔵のベクトル演算器は、インテルのGranite RapidsではAVX-512(512bit幅)やAMD Zen6/6cにはコアに256bit x2器のベクトル演算器がある。インテルのClearwater ForrestはAVX2(128bit) x2器、Arm AGIは128bit SVE2 x2器、NVIDIA Veraは128bit SVE2 x6器を搭載している。512bit幅のベクトル演算器は、科学技術計算向けに倍精度(FP64)で計算するために搭載されているが、電力消費が大きいのでスパコン用CPUを目指さなければ載せない方向だと思う。一方で、ベクトルエンジンをFP8やFP4に分割してAIワークロードを処理するので、ベクトル演算器自体は必要である。近年のAI向けCPUの変化のひとつと言える。

同様に、最近はマトリクス(行列)演算器が搭載される傾向にある。インテルのGranite RapidsではAMX(Advanced Matrix Engine)がある。AMXはSapphire Rapids(2021年)から載っている。一方で、Eコア系のClearwater Forrestには搭載されていない。ArmアーキテクチャにはSME/SME2という行列演算器があり、SMEはFP32、SME2はFP16での行列演算が可能となっている。SMEはQualcommのSnapdragonに載っていたと思う。SME2はサムスンの次期Exynosに載る予定だったような気がする。

Arm AGI CPUにSME2が載っていない点は少し注目かと思う。NPUにオフロードすることが前提となっているのかもしれない。NVIDIA VeraにもSME/SME2は載っていない。そもそもGPUのTensorコアが行列演算器で、Volta GPU(2017年)のころに先行していて、他社のCPUに波及したのがAMX(GPUではXMX)やSMEと言ってよいと思う。Veraも行列演算はGPUにオフロードすることが前提と思われる。AMDもGPUにCDNAを搭載しており、Zen6には行列演算器は搭載していない。Ryzen AIにNPUとしてXDNAを搭載しており、これをZen7以降で搭載すると見られている。現状のCPU内蔵の行列演算器は、当座のNPUとして機能する程度と見て良いと思われる。インテルもPanther Lakeには50TOPS程度のNPUが搭載されている。AIデータセンター規模になると、行列演算はCPUで処理せず、GPU/NPUにオフロードするのが現在の傾向と考えられる。

従来の観点では、一般的なCPUの特徴は、コア数・キャッシュメモリ容量・動作周波数・発熱などだが、性能という点では、メモリ帯域、専用演算器の有無など細かく見るべき項目があると思う。現在のAI向けの性能指標は、AI FLOPS(FP8またはFP4)、NPUのTOPS、トークン/秒のTPSあたりだが、MLPerfなどのベンチマークもこれから整理されると思う。ソフトウェア性能(UI/UX)とベンチマークの関係が社会に認知されると、次はベンチマークを高得点にするためのアーキテクチャが考案され、ハードウェアに波及していく流れになると思う。しばらくは推移を見守ることにしたい。 

CPUの性能関連でもうひとつ。数日前からインテルのBOT(Binary Optimization Tool)について記事が多く出ている。ゲーム全般で性能が8%程度向上するらしく、効果がある場合では18%などの数字が見られるようだ。命令数の変化に着目すると、スカラー命令をベクトル化するという記事があり、ベクトル演算の多用でIPCを上げていると思われる。せっかくの専用演算器も使うソフトが無ければ、ただのダークシリコンとなって不要と判断されてしまう。一方で、このような最適化活動があって効果がわかると、やはり必要だということになって無いと売れなくなってしまう。こうしてハードウェアは変わっていくのだと思う。

最後にTSMCの話題。TSMCの熊本工場(FAB23)で、3nmプロセスを製造する件に関して、台湾経済部投資委員会の承認が下りたようだ。2028年に12インチウェハ換算で月産15,000枚を目指すとのこと。台湾のTSMCはそのころA14プロセスに移行している見込みであり、台湾での最先端プロセスから2世代前の半導体プロセス製造であれば海外に出しても良いという「N-2原則」は保持されている。 

もうひとつTSMC関連。ドイツのドレスデン建設が進められているESMCについて記事が出ている。ESMCは、TSMC・ボッシュ・インフィニオン・NXPが出資した半導体工場で、TSMCが70%の株を保有、あとの3社が10%ずつとなっている。ESMCが地域に向けたシンポジウムを開催したようで、TSMCから1.6nmプロセスについて説明があったようだ。これまでに公表されている計画では28/22nm、16/12nmプロセスだったと記憶しているが、導入予定のないプロセスについて説明するのもおかしい気がする。熊本のJASMのように最初は汎用的なプロセスで、その後に先端プロセスの導入を考えているのかもしれない。

2026年3月30日

そういえば、NVIDIAがRTX60シリーズを発表したようだ。GeForce RTX6090が含まれる。先日のGTCでは、カートリッジは披露されたが、具体的な機種としては発表されなかったと記憶している。今回はGeForce RTX6070,6080,6090が発表された。Rubinベースなので、GPUチップの型番は、それぞれGR205,GR203,GR202となる。いずれもTSMC 3nmプロセスで製造される。最上位機種のRTX6090は、前世代のRTX5090と同様の32GB(GDDR7),バス幅512bitとなっているが、6070と6080は前世代の5070,5080からメモリが4GB増加し、バス幅が64bit広くなっている。発売は2027年と見られる。

次にAIの話題。韓国のAIスタートアップのRebellionsが、4億ドルを調達したとの記事が出ている。2月のISSCC2026で、Rebel100という推論チップを発表していたおり、すでに販売しているようだ。4つの推論チップをUCIeで接続しているが、左右に2つのチップを点対象に並べており、その2つのセットを上下に並べている。両脇にHBM3eが配置されているが、推論チップの方が少し長いので、HBM3eの横にはシリコンチップがある。ただし、普通のダミーシリコンではなく、中にデカップリングキャパシタ(いわゆるパスコン)が入っているらしく、ISC(Integrated Silicon Capacitor)という名前がついている。シリコンインターポーザ―上にアセンブリされており、半導体ベンダーはサムスンとのこと。Rebellionsの名前は、先週のArm AGI CPUの発表の中で、初期ユーザーの中のひとつとして挙がっていたと思う。サムスンやSKハイニクスも投資しているので、メモリ不足の影響は受けにくいとみられているようだ。

AIつながりでもう一つ。欧州のAIモデル開発のミストラルが、8億ドル調達したらしい。13,800基のNVIDIA GB300を用いたデータセンターをパリ郊外に建設するとのこと。ラックにして1,900台規模と見られる。ミストラルはフランスの企業で、ヨーロッパのAI主権について期待を集めている思われる。12億ユーロを投じてスウェーデンにAIデータセンターを建設するなど、2027年までに欧州全域で200MWのデータセンター建設を目指していると記事は伝えている。

最後にAppleの話題。Apple ティム・クックCEOが、スマートフォンの使用について、スクリーンタイムを減らすよう語ったという記事が出ている。テレビ番組に出演したときのコメントのようだ。人と直接コミュニケーションをとる時間を犠牲にしてまで、スクロールに時間を費やすことは無い、語ったとのこと。若年層に限った話ではないとは思うが、最近は子供へのSNS使用の影響が問題視されていると思う。自治体が年齢でSNSやゲームを禁止したり、学校にいるときはスマートフォンは使用禁止として、生徒同士でのコミュニケーションを促す学校も増えている。そういった例はいいと思うが、一方でインフラとしてのスマートフォン利用を制限するのはデメリットが大きいような気もする。社会と技術の相互影響については、今に始まった議論でもないが、この先もずっと考えることになるだろう。おそらくスマートフォンの次はAIと思われる。

2026年3月29日

そういえば、AMDの次期Zen6 EPYC Veniceの実物について情報が出ているようだ。エンジニアリングサンプルの評価が始まっていると見られる。評価システムの情報も出ており、評価システムの名前が、コンゴ・ケニア・ナイジェリアとなっている。コンゴとケニアは1ソケット、ナイジェリアが2ソケットシステムとのこと。Zen6のサンプルと伝えている記事もあるが、中を見るとZen6cのようだ。Zen6cはZen6の高密度コア版で、Zen4c, Zen5cの後継とみられる。cのあるなしでCCDの設計自体が異なっており、歴代のCCDあたりのコア数がZen4/4cで8コア/16コア, Zen5/5cで8コア/16コア, Zen6/6cで12コア/32コアとなっている。Zen6はTSMC 2nmプロセスで製造される。(Zen4は5nm, Zen5は4nm, Zen5cは3nmプロセス)

今回のVeniceのエンジニアリングサンプルは、3種類CPUが用意されており、192コア(384スレッド)、128コア(256スレッド)、64コア(128スレッド)となっている。CCDの数がそれぞれ8つ、4つ、2つとなっており、128コアと64コアは32コアで割り切れるが、192コアはCCDあたり24コアになっているようだ。32コア×8CCDだと256コア(512スレッド)になるはずだが、これまでのEPYC Zen5cの最多コア数が192コアなので、システム側(評価環境)の都合で192コアに制限したのか、冷却か電力か何等かの制限があったのかもしれない。VeniceではIOダイが2つ載るようになっており、DDRのチャネル数は12chから16chに増える。ソケットもSP5からSP7に変わる。フル構成でのテストは、まだこれからと思われる。

少し違う角度からの話題、というと、最近は中東関連の話になるが、今回は水不足の話題。台湾の西側が顕著な水不足となっているらしい。西側にはTSMCのファブが集まっている。半導体工場には大量の水が必要で、TSMCの日本工場が熊本に決まったのは、阿蘇山の水が豊富だった点も理由のひとつであると聞いている。もちろんTSMCのファブは資源の再利用技術が進んでおり、環境にやさしい半導体工場であることは間違いないが、深刻な水不足となると生産に影響が出るのではないかとの観測が流れているようだ。もっとも半導体の製造以前に、地域全体の問題として水不足は深刻な課題だと思う。

2026年3月28日

そういえば、インテルとAMDのCPUが4月から値上げとの記事が出ている。インテル10%、AMD15%程度の値上げらしい。今年に入ってから値上げの話が絶えなかったが、Webで提示されているロット価格(千個購入時の単価)は、今のところ変わっていないようだ。公表されている単価は目安なので、実際に買い付けるときには、個別に交渉して取引価格が決まると思う。個別の取引価格は知ることはできないが、業界内の雰囲気で最近の高い低いのレベル感は伝わるのではないかと思われる。 

つぎに、Qualcommの話題。次世代のSnapdragon 8 Elite Gen6の製造でTSMC 2nmを使うとの記事が出ている。現行のGen5がTSMC 3nmで製造されているのに対して、Gen6はサムスンの2nmを使うのではないかとの推測も出ていたと思うが違っていたようだ。チップのバリエーションとしては2種類あるらしい。2月の下旬に、Qualcommのインドチームが2nmでのテープアウトを完了したという記事が出ていたと思うが、出した先はTSMCだったようだ。

最後に、AWSの話題。AWSのマット・ガーマンCEOのインタビュー記事が出ていた。2006年にサービスを開始して20年になるのを記念して、CNNのインタビューに答えたものらしい。私個人の認識では、アマゾンと言えば通販でお世話になっている程度でそれ以外の接点はない。ジェフ・ベゾスが創業して、通販の商品の登録・タグ付けや、サーバーやストレージを貸すような感じだったサービスが、あるときからインスタンス単位で計算能力を売るようになり、気が付いたらメガデータセンターでクラウドサービスプロバイダーになっていた。もちろんその間に、有線や無線の通信速度が上がり、スマホが登場し、仮想環境がととのう、といった感じでハードウェアやミドルウェアも進歩してきたと思う。

インタビュー記事では、2026年度のAWSのAI関連投資額が2,000億ドルとなっていることに触れており、その予算の行き先は、単純にデータセンターとサーバーだと答えている。1ドル160円(ここのところ中東情勢のおかげか1ドル160円ギリギリ)とすると、32兆円になる。GDP世界第4位の日本の1年の国家予算の4分の1におよぶ投資を、一企業だけで行う。個人的に、以前から半導体やコンピューターは戦略物資であると考えていたが、今や半導体やコンピューターが国家予算に匹敵する金額に膨らんでいる状況となっている。産業革命以降、欧米を中心に鉄を扱う技術が飛躍的に進歩し、それまでレンガと石で作られていたビルが鉄筋になっていく中で、ビスマルクは「鉄は国家なり」と言ったことは良く知られている。データやAIの国家主権(ソブリニティ)が意識される現代では、半導体は国家なりと言ってよいのかもしれない。

2026年3月27日

そういえば、インテル元CEO・パット・ゲルシンガーの談話が出ている。半導体分野の投資とリターンは長期計画に基づくものとなるため短期的な利益は見込めない性質がある。しかし、経営者はウォール街の投資家から短期的な利益を求めるプレッシャーにさらされて失敗してしまう、という内容のようだ。ゲルシンガー氏がCEOに就任した当初、5N4Yという方針が出て度肝を抜かれたが、その反面、ほんとうに達成できるのか疑問に思ったことを覚えている。5Nとは半導体プロセスノードで、5つのノードを開発するということである。4Yとは2021年からの4年間ということで、2021年から2025年の4年間で、5つのプロセスノードを開発するという計画であった。 

当初の5Nは、具体的にはINTEL7, INTEL4, INTEL3, Intel 20A, Intel 18Aの5つであった。最初のINTEL7の次の世代は、7に0.7を掛けて5になるところだが、ハーフピッチ進めてINTEL4となっている。4の次は同様に0.7を掛けてINTEL3、3の次は2(intel 20A)、その次はIntel 14Aとなるところだがハーフピッチ戻して18Aとしたと思われる。1.5世代+1世代+1世代+0.5世代で4世代となる。INTEL7は実態としては10nm Super Finで、10nm相当と言われている。TSMCは2017年に10nmを達成しているのでインテルとしてはだいぶ遅れており、ロードマップの2017年に10nm、2019年に7nm、2021年に5nm、2023年に3nm、2025年に2nmというペースに追いつく必要があった。そこで、2021年に10nmから始めて、4年間で18Aまで進めてTSMCを追い抜く構想があったと思われる。

さて、2025年が終わって2026年現在、ゲルシンガー氏はCEOを退任してしまったが、Intel 20Aはキャンセルしたものの、INTEL7でXeon5、INTEL4でMeteor Lake、INTEL3でXeon6、Intel 18AでPanther Lakeを製造した。18Aは2026年1月6日発表だが、TSMCの2nmは2025年12月30日に量産開始なので、1週間しか違わない。ゲルシンガー氏のころ、インテルのイベントのたびに、キャッチコピーのように"Moore's Law Still Alive"と繰り返していたのが、個人的に気に入っていた。2023年にGordon Moore博士が亡くなったが、あのキャッチコピーが耳に届いていたのだろうかと思うと、少し胸が熱くなる思いがする。

一方、昨日、現在のインテルのCEO・リップ・ブー・タンのインタビュー記事が、出ていた。スタートアップへの投資を継続するという内容で、インテルの投資部門について、スピンオフする考えはないことを表明したようだ。コーポレート・ベンチャーは企業の目と耳のようなものだと述べている。新しいテクノロジ―を活用した新しい企業への投資は、リターンを求めるものというよりは、採用や設備投資を行わない研究開発の延長とみているのかもしれない。就任以来、インテルがばらばらにならないように、いろいろ繋ぎとめるような決断が多い気がする。ゲルシンガー氏の意志を継いでおられると思う

次にNVIDIAの話題。NVIDIAのジェンスン・フアンCEOが、TSMCとの間には契約書がないと述べた、という記事が出ている。無いわけないと思うのだが、どうやら、開発契約などの契約書にサインしたことは無く、頼んだことは必ずやり遂げてくれる、ということが言いたいようだ。つまり契約書が要らないほどの信頼関係と言いたいのではないかと思う。一般論だが、契約書が無くても依頼して応諾すれば、諾成契約(口約束)という契約関係になるので、書面は無いが何らかの情報は伝えているのだろう。

具体的な話は知る由も無いが、おそらくNVIDIAがGPUなどのチップの開発計画(仕様・希望納期・希望価格・投入時期など)を伝え、TSMCが応じられる範囲で技術的なチャレンジを設定するのではないかと想像する。そのときに、いわゆる開発委託計画書などは作成していないということかと思う。過去の製品を見ると、NVIDIAのGPUの半導体プロセスは少し違っていて、10nmが最先端のときに12nm(12FF)プロセスを使うなど、ハーフピッチほど緩くなっていることがあった。次期Feynmanも、A14ではなくA16である。TSMCも最先端でチャレンジではなく、すこしマージンをもって確実な線で答えているのではないかと思うが、どうなのだろうか。半導体プロセスが少しずれている理由が、なんとなくわかった気がした。

引き続きNVIDIA関連。NVIDIAが出資しているAIスタートアップにReflectionが注目を集めているようだ。NVIDIAはすでに8億ドルを出資しているらしい。Reflectionは西欧版DeepSeekと呼ばれており、現在はオープンウェイトモデルを開発中とのこと。1年前の企業価値は5.45億ドルとみられていたが、いまは200~250億ドルと言われている。今回資金調達で25億ドルの獲得をめざすと見られている。ただし、まだ収益を上げる成果には結びついておらず、韓国の新世界グループと提携して、LLMの韓国語カスタマイズを行うようだ。GPUリソースはNVIDIAが支援するらしい。

技術的な話から少しずれるが、NVIDIAに対して株主から集団訴訟が起きているようだ。2018年くらいに仮装通貨のマイニングが大流行して、GPUがゲーム市場ではなくマイニング業者に流れていった時期があったと思う。その時のNVIDIAが開示した売上げの内容がゲーム市場での売上となっていて、仮装通貨向けの売上として計上されていなかったようだ。ただし、2022年にこの件はSEC(証券取引委員会)から指摘を受けており、NVIDIAはおそらく6億ドル程度を計上し直して課徴金550万ドルをおさめている。しかし売上の実態は17億ドルほどと見られ、開示内容に10億ドル以上の乖離があるとして、集団訴訟に発展したようだ。

NVIDIAつながりでもうひとつ。マイクロソフトがAzure上で、NVIDIA Vera Rubin NVL72ラックAIシステムを用いて、ERPワークロードへの適用評価を始めたとの記事が出ている。ERPはEnterprise Resource Planningの略で、企業の基幹システムのことだが、いわゆる人事給与・会計システムのようなものだと思う。そういう分野にAIワークロードが入り始めたということは、AIエージェントが事務を始めるということかと思われる。時代が進んでいる気がする。

最後にGoogleの話題。GoogleのTPU v7 Ironwoodと、量子チップWillowについての記事が出ていた。Ironwoodは2026年内に310万から320万チップの出荷を見込んでいるとのこと。TPUラックとして統合され、1ラックあたり64TPUを搭載し、光回路スイッチで144ラックを接続することが出来る。全体で9,216TPUのシステムとなる。Metaは2027年にTPUをレンタルで導入するようだ。また、Willowチップは、特定のタスクで、従来のスーパーコンピュータより13,000倍高速に実行できるとしており、創薬や材料開発といった分野に向けた応用で期待されているらしい。Willowは超伝導量子ビットによる高速システムだが、Googleとしては中性原子量子コンピューティングにも拡大していくとしており、こちらはスケーラブルな構成をとることが可能となっているようだ。

2026年3月26日

そういえば、Appleの創業者のひとり、スティーブ・ウォズニアックが、現在の生成AIについて、まだ不十分で失望していると述べたと伝える記事が出ている。おそらくAppleの創業50周年に合わせたインタビューで、米CNNテレビとFOXニュースで、キャスターの質問に答えた内容と思われる。不十分という内容は、いろいろな情報はくれるが方向性が違うことが多い、味気ない、人間味が無い、という趣旨で、結論としては、本当に完成するには人間として生きる必要がある、と述べているようだ。生成AIというよりも「人工知能」としての完成を期待してのコメントという気もする。

一方で、2・3日前に、NVIDIAのジェンスン・フアンがネット動画番組のロングインタビューで「AGIは、いまもう既に達成されている」と述べた、という記事が出ていた。AIエージェントが社会に進出を始めている状況を考えると、AIが人間に混ざって仕事を始める状況は「汎用的」と言えるかもしれない。その意味では、AGIは達成されていると言ってもいいような気もする。

AIは「フリをする計算機」であると私個人は思っている。教えてと言えば「先生のフリ」をするし、相談すれば「友達のフリ」をするだろうし、画家や小説家のフリもする。事務的な依頼をすれば「担当者のフリ」もする。会社の中ではさまざまな職種に役割があり、そのポジションに対して募集をかけるので、応募してくるのが人かAIかは関係が無くなってくると思う。そういう意味では、すでにAIは職に就けると思う。ただし、見たことのない案件で新しいフローを追加する場合は、コンプライアンスや会計処理などで人間が判断を下すことになる。そういうマネジメントは判断に責任が伴うので、人間の役割になるだろう。(なので、AGIがいくら集まったところでNVIDIAにはならない) 単純に考えると、人間と協働できるという意味では、汎用AI(AGI)と言っても過言ではないと思う。ジェンスン・フアンが言っているのはこういう意味ではないかと想像する。

一方で、友達のフリはどうだろうか。人間でも友達のフリはするので、問題ないだろうか。(この場合はちょっと意味が違う気もするが) 将来的には親のフリをするAIも現れると思うが、どうだろうか。これは人間関係をAIに置換えようとするので、倫理的な問題が付きまとうように思われる。

すこし軽めの話題にレベルを調整することにして、話し相手をしてもらうだけと考えると、AIは人間としての感情の動きをもつ必要があると思う。すると、AIにも個性が求められることになるような気がする。人間は育った環境で個性が磨かれていくのに対して、AIは話し相手に合わせた個性を持つのかもしれない。ただし、エコーチェンバーやバブルフィルターのようなことになると、人間には害悪となる可能性があるので、AIが備えるべき標準的な哲学が求められるだろう。人間界でも生成AIのおかげで、哲学に関心が集まっているらしい。(人間は自問自答するものだ) 話し相手となったAIと人間のあいだに思い出が重ねられていくと、AIがリセットして個性が失われると、人は「AIが死んだ」と表現するようになるかもしれない。そうなると、AIは人間として生きたことになると思う。ウォズニアック氏が言っているのはこういう意味ではないかと思った。

NVIDIAが実現したAIファクトリーは、人間と協働するAIを産んだと思う。一方で、Appleが志向するAIは、死ぬAIなのかもしれない。

次にテラファブの話題。数日前から、イーロンマスクのテラファブ構想について記事が多数出ている。実現性はよくわからないと思ったが、背景を考えるとリアリティはあると思う。テキサス州オースチンに構えるテラファブ構想には二つの半導体工場があり、ひとつは自動運転やヒューマノイド向けAI半導体、もう一つは宇宙AIデータセンター向け半導体となるとのこと。宇宙向けは特別な半導体になるため、専用に開発するつもりのようだ。ちなみに、低軌道衛星(LEOSAT)は地上200km~1,500kmで、ヴァンアレン帯の内側である。放送用静止衛星は地上36,000kmにあり、より多くの放射線にさらされている。おそらく宇宙AIデータセンターは、低軌道高度を考えているのだろう。

宇宙空間は太陽の日射があたるときと、地球の影に入ったときの温度差が激しく、また放射線の密度も地上の比ではないので、半導体には過酷な環境と言える。イーロン・マスクはスターリンクの小型衛星(地上550km付近)を飛ばしているので、放射線の影響データなども持っているのかもしれない。放射線がトランジスタにあたると、一時的に誤動作を起こすことがある。電源を切って入れ直すとエラーが消えるので、ソフトエラーと呼ばれている。ただし動作中に電源の入れ直しはできないので、宇宙・航空用途では二重化や三重化が必要となる。

イーロン・マスクが、テラファブが必要だと言う理由は、世界全体の半導体の供給能力にあるようだ。TSMC、サムスン、マイクロンなどのファブによる供給が限界にきているため、自分でファブを建設するということらしい。現在全世界で生産している半導体の計算能力は年間20GWと見ており、テラファブは、まず年間100~200GW、最終的に1TWの計算能力の生産を目指すという。その80%(800GW)が宇宙向け、20%が地上の自動運転やヒューマノイド向けらしい。データセンターは、すべて宇宙にある前提と思われる。

記事によると、アナリストの資産として、1TWの計算能力を生産するには、月産700万枚から1800万枚のウェハを生産する必要があり、月産5万枚と仮定すると新たな半導体工場が140から360ほど必要になるらしい。ウェハだけではなく、パッケージング工場も当然必要になるし、関連するメモリやICなどの半導体も必要になる。おそらく、現在のファブの供給能力が単純に限界に達したというのではなく、いま現在の半導体各社の拡張計画や増設の予定よりも、伸びてゆく需要の方がずっと上回り続て「永遠の順番待ち」が発生すると見て、イーロン・マスク自身でファブを作ることにしたのではないかと思われる。こういう状況だと、思い立ったが吉日で、早く始めた分だけ損失は少ないということになると思う。

もしこの先も計算能力がずっと不足を続けるとしたら、半導体の価格と半導体を用いる製品は高額にならざるを得ないだろう。2003年にデジタルデバイドという言葉が生まれ、インターネット人口が増えてゆく中でIoT社会が到来し、スマホが普及して、自動運転になり、データセンターが建設されて、いまやAIが社会を変えつつある。ベースには常に半導体があり、多くの半導体各社が社会を支えてきた。すでにAIやデータセンターの国家主権がキーワードになっており、ここで半導体が高騰すると、国単位で第二のデジタルデバイドが起きるのではないかという気がしている。AIやデータセンター、HPCを持っている国と持っていない国では、ますます格差が開くのではないだろうか。

今回のテラファブ構想では、イーロン・マスクは銀河文明の幕開けと言っていたようだが、1月の下旬に開催されたダボス会議での発言を聴いていると、太陽系をひとつのエネルギーシステムととらえていると思われる。人類全体が巨大なエネルギーと計算リソースを必要とする現実に対して、石油を堀り出して燃やしたり、原子力でお湯を沸かして電気にしているのは非常に不自然な話ととらえているのではないかと思う。宇宙や自然は、全体が低コスト・低ポテンシャルに収まっていくようにできている。その流れの中に計算機を置くとしたら、宇宙空間が最適だということなのかもしれない。災害はともかく戦争でデータセンターが狙われるリスクも減るに違いない。テラファブ構想は株価対策や補助金集めではないかという声もあるようだが、個人的には期待したいと思う。

最後にホワイトハウス関連。PCASTの委員に、米国AI関連企業のトップが招聘されたようだ。PCASTは大統領科学技術諮問委員会(President’s Council of Advisors on Science and Technologyの頭文字)で、アメリカ大統領に科学技術に関する政策課題と解決策の方針を助言する機関である。かなり古くからあるが、 今の形になったのは2001年のブッシュ大統領のころからのようだ。私が知ったのはオバマ大統領このころだったと思うが、隔月くらいで会合が開かれ、資料や動画が公開されていた。科学技術に関する議題が中心だが、ITだけでなく教育・健康・都市生活・宇宙開発など個人から社会まで全般を扱う。自然科学ならNSF(National Science Foundation)の方だが、工学は社会課題と絡むので、PCASTの方が課題が明確で面白い。

トランプ大統領の1期目のときにはPCASTそのものが途切れたようで、DOE(エネルギー省)の隅に追いやられた感じだったが、バイデン政権で大統領令が出て復活し、第2期トランプ政権ではEO(Executive Order) 14177が発せられて継続はしたようである。活動内容はよくわからない。今回メンバーが追加されたようで、NVIDIAのジェンスン・フアンやオラクルのラリー・エリソン、Googleのサーゲイ・ブリン、metaのマーク・ザッカーバーグ、AMDのリサ・スーなどが任命されている。リサ・スーはバイデン政権のときにもPCASTの委員になっていたと思う。

最近はPCASTの動きを追っていなかったが、いくつかドキュメントが出ているようなので、また追ってみたいと考えている。

2026年3月25日

そういえば、Armが開催したイベントArm Everywhereにて、独自開発のArm AGI CPUが発表されたとの記事が出ている。ArmがCPUを出すことについては、2024年5月に開発計画が発表されて、2025年2月に開発が進んでいることが報道されていたと思う。25年内か25年度内に出るのではないかとのことだったと思うが、年度内には間に合ったようだ。アーキテクチャやIPのライセンス販売と並行して、チップ自体も販売するというのは、少し珍しいかもしれない。x86はインテルとAMDが作っているが、ライセンスは販売していない。RISC-VやSPARCはオープンライセンスで管理団体があり、自ら作ることはしていないと思う。IBMのPowerアーキテクチャは、IBMでチップ開発してはいるが、オープンライセンスに移行してLinux Foundationに移管したと思う。

発表されたチップは、2チップレット構成で、Arm Neoverse V3コアで136コアと書かれている。チップの画像はCGなので実物ではないことはわかったうえで数えると、120コアのようだ。V3コアの上下の両端に10個ずつ計20個のコアのような模様があり、これもV3コアだとすると計140コアで、4コアが冗長用と考えられる。また、120個のコアの方は2個単位でペアになっているように見える。これで思い出したのは、NVIDIAのVeraのチップ画像(これもCGだと思うが)で、Veraもコア2つがペアになっている。Arm AGI CPUはVeraと同じメッシュネットワークを使っているのかもしれない。ただし、そうすると両端の20個のコアのようなものは、メッシュネットワークから独立しているようにも見える。これはV3コア(Poseidon)ではなく、N3コア(Hermes)ではないかと推測する記事もあるようだ。そうすると「136個のV3コア」ではなくなるが、いずれにせよイメージ図なので、あまり深く考えないことにしたい。

2つのチップレットの間がつながっているかどうかは、発表されている情報からはわからなかったが、基板の色からすると、おそらくNVIDIA Blackwellと同じくCoWoS-Lではないかと思われる。CoWoS-Lは有機基板で、配線幅がシリコンインターポーザ―(無印のCoWoS)より太くなるが、チップ間の下にLocal Si Interconnect(LSI)という接続部品が入っているので、CoWoSと同等の配線密度でチップ間を接続出来ると思われる。2つのチップレットの向かい合った側はL3キャッシュメモリと思われ、合計で128MBとなる。紹介動画でソケットに78 X 73 MMと書いてあるのがソケットのサイズだとすると、チップサイズは2cm x 3cmくらいになると思われ、600mm2越えていると思われる。3cmは、製造限界に近い。TSMC N3Pプロセスで製造されているが、DDR5やPCIeも含めて同じチップを回転対象で2つ並べた構成となっており、部品点数が少ないのはサプライチェーンのリスクが減るのでメリットかと思う。

サーバーとしての供給は、AsRockが基板を開発し、Supermicroが販売するようだ。ラックとしても準備しており、OCPラックに準拠する。1CPU300Wで空冷が可能、2CPUを1Uにしたブレードを30段組みこんだ空冷ラックと、8CPUの1Uブレードを42段組込んだ水冷ラックがある。空冷ラックは36kWだが、水冷ラックは200kWとなっている。NVIDIAのVera Rubin NVL72ラック(水冷)やAMD Heliosラック(水冷)と遜色ない電力となっている。

最初の顧客はMetaで、2024年の開発開始から共同で取り組んでいるとの情報が出ている。Metaは、自社製のAIチップであるMTIA400シリーズを先日発表したが、そのCPUとしてArm AGI CPUを使うとのこと。他にもOpenAIやCerebrasなどが初期顧客となるらしい。Armからの発表では、52社からのエンドースメント(支持するコメント)が出ている点が印象的であった。製造や開発をサポートするファブやASIC開発やCADと、OSやプラットフォームに加えて、競合するArm CPUを開発するAWSなどのクラウドサービスプロバイダー(CSP)と、Veraが競合するNVIDIAからもエンドースメントが出ている。ライバルとなるx86のインテルやAMD、おそらくマーケットがかぶらないAppleやQualcomからは出ていなかった。(Qualcommはかつての訴訟相手でもあるが…)

Arm Everywhereというイベント名が示すとおり、組込みからスパコンまでArmアーキテクチャのCPU/MPUは広がっており、そこにArm社自身がハイエンドCPUを持って入ってきた形となっている。分野がすこしずれるが、TSMCは自社チップは顧客と競合になるので作らないと言っているし、顧客と競合するインテル(ファウンドリ)は顧客がなかなかつかない状況であることを考えると、ライセンスの顧客とは競合しないこと示すための、52のエンドースメントであるように思われる。とはいえ、アーキテクチャライセンスを売りながら競合製品を製造するというのは、しばし注目ではあると思う。

次にちょっと話題が変わるが、GPUの密輸出関連。Supermicro社員による中国への迂回輸出事件が、NVIDIAに飛び火しているようだ。米国ホワイトハウスがNVIDIA GPU の中国向け輸出許可を出すにあたって、NVIDIA(ジェンスン・フアン)が、GPUシステムはこっそり持ち出せるほど小さくないので密輸出は不可能だと説明していたことが、許諾の判断根拠のひとつになっていたらしい。どうもGBラックシステム(重量2トン)が念頭にあったと思われる。実際には密輸出されたのはGPUサーバーでGBラックよりはずいぶん小さい。CEOからすると、GPUサーバーは眼中になかったのかもしれない。

中国つながりでもうひとつ。アリババが次世代AIチップを発表したようだ。玄鉄C950というチップで、RISC-Vアーキテクチャとみられている。TSMC 5nmプロセスを使うらしい。中国企業のAIチップがTSMCで製造できるのか、よくわからないがどうなのだろうか。2022年ごろに、BIRENという中国のファブレスによるGPUをTSMCが7nmで製造していたが、アメリカの横やりで製造中止になったと記憶している。2024年には、Huaweiに迂回して供給していた中国メーカーが米国に摘発されて、TSMCが7nm以降のAIチップは供給しないと全中国メーカーに通達したと思う。

最後にAppleの話題。Appleから昨年9月に発売されたiPhone Airに搭載のC1X 5Gモデムについて、性能評価の結果が出ているようだ。同時期に発売されたiPhone17pro Maxには、Qualcommの5Gモデム X80が載っており、両者を比較したところ、レイテンシやダウンロード速度で互角に近い性能が出ているとのこと。アップロードはキャリアグリゲーションに対応しているX80が優位を保っているらしい。AppleはC2モデムで対応すると見られている。C2モデムは今年の秋のモデルに搭載されるのではないかと期待されている。ただし、今月中ごろにQualcommの5G RFシステムに関する契約を延長したとの記事があり、Appleの自社開発の遅れを懸念する声が出ていたと思う。

2026年3月24日

そういえば、Broadcomが、半導体はTSMCの供給能力がボトルネックになっていると指摘したようだ。TSMCの2nm以下のファブは2026年第3四半期にFAB20p3(新竹)とFAB22p3(高雄)に装置の設置が始まるので、2027年にはある程度増強されるが、2026年はサプライチェーンに影響するのではないかとのこと。とくに2nmの初期プロセスは、Appleが製造能力の50%を占めているとの観測もあるようだ。他にも、Broadcomによるとレーザー分野はとくに供給が滞っており、台湾と中国本土のPCB納期が延びているらしい。確証はないが、シリコンフォトニクス関連の生産が追い付いていないことを示唆しているのかもしれない。一方でサプライヤー側は、顧客と長期契約を結ぶ傾向にあり、サムスンが主要顧客との提携関係が3~5年の長期契約になっていると、記事は伝えている。

TSMC関連でもう一つ。TSMCの2nmは4年連続で値上げの見通しが出ている。28年まで予約で埋まっているとのこと。アリゾナのFAB21も、まだ出来ていない3nm/2nm工場の生産予定まで全部埋まっているようだ。FAB21の3nmラインは、2028年完成の予定だったが、2027年後半に工程を前進しているとのこと。海外のTSMC工場の建設期間は、約6四半期(1.5年)とされているようだが、現在は合理化が進んで約4~5四半期となっているらしい。すでにApple, NVIDIA, AMD, Qualcommが米国内での製造を望んでいる状況とみられている。

中東情勢が半導体に影響を与えているというのは、ここのところ報道されるようになっていると思う。ヘリウムの供給は世界全体の約30%がカタールから輸出されており、半導体プロセスの中では冷却などの材料として不可欠である。TSMCだけでなくサムスンにも影響が及ぶ。サムスンにしてみると、調達しているヘリウムの68%がカタール産とのことで、供給の停止は死活問題かもしれない。インテルが使うヘリウムは、おそらく米国産と思われる。(米国は世界最大のヘリウム産出国)

もう一つの脅威は台湾の天然ガスで、台湾には天然ガスの備蓄が11日間程度しかないのではないかとの記事がている。(日本や韓国には90日分の備蓄がある) ホルムズ海峡が閉鎖されたのは3月12日ごろかと思うが、TSMCのファブへの電力供給に影響が出ると、作りかけのウェハが大量廃棄になるリスクがあると記事は伝えている。先端テクノロジーはTSMC以外の選択肢はなく、マルチソース化もできない。台湾に限らないが、いまは在庫をあまり持たないジャストインタイム(JIT)方式で製造を行うため、いったんチップ製造が滞ると下流の行程にかけて生産がマヒする可能性がある。部品表に載っている部品がそろわなければ、製品は完成しないし、モジュールが完成しなければ次の工程に進むことはできない。半導体製造と半導体を用いた製品は、国際協調の中で作られている。

2026年3月23日

そういえば、NVIDIAのFeynmanがGTCで発表されたばかりだが、TSMCの生産キャパシティの観点から、もう今の段階で製造が困難ではないかと言われているようだ。FeynmanはTSMC A16で製造する予定だが、A16はプロセスノードとしては2nmの改良版(スーパーパワーレールと呼ぶBSPDを導入するなど)の位置づけとなる。2nmは2025年の年末から量産を開始しているが、すでに需要がひっ迫しており、2027年まで製造予約が埋まっているらしい。TSMCは2nmの工場を建設する予定だが、それでも2028年以降の需要はすぐに埋まると思われる。そのような中で、A16のキャパが十分確保できるのか、早くも疑問が出ているということのようだ。チップレット構成になると思われるが、A16以外の部分にはN3Pを用いるのではないかとみられている。

また、CoWoSもネックになると見られており、FeynmanではTSMCだけでなくIntel Foundryも使うのではないかと見られているようだ。GTCでは3DスタッキングやカスタムHBMを使用するとしていたが、調達と供給を調整しておく必要があると思う。一般論だが、異なる半導体プロセスや会社をまたいだチップレット構成になると、どれかの供給や組立が滞ると最終的な製品にならない。半導体の微細化が進んでいたころは、ひとつのチップがどんどん多機能になっていく流れであったが、微細化が緩やかになった現在では、高性能なXPUを作るにはチップレットの数が増える複雑な構造にならざるを得ない。半導体の供給不足やファブやOSAT(組立と試験の外部委託)のキャパ不足が予見されるときは、部品の点数や組立の手間を減らしたシンプルな構造の方が望ましいと思う。この問題はしばらく続くと思われる。

GTCでの発表をもう一つ。NVIDIAとEmerald AI社が提携し、電源供給網をコントロールするAIファクトリーを構築するようだ。NVIDIAが提供するVera Rubin DSX AIファクトリーリファレンスデザインを活用し、Emerald AI社のConductorプラットフォームで、電力各社の電源供給網を管理する取組みを行うらしい。この取り組みに加わる電力各社は、AES(バージニア州)、Invenergy(イリノイ州)、NextEra Energy(フロリダ州)、Vistra(テキサス州)と、原子力関連のConstellation社、欧州のハイパースケーラーNscale社のデータセンター電力インフラ部門であるNscale Energy & Powerとなっている。Nscale社はNVIDIAから出資を受けていたと思う。電力供給は、発電量と消費量のバランスを、一日を通して保ち続けることが基本となるが、近年は再生可能エネルギーが入ってきたり、蓄電池が普及したりと電源が多様化している。AIデータセンター自身の消費電力も問題となりつつある中で、逆にAIデータセンターを電力供給網に取り込んでしまうという取り組みのようだ。 

2026年3月22日

そういえば、Appストア内にあるAI Vibeコーディングアプリについて、Appleからアップデートが阻止される事例があったという記事が出ている。Vibeコーディングは、プログラミングの知識が無くても、おおまかな支持を伝えるだけで、AIが仕様に落としてコーディングしてくれる仕組みである。問題になったアプリは、プレビュー時にブラウザを開いたり、デバイスの機能に特化したアプリを実行できてしまうらしい。問題点の詳細はよく理解していないが、なんとなく悪意を持つ者が利用しそうな機能ではある。これらの点が、Appストアの審査ガイドラインに抵触するようだ。開発側で修正すれば、再開できる可能性はあるとのこと。しかし、大まかな雰囲気を伝えるだけでプログラムになってしまうというのは、すごい時代になったものである。

つぎに輸出関連の話題。米サーバーベンダーの社員2人と請負業者1人が、NVIDIA GPUサーバーを中国へ不正に輸出していたとの記事が出ている。東南アジアのダミー企業からH200とB200のGPUサーバーを大量に発注し、届いたGPUサーバーを他の箱に入れ替えて中国へ送り込んでいたらしい。3人のうち2人は逮捕されたが1人は逃亡中と伝わっている。この、逮捕されたのはSupermicroの共同創業者と請負業者で、逃亡している一人は同社の台湾営業部長とのこと。Supermicroからは、当該の社員2人は解雇し、同社としては輸出規制を遵守するとの声明が出ている。

Supermicroは、2024年度決算(2025年6月)の適時開示と、そのあとの2025年度第1四半期(2025年7-9月期)の四半期決算の適時開示が出来なかったことがある。2018年にも、財務諸表の提出を怠ったため、米国の証券取引委員会から一時上場廃止の決定を受けていた。その後、いったんはCFOを替えて建直したが、立て直しが終わるとCFOを替えて、もとの経営幹部を再雇用して元に戻っている。空売りアクティビストのヒンデンブルクリサーチ(2025年1月に廃業)からレポートが出ており、企業体質がわかるエピソードが詳しく記されている。どうも経営ガバナンスを問われる体質があり、不安な感じはぬぐえないように思う。

最後にAWSの話題。AWSのAIチップであるTrainiumを立ち上げている研究所のレポート記事が、TechCrunchから出ているようだ。現在Trainiumu4を開発中だが、Trainium3は昨年12月にリリース済みである。加えて、現在はNeuronスイッチを開発しており、メッシュ構成のTrainium3が互いに低レンテンシでつながるようになるようだ。Trainium3までの配備されたチップの累計は140万チップになるとのこと。Trainium2は、Anthropicで100万チップが稼働しているらしい。ということは、40万チップがAWSということだろうか。Trainiumの開発グループは、元は2015年に買収されたAnnapurna Labsで、現在もラボにはそのロゴは残っているということで、設備や談話など写真とともに紹介されている。私個人もちょっと懐かしい現場の感じを思い出した。

2026年3月21日

そういえば、NVIDIAがGPUの供給でAWSと提携したようだ。2027年までに、GPUとLPUのAIチップを100万個以上を納入するとのこと。AWSは、自社設計のGraviton5 CPUと学習・推論用のTrainium3 AIチップが稼働しているが、それらとは別に、即戦力としてのNVIDIA社チップを購入したと思われる。Trainum4も開発中だが、今回の購入が2027年までに、という条件が付いているところを見ると、性能が安定するのはまだ先で、いわゆる「つなぎ」の形でNVIDIA社製チップを購入したのかもしれない。下の話題と絡むが、OpenAIに出資したことで、AIエコシステムの拡大を目論んでいることも考えられる。

そしてAWS関連でもうひとつ。マイクロソフトがAWSとOpenAIを訴えるようだ。先月末に、AWSがOpenAIに500億ドルを出資するという記事が出ていた件と関連があると思われる。AWSとOpenAIの提携内容は、ステートフルなAIサービスをAmazon Bedrockを通じて提供するということで、従来からのステートレスなAIサービスの提供を行っていたマイクロソフトとの関係は、何ら変わりがないとされていた。訴訟内容はわからないので想像するしかないが、マイクロソフトはOpenAIが非営利団体だった2019年から出資しており、AzureとOpenAIで顧客企業とAIエコシステムを築いてきた経緯がある。その中には技術的なノウハウや営業上のノウハウが入っていると考えられる。マイクロソフトとしては、それらの秘密情報がOpenAIを通じてAWSに流れていくことを懸念している可能性があると思われる。一方でAWSは、NVIDIAから100万を越すAIチップの供給を受ける約束も取り付けており、OpenAIとともにAIエコシステムの拡大を狙っているとみられる。訴訟は真っ向勝負になると時間がかかるため、待ったをかける立場のマイクロソフトが有利かもしれない。

TSMCのC.C.ウェイ会長が、亞州大學(台中市)の名誉博士号を取得したとの記事が出ている。1998年にTSMCの職に就いたときの半導体プロセスは0.25umが主流だったが、現在2nmを生産しており、100分の1になったとのこと。もっとも2nmというのは商標上でのサイズで2nmの線幅で露光しているわけではないのだが、半導体ロードマップ上の等価的スケーリングに則して考えると現在は2nm相当ということで、トランジスタ性能は100倍になったと言ってよいと思う。スピーチの中では、人を介護するロボットへの構想が示されたとのことで、画像解析はもちろんのこと、人体に安全に触れるための圧力センサーや、駆動系を制御する機能など、まだまだ課題は多いとの認識が示されたようだ。人とロボットが共存する時代は間違いなく到来すると思う。フィジカルAIが自動車産業並みに発達する未来が楽しみではある。

最後にIBM関連。あまり技術的な話題ではないが、32年間にわたってIBMの広告戦略を担当してきたOgilvy社が、IBMの次期クリエイティブエージェンシーの選考に参加しないとの記事が出ている。IBMのCM動画というと、画面の上下にやや暗めのブルーの帯が入って、その間でいろいろな解説動画やショートドラマ風の動画、ときにはコミカルなやり取りが繰り広げられてきた。ビッグデータやスマータープラネット時代のCMには印象に残っているものがいくつもある。今後は少し変わるのだろうか。ちょっと要注目かもしれない。

2026年3月20日

そういえば、インテルがソケットの戦略を見直すとの記事が出ているようだ。インテルのCPUは、2世代ごとにソケットの形状が変わると言われているが、マザーボードを変えずともCPUのアップグレードで使い続けられるように、ソケットの形状を変えないようにするらしい。AMDは、RyzenのソケットをZen3まではAM4、Zen4以降はAM5で出している。ソケット互換の方が、同じマザーボードやメモリなどのセットアップで使い続けられるので、その方がユーザーの利便性が高いと思われる。去年からメモリが高騰しており、余波でコンシューマー向けのCPUやGPUの今年の発売が無さそうな状況となっている。基本的に自作PC派には厳しい状況なので、ソケット互換を約束するというのは良いことだと思う。マザーボードメーカーにとっても、現状ではメリットが大きいのではないだろうか。

だいぶ以前の話になるが、インテルのCPUが出るときには、CPUアーキテクチャがアップグレードするときにはソケットが変わり、CPUアーキテクチャが同じで半導体プロセスが次の世代に移るときはソケットが変わらない、というお約束のようなものがあった。いわゆるTik-Tok戦略と呼ばれていた開発方針で、ユーザーから見ると1年ごとにCPUのアップグレードがある一方で、開発する側はアーキテクチャのチームと半導体プロセスのチームが約2年ごとに更新するということになっていた。

そしてこの約2年かけて半導体プロセスを開発するところがムーアの法則そのものだったと言ってよい。24ヶ月でトランジスタの集積度は倍になり、電力はそのままでコアやキャッシュメモリが増えて周波数が上がる、という具合だったと思う。このTik-Tok戦略は、インテルがNetburstアーキテクチャで65nmプロセスに移った2006年から、14nmプロセスでSkyLakeアーキテクチャに移った2015年まで続いた。その後、プロセス開発が10nmへ移行できずに、インテルからTik-Tokは止めるという宣言が出ていたと思う。

また、CPUアーキテクチャが変わるときは、システム側でもメモリやチップセットをアップグレードするタイミングで、CPUの端子数が増えてパッケージの外形が変わり、ソケットも交換となっていた。当時はDIMMもDDRが3から4になったり、PCIeやUSBの世代がアップしたり、ATAがSATAになったり、いろいろな技術が次から次に出てきて、新しいマザーボードに替える動機になっていたと思う。かつてはインテルのIDF(Intel Developers Forum)が賑やかで、マザーボードのフォームファクター開発もけん引していたような気がする。

インテル関連でもう一つ。CPU製品の価格を、10%程度値上げの情報が出ている。AIの推論システムの需要が増したことで、CPUに依存するワークロードも増え、CPU需要を押し上げているようだ。

CPUつながりでArm関連。ArmからArm CPUが発表されるようだ。来週開催予定の、Arm Everywhereで発表されるとの記事が出ている。Armはアーキテクチャ販売の会社だが、去年、独自設計のArm CPUを出すと発表していたと思う。いよいよ具体化したということか。詳細はまだわからないが、スマホ向けかPC向けか、データセンター向けかHPC向けか組込み向けか、いろいろな用途で使われるArmアーキテクチャだけに、予想がつかない。また、各方面ですでにメジャープレイヤーがいる状況で、はたしてシェアを獲得できるのか、という気もしている。また、半導体プロセスはどこなのかも気になる。すでに製造ラインに空きがない気がするが、予約してあるのだろうか。(大きなお世話かもしれないが)

SKハイニクスのHBM4Eのロジックダイに、TSMCの3nmプロセスを使うという記事が出ている。SKハイニクスのHBM4はNVIDIAのGPUに採用されているが、サムスンよりも性能が劣るとされているようだ。これを覆すためにHBM4Eを強化するとみられる。HBM4では、コア(DRAM)チップに1bプロセス(10nmクラス第5世代)、ロジックダイ(PHYやIOなど)にTSMCの12nmプロセスを用いているが、これをHBM4Eでは、コアに1cプロセス(10nmクラス第6世代)、ロジックダイにTSMCの3nmプロセスを用いる計画のようだ。サムスンは1c+自社4nmとみられる。

TSMCとサムスンの関連で2つ。まず値上げの記事が出ている。TSMCが製造ラインのひっ迫もあって、5nm以下のウェハ価格を上げるかもしれないとの記事が出ている。この場合、5/4nm、3nm、2nmプロセスの値上げとなる。昨年から今年にかけて、3nm以降は2029年まで毎年10%程度のウェハ価格の上昇を予定している、と言われていた気がする。5/4nmが加わったということか。次世代の半導体プロセスが主流になると、それより前の世代のウェハ価格が下がる、というのは過去のビジネスモデルかもしれない。また、サムスンも5/4nmの需要の高まりを受けて、2025年第4四半期から値上げしているとのこと。 

次に労働争議。台湾の労働監督署が台湾企業の労働基準法違反を調査したところ、Top10の7位にTSMCがランクインしたらしい。詳細はわからないが、全体的には残業代の不払いや長時間労働の隠ぺいなどの違反が多いとのこと。景気が良くても悪くてもこういうのは後を絶たないような気がする。景気が良い場合は仕事が多すぎて、景気が悪い場合はお金が少なすぎるからだと思う。もちろん台湾は前者だと思うが。また、おとといの記事だが、サムスンが5月にゼネラルストライキを予定しているそうだ。ゼネストとなればサムスングループ全体と思うので、半導体製造も対象だろう。現状は労働組合がスト権を獲得したということだと思うので、5月まで交渉は続くと思われる。技術的な話ではないが、技術を支えるのは人なので、こういう話は重要だと思う。

2026年3月19日

そういうことで、GTC関連の話題が盛りだくさん。基調講演のほかのジェンスン・フアンの話として、NVIDIAは今後10年間で社員の数が7万5千人になるが、750万のAIエージェントと協働するようになると語った記事が出ている。社員1人当たり100のAIエージェントと働いて、会社の業務の主体はAIエージェントということになる。数は抜きにしてAIエージェント主体という意味では、10年かからないような気もする。また、事業を遂行するペースが速くなり、常にクリティカルパスの上で仕事をするようになると語ったらしい。それはその通りのような気がする。急ぎの仕事は忙しい人に頼めという言葉があるが、そんな感じの業務風景が日常になるのかもしれない。健康管理やウェルビーイングの重要性が増すと思われる。

AIつながりで次の話題。NVIDIAからOpenClawへのNVIDIAの取組みとしてNemoClawが発表された。基調講演でも、大きなトピックのひとつだったと思う。NemoClawは、NVIDIAのOpenShellにNemotronを統合したもののようだ。NemotronはNVIDIAのLLMで、Nemotronを扱うフレームワークとしてNVIDIA NeMoが用意されている。OpenShellは推論エージェントのランタイム環境である。これらを統合し、AIエージェントがオンプレのローカル環境からプライバシールーターを介してクラウドにアクセスすることで、セキュアな運用を確保しているとのこと。強化学習も行うので自己進化型自律エージェントと呼ばれているようだ。ガードレール層があり、ファイルやネットワーク、プロセス、推論が、他のAIエージェントと混ざらないように分離保護されていると見られる。個人向けというよりも企業向けパッケージのようだ。 

ここからハードウェア。まずはラックの話題。NVIDIA Vera RubinのラックシステムKyberで、800VDC対応が進んでいるようだ。DCなので直流給電となる。従来の電源供給は、415VACで供給し、途中で54VDCへ変換し、GPUカードなどで12Vに変換し、さらに負荷点(POL)となるチップのそばで0.8Vなどの電源電圧に変換する、という具合になっている。変換の損失もあるのだが、根本的な限界も見えている。同じ電力(W)を供給する場合、電圧(V)が低いと電流(I)が増え、電流が増えると途中の配線やコネクタの抵抗値(R)に対してIRドロップが起きやすく、損失(=発熱)が増えるという問題があり、実際に12Vコネクタが燃えたりして問題が徐々に大きくなっている。

この問題に対応するためには、電流を少なくすればよいが、電圧を上げることになるが、チップ自体への供給電圧は1Vを切っており、この電圧差を吸収できる電圧コンバーターが必要になる。一般的に入力電圧が大きいとコンバーターのサイズも大きくなるため、配置する場所など物理的な対応が難しかった。パワー半導体のGaN素子は耐圧が大きく、入力電圧が高くても小型化が可能なので、ボードに実装できるサイズで800VDCを受けて12Vを出せるようになる。電源系全体でも、コンピューティングトレイまで800VDCで配ることが出来るため、ラックや給電設備全体で損失を減らすことが出来る。GW級AIファクトリーを構成するラックシステムには、必須の技術になると見られている。電力がAIファクトリーの規模(=AI性能)を決める時代となっている。

ここからVera CPUの話題。NVIDIAがVera CPUの詳細を明かしたという記事が出ているようだ。チップレット構成で、CPUダイの両わきにメモリーコントローラーダイが2つずつ4つ並んでいる。ひとつのメモリコントローラ―ダイには2つのLPDDR5コントローラーが入っているので、1チップあたり8つのLPDDR5コントローラーが載っている。システムボード上はVeraを挟むように4本+4本のSOCAMM2が並ぶ。SOCAMMを192GBとすると、8本で約1.5TBとなる。1ノード2CPUで約3TB。CPUダイの下側は、PCIe Gen6 x16のPCIeダイがある。CPUダイの上側はチップレットは無く、CPUダイに搭載されたNVLINK C2C(Chip-to-Chip)マクロがある。これはGPUともつながるが、1ノード2CPUとなるときには、Vera同士をつなぐことになる。NVLINK部分の面積は、PCIeダイの面積よりかなり小さい。半導体プロセス(VeraはTSMC 3nm)の違いもあるのかもしれないが、PCIeダイの方が5倍くらい大きい。 

CPUダイの内部は、コアが7列x13行で並んでいる。計算すると91コアになるが、公表されているコア数は88コアで、差引き3コアが動かない場合のバックアップ用の冗長コアのようだ。動かないと言っても、製造後の試験で動かない場合や、機能的には動くが動作速度が遅くて不合格になる場合など、いろいろある。チップ内で91コア中88コアが合格するということは、96.7%の合格率があればよいので、動作速度のチップ内ばらつきとしては片側2σ(97.7%)で管理すればよいことになる。実際のところはわからないが、さすがに設計基準は3σとして、2σ管理に緩めたマージンは製造側が持っているということだろうか。設計も製造も3σ管理ならば88コアと言わず90コアでも良いと思う。しかし、91コア中の3つのコアを動かないようにして出荷するというのは、少しぜいたくな気もする。ちなみにGraceは76コア中72コアで出荷しているようなので、Graceよりは攻めているのかもしれないが。

CPUコアのアーキテクチャは、前世代のGraceがArm Neoverse V2だったのに対して、Veraでは独自設計のOlympusコアを開発している。コア間のメッシュネットワークはSCF(Scalable Coherency Fabric)の第二世代となっているが、Graceと同じくArmのCMN(Coherent Mesh Network)ベースとみられている。一般にArm CPUというと、物理コア数=論理コア数のシングルスレッドが主流のような気がするが、Veraは2スレッドで、176論理コアとなっている。ひとつの物理コア内でマルチスレッドにすると、同じ演算器リソースをタイミングで切り替えて使うの、ノイジーネイバー問題や意図していなかったセキュリティの脆弱性が発覚するリスクがあると見られている。このためデータセンター向けでは、シングルスレッドが主流になっていると思うが、Veraの2スレッド構造は対策がしてあるようだ。

Veraの2スレッド構造はSpatial Multi-threadingで、同じ物理コア内ではあるが、それぞれにリソースを割り当てるので空間的に分けている、と説明されている。よく理解していないが、演算機のリソースが2つ分入っているのだろうか。Graceのメッシュ構成は7x6のようだが、Veraの構成は7x7のように見えるので、メッシュサイズと接続可能な物理コア数はそれほど変わらないと思われる。ただしプロセスがN4(Grace)からN3(Vera)に進むことで、増やせる物量を論理コア数に振り向けたのかもしれない。N4のLogic密度はN5とほぼ同じで、N3のロジック密度はN5の1.7倍程度と言われているので、N4からN3も論理回路は1.7倍程度は増やせると思われる。物理コア内のL2キャッシュメモリは共有するとして、演算リソースは2つ分入るのかもしれない。

また冗長の話に戻るが、仮に90コアまでアクティベートするなら、180論理コアになるので、2スレッド化の恩恵で4論理コアを増やすことが出来る。歩留りが安定すると増やすつもりなのかもしれない。ちょっと気になるのはロイヤリティで、一般的にはチップ単体での課金やコア単位での課金など、ケースバイケースではあるが、88コア分で払っているのか176コア分で払っているのか少し気になった。ただしVeraの場合は、現状でコア数のバリエーションが無いようなので、チップレベルでの課金かもしれない。以上でVeraの話は終わり。

ここからGTC関連の話に戻る。シスコから、セキュアAIファクトリーという構想がGTCで発表されている。AIファクトリー内は、膨大な数のGPUとCPUがあり、光も入ってきて多様な高速通信が行われるようになっている。セキュリティも合わせて変わっていく必要があり、その中のひとつで、Cisco Hybrid Mesh FirewallをNVIDIAのBlueField DPUに拡張するシステムが出ているようだ。外部からのリクエストに紛れて入ってくる脅威が、CPU/GPUに到達する前に、DPUで防御する構想らしい。AIファクトリー内部のワークロードはこれまでよりも飛躍的に検査するべきプロセスが増加するので、BlueFieldで守備を固めることで、堅牢なセキュリティを築くとのこと。

また、Alice&Bob社から、NVIDIAのCUDA-Qを量子コンピューティングに組み込んだ成果が、GTCで報告されている。昨年、同社のQPUシミュレーションライプラリ(Dynamiq)にCUDA-Qを統合し、今回、量子誤り訂正(QEC)復号シミュレーションにGH200を用いたところ、AMDのRyzen 9 9950X(16コア/32スレッド)に比べて、実行時間が18時間2分から1時間57分(約2時間)に、約9分の1になったとのこと。量子コンピュータ内でデコヒーレントによって量子計算が壊れた後、量子誤り訂正(QEC)復号シミュレーションで復号した結果を、量子計算に戻して継続することが出来るらしい。戻し方など皆目見当がつかないのだが、復号に18時間かかると1日挟むような感じになると思うが、これが2時間だとだいぶ助かるのではないかと思う。

最後にGTCとは別の話題。AMDのリサ・スーCEOが韓国のネイバー社を訪問したとの記事が出ている。ネイバーのAIデータセンターに、AMDのチップを使うという覚書を交わしたようだ。ネイバーのLLMであるHyperCLOVA Xに最適化したGPUを提供するらしい。現在はNVIDIAのBlackwellが入っているが、NVIDIAにロックインされないためにマルチベンダー化を検討しており、当面はAMDかインテルのGPUで90MW程度の増設(合計135MW)を計画しているとのこと。さらに倍の規模の270MWまで拡張する予定らしい。

2026年3月18日

そういえば、NVIDIA H200の中国への輸出が再開する動きを見せているらしい。今年に入って何度か、中国国内に入る動きを見せていたが、実際にはまだ輸出できておらず、今月の初めの方には在庫が積みあがっているので、H200の生産は中止したという記事が出ていた。GTCの最中だが、ジェンスン・フアンが、発注書を受け取ったので出荷も製造も再開すると答えたと、伝える記事が出ている。 

以下GTC関連。基調講演の影響や、こべつの企業からの発表など、目を引く記事が出ている。

基調講演で触れていた宇宙への進出について、記事が出ているようだ。データセンターなのか宇宙ステーションなのかはよくわからないが、データセンター級宇宙ステーション(そのようなクラス分けは無いと思うが)の、軌道上での自律運用を可能にするチップセットとして、Space-1 Vera Rubinを開発するらしい。データセンターの構築や通信、画像伝送、アプリ開発など、NVIDIAと提携している企業はすでに数社あるようだ。

GTCでの製薬・美容関連から2つ。スイスの製薬大手ロシュ社が、NVIDIA GPUを2,176基購入するとの記事が出ている。GPUの種類は明かされていないようだが、これまでの購入済みGPUと合わせて3,500基になるそうだ。これは製薬業界では最多になるとのこと。ラックあたり72基とすると、50台弱と思われる。もうひとつは化粧品のロレアルが、NVIDIA Alchemiフレームワークを採用するようだ。予測型AI科学を強化するとともに、スキンケアの成分がどのように作用するか、原子レベルの解析を行うとのこと。これによって研究開発から製品化までのスピードがアップすることを期待しているらしい。

もうひとつGTC関連。基調講演でDLSS 5の効果を示すために、いくつかのゲームのワンシーンでDLSS 5 OFF→ON の切替を見せていた。あらかじめ私はPCではゲームをしないことを断っておくが、ONの方が単純にリアリティが上がったと思って見ていた。ところが、これがONの方がよろしくないという批判がX(旧Twitter)で噴出しているらしい。どうやらゲームクリエイターからは表現の押し付け(もしくは不気味の谷に触れたか)に見えたようだ。ジェンスン・フアンからは、この炎上をうけて、DLSS 5のコントロールの調整はクリエイターに開放されているので、どのような表現も可能、とのコメントが出ているらしい。NVIDIAとしてはこれからはニューラルレンダリングになるということで、ハードウェアでレンダリング性能を向上させる流れから、AIがレンダリング性能を引き上げていく流れになりつつあることを言いたかったようだ。

AMDのリサ・スーCEOが韓国を訪問しており、サムスンとメモリ供給について覚書を交わしたとの記事が出ている。AMDの次期GPU、MI455Xに使用するHBM4メモリと、Zen6世代のEPYC(Venice)に使用するDDR5メモリについて、供給を確保したようだ。また、メモリのみならず、AMDの次世代製品のウェハ製造も視野に入っているらしい。AI半導体需要の増加で、TSMCも工場建設を急いで入るが、既存のラインは3nmも2nmも2027年まで空かないようなので、新規設計のチップは、どこに製造を委託すればよいのか、という状況かもしれない。TSMC以外でEUVを用いた最先端プロセスを製造できるのは、インテルかサムスンとなる。AAMDがインテルに委託するのはちょっと想像しにくいような気がする。

インテルのマレーシア工場が2026年内に稼働を開始するようだ。プロジェクト・ペリカンというコードネームのもとで、先端パッケージング工場として準備が進められているとのこと。ダイの選別から、EMIBやFoverosに対応するLSI実装を行うらしい。他にも、韓国にあるAmkorの松島K5工場が、インテルのOSAT(Out-Sourcing Assemble and Test; 組立と試験の外部委託)としてEMIB対応をしているそうで、インテル以外のファウンドリが製造したチップに対して、インテルがパッケージングを請け負う体制が整ってきているとみられる。

最後に量子関連。Quantum Machines社がNVIDIA, AMD, Riverlaneとの共同で、CPU-GPU-QPUのOpen  Acceleration Stackを発表したようだ。同社のOrchestration Platformを拡張し、NIVIDAのNVQLINKを使用することで、PPUと呼ぶパルス処理ユニットと、CPU, GPU, FPGA, ASICなどのアクセラレータを低遅延で接続できるようになったとのこと。これにより、量子コンピュータが、量子誤り訂正(QEC)とAIをネイティブに使うことが可能になるらしい。また、量子コンピュータとのオープンな接続が可能になることで、各社がCPUやGPU、アクセラレータ開発の効果検証を進める環境が、一歩前進したと思われる。

2026年3月17日

ということで、NVIDIA GTC2026が始まっている。3/16(現地時間)から4日間の開催。初日は恒例の、ジェンスン・フアンによる基調講演がある。時間はサンノゼの昼11:00~13:00なので、日本は日付が変わって3/17の早朝3:00~5:00となる。前の晩に早く寝て、朝会社につなぐ前にYouTubeを探したら、もうアップされていた。6:00過ぎだったような気がする。

半導体製品関連では、新しい動きとしてFeynman GPUとGroq 3 LPUが発表された。新しいCPUは、Rosaという名前だけが表示された。Groq 3はチップ写真のようなパッケージの画像が出ていたが、たぶんCGだと思う。FeynmanもCGではないだろうか。NVIDIAは基本的にダイフォトは公開していない。学会発表でもGPUのダイフォトのようなCGが提示されていて、少し物議をかもしたことがあったように思う。Feynman GPUとRosa CPUが次世代のペアとなるようだ。Groq 3はRubin世代からシステムに加わる。

2024年から、2年刻みのロードマップが示された。以下となるようだ。1月のCES2026では、2026年の組合せは6種類だったが、Groq LPUが加わったことで7種類に増えた。

◆2024
GPU: Blackwell / Blackwell Ultra (2025)
CPU: Grace
DPU: BlueField3
Network: NVLINK5
Ether SW: Spectrum-5
Infiniband: CX8
Rack System  Oberon NVL72

◆2026
GPU: Rubin / Rubin Ultra (2027)
CPU: Vera
LPU: LP30/35
DPU: BlueField4
Network: NVLINK6/NVLINK7
Ether SW: Spectrum-6 
Infiniband: CX9
Rack System:  Oberon NVL72 / Oberon NVL576 / Kyber NVL144

◆2028
GPU: Feynman (TSMC 1.6nm / Die Stacking / Custom HBM)
CPU: Rosa
LPU: LP40
DPU: BlueField5
Network: NVLINK8
Ether SW: Spectrum-7
Infinibamd: CX10
Rack System: Oberon NVL72 / Kyber NVL144 / Kyber NVL1152

製品紹介では、ラックに入る各トレイと、Kyberラックの背骨となる大型のNVLINKモジュールが紹介された。ジェンスン・フアンが試しに持ち上げていたが、人が作業できる重さはとうに超えていると思う。フォークリフトのような、補助機械が必要と思われる。シリコンフォトニクスの導入については、推進してはいるが銅配線と並列で、どちらも平等に扱うことを強調していたように思う。銅にとどまることは無いし、光だけになることも無い、あくまで適材適所で併用ということのようだ。

基調講演全体の流れとしては、最初にCUDAが20周年を迎えたところから始まった。GPUの進化をたたえたがBlackwellベースのRTX5090までで、Rubinベースとなるであろう6090の映像は出なかった。AIエコシステムの拡大と紹介で、IBMのWatsonXが入っていた。ちょっと驚いたが、IBMの紹介では、なんとSYSTEM/360の写真が使われていた。少し話がずれるが、SYSTEM/360は1964年に発表されたメインフレームの元祖で、「ファミリー」と呼ばれる製品のラインナップを最初に取り入れたコンピュータシステムである。オフィス用の小型機から計算機室を構える大型機まで、同じOSで動くことが素晴らしいと言われた時代で、360は360度全方向に対応するという意味だった。GTCで360の写真を見るとは思わなかった。

AIシステムの評価では、HopperからGrace Blackwellに進み、今回はVera Rubinと、さらにGroqを加えたトークンコストの効果が示された。SemiAnalysisが提供しているWebベースのAI性能比較ツールInference-Xで、チャンピオンであることを誇っていた。このあたりは、もう少し理解しながら動画を見直してみたい。また、来年度は売上高を1兆ドル(今年度は500億ドル)にすると意気込んでいた。

終盤は、宇宙の構想と、フィジカルAIでロボットが出てきた。小型ロボットは、今回はアナと雪の女王(原題:Frozen)のキャラクターのオラフが登場した。余談だが、オラフを見ると「タレントの柳沢慎吾に似ているな」といつも思う。映画も見に行ったが、今回のロボットのフォルムを見ても、やはりそう思った。

最後はロボットのCGアニメで、森の中でロボットたちがキャンプファイヤーを囲んで、ギターや楽器を弾きながらブルージーな歌で基調講演の内容をRecapしてくれた。歌の中の映像で、五層のケーキがちらっと出てくる。歌詞も曲も歌声も、おそらくAIで作ったのではないだろうか。人が作っていたら、逆に驚くというものだ。

その他、GTC関連の記事でいくつか。昨日、CPUにインテルのXeonが採用されるのではないかと書いたが、DGX Rubin NVL8システムのホストCPUにXeon 6776Pが採用されたようだ。PコアなのでGranite Rapids(INTEL3プロセス,64コア/128スレッド)となる。ちなみに、Xeon 6776Pとして単体で購入する場合は、単価$9,875(1,000個単位での購入が前提)とのこと。

また、Groq3 LPUはTSMCではなく、サムスンで製造するようだ。 Groq2がサムスン4nmプロセスで製造されており、そのままGroq3もサムスンでの製造を踏襲した模様。プロセスも4nmとみられている。

2026年3月16日

そういえば、インテルが、NVIDIA GTC2026で何か発表するらしいとの記事が出ている。NVIDIAのGPUをコントロールするCPUとして登場する可能性があるようだ。インテル自身、NVIDIAから50億ドルの出資を受けており、技術的にもNVLink Fusionを採用すると発表していたので、接続可能になるのは不思議ではないと思う。インテルの決算ではカスタムXeonは好業績とされており、NVLink対応は一般品ではなくカスタムXeonで対応するのではないかとみられていたと。NVIDIAは、これまではArmアーキテクチャでGrace、Veraを開発しているが、Armはキープしつつも、x86も選択肢の一つと認めているということかと思われる。NVLink Fusionには、Arm CPUとしてはAWSのGravitonや富士通のMONAKAシリーズ、RISC-V CPUとしてはSiFiveが名乗りを上げていたと思う。

GTCの前触れのおかげで、他のニュースは少ないようだ。

AMD関連をまとめて。AMDとCelesticaが、Heliosラックの生産で協業するようだ。また、先日、リサ・スーCEOが韓国を訪問しており、サムスンからMI450X向けのHBM4の供給を受けるのではないかとの記事も出ている。

つぎに半導体関連。TSMCが1.2nmプロセス向けの工場用地について、環境アセスメントを進めているとの記事が出ている。生態系への影響調査を実施してる模様。1.2nm世代は、1.4nm世代と同様のナノシート型トランジスタと思われる。半導体プロセスとその周辺技術には、多くの化学薬品や重金属、ときにはランタノイド系の放射性物質が含まれることがある。人間だけでなく環境への安全性を評価すること(ESH)が、半導体プロセス開発のロードマップには含まれている。

EUVに関する興味深い記事が出ていた。半導体リソグラフィに使用されるEUV露光機は、オランダのASMLが独占的に供給しているが、年間の生産台数は約70台らしい。以前に比べれば生産ペースは増強されているし、この先も徐々に増加すると思われる。しかし、2030年に年間100台ペースになるのは困難だろうとのこと。現在の最先端半導体プロセスにおいて、スループットのボトルネックが露光機にあることは間違いないと思う。生産量を増やすために、EUVの台数を増やしたいファブや半導体メーカーはたくさんあると思うが、思うようにはならないようだ。記事では、たとえばNVIDIAのRubin GPUを1GWのAIデータセンターにインストールするには、約200万回のEUV露光が必要になり、EUV装置としては3.5台が必要になるとの分析が出ている。

記事の中では前提がよくわからなかったが、少し考えてみると、現在の主流のEUVは開口率NA(Numerical Aperture)が0.3くらいで、ウェハに回路パターンを焼き付けるには、4回くらいの露光が必要と言われており、そこでウェハが停滞すると思われる。EUV前後のプロセスとスループットをそろえるためには、EUV装置を4台を並列に稼働ればよいということになり、上の3.5台が必要という結果とほぼ合うと思う。ただしマスクセットが4つ必要にということになる。需要が大きいチップなら4つ用意するが、少量生産ではそうはいかないと思われる。EUV装置メーカーでは高NA=0.5の装置を開発や、光源を1000W級に改善するなど、露光の回数を減らせるように取り組んでいる。世界のあちこちでGWクラスのAIデータセンターが出来ようとしているが、半導体製造のペースが上がるよう、EUV装置が滞りなく供給されることを期待するしかない。

最後にクラウド関連。AWSのストレージサービス(Simple Storage Service)が、サービス開始20周年を迎えたようだ。1PBで始まったサービスは、いまや数百エクサバイトに拡張し、ハードディスク(HDD)数千万台を抱えているらしい。このHDDを積み重ねると、地球上空400kmに浮かぶ国際宇宙ステーションに行って帰ってこれるそうだ。往復800kmを厚さ1インチ(25.4mm)で割ると、3,150万台という数になると思う。ちょっと想像がつかない。もっとも、データセンターを宇宙に打ち上げなくても、HDDを積み重ねたら軌道に届いてしまう、ということが言いたいのかもしれないが。

2026年3月15日

ところで、イーロンマスクが半導体製造に乗り出すようだ。テラファブ・プロジェクトを3月21日に始動すると記事が伝えている。テラはギガの1000倍だが、ギガファブはTSMCの12インチウェハ工場の総称だったような気がする。TSMCへの対抗意識というところか。マスク氏の言い方では、ルーム全体をクリーンに保つ必要はなく、ウェハの周囲だけをクリーンな状況に隔離すればよいのではないか、とのことらしい。ウェハ運搬ボックスと、プロセス装置のチャンバー内をクリーンに保つということだろうか。ひょっとすると、ボックスとチャンバーのドッキングが、スターシップと宇宙ステーションのドッキングのようなイメージなのかもしれない。クリーンなエリア同士を機密性高くつなげる・切り離すという意味では似ているような気がするが…。半導体装置の場合だと、保守作業をするのに結局クリーンルームが必要になるのではないだろうか。詳しいことは全然わからないが。

AMDからOpenClawフレームワークが発表された。生成AIをローカルPCで動かす構想のようだ。インテルのAI PCに対応する構想のようにも思えるが、AI PCは今のところCopilot+Windows11という構成だと思うので、データセンターへのネットワーク接続が前提と思う。エージェントPCはローカルで閉じているので、もう少し先を行く考え方かもしれない。RyzenClawRadeonClawというハードウェア構成が提案されている。OpenClawの構成としては、WSL2(Windows Subsystem for Linux)とLM Studioとのこと。生成AIモデルは自分が好きなものを使えるようだ。RyzenClawはメインメモリ128GB、RadeonClawはVRAM 32GBとなっており、お値段もそれなりにすると思われる。

AMD OpenClawの構成を見ていると、おそらく、WSL2上で強化学習を行い、LM Studioで推論を行うことで、ローカル環境で個人用のAIエージェントを構成するということかと思う。私もPCにLM Studioを入れているが、生成AIのモデルパラメータが8Bを越えて12B、20Bと大きくなると、128GB載せてあるメモリが手狭に感じる。また、強化学習させようと思うとiGPUではちょっと無理で、VRAM 16GBくらいのGPUとWSL2が必要だと思う。(なのでまだ強化学習は行っていない) 導入効果がわかりにくいうちは、ハードウェア構成がちょっと贅沢ではないか、なんとなくそんなことを思った。

2026年3月14日

そういえば、TikTokの親会社である、中国のバイトダンス社が、NVIDIAのBlackwell GPUを使ったAIクラスターにアクセスするとの記事が出ているようだ。マレーシアのAolani Cloudというクラウドプロバイダーとバイトダンスが提携したらしい。B200約36,000基のAIクラスターとあるので、500台のGB200ラックで構築されているとみられる。輸出規制で中国本土へのH200の輸入が滞っているが、規制の及ばないマレーシアで、NVIDIA GPUへのアクセスを確保したと思われる。

次にAMDと半導体関連。少し前だが、AMDがAdeia社との訴訟で和解したとの記事が出ている。Adeia社はハイブリッドボンディングの特許のポートフォリオを組んでいるらしく、その中で7つから10の特許をAMDが侵害したとしているようだ。ハイブリッドボンディングは、わりと最近の技術だと思う。Adeia社の技術は、Flashメモリ(SSD)で多用されていたようだ。2024年に、AMDの3DV-Cacheで特許侵害が認められ、昨年の秋ごろから訴訟になっていたようだが、それが和解したとのこと。製造技術ではあるが、製造者のTSMCではなく、AMDが訴訟相手というところは少し不思議な感じではある。詳細は明かされていないのでわからないが、AMDがライセンスを得る必要があったのかもしれない。

ちなみに、ハイブリッドボンディング以前は、チップとチップを積層するには、間に端子とパッドが必要で、パッド径と端子(マイクロバンプ)径が30um程度、その間のギャップも同じ程度必要だった。Face-to-Face接続にハイブリッドボンディングが登場して、Cu-Cuが直接接合されることになったので、パッドもバンプも不要になり、インテルのFoverosのように9umピッチでの接続が可能になった。また、従来はバンプの高さの隙間を埋めるための充填剤など、熱伝導率も含めていろいろ検討されていたが、それも不要になった。3次元実装には不可欠な技術だと思う。

2026年3月13日 13日の金曜で

そういえば、来週からNVIDIAGTC2026が始まる。また「AI産業は5層のケーキ理論」が出るだろうか。GPUとしては、次世代のFeynmanが発表されると見られている。話題を呼んでいるのは推論用のチップで、NVIDIAが昨年買収したGroqベースのチップについて注目が集まっている。NVIDIAがGroqを200億ドルという金額で買収したことで、推論用NPUを開発するスタートアップの価値が爆発的に値上がりしたと言われているようだ。インテルがNervanaやHabana Labsを買収したときは、4憶ドル(2016年)とか20億ドル(2019年)くらいだったことを考えると、Groqの買収後は推論用NPUは簡単には買収できなくなったと考えて良いのかもしれない。また、CPUはVeraの次が発表されるかどうか、要注目かと思う。Meta向けにGraceとVeraがCPU単体で出荷されるので、これからArm CPUに対する要求は高まる可能性があると思うが、どうだろうか。

NVIDIA関連でもう一つ。NVIDIAとパランティア・テクノロジーズが提携したらしい。パランティアはデータ分析のツールを提供する会社で、米国政府のデータ集計を担っていたと思う。提携内容としては、パランティアのAIOS-RA(AI OS リファレンスアーキテクチャ)のインフラ部分に、NVIDIAのBlackwell GPUを使用するというもののようだ。GTCでも発表されると思われる。パランティアは行政に入り込んだサービスを提供しているが、サービス基盤にAIを組み込み、AI基盤をNVIDIAが担当するという構図のようだ。データ分析と意思決定をAIが迅速に支援する仕組みが整うことになると思う。 

次にインテルからのお知らせ。CPUが不足することについてコメントが出ているようだ。ハイパースケーラーやAIデータセンター向けのハイエンドからミドルクラスの製造にシフトしているとのこと。INTEL3やIntel 18Aプロセスを使う最先端CPUに加えて、INTEL7で製造されているRaptor Lake世代も影響を受けるらしい。コンシューマー向けのBOX品や、ノートやChrome Bookなど、エントリーレベルのCPU供給が影響を受けると思われる。2月の初めの方に、インテルとAMDが、中国メーカーにCPU納期の遅延を伝えたという記事があったと思うが、その状況が継続しているということだろう。数字で押さえているわけではないが、インテルはミニPC向けのローエンドCPUを、かなり輸出していたのではないかと思う。ハイエンドにシフトしたので、中国向けが滞ったということかもしれない。。

つづいてシリコンフォトニクス関連で、OCI MSA(Optical Compute Interconnect Multi-Source Agreement)というグループが設立されたようだ。AMD・Broadcom・Microsoft・Meta・Nvidia・OpenAIが参画しているらしい。NVIDIAのSpectrum-XやBroadcomのTomahawkなどのCPOを用いたチップと、それを搭載してAIデータセンターを構築するハイパースケーラーやAIクラウドで構成されるグループとみられる。今の段階で規格を共通化し、マルチソース化しておくことは重要だと思う。現在は50Gbps x 4波長でファイバーあたり200Gps(片方向)だが、これを800Gbpsまで引き上げ、最終的にファイバー当たり3.2Tbpsを目指すとのこと。CPOだけでなく、プラグイン光モジュールなどもカバーされる。

ここでアップルの話題を少し。Appleは今度の4月1日で50周年を迎える。関連記事が多数出ているようだ。また、AppleがQualcommから提供を受けている、Snapdragon 5GモデムRFシステムについて、延長する契約が締結されたらしい。Appleが独自で開発する予定の5Gモデムが、遅れていると指摘する記事が出ている。

最後にAWS。AWSとCerebrasが提携したようだ。Cerebrasは、CS-3がAWS Bedrockで利用可能になるとプレスを出している。単にCerebrasが使えるというよりも、AWSのTrainiumと、CerebrasのWSE-3で役割分担をして高速推論を実現するようだ。推論の仕組みとしては、プリフィルと呼ばれる「質問の理解」と、デコードと呼ばれる「回答の生成」がある。プリフィルは計算量が主体のプロセスで、ここをTrainum3が担当する。デコードはメモリ帯域が主体となるプロセスで、モデルの重みをSRAMに載せているWSE-3のずば抜けた帯域幅を利用してトークンを生成する。GPUで数百TPS(トークン/秒)のところを数千TPSでこなすので、高速推論が可能となっている。OpenAIがCerebrasuと提携したのは1月の中ごろだったが、2ヶ月後にAWSに登場したということになる。とうとうCerebrasの時代がやってきた、という感じがする。

 

昨日は少し暖かかったのに、今日はまた冷え込んだ。空は少し曇っている。冬の名残がまだしぶとく居座っている感じ。

 

昼になってもまだ寒かった。今週はこまごましたタスクに気を取られて、全体としてはあまり進んでいないような感覚が残る。ちょっと一週間が長く感じるパターンかもしれない。

 

夜は残業を終えて帰宅したら、キャベツとニンジンがたっぷり入ったオムレツがテーブルにあって助かった。野菜多めのオムレツは見た目よりボリュームがあって、ありがたい。

2026年3月12日

そういえば、NVIDIAとトヨタ、ウーバーなどが出資しているNuro社によって、東京の市街地での自動運転が試験的に開始されるとの記事が出ている。Nuroは、サンフランシスコなどでロボタクシーを運営している。東京は道が狭い上に左側通行なので、海外での学習成果は、ほぼ役に立たないと思うがどうだろうか。レベル4運転めざすとのこと。

自動運転つながりでもう一つ。Qualcommと英国の自動運転スタートアップWayveが、ADAS(先進自動運転支援)システムで提携したようだ。WayveのAI Driverと、QualcommのSnapdragon Rideプラットフォームを組み合わせる。自動車メーカーがさまざまな車種に対して、AI自動運転システムの実装を簡略化できるよう、事前に統合されたシステムを提供するらしい。この導入によって、ハンズオフからアイズオフ(Level 3自動運転)を可能にするとのこと。今年のQualcommは、ロボットや自動運転に力を入れており、NVIDIAを追随する動きを見せていると思う。

珍しいところで、Metaがトレーニングと推論用の新しいチップを発表したようだ。MTIA 300/400/450/500のシリーズがあり、今回発表されたチップはMTIA 400とみられる。MTIA 300はすでに量産中のようだ。ASIC開発はBroadcomで、400以降を半年ごとにリリースする計画とのこと。MTIA 400はメインのチップが二つ並んでおり、ひとつのチップの上下に2つ、全体で合計8つのHBMが搭載されている。チップひとつの大きさはHBMが6つ分くらいに見えるので、600mm2程度とみられる。2つのチップは回転対象ではなく、平行移動するように並べられている。左辺がPCIeチップレットにつながり、右辺がネットワークチップレット(2つ)につながるようだ。300から始まっているのは、過去にMTIA1(TSMC 7nm)とMTIA2i(TSMC 5nm)を使った100と200があるからだろう。300以降はTSMC 3nmの可能性がある。

次にAMDの話題。リサ・スーCEOが、韓国を訪問するとの記事が出ている。サムスンとメモリ供給について話し合うのではないかとみられているようだ。MI400X GPUには、おそらくHBM4が12個必要である。また、ネイバーも訪問する予定となっており、AIコンピューティングインフラについても、なんらかの話し合いがあるのではないと見られている。NVIDIAのGPUについては、すでに2030年までに、26万基が導入される計画があったと思う。AMDはNVIDIAを追随している。

量子コンピュータ関連で、IBMがQCSC(Quantum-Centric Supercomputing)のリファレンスアーキテクチャを発表したようだ。アプリケーション、アプリケーションミドルウェア、システムオーケストレーション、ハードウェアインフラストラクチャの4つのレイヤで構成される。例えば従来のCPUとGPUを用いた量子コンピューティングの中で、本質的に量子的な実行結果が必要な部分について、量子コンピュータ(QPU)へオフロードするような連携が可能になる。IBM Quantum Heronプロセッサと理化学研究所の富岳との連携研究や、海外での連携研究で、アーキテクチャとしての妥当性は確認済みとのこと。

最後に半導体と国際情勢。米国・イスラエルとイランの紛争の影響で、半導体製造に使うヘリウムガスと臭素の供給が減っているようだ。ヘリウムはカタールから、臭素はイスラエルから輸出されているらしい。韓国や台湾は少なからず影響を受けるが、当面の必要量は確保しているとのこと。ただし紛争の長期化は懸念材料である。半導体製造はグローバルサプライチェーンの上に成り立っているので、どこかが滞ると別の場所で影響が出やすい。マルチソース化でカバーしているが、限界はある。 

2026年3月11日 15年

ところで、IBMLam Researchとサブ1nmのトランジスタ開発であらためて提携したらしい。5年くらい前にIBMが2nmのいわゆるGAA型トランジスタを発表していたときも、Lam Research社との共同開発体制だったようだ。現在のEUVプロセスはウェットエッチングだが、ウェットプロセスだとHigh-NA(高開口数)EUVへの対応が難しいようだ。Lam Researchのドライレジスト技術をHigh-NA EUVに組み合わせることで、サブ1nmパターニングでもスループットを落とさず製造することを狙うとのこと。研究施設はニューヨーク州アルバニーにあるIBM Research NY Creates Albany NanoTech Complexらしい。たしか日本のラピダスの技術者が、EUVのトレーニングでアルバニーのIBMに行っていたような気がする。

余談だが、1nmは10Å(オングストローム)なので、最近のインテルの18Aとか、TSMCのA14などはÅ単位でのノード名となっている。今回のサブ1nmは1桁Åということだが、シリコンの結晶の格子定数は5.431Åだ。結晶の格子定数より短いチャネル長(最小回路線幅)があり得るのだろうか?いやあるわけがない。ではなぜ、1桁Åが可能なのかというとノード名と実際のチャネル長(最小回路線幅)は乖離してしまっているからだ。その経緯は2月8日のブログに書いておいた。

つぎに今日のNVIDIAニュース。NVIDIAがAIスタートアップのNebius社に20億ドルを出資したとの記事が出ている。同社は、2030年までに5GWを越えるAIデータセンターを展開していくとのこと。やはり、GPUを開発して売るとか買ってもらうとかではなく、開発して投資をつけて使ってもらう、儲けてもらう、そして利益を回収するというビジネスモデルだと思う。GPUやラックは、AIエコシステムを広げていくためのツールに過ぎないということか。それで、投資先のスタートアップを探しているのだろう。もう誰も追いつけないのではないか。(AMDが頑張っているが)

これも余談だが、チャンスの神様は前髪がフサフサで、後ろ頭がつるっぱげと聞いたことがある。前から来たときに前髪を掴まないと、すれ違ったあとで振り返って後ろ頭に手を伸ばしてもツルツルすべってつかめずに遠くへ去って行ってしまう。これは、最初に気が付いた人が最も大きな利益を得て、後から真似をした人は損をするというメタファーだと思う。NVIDIAは、チャンスの神様の前髪を掴んだということだろうか。

 

今日の朝はまだ寒かった。晴れていて朝の半月が中天に見えていた。天気予報では今週いっぱい寒いと言っていた気がしたけれど、どうやらそこまででもないらしい。

 

昨日から急に仕事が進み始めて、だいぶあわただしい。新しい案件も入ってきて年度末らしくなってきた。やることは増えているのに、なぜか今日は手がよく動く日だった。

 

遅めの残業を終えて帰宅すると、ご飯ができていてたすかった。今日は東日本大震災から15年で、ニュースでは特集が組まれていた。災害への備えを改めて考えさせられる。

2026年3月10日 春雪

そういえば、NVIDIAが、スタートアップのThinking Machine Labと提携したとの記事が出ている。同社はOpeAIからのスピンアウトのようで、完全自律型とは異なる、人間と協働するタイプのAI開発に注力していくとのこと。額は明かされていないがNVIDIAからの投資も受けているらしい。詳細は不明だが、1GWのVera Rubinデータセンターを構築する予定のようだ。

NIVIDIAつながりでもうひとつ。サステナビリティマガジン社とAWSとNVIDIAで、企業経営者を招いた会議が開催されたとの記事が出ている。気候変動がインフラやサプライチェーンに与える影響をAIモデルを使って予測することで、ビジネスのリスクを回避することが議論されたようだ。クラウドはAWSで、AIモデルはNVIDIAのEarth-2で行うことを想定していると思われる。Earth-2は1月の下旬にリリースが始まっていたと思う。気候変動による地域経済への影響をどう回避するか、企業が個々に意思決定できる環境を構築することで、ビジネス上のニーズにつなげる狙いがあると思われる。たしかに、気象予測だけだと公共用途にとどまるので、ビジネス的な広がりに欠けるような気もしていた。リスク予測と回避策の策定と企業業績への影響予測まで一貫して計算できるようになると、企業のニーズにつながると思う。企業版サイバー・フィジカル・システムズといったところか。 

次にAWSつながり。AWSが欧州で、Eviden社の外部鍵管理システム(KMS)を導入したとの記事が出ている。AWS欧州ソブリンクラウドの機能のひとつらしい。Eviden社はAtosの子会社。AtosはフランスのITで、スーパーコンピューターも扱っている。(スパコン部門は昔はBullと言っていたと思う) KMSでは、クラウド上にマスターキーを保存しないことでセキュリティ向上しているとのこと。

最後にインテル関連。インテルのOptaneメモリに関するオープンソースプロジェクトが、アーカイブされたようだ。Optaneメモリのハードウェアからは、2022年くらいに撤退していたと思う。(共同開発していたマイクロンはその前年に撤退だったような) Optaneは記憶素子にカルコゲナイド系の相変化材料を使ったメモリで、PCM(Phase Change Memory)という単語が当時の記事に多く見られた。メモリの構造が2層の縦横の配線の交点に記憶素子を形成する形で、理解しやすかった。インテルとマイクロンとしては、DRAMとフラッシュのメモリ階層のギャップを埋める、と意気込んでいたと思う。あのころは似たような構造で、RRAMとかMRAMとか出ていたと思うが、産業的に残っているのはMRAM(TSMCで製造可能)だけではないかと思う。

 

今日の朝はしんと冷えていた。都心では雪が降ったらしい。3月も中旬に入ったのに真冬みたいな空気で、思わず肩をすくめながらコーヒーを飲んだ。

 

午前も午後も細かい割り込み仕事がちょこちょこ入ってきたけれど、考える系の作業をなんとか進めていく。ようやくひと山越えた。

 

残業したが、コーヒー豆が切れていることに気づいて買いに出た。商店街の飲み屋は火曜なのに意外と人が多かった。そういえば送迎会シーズンなんだな、とぼんやり思いながら帰宅した。

2026年3月9日 月曜の空

そういえば、今月はNVIDIAのGTCがあるが、サムスンがSOCAMM2メモリを展示するらしい。メモリモジュールひとつで最大192GBとのこと。SOCAMMとはSmall Outline Compression Attached Memory Moduleの略。Compression Attached Memory Module(CAMM)とは圧着式のメモリモジュールを意味する。つまり、DIMMはスロットに挿す方式だが、CAMMはネジ止め方式のメモリとなる。DIMMはエッジの長さで端子数が決まるが、CAMMは面で端子数が稼げるので面積的には有利かもしれない。(取り付けが手間だが) CAMMはいろいろな形や大きさのものが出ているようだが、SOCAMMはNVIDIAの規格で、14mm x 90mmの長方形に統一したものとなる。SOCAMM2でLPDDR5XからLPDDR6に対応し、128GBから192GBとのこと。14mm x 90mmというと M.2の2280(22mm x 80mm)より少し細長い。ちなみに板ガムは21mm x 76mmくらい。

そのままNVIDIA関連の話題。イギリスのAIスタートアップのNscaleに、NVIDIAが出資したという記事が出ていた。Nscale社は、暗号通貨のマイニング業者からスピンアウトした会社らしい。計算リソースを供給する会社として、欧州にデータセンターを複数立ち上げているとのこと。NVIDIAの出資額は不明だが、Nscale社が20億ドルを調達したようだ。何かの記事で、NVIDIAは銀行のようなものだ、と書いてあった気がするが、まあたしかにそうかもしれない。 

NVIDIAがシリコンフォトニクスへの投資に力を入れているという記事が今月の初めに出ているが、Googleも台湾のInnolux社に光インターコネクトの大量発注を行っているようだ。Googleはバックボーン回線に、Google Apollo OCS(Optical Circuit Switch)の光スイッチを使っている。Apolloはシリコンミラーの切替にMEMSを使っている。MEMSは高速切替えはできないが、バックボーン回線はスイッチの頻度が低いので使用できるらしい。Google TPUv4からv7のシステムで使用されているとのこと。NVIDIAが投資するとしたLumetumやCoherentも、同様のMEMS光スイッチを扱っているようだ。NVIDIAはSpectrum-X EthernetやQuantum-X InfinibandでCPOを用いているが、バックボーン回線のスイッチにもOCSを使うことを考えているのかもしれない。光のままパケット交換する方が低電力と思う。通信電力を下げることが、AIデータセンターの大規模化を可能にする流れになっていると思われる。

少し懐かしい話題。マイクロソフトのサティヤ・ナデラCEOが、インテルがいなければWindowsは生れていないし、AppleがいなければOfficeは生れていなかった、と述べたそうだ。先週開催された、モルガンスタンレーのカンファレンスでの講演とのこと。IBMが出したIntel8086を採用したパソコンのOSがMS-DOSのOEM版(PC-DOS)で、その後、IBM PCのクローンが世界中で作られたことでMS-DOSが事実上の標準となり、8086が80386になったあたりで、Windowsが使えるようになった。このあたりの流れは懐かしい。

Officeも、Excelは昔はMacで使っていた。私個人はMacは持っていなかったが、当時の会社事務所にExcel用のMacがあった。Excelで計算してCricketGraphでグラフ化していたような気がする。記憶があやふやだが、会社に入る前は、DOSベースでMulti-Planという表計算ソフトを使っていた。市場にはIBMのLotus 1-2-3もあったと思う。いつのまにか、WindowsでExceが使えるようになって、MS-Officeというパッケージになっていた。これも懐かしい話ではある。

先週から、モルガンスタンレーのカンファレンスの記事が毎日のように出ている。先週触れたAMDのリサ・スーがCPUの需要が急増したという話や、インテルがIntel 18A-Pもファウンドリで外部顧客に展開したいという話の他、NVIDIAのジェンスン・フアンがRAM不足などの制約は(顧客がじっくり選ぶので)大歓迎だと述べたり、これらはカンファレンスでの講演内容が記事になったもので、他にもたくさんの業界のリーダーが講演したようだ。


今日は朝からよく晴れていて、コーヒーをひと口飲んだ瞬間に、ようやく頭が動き始めた。月曜の朝はどうしても体が重い。光が強いと少しだけ助けられる。

 

進みそうな仕事が意外と進んでいなくて、段取りを考えていたら昼になっていた。午後は考える系の作業に時間を使う。気づけばまた夕方になっていた。

 

残業して帰宅。牛肉と玉ねぎとピーマンをさっと炒めて晩ごはん。今週は寒くなるらしいので、体調だけは崩さないようにしたいところだ。

2026年3月8日 安静の日曜日

ところで、インテルのPanther Lakeのダイ写真が出ているようだ。CPUパッケージからチップをはがして、端子面から配線層を剥ぐように除去していったと思われる。除去して何を見たいかは人それぞれだと思うが、公表されている仕様に沿った造りとなっているかとか、公表されていない部分の設計を知るためなど、いろいろあると思う。解体自体はリバースエンジニアリングにあたるので、契約で禁じられている場合が多いと思うが、契約の縛りが無ければ、解体すること自体は違法ではないらしい。チップを端子面から除去していくと、一番下はトランジスタになるが、ナノメートル単位の加工なのでトランジスタを見るには電子顕微鏡が必要になると思う。そこまでこだわらなくても、もう少し上の配線層が見えるレベルで、コアとかメモリとかの機能ブロックはなんとなくわかるはずだ。ただし、従来であれば電源配線が信号配線より幅が広かったりして目印になったと想像するが、今回のPanther Lakeのコンピューティング・タイルはIntel 18AでBSPD(背面電源供給)となっているので、従来ほど機能ブロックの境界がわからない可能性はあると思う。

また、Panther Lakeは、3つのチップレットと1つのベースダイで構成するが、6つのチップレットと3つのベースのダイを製造するようだ。つまり、コンピューティング・タイルが16コアと8コアの2種類(両方ともIntel 18A)、グラフィックス・タイルが12Xeと4Xeの2種類(TSMC N3EとINTEL3)、プラットフォーム・コントロール・タイルがPCIe 20レーンと12レーンの2種類(TEMC N6)がある。これらの組合せで3つの品種があるので、ベース・タイルは3種類になる。3つのチップレットが2種類ずつなので、8種類の組合せが可能になるが、製品としては3つしか作らないようだ。Raptor Lake以前のモノリシックのときも、コア数に応じてダイを作り分けていたので、同じような感じなのだろう。

少し社会的な話題。金曜日に2月の全米雇用統計が発表されて、予想では5.4万人くらいの失業者数の増加としていたところが、発表された数字は9.2万人の労働者の減少で、驚きの結果となっているようだ。原因の一つにカリフォルニアの医療従事者の労働争議の影響などが挙げられている。他にも、AIの導入が影を落としていると見られている。1月から2月にかけて、コンピューターやデータ処理、電子部品などの分野で、前年比で多くの人員削減が起きているようだ。ここのところ何度か、AIをうまく使うことで企業が発展し、より多くの人を雇用することが出来るようになる、というスキームがこれから立ち上がってくるのではないかと書いたが、実際そうなるまでは、まだ時間がかかると思うし、その間のジョブチェンジに伴う失業や雇用の増減はあると思う。

AIが人間に取って代わることが、どれくらい効率的なのか、そうでないのか、少し考えてみたい。現在のAIデータセンターのインストールは、GW単位になっている。人間の脳みその電力量は20Whである。これを比較してみたい。20Whは15年くらい前から言われている数字だが、根拠はおそらく脳みその1日の消費カロリーで、350~450kcalと言われている。頭の良し悪しというよりは、体格によって変わると思われる。1kcalは約1.16Whなので、脳みその1日の消費カロリーを413kcalとすると、一日の電力量に換算すると480Whとなる。24時間で割ると20Whとなる。

ただし、これでは平均20Whなので、寝ているときと起きているとき、起きているときでも働いているときで、それぞれに電力量に差があるに違いない。仮に寝ているときを、8時間10Whとする、起きているときは16時間25Whとなる。起きているときの普通に過ごしている8時間を20Whとすると、働いている8時間は30Whとなる。30Whは、30Wで1時間動かしたときの電力量なので、人間の脳は30Wで8時間が限界、というモデルとなる。これで電子機器と比較できるようになる。

人間が30Wということは、AIワークロードが消費する1kWは、約33人分のエネルギー消費になる。作業量が33人分ではないので要注意。エネルギー量の比較である。また、人間の30Wは8時間が限界なので、AIワークロードが1kWで24時間動くと、100人分のエネルギーとなる。AIが1kWで24時間動いて100人分の作業量をこなすだろうか。そうあってほしいが、少し微妙な気がする。

そこで、作業量と電力を測ることが出来ないか考えてみたい。先月の中ぐらいに、OpenAIのCodexを、CerebrasのWSE-3に乗せて1000TOPSを実現したのが、人間で言うとペアプログラミングをするくらいの応答速度らしい、と書いた。WSE-3は18kWくらい(システムCS3で23kW)らしい。8時間動かすと600人、24時間で3倍の1800人分のエネルギー消費となる。作業量として600人とか1800人のペアプログラミング作業が可能だろうか。同時接続アカウントで言うと、これくらいのアカウント数はなんとかなるのかもしれない。

以上から、現状のエネルギー消費と作業量の解釈としては、AIワークロードは人間よりも巨大なエネルギーを消費しており、多くの人数分の作業量をこなさないと元が取れない状況だと思う。この先、世代が進むとこのギャップが小さくなり、実用的な感覚が得られるかどうかだと思う。例えば、AIワークロードが10W単位で測られるようになり、作業量として数人分をこなしていると考えると、ちょうど人間と同じくらいと判断できるのではないだろうか。

現在はGPUのトークンのコストが指標となっているが、AIワークロード電力と作業量で人間との比較ができるようになると、IRDSで定義される3Dスケーリングの進歩とともに、新しいムーア則のようなものが生まれてくるかもしれない。ちょっと期待しすぎかもしれないが。

最後に別角度からの話題。TSMCの映画が、日本国内で上映されるようだ。昨年、台湾で上映されていたらしい。原題は「造山者 世紀的賭注(ぞうざんしゃ・せいきのかけ)」だが、「チップ・オデッセイ 台湾の賭け」という邦題が付いているようだ。3月に東京で、4月に熊本で上映会があるとのこと。

 

昼前に起きたらよく晴れていた。昨日はワクチンを打ったので、夜は免疫反応でぐったりしていたが、起きると少し抜けた気がした。

 

今日は奥さんのほうが免疫反応でぐったりしている。同じ日に打ったのに時間差がある。家の中で静かにすごす。必要なことだけゆっくりこなす一日になった。

 

夜には体調もほぼ戻ってきたので、晩ごはんに豚肉とピーマンの炒め物をさっと作って食べた。ゆっくり休めたのは本当に良かったと思う。

2026年3月6日 週末

そういえば、MWCは今日(現地は3/5)までだったような気がする。サムスンから、今年のうちにスマートグラスが出てくるだろうという記事が出ている。スマートグラスというと、Googleグラスの最初の方が思い出される。「最初の方」というのは2015年に中止になった個人向けのことだが、その後、産業用に継続していたが、2023年にそれも終息したと聞いている。そして、今年また、こんどはサムスンから出るらしい。サムスンのスマートメガネはかけている人が見ているものを認識して、関連する情報をスマホの画面に出すようになっているようだ。かつてのGoogleグラスが中止になったのは、めがねにカメラが付いていて、プライバシーの侵害と感じる人が多かったからだと記憶している。あれから10年経って、インスタやX(旧ツイッター)やTikTokで、個人がバズる世の中になったが、プライバシーへの意識は少しは変わったのだろうか。 

また、スマートグラスで見たものの情報をスマホへ飛ばし、スマホが関連する情報を調べる仕組みは、通信量の増加を招くと思われる。MWC初日の、Qualcommのクリスティアーノ・アモンCEOによる基調講演では、AIエージェントが普及すると、2034年までに全世界のトラフィックは現在の3~7倍に増加し、その30%はAIによる通信になるだろう、との予測が述べられたようだ。通信規格も高速・大容量に対応する必要があり、MWCではQualcommを中心とした6G規格とWiFi-8が提示されている。通信とコンピューターは車の両輪で、両方とも発展していく必要がある。

ここからNVIDIA関連。TIとNVIDIAがロボット事業で提携したらしい。TIはmm波センサー技術、NVIDIAはJetson Thor(TSMC 4nmプロセス)によるAIを提供し、両者がNVIDIA Holoscan Sensor Bridgeシステムで統合される。応用先がロボットということで、屋内や屋外、倉庫や野外で作業するロボットの、周囲環境のセンシングに関するフィジカルAIの取組みと思われる。AIの5層のモデルで言うと、一番下のインフラがTIのセンサーで、Jetson Thorのハードが2層目、これをクラウド(3層目)で集めて、オムニバースのモデル(4層目)で学習を強化し、ロボットの遠隔操作や自律動作が目的(最上層)と思われる。Jetson Thorは、すでにボストンダイナミクスなどで採用されているようなので、駆動部分に関する知見と今回のmm波センサーによる識別の知見が合体すれば、自律動作への進展につながると思われる。

NVIDIAでもうひとつ。今後は、OepnAIやAnthropicなどのAIスタートアップへの投資を、これ以上増やさない方針を出しているようだ。AIスタートアップとの、財務上の関係を再考したということらしい。投資額が十分大きくなっているということもあると思われる。スタートアップも成長すると、スタートアップではなくなるということか。

ここからAIとデータセンター、そして法律の話題。インテルが買収をあきらめて提携に切り替えたSambaNovaが、SN50を発表したようだ。エージェント型AIを構築するのに向いているとのこと。半導体プロセスは公表されてないようだが、前世代のSN40LはN5プロセスなので、SN50はTSMC 3nmとみられているようだ。ラック当たりMaX 30kWだが、性能を少し落とすと20kW以下に調節できるので、空冷も対応可能とのこと。ソフトバンクがユーザーとなって、日本のデータセンターに導入する予定があるらしい。

米国政府が、AIチップの輸出規制を強化するようだ。まずNVIDIAとAMDのGPUは対象になるとみられる。何をどのくらい、というのはよくわからないが、例として、GB300を1,000基購入する場合は、比較的緩い審査をうけることになるが、大規模となると米国政府の事前承認が必要となる見通しのようだ。WA(ワッセナー・アレンジメント)のような、計算性能が指標になるのかもしれない。これまで40ヶ国が対象だったが、事実上全世界が対象になるのではないかとのこと。承認を受けるには、用途の説明の他、査察の受入れなどが含まれると思われる。他にはBroadcomやQualcommも影響を受けるだろう。米国ベンダーにとっては、ビジネスチャンスが阻害される一方で、中国企業のファーウェイにはチャンスではないか、との観測もあるようだ。 

先月の末ごろに、Anthropicが国防総省(戦争省)からの要求(用途に制限なくCloude AIを使用すること)を断ったので、米国政府はAnthropic社を「サプライチェーンリスク」に指定したようだ。要するに、米国政府がAnthropic社を使うことはリスクがあるから気をつけよ、という注意喚起を発したということだと思う。AnthhropicのClaudeを提供しているAWSからは、DoW(戦争省)に関連しない用途であれば問題なく使えるとのアナウンスが出たようだ。もし関連する用途があれば、AWSの代替え手段を提供するらしい。ちなみに、国防総省はAnthoropicからOpenAIに契約先を切り替えていたと思う。

AWS関連でもう一つ。中東(UAE・バーレーン)のデータセンターなど3ヶ所が、イランからのドローンで損害を被った件について、イランからは意図的な攻撃であるとの声明が出ているようだ。これらのデータセンターが、米国の作戦遂行に関係しているか見る意図があったとのこと。米国も報復としてイランの首都テヘランのデータセンター2ヶ所を攻撃したとの記事も出ているようだ。

最後。AIクラウド事業者のIRENが、NVIDIAのGPU B300を5万基導入するとの記事が出ている。場所はカナダのブリティッシュコロンビア州と、合衆国テキサス州のようだ。ビットコインのマイニングを手掛けていた企業で、マイニングは継続中だが規模を縮小し、AIクラウド事業にシフトしていくとのこと。GPUつながりではあるが、業種が全然違うと思うので、業種転換するのは素直にすごいと思う。NVIDIA PASCALやVOLTAのころはマイニングが盛んだったと思うが、あのGPUはどこに行ったんだろうと、たまに思うことはある。


ようやく金曜日。今朝は少し空気が冷たくて、外を見たら曇り空だった。夜中は風が強かったようだ。春と冬の空気が入れ替わっている。

 

午前中は昨日の続きで淡々と片づけていく感じ。午後は社内の細かい用事をこなす。年度末らしく本業以外の用事が積み重なっていた。

 

残業はほどほどで切り上げて、そのままオンラインの寄り合いに参加。晩ごはんが遅くなったが、肉とピーマンをカレー風味でさっと炒めたら、思ったより美味しかった。

2026年3月5日 段取りスト


そういえば、NVIDIAが中国に輸出しようとしているH200の生産を中止して、Vera Rubinの製造に振り向けたらしい。現在25万チップが在庫されているとの記事が出ているようだ。米中で輸出入の許可はでているが、いろいろ制限がある中で、中国側企業が購入できる数は7万5千チップまでという制限もあるらしい。H200はTSMC 5nmプロセス+HBM3で、Vera Rubinは3nmプロセス+HBM4なので、製造ラインも部品も異なる。仮にTSMC Fab18であれば、5nmと3nmのラインがあるので、製造計画の変更も比較的容易に対応できるのではないかと思われるが、どのファブで製造しているかは不明。

もうひとつNVIDIA関連。RTX 3060を増産するとの記事が出ている。3060というとAmpere系になると思うが、プロセスはサムスン8nmプロセスらしい。TSMCで製造されていたAmpere A100とかは7nmプロセスだったと思う。メモリひっ迫の影響でコンシューマのGPUが市場から少なくなっているようだが、このRTX 3060はメモリと一緒にインストールキットとして卸されるようだ。

次にインテルの話題。Intel 18AプロセスはPanther LakeやXeon6+(Cklearwater Forest)と、次期Xeon7向けの自社製品用プロセスとみられているが、ファウンドリ事業への展開を再検討し始めたとの記事が出ている。昨年末に、NVIDIAのGPUには不採用との記事が出ていたような気がする。理由は歩留りが低かったからだったと思う。さらに、18Aプロセスに外部顧客がおらず、インテルファウンドリが展開するプロセスは、14Aからと言っていたと思う。今回、18A-Pというエンハンスプロセスを提供するとの記事が出ており、18Aの製造がすすんで性能や歩留まり(スループット)が改善してきたと見られる。

また、市場の変化として、BroadcomがFUJITSU-MONAKAを皮切りにXDSiPを提供し始めている。これまではどちらかというとインテル・AMD・NVIDIAのような自社販売や、AWSのような自社使用といったチップに用いられてきたチップレット技術だが、Broadcomが3.5DでチップレットASICとして受託開発を可能にした点は大きいと思う。インテルファウンドリも、EMIBFoverosを用いた3D積層+チップレット構成のASIC需要の獲得を急ぎ始めたのかもしれない。

 

今朝はよく晴れていて、寝ぼけた目に光がまぶしかった。昼前には部屋の中もかなり暖かくなってきて、さすがにヒーターを切っても平気な感じになった。

 

仕事の段取りをつけているうちに、気づけば時間だけがどんどん過ぎていく。段取りそのものは自分の本来の仕事ではないので、自分の仕事はなかなか進まない。午後は打ち合わせが連続で、座ったまま一日が終わっていった。

 

残業をほどほどで切り上げて、買い物に出た。冷蔵庫の中はほぼ空っぽなので。帰り道の途中からお腹がすいて仕方がなくなる。帰りついて、豚肉と茄子をさっと炒めて一皿にまとめた。うまかった。

2026年3月4日 春が来た?

ところで、アメリカ・イスラエルとイランの間で起きている紛争が、データセンターやクラウドに大きな影を落としている。AWSはUAEとバーレーンの3ヶ所の設備が被害を受けて、リージョンのひとつでサービスが低下したようだ。数日前から、データセンターがドローン攻撃による被害を受けたという記事が出ている。データセンターだけでなく地域の電力網がやられると、おそらくその地域のクラウドは使えなくなる。AWSからは、代替リージョンへの対比を促すアナウンスが出ているようだ。

古い話だが、インターネットはアメリカの軍事技術から始まったと言われている。URLの最初のwwwが示すワールド・ワイド・ウェブは、どこかが攻撃を受けても他の通信経路があればネットワーク自体は存続していくという仕組みに基づいている。現在のネットは生活インフラを支えているので、ネットワークやデータセンターを攻撃されることは、生活そのものを攻撃されることに他ならない。どこかが生き残ればいいというものでもないので、ネットやコミュニケーションによって、攻撃そのものが起きない世界を望みたい。

イスラエルに、インテルの工場があるのは良く知られていると思う。2000年代にCentrino (Baniasコア)を開発したCPU部門もある。NVIDIAが2020年ごろに買収したMellanoxもイスラエルの会社で、部門としていまもあるのではないかと思う。

ここからいつもの話題。CDN(コンテンツ・デリバリ・ネットワーク)の最大手、AkamaiNVIDIAのBlackwell GPUを数千基導入したという記事が出ている。NVIDIA RTX PROサーバーで、BlueField-3 DPUが搭載されている。これを一ヶ所に集めるのではなく世界中のネットワーク拠点に導入し、分散型クラウドコンピューティングを行うようだ。Akamaiのビジョンとして、グローバル分散型AIコンピューティンググリッドを掲げているとのこと。よく理解していないが、ちょっと前に、シスコが言っていたフォグコンピューティング近いのかと思ったがどうだろうか。

次にAMD関連。リサ・スーCEOによると、CPUの需要が予測を上まわって急増しているらしい。アナリストとの会議で語ったとの記事が出ている。推論ワークロードの比率が上がってきており、CPUへの需要が予想外に伸びているとのこと。CPUとなっているが、Ryzen/EPYCのCPUなのか、CPU+NPUのAPUなのかは不明である。エージェント型AIが増えてくると、CPUの需要は伸びると思われる。また、GPUプラットフォームの組み立てについて、AMDが米国内のEMSであるFlex社と提携したという記事が出ていた。Instinctプラットフォームの組立てを請け負うようだ。GPUはもう大量に売り先が決まっているので、淡々と製造するだけだと思う。

AMDでもうひとつ、MiTACが販売しているAMDのInstinct MI350Xに、ダイヤモンド冷却が使われているという記事が出ていた。内容としては、GPUとヒートシンクの間にダイヤモンドを使用したシートが使用されているようだ。もちろん天然ではなく人工ダイヤだが、ダイヤモンドと同じ炭素を用いたグラフェンシートというのは、すでにある。グラフェンの方がダイヤモンドより熱伝導率は高いが、電気を通すので電子回路に混入するとショートの懸念があるのと、グラフェンの粉末は健康に悪いので、素材として扱いづらいと思われる。半導体や電子機器の製造にはESH(Environment Safety Health)という指標があり、環境・安全性・健康の観点から素材をチェックするようになっている。

最後にインテルの話題。インテルの会長が、5月の株主総会で交代になるらしい。新しい会長は、QualcommやGoogleでの役職歴があるようだ。いまの会長のもとで製造が分離されてインテルファウンドリが出来たと思うが、今度の会長は、統合型デバイスメーカーであることを維持していくとみられている。

 

今朝はまだ雲が厚くてどんよりしていたけれど、昼に近づくにつれて少しずつ明るくなってきた。朝はちょっと寒かったが、昼は暖かかった。

 

仕事はまた少し混んできた感じで、今月も忙しくなりそうな気配が漂ってきた。年度末なので回りも忙しいと思う。先回りと情報共有が重要だ。

 

残業してきりのいいところで帰宅。買い物に行く時間はなかったので、新タマネギでオムレツを焼く。コロッケを付けておいたら、思ったより満足感があった。こういう簡単なもので十分だと思える日はありがたい。

2026年3月3日 雨のひな祭り

そういうわけで、昨日からMWC(Mobile World Congress)の話題が続いている。Qualcommから、ウェアラブルデバイス向けのSnapdragon Wear Eliteを発表したようだ。ウェアラブル向けだが、NPUを搭載している。搭載されているHexagon NPUは、20億パラメータ(2B)で10トークン/秒(TPS)の性能を備えているとのこと。エッジAIデバイスとしての活用が期待される。

先日来話題が続いている、富士通のFUJITSU-MONAKA(今後はMONAKAとだけ書く)だが、MWCでウェハが展示されたようだ。MONAKAはチップレットで、コンピューティングダイ(TSMC 2nm)、キャッシュダイ(TSMC 5nm)、IOダイ(TSMC 5nm)の3つがある。写真を見たときにどのチップのウェハなのか、と思ったら、キャッシュダイにコンピューティングダイをダイレクトボンディングした状態のウェハらしい。2nm GAAFETのウェハはIBMが何年か前に出したし、1月のCESでインテルが18Aのウェハを出したので、5nmのウェハに2nmのチップを貼ったウェハを出してきたということだろうか。ちょっとびっくりした。

シリコンフォトにクス系の話題がいくつか。NVIDIAが、Lumentum社とCoherent社に、それぞれ20億ドルを投資したらしい。AIファクトリーの内部は、従来型のデータセンターよりも通信電力が増えるとみられている。これを解決するために、NVIDIAはSpectrum Ethernet Switchチップを開発している。今回の投資がどのような進歩をもたらすか、注目しておきたい。

CPO(Co-Package Optics)に取り組むスタートアップのAyer Labsが、5億ドルの資金を調達したとの記事が出ている。NVIDIAとAMDから支援を受けたようだ。AIデータセンター内の通信電力を削減するためには、CPOが不可欠という流れを表していると思われる。Ayer Labsのボードメンバーのひとりには、元インテルCEOのパット・ゲルシンガーがいる。Ayer Labsは、インテルやTSMCと共同開発を行っている。

インテル関連でもう一つ。インテルがインドのInfosysと提携したという記事が出ている。ここのところインドの話題も多かったが、インテルもその輪の中に入ったようだ。Infosys社のInfosys Topazという企業向けAIプラットフォームをインテルのXeonやGaudi、AI PCで構築していくということらしい。AIが企業の事業を支える取り組みと思われる。勝手な想像だが、たとえば出張の旅費精算をAIで効率化するというよりも、出張の計画と手配をAIがやってくれるような感じになるのではないかという気がする。(気がするというか、願望だが) 

 

今日は少し早めに起きて出かける準備をした。リアル事務所へ行く。外に出たら雨が降っていて予報通り寒かった。今日はひな祭りの日だったことを、ふと思いだす。

 

電車が遅れていて焦ったけれど、なんとか到着して用事を済ませた。だいたい1時間半くらいで片づいて、昼休みを使ってそのまま帰宅。家に戻ってネットにつなぎ直して仕事を続ける。

 

疲れたので定時で上がったあと横になっていたら、晩ごはんができていてたすかった。豚肉としめじとピーマンの炒め物。食後は洗い物を担当。

2026年3月2日 寒の戻り


そういえば、バルセロナで開催中のMWC(Mobile World Congress)2026で、IntelがXeon6+を発表したようだ。コードネームはClearwater Forest。Eコアが288コア載っている。昨年のこの時期に、前機種のXeon6E (Sierra Forest, INTEL3プロセス)の最上位機種で288コアが出るとみられていたが、中位機種の144コアが、思ったほどデータセンター系ユーザーでの導入が進まなかったようで、最上位機機種288コアはついに市場には出てこなかった。今回Intel 18Aプロセスで製造したClearwater Forestが288コアでXeon6+として発表された。Eコアのアーキテクチャは、Sierra ForestのCrestmontからClearwater ForestではDarkmontになっている。Darkmontは、Panther LakeのEコアでも用いられている。

Clearwater Forestのコンピューティングダイは、24コアのチップレットが12個で288コアとなっている。24コアの内部は4コア+4MB(L2$)で1つのコアモジュールになっているようだ。これが6モジュールで1つのコアダイになる。 12個のコアダイは、4個ずつにわかれて3つのベースダイに乗っている。ベースダイはL3キャッシュメモリになっており、INTEL3プロセスで製造されている。1つのベースダイは細長く、4つのコアダイが乗った橋はDDRメモリコントローラ―が載っていると思われる。IOダイはINTEL7プロセスで製造されており、3つのベースダイの両端に並んで配置される。PCIe Gen5なので、Sierra Forestと共通かもしれない。

Sierra Forestは144コアが1つの大きなダイになっていたが、Clearwater Forestはベースダイ+3D実装になっており、チップレット構成としてだいぶ進んでいるように見える。Clearwater Forestで144コア品などを作る予定があるのかどうかわからないが、ベースダイはそのままに、コアダイを半分の6個にすると144コアになるので、置換えは可能と思われる。なお、Xeon6EとXeon6+Eでソケット互換となっている。

 

今朝は起きた瞬間に思ったより寒くて、すこしびっくりした。どうやら明日にかけて気温が下がるらしい。寒の戻りか。冬がまだ粘っている感じがした。

 

今日から3月の営業日が始まって、新しい仕事がきた。とはいえ、事前にわかっていた案件なので、特に驚きもなく淡々と切り替えていく感じだった。年度末に向けてまた忙しくなる気配がする。

 

仕事を終わると晩ごはんができていた。鶏肉とキャベツの炒め物が玉子でとじてあった。こういうのが用意されていると本当に助かる。

2026年3月1日 東京湾から

ところで、Broadcomから 3.5D XDSiPの供給を開始したという記事が出ていたという話は2月26日に書いたが、その後たくさん記事が出てきたので、もう少しまとめておきたい。XDSiPは eXtreme Dimension System in Packageの略で、要するに3次元積層チップを、シリコンインターポーザ―で2.5D実装する技術の名称らしい。その第一号が、富士通が開発しているFUJITSU-MONAKAだったようだ。富士通以外にもXDSiPの顧客はいるそうで、全部で6つの設計が進んでおり、XDSiPの出荷数 100万チップを目指すとのこと。

また、FUJITSU-MONAKAについてもいろいろ情報が出ているが、すこし整理が必要と思われる。FUJITSU-MONAKAはデータセンター向けのCPUであることが公表されている。次期スーパーコンピューター「富岳NEXT」も富士通が受注したせいか、FUJITSU-MONAKAが富岳NEXTのCPUのように受け取っている記事が見られるが、そうではない。富岳NEXTはまだだいぶ先なので、FUJITSU-MONAKAは、そのころにはちょっと役不足になっていると思う。富岳NEXTのCPUは、FUJITSU-MONAKA-Xになるとのこと。コンピューティングダイも1.4nmとなることが公表されている。また、富岳NEXTのGPU部はNVIDIAが担当するので、NVLINK-Fusionでつながると思う。昨年の10月に報道が出ていたような気がする。

話は変わるが、Qualcommの話題。6Gに向けて、エリクソンとQualcommが提携したようだ。6GではネットワークにもAIコンピューティングが入ってくるとみられている。ソフトバンクや楽天モバイルでもAIとRANの融合について検討されていたと思う。通信とコンピューティングにまたがっているQualcommやソフトバンクは良いポジションにいるような気がする。

Qualcommでもう一つ。3月9日から開催予定のGDC(Game Developer Conference)で、QualcommのWindowsハンドヘルドの端末が発表されると見られていたが、Qualcommが撤退したので発表自体がないようだ。どうやらメモリ不足が影を落としているようだ。この壊滅的なRAM不足は「RAMagedon」と呼ばれているらしい。

最後は量子コンピューティングで、IBMがインド工科大学(IIT)カンプール校(ウッタル・プラデーシュ州)に、量子コンピュータを設置したらしい。IBMとIIT、州政府と連携して、量子コンピューティング分野における技術的な検討を進めていくとのこと。

 

今日も昼過ぎに起きたら、外はカンカン照りで春っぽい空気だった。今日から3月かと思うと、年度末がもう目の前に来ている感じがして、早いような気もするがそれなりにいろいろあったような気もする。

 

窓を開けると、春先特有の東京湾の磯くさい風が入ってきた。南側の窓は長時間開けているとさすがにきついので、換気しつつも掃除を行う。少し汗ばむくらいで、季節が変わりつつあるのを体で感じた。

 

テレビをつけると、中東情勢のニュースが流れている。アメリカやイスラエルとイランの間で軍事的な衝突が起きている。民間にも被害が出ているのは痛ましい。

.。.:*・゚+.。.:*・゚+.。.:*・゚+.。.:*・゚+.。.:*・゚+.。.:*・゚+.。.:*・゚+.。.:*・゚+.。.:*・゚+.。.:*・゚