
ロボットが考え始めた
AIが画面の外に出てきました。工場の床、物流倉庫、手術室、介護施設。今やAIは身体を持ち世界と直接向き合います。これがフィジカルAIです。
2026年1月、NvidiaのCEOジェンスン・ファンはCESの舞台でこう宣言しました。「フィジカルAIのChatGPTモーメントが来た」。ChatGPTがテキストAIの大衆化を告げたように、今ロボットはその変曲点を迎えているという意味でした。
実際に数字がこれを裏付けています。ロボット分野は2025年一年だけで379億ドルの投資を受けました。ソフトバンクはABBロボティクスを54億ドルで買収しフィジカルAIエコシステムに直接参入。米国市場ではTesla Optimus、Figure AI、1X Technologiesなどのスタートアップが相次いで大型投資を誘致しています。
ヒューマノイドロボット市場規模(2050年予測)$5T
フィジカルAI市場の年平均成長率 47.2%
日本の2040年グローバル市場シェア目標 30%
フィジカルAIとはまさに「物理世界で動くAI」です。画面の中でテキストや画像を生成するソフトウェアAIと違い、フィジカルAIはカメラ・センサー・ロボットアーム・足を通じて実際の空間を認識し、判断し、行動します。
ソフトウェアAI
入力を受けテキスト・画像・コードを出力。物理世界と直接やり取りしない。サーバーやクラウドで実行。
身体を持つAI
センサーで環境を認識→判断→ロボット本体で行動。実際の空間で動き不確かな状況に自律適応します。
核心の違い:ソフトウェアAIは「考える」だけです。フィジカルAIは考え、見て、動きます。人間労働のあらゆる形を代替できる最初のAI技術です。
3つの核心要素
認識(Perception)— 世界を見る目。
カメラ・LiDAR・触覚センサーで周囲環境をリアルタイムに認識します。人間のように「暗い場所」「雨の日」でも動作するよう設計されます。
推論(Reasoning)— 状況を判断する頭脳。
大型言語モデルとビジョンモデルが結合し「今この状況で何をすべきか」をリアルタイムで決定します。
行動(Action)— 決定を実行する身体。
判断したことをロボットアーム・車輪・足で物理的に実行します。電気アクチュエーターが筋肉の役割を果たします。
2つの市場の出発点
フィジカルAI投資地形を理解するには、米国と日本がそれぞれどこから出発するかをまず知る必要があります。両国は全く異なる強みを持っており、その強みがどう噛み合うかがこの連載全体の核心視点です。
米国 AIソフトウェア最強国
OpenAI、Nvidia、Google、TeslaなどAIの頭脳を作る企業が集中。フィジカルAIの「考える部分」を支配。しかしロボットハードウェア生産基盤は弱い。
日本 産業用ロボット製造最強国
FANUC、Yaskawa、Kawasaki、三菱電機。世界の産業用ロボットの70%を日本企業が供給。しかしAIソフトウェア競争力は米国に遅れ。
投資家視点:米国はAIの頭脳を、日本はロボットの身体を持っています。フィジカルAI革命はこの二つが合わさる時に爆発的に成長します。FANUC×Nvidia協業、ソフトバンクのABB買収がまさにこの結合の狼煙です。一方の市場だけ見ると半分しか見えない理由です。