スクリーンから現実世界へ：ディズニーの「物理AI」が切り拓くロボティクスとシミュレーション技術の未来（Humanoid Summit2026Tokyoレポート）

Name: Camino
Author: ディズニー・リサーチ

小宮昌人 / Komiya Masahito
6 日前
読了時間: 17分

Humanoid Summit2026下記セッションレポート

「Insights Into Disney’s Robotic Character Platform」

Moritz Baecher, Director, Zurich Lab at Disney Research

ディズニー・リサーチが推進する物理AIとロボティクス技術の進化は、エンターテインメント業界のみならず、今後の産業用ロボットやAIのあり方を根本から揺るがすポテンシャルを秘めている。スクリーンの中で躍動するキャラクターの魅力を、いかにして物理的な現実世界へ安全かつ頑健に移行させるのか。その舞台裏では、独自の強化学習アプローチ、モジュール式ハードウェア、そして新世代の高速物理シミュレータの自社開発といった、最先端の工学技術が惜しみなく投入されている。

ディズニーにおける物理AI（Physical AI）とは、単に実用的なタスクや機械的な作業をこなすことではない。キャラクターが持つ個性、感情表現、そして物語の命そのものを、現実の物理的な制約を乗り越えて表現することを意味する。映画やゲームといったスクリーンの世界から、私たちが暮らす現実世界への橋渡しを行うロボティク・キャラクター・プラットフォーム。その具体的な挑戦とブレイクスルーについて詳細に解説する。

個性と物語を宿すロボティク・キャラクターの定義とBDXドロイドの挑戦

ディズニーが定義するロボティク・キャラクターとは、ロボットという工学的な実体でありながら、独自の個性や感情表現、そして詳細なバックストーリーを持っている存在を指す。彼らはあらかじめ決められた単純な動作を機械的に繰り返すのではなく、テーマパーク内を自由に歩き回り、散策することができる自律性を備えている。さらに、周囲の物理的な環境や様々なオブジェクトに対して、高い適応力を持って相互作用する。

このロボティク・キャラクターの代表例が、二足歩行型のBDXドロイドである。BDXドロイドは、テーマパークを訪れるゲストとの協調的な物語創出において極めて重要な役割を果たす。ディズニーでは、テーマパークの来場者をゲストと呼ぶ。BDXドロイドは、目の前にいるゲストとのリアルタイムな関わり合いを通じて、ゲスト自身をストーリーの共同監督として巻き込んでいく。ゲストがパークを訪れるたびに、ドロイドとの新しいインタラクションを通じて異なるストーリーが紡ぎ出される。これにより、ゲストは体験する物語の内容に直接的な影響を与えることが可能になる。

このBDXドロイドの誕生プロセスには、スクリーンと現実世界との間で発生した驚異的な循環がある。このドロイドの最初の着想は、ゲーム作品に登場する小さなキャラクターであるBD1であった。開発チームはBD1を子犬のような愛らしい存在として位置づけ、その特徴的な動きを物理世界で再現することを目指した。こうして誕生したのが、成長した大人バージョンのタイムドロイドに相当する二足歩行ロボット、BDXドロイドの実機である。

この新しい実物ロボットは、まず現実のテーマパークに初めて登場した。その後、その魅力的なビジュアルとユーモラスで生命感に満ちた挙動が映画制作サイドでも高く評価され、スター・ウォーズの実写映画であるマンダロリアンに、CGではなく実際の物理キャラクターとして出演を果たすことになった。ゲーム画面というスクリーンからスタートしたキャラクターが、現実世界のロボットとなり、それが再び実写映画というスクリーンへと戻っていく。この極めてユニークなライフサイクルの実証は、エンターテインメント業界におけるロボット技術の新たな可能性を示している。

重心の壁を打ち破る、アニメーション映画から飛び出したオラフの挑戦

もう一つの大きな工学的挑戦として、映画アナと雪の女王に登場する人気キャラクター、オラフのロボット化プロジェクトが挙げられる。このプロジェクトの目的は、完全に2Dまたは3Dアニメーション映画として作られ、物理法則を完全に無視した誇張された動きをするオラフを、物理的な現実世界でそのまま自律的に稼働させることであった。

ディズニーランド・パリでは実際に自律歩行するオラフがゲストと交流しており、研究室内でも人間と極めて自然にインタラクションを行う様子が確認されている。しかし、ロボット工学の常識的な観点から見れば、オラフのプロポーションは極めて異例かつ困難な課題を内包している。

通常、物理的な機能性を最優先にしてロボットを構築するエンジニアであれば、このような巨大な頭部を持つロボットを設計することはない。なぜなら、これほど大きな頭を乗せてしまうと、ロボット全体の重心が体の極端に高い位置に移動してしまい、二足歩行時の安定性を保つことが著しく困難になるからである。この物理的に極めて不利な、頭でっかちのプロポーションを維持したまま、現実世界においてアニメーション通りの魔法のような歩行をさせることは、工学的な常識を覆すほどの高いハードルであった。

わずか数ヶ月でロボットを完成させる、モジュール式ハードウェア設計

新しいロボティク・キャラクターを構想し、それをわずか数ヶ月という短期間で現実世界に誕生させること。これがディズニー・リサーチの野望であり、それを支えるのが徹底したモジュール式ハードウェアの思想である。

開発のスピードは圧倒的である。BDXドロイドは、最初のコンセプト設計から、3台の完全に仕上げられた実機ドロイドが実際にパークの地面を歩くまでに要した期間は1年未満であった。さらに、重心の極めて高いオラフにいたっては、開発着手からわずか4ヶ月から6ヶ月という驚異的な短期間で完成にこぎつけている。

この高速開発とスケールを実現するための鍵は、キャラクターごとにゼロから専用部品を設計するアプローチを完全に排除し、徹底して使い回すことができる共通の構成部品を採用したことにある。

その核心となるのが、アクチュエータ・ファミリーと呼ばれるライブラリ化された数種類のアクチュエータである。これらをすべての異なるキャラクター、例えばBDXドロイドやオラフなどの間で100パーセント再利用する。これにより、ソフトウェアスタックやリアルタイム・ランタイムシステムにおける挙動の制御、さらにはシミュレーション上での挙動の正確なモデル化が一挙に可能となる。

ハードウェア構成要素としては、共通のアクチュエータ・ファミリーに加え、将来的な自律性の向上を見据えた共通のセンサー群、これらを高速に仲介・通信する標準化されたカスタム電子基板、現場で容易に取り外しや再充電が可能な構造を持つバッテリーモジュール、そしてグラフィックプロセッサ（GPU）処理能力に優れたNVIDIA Jetsonを搭載したリアルタイム・オンボードコンピューティングが標準的に統合されている。

このプラットフォームでは、骨格、頭脳、関節といった基本的なモジュールは完全にキャラクターに依存しない共通設計となっている。一方で、キャラクター特有の装飾や個別の追加機能は、ショーファンクションとして外付けで個別にカスタム設計される。例えば、BDXドロイドの動くアンテナや、LEDアレイを使用した豊かな表現力を持つ目、首のスキャン用パン機構などがこれにあたる。

オラフの設計においても、基本的には既存のアクチュエータ・ファミリーをそのまま100パーセント再利用したが、唯一の例外として、オラフの極めて細い首に収まるよう、ファミリーに新たな超小型アクチュエータを1つだけ追加設計した。既存の標準化されたハードウェアとランタイムシステムを極限まで使い回すからこそ、これほど短期間でのロボット開発が可能となる。

プログラムによるコーディングを廃止した、強化学習（RL）による歩行制御

ディズニーは、ロボットの動作や歩行パターンを定義するために、従来のプログラムによる一連のコーディングを完全に廃止し、強化学習を全面的に導入した。

ロボットは、故障のリスクが伴う現実世界で直接歩行練習を行うのではなく、物理シミュレーション環境の中で自ら歩き方を学習していく。アーティストが3Dグラフィックスソフトで作成した、そのキャラクターらしい特徴的な歩行アニメーションのモーションデータをベースとして、ロボットが物理的な動的バランスを維持しながら、その動きを忠実に模倣するための制御ポリシーを訓練する。この制御ポリシーは、シンプルなニューラルネットワークで構成されている。

訓練の初期段階では、ニューラルネットワークの接続の重みがランダムに初期化されているため、ロボットはシミュレーション内で転倒し続ける。しかし、強化学習の試行錯誤を重ねるごとに、アーティストが作った特徴的な動きを再現しつつ、決して転倒しない絶妙なバランス感覚を自律的に習得していく。

この学習プロセスを劇的に加速させるため、1台のデスクトップPCに搭載されたGPUを用いて、シミュレーション空間内で最大4,096ものシミュレーションを同時に並行して実行する。これにより、現実世界で実際にロボットを歩かせて訓練すれば、およそ10年間かかるほどの膨大な学習データを、たった1台のデスクトップマシン上で、わずか数時間から2、3日のうちに取得・完了させることができる。

さらに、この学習環境では、ロボットに過酷な頑健性を付与するためのトレーニングが行われる。シミュレーション内において、ロボットの骨盤や両足に対して、ランダムな強い外力やトルク（横から不意に突き押す力）を継続的に加え続ける。また、床の傾きや凹凸、障害物の高さなどの地形環境を激しく変化させる。

学習中のロボットはセンサーを持たない完全に盲目の状態であるが、この過酷なランダム外力に耐え抜く訓練を繰り返すことで、現実世界においてゲストと不意に衝突したり、想定外の段差や滑りやすい床に遭遇したりしても、自動で瞬時に踏みとどまり、決して転倒しない極めてタフなバランス能力を体得する。

ゼロショット転移（Zero-Shot Transfer）の成功

シミュレーション空間での学習が完了した制御ポリシー（ニューラルネットワークのパラメータ）は、そのまま実機のロボットへと直接アップロードされる。実機にアップロードされた瞬間から、ロボットは何の追加学習や現実世界での調整も行うことなく、その場ですぐに完璧に歩行を開始する。これをゼロショット転移と呼ぶ。

もし、アーティストが作成した美しいアニメーションデータを、物理的な重力や反発力を考慮せずにそのまま実機のサーボモーターに流し込んで駆動させた場合、ロボットは一瞬で無残に転倒してしまう。しかし、物理エンジンによる重力演算と、過酷なシミュレーションで鍛え上げられた外力耐性ポリシーが組み込まれているため、実機ロボットは現実の物理環境において完全に自律的にバランスを保ち、アニメーション通りの自然な歩行を美しく再現できるのである。

オラフ開発がもたらした、ロボティクス一般に応用可能な2つの技術革新

オラフを実際に屋外のテーマパークで稼働させるにあたり、従来の強化学習モデルをさらに進化させ、産業ロボティクス一般にも応用可能な2つの画期的な技術革新が導入された。

第一の革新は、足元にかかる衝撃力の最小化（Impact Force Reduction）である。開発の初期段階において、二本の脚だけで歩行する最初の制御ポリシーを実機に適用した際、ロボット特有のガシャンガシャンという金属音が響くという課題が生じた。どれほど外観がオラフであっても、重い足音が聞こえてしまっては、ゲストにとってのキャラクターとしての信憑性、すなわちディズニーが最も大切にする魔法が一瞬で崩壊してしまう。雪だるまに足音はしないはずだからである。

そこで、強化学習のシミュレーション環境における報酬設計に、地面との接触時に環境からロボットの脚にかかる衝撃力を徹底的に最小化するという新しい評価軸を追加した。この衝撃力低減の報酬（impact reduction rewards）を導入した結果、実機オラフの歩行音からは金属的な足音が完全に消え去り、まるで本物の雪だるまが静かに地面を踏みしめるかのような、極めてソフトな歩行へと劇的に変化した。

この消音歩行技術は、単なる演出としての足音低減に留まらない。ロボットが地面を叩く際の物理的な過渡ストレスを劇的に減らすため、関節アクチュエータや内部の機械部品の摩耗を抑えることができる。結果として、ロボットの製品寿命を飛躍的に延ばすという、産業ロボティクス全体に共通する極めて実用的な恩恵をもたらす。

第二の革新は、アクチュエータの熱力学的モデリング（Thermal Dynamic Modeling）である。オラフは巨大な頭部を支える必要があり、さらにその頭部を動かすために、直径わずか数センチの極めて細い首の中に3つの超小型アクチュエータを詰め込む設計が行われていた。しかし、頭を大きく後ろに傾けるポーズを維持すると、小さな首のアクチュエータに過剰な負荷がかかり、短時間でオーバーヒートによる熱破損を引き起こす危険性が発覚した。

そこで開発チームは、シミュレーション内にロボットの機構だけでなく、アクチュエータ内部の熱力学的な変化（電流と負荷による温度上昇の推移）まで再現する高度な熱力学モデルを統合した。そして、アクチュエータの内部温度が一定の閾値（限界温度）を決して超えないように、ロボット自身が熱を管理しながら動作することを強化学習の報酬として設定した。

このサーマル報酬を学習したオラフは、首の関節温度が上昇しそうになると、オペレーターの移動指示を優先しつつも、人間にはほとんど知覚できないレベルで、頭部をほんの少し前に傾けて負荷を逃がすという、極めて繊細な自己防御動作を自律的に行うようになった。

現実の真夏の炎天下のパークであっても、オーバーヒートによってシステムが破損することなく稼働し続けるこのサーマル制御技術は、例えば過酷な建設現場や被災地などで活動する、産業用ヒューマノイドロボットの耐久性と安全性を確保する上でも極めて重要かつ応用価値の高いソリューションとなる。

シム・ツー・リアル（Sim-to-Real）の深いギャップを埋める秘策

物理的なシミュレータ上で学習した知能を、いかにして寸分の狂いもなく実機ハードウェアに適合させるか。ディズニー・リサーチはこのシム・ツー・リアルの深いギャップを埋めるために、極めて実用的な手法を確立している。

まず、アクチュエータの完全なプロファイリングとバックラッシュ（遊隙）の再現である。使用するアクチュエータを特性評価装置にマウントして実際に駆動させ、その機械的特性やトルク特性、ロスを極限まで精密に測定してシミュレータに反映させた。特に、現在の多くの高トルク・高応答性ロボットに用いられる準ダイレクトドライブ（QDD）アクチュエータには、約1度の機械的なバックラッシュ（ギアの遊び、ガタつき）が存在する。

仮に5自由度を持つ脚が2本あるとすると、両脚のシステム全体で合計10度もの遊びが累積することになり、これは精密な二足歩行制御において致命的な狂いの原因となる。ディズニー・リサーチは、このバックラッシュの非線形な物理挙動までをもシミュレータ内で正確に数理モデル化し、強化学習の段階からその遊びを織り込ませてトレーニングを行うことで、実機においてブレのない、極めて洗練された歩行ポーズを維持することに成功した。

次に、ドメインランダム化（Domain Randomization）の徹底である。全く同じ設計図から、全く同じ部品を使って複数台のロボットを製造したとしても、ネジの締め具合のわずかな差や部品の個体差、経年劣化によって、物理的挙動は必ず異なるものになる。また、各パーツの正確な重心、慣性モーメント、地面との摩擦係数を完璧に数値化することはほぼ不可能である。

そこで、シミュレーション空間において、ロボット各部の質量、重心、慣性モーメント、関節の摩擦、および地面の摩擦係数などの物理パラメータを、一定の許容幅の中で意図的にランダムに変動させて学習させる。実機ロボットが持つ物理的な個体差や環境の不確実性が、シミュレーション内で学習した確率分布の範囲内に収まってさえいれば、ロボットはどのような状態にあっても、追加の調整なしで極めて安定して動作し続けることができる。

球面・閉リンク機構シミュレータ「Camino」の独自開発とオープンソース化

ロボット開発において、既存の物理シミュレータには大きな限界が存在していた。二足歩行ロボットの脚部のように、関節が単純な回転軸で直列に連結されている開ループ系の構造であれば、既存のGPU並列型の剛体物理エンジンで容易かつ高速に計算できる。

しかし、オラフの細い腕や、顔の細かな表情を動かすシステムには、内部スペースを極限まで節約しつつ強力な出力を得るため、アクチュエータを胴体の深くに配置し、そこから骨組みやロッドを介して複雑な動きを伝える球面リンク機構や閉ループリンク機構が多用されている。市場に流通している一般的な剛体物理エンジンは、これらの閉ループ構造や複雑な汎用機械リンク機構を高速かつ安定してシミュレートすることが極めて困難であり、計算が破綻するか、速度が劇的に低下するという問題があった。

この限界を打破するため、ディズニー・リサーチは、長年にわたり映画アニメーションやグラフィックスで培ってきた最高峰の知見と物理モデリング技術を融合させ、閉ループの機械リンク機構をGPU上で驚異的な超高速かつ並列で計算できる新シミュレータ、Camino（カミノ）を独自開発した。

Caminoは、指と頭部を除くだけで150個以上の独立した可動部品が複雑に噛み合って動くアイアンマンのフィギュアのような、極めて複雑で汎用的な機械リンク構造をGPU加速で正確に演算・再現することができる。同時に、3Dでの二足歩行に必要な地面とのダイナミックな接触物理もシームレスに解くことができる、世界で唯一無二の性能を誇る。

このシミュレータの名前は、映画スター・ウォーズシリーズに登場する、クローン技術の専門家たちが住む海洋惑星カミノにインスパイアされている。シミュレーション空間内で数千台ものロボットを複製して並行訓練するプロセスに合致する命名である。

Camino開発の最大の野望は、これまでの制御アルゴリズムやシミュレータの制約によって、機械エンジニアが描けるロボット設計の自由度が制限されていた時代を終わらせることにある。制御が難しいからと諦めていた、リンク機構やレバー比などの機械的優位性を駆使したスマートなロボット設計を完全に解放し、強化学習をあらゆる複雑な機械システムに適用できるようにすることを目指している。

現在、Caminoはオープンソースとして一般公開されており、ディズニーがNVIDIAおよびGoogle DeepMindと共同で開発した新しいシミュレーションフレームワークの一部として、世界中の開発者が自由に利用可能となっている。

異なる身体性（エンボディメント）へのモーション自動マッピング技術

ヒューマノイド開発の大きな利点は、インターネット上に人間の動き（モーションキャプチャ、動画データなど）が無限に存在することである。しかし、オラフのように、人間とは似ても似つかない極端な等身や構造を持つキャラクター、または四足歩行のキャラクターに対しては、そのような大規模な学習用データはどこを探しても存在しない。

ディズニーはこの課題を解決するため、内側のループで頑健な制御ポリシーを訓練しつつ、外側のループでモーションのリターゲティング（目標関節角の最適変換）を同時に行う、バイレベル（二段階）強化学習（Bi-Level RL）という画期的な手法を開発した。

ユーザー側の操作は極めてシンプルであり、人間の骨格モデルとロボットの骨格モデルの間で、対応するいくつかの関節や部位をまばらに関連付け（マッピング）して定義するだけでよい。全身のすべての関節を一致させる必要はない。

このバイレベル強化学習システムが、物理演算の裏で地面の足滑りを完璧に防ぎ、地面との適切な接触を動的に計算し、物理的に不可能な関節同士の自己衝突を自動で回避しながら、人間の滑らかなモーションデータを全く異なる外観のロボットへと見事にマッピングして転移させる。これにより、人間用に蓄積された膨大なモーションデータ資産を、あらゆるロボットキャラクターに直接活用することが可能となった。

少数精鋭のチーム構成とグローバルなデプロイ実績

この魔法のようなプロジェクトを動かしているのは、メカ設計、制御スタック構築、強化学習ツールの開発、そして高度な自律ソリューションの構築に至るまで、すべての専門分野を内包した非常にコンパクトで俊敏な少数精鋭のチームである。

さらに、完成したロボットを実際に世界のパークに安全に配備・運用するためのグローバル・サポートチームが舞台裏で支えている。彼らの強力なサポートにより、BDXドロイドは世界中のすべてのディズニーテーマパーク、さらには豪華客船であるディズニー・クルーズラインにまで派遣され、オラフはディズニーランド・パリや香港ディズニーランドに登場し、多くのゲストを魅了し続けている。

想像力から可能性を構築し、工学的に不可能に見えるものを実現可能へと変えるディズニーの物理AI技術。これはロボティクスにおける最も重要で困難なフロンティアであるデクスタリティ（手の器用さ）など、物理AIのさらなる未来の領域への道を切り拓き、産業界全体に革新をもたらし続けている。