top of page

物理AIの最終フロンティア「手先の器用さ」を突破する油圧駆動の破壊的革新──Sanctuary AIが描くロボットハンドの未来と日本企業とのアライアンス(Humanoid Summit2026Tokyoレポート)

  • 執筆者の写真: 小宮 昌人 / Komiya Masahito
    小宮 昌人 / Komiya Masahito
  • 6 日前
  • 読了時間: 13分

Humanoid Summit2026下記セッションレポート

Dexterity: The Final Frontier for Physical AI」

James Wells, CEO at Sanctuary AI


AI技術の急速な進化に伴い、ロボティクス分野における物理AI(Physical AI)の実用化に大きな注目が集まっている。しかし、製造や組み立ての現場においてロボットが人間と同等に活躍するための最大のボトルネックは、依然として手先の器用さ、すなわちデクスタリティ(Dexterity)にある。カナダのロボティクススタートアップであるSanctuary AI(サンクチュアリAI)は、この課題を打破する極めて革新的なアプローチを展開している。同社と日本との歴史的な繋がりから、最新の材料開発アライアンス、0.1ミリメートルの超高精度制御、そしてロボットハンドの駆動方式に油圧を採用するという破壊的イノベーションの全貌までを、技術メディアの視点から詳細に解説する。



カナダと日本の3世代にわたる絆と、日本ゼオンとの最新パートナーシップ


Sanctuary AIと日本には、歴史的かつ家族的な深い絆が存在する。同社の創業者一族は、1960年代、70年代、80年代にかけて、日商岩井(Nissho Iwai)、三井(Mitsui)、三菱(Mitsubishi)といった日本の大手商社や企業に対して、カナダ産の木材(lumber)を販売するビジネスに携わってきた。この3世代にわたる強力なパートナーシップの歴史を受け継ぎ、現代の最先端ロボティクス分野において、日本との新たな提携が発表された。


具体的には、日本のZeon Chemical(ゼオン化学 / 日本ゼオン)との間で、器用な手先操作であるデクスタラス・マニピュレーションに向けた新しい素材(new materials)を共同定義・開発するための極めて重要な共同開発パートナーシップが締結された。手先の器用さを支えるこの材料技術の領域は、グローバルな開発グループや中国などの他国の競合が直接的に競争できていないブルーオーシャンであり、Sanctuary AIと日本企業独自の強力なアドバンテージとなることが期待されている。


物理AIにおける最重要ボトルネックとしてのデクスタリティ


これまでロボティクス業界全体の多大な努力と巨額の資金は、ハードウェアの構築、制御ソフトウェアの設計、高度なAIモデルのトレーニング、データの収集、そしてそれらを支えるデータインフラストラクチャの確立へと注がれてきた。しかしながら、これらの技術が著しい進化を遂げた現在でも、産業現場での実用化を阻むナンバーワンのボトルネックとして依然として存在し続けているのがデクスタリティ(手の器用さ)である。

人間の手は、自然界が作り出した絶対的な驚異(marvel)であり、世界の経済活動や産業全体のあらゆるプロセスやタスクにそのまま適用できる究極の万能ツールである。Sanctuary AIは、日々行われる人間の手の極めて洗練された複雑な動きを開発ロードマップの最も重要なインスピレーションとして位置づけ、この難解な領域の突破を目指している。


グリッパー対5本指ロボットハンドの二者択一に対する結論──タスク至上主義の導入


ロボットアームの先端に装着する機構として、業界では2本指などのシンプルな既製品グリッパー(off-the-shelf gripper)を採用すべきか、それとも多指を備えたロボットハンド(robotic hands)を採用すべきかという議論が長く交わされてきた。これに対し、何百社もの顧客との対話と緻密なリサーチを重ねた結果、導き出された結論は、二者択一ではなく両方(both)が必要であるというアプローチである。


既製品グリッパーは、現在急速に進化している高度なAI技術をシンプルで安価なハードウェアに注入・実装するだけで、顧客に対して極めて短期間で直接的な投資回収効果(ROI)を提供できる。一方で、人間の手が持つ真の無限の可能性(promise)を引き出し、将来のより複雑で不規則なタスクを自動化するためには、5本指ハンドのような高度な擬人化ロボットハンドの開発を並行して強力に推進する巨大な機会を捉えなければならない。


ここで自動化を検討する上で最も重視すべきなのは、ハードウェアの形状そのものではなく、自動化しようとするタスク(作業内容)である。個々のタスクごとに求められる能力や難易度、グリッパー側の特性などの様々な要因(variety of factors)を細部まで評価する必要があり、すべての産業タスクを単一のグリッパー形状だけでこなそうとすることには無理があるというタスク至上主義が基本姿勢となっている。


単一AIプラットフォームによる多様なエンドエフェクターの完全制御


顧客に対して早期に確実なビジネスメリットを提供するため、Sanctuary AIはハードウェアに依存しない独自のシステムデザインを採用している。

同社は、異なる複数のエンドエフェクター(吸着式、並行2本指、5本指など)に共通してシームレスに適用可能な単一のAI制御プラットフォーム(Single Platform)を構築した。この共通のAIシステムを用いることで、独自にカスタム設計した吸引式(サクション)グリッパー、並行開閉式(パラレル)グリッパー、さらには人間の手の構造を模した高度な擬人化エンドエフェクター(anthropomorphic end-effectors)にいたるまで、同一の制御システム上で滑らかに動作させることができる。これにより、顧客の求める特定の現場作業に対して、即座に最適化された価値を提供することが可能となる。


0.1ミリメートルの超高精度板金位置決め──自動車プラントの実稼働に耐えるAIポリシー


実験室でのデモとは異なり、実際の製造現場でロボットを稼働させるためには、AIモデルが満たすべき極めて過酷な基準がある。その中でも最も重要なのが、厳格に設定された生産ラインのサイクルタイムの枠内に収まる超高速な処理速度である。サイクルタイムを克服することこそが、手先の器用さを要するロボットマニピュレーションが産業界へ爆発的に普及するための最大の条件となる。


実稼働プロセスの具体例として、自動車プラント(automotive plant)における板金(sheet metal)の超高精度位置決めが挙げられる。このタスクは、ランダムに置かれた不規則な形状の板金を正確にピックアップし、その板金を溶接用の治具(フィクスチャやジグ)の上に極めて精密に配置するものである。板金の上には、のちに溶接されるボルト・ナット(nuts)が配置される。


板金を持ち上げる動作や、固定具の上に板金を置くだけの動作は、それ単独では難しくない。真の挑戦は、これらピックアップと超精密配置という独立した二つの動作を、途切れなく、一つの滑らかな一連の動作として高度に融合(blend)させる点にある。


板金を固定具にしっかりと装着するためには、ガイド用の小さなピン(pin)に対して、わずか0.1ミリメートル(0.1 mm)の許容誤差(tolerance)という超極小の隙間に一発で通す必要がある。従来の工場における固定型自動化技術や物理プログラミングでは、通常1ミリメートルから2ミリメートル程度の誤差が限界とされていたが、開発されたAIポリシー(AI policy)は、この0.1ミリという髪の毛ほどの極小の隙間に対して動的に交渉・調整(negotiates with this very tight tolerance)しながらはめ込む動作を自律的にやり遂げる。


このAIは、毎回機械的に同じ軌道を描くわけではない。ロボット自身が、最初に板金を掴んだ位置や角度のわずかなズレ(事前の把持状況)を瞬時に認識し、そのズレを補正するように配置の軌道をリアルタイムで自律的に適応(adapt)させて位置決めを完了する。


難攻不落のタスク──移動コンベア上での「ワイヤーハーネス差し込み」で成功率99.5%


さらに難度の高い実用タスクとして、産業界、特に自動車や電機製造の組み立て工程においてロボット化が最も困難(最悪のタスク)とされてきたワイヤーハーネスのプラグ差し込みタスク(wire harness plugging task)がある。


この自動化を阻むのは非反復性(非繰り返し性)という特性である。ワイヤーやケーブルは、つかむたびに形がふにゃふにゃと変わり(剛体ではないため)、パーツの正確な形状やプラグの初期位置が一定しない(nothing about it is repetitive)。そのため、人間が日常的に行っている、ケーブルを持って1ミリ未満(sub millimeter)の狭いポート(受け口)に素早く正確に挿入するという作業は、これまでのロボット工学にとって最も難解な課題であった。さらに、差し込む対象物であるポートが載っているコンベアベルト(conveyor belt)が常に動き続けている(moving)という点が、このプロセスをいっそう困難にしている。


しかし、カスタム設計のエンドエフェクターと、その頭脳となるAIポリシーの組み合わせにより、動き続けるコンベア上でも99.5%という極めて高い作業成功率を達成することに成功した。さらに、この難作業を、一時的な実験室レベルではなく、実際の工場が要求する過酷なサイクルタイム内に収めて実行(industrially relevant)している。コンベアから流れてくるプラグの向き、回転、傾きは、流れてくるたびに毎回微妙に異なっているが、AIポリシーはそれらを画像認識と動的な軌道修正によって完璧に補正してポートへ差し込み続ける。


わずか5時間のデータ収集で学習完了──驚異の「高サンプル効率性」と自律エラーリカバリ


物理AIシステムが真の実用に耐えうる存在になるためには、制御モデルが現実世界の不確実性(非決定的、nondeterministicなエラーや失敗)に対処できなければならない。


実際に、作業が失敗した瞬間のハプニングシーンを検証すると、ロボットの高度な自律性が明らかになる。プラグの差し込みに一瞬失敗して弾かれた際、システムが停止することなく、ロボットは即座に自分で失敗を認識し、つかみ位置を微調整してすぐに差し込み直す自律的エラーリカバリ(error recovery)を実行する。さらに、一度の失敗で発生したタイムロスを取り戻すために、一時的に滞留した(バックログとなった)後続のプラグ群を、動作スピードを上げて次々と処理していく見事な挙動を実証している。


そして、この高度な挙動と超高速なサイクルタイムのAIモデルを学習させるために必要とした、遠隔操作(テレオペレーション)データの量こそが、最もエキサイティングな部分である。


開発された新しいモデルアーキテクチャは、データ効率が極めて高い(extremely sample efficient、サンプル効率性に優れている)という類稀な特性を持っている。通常、このような複雑な物理タスクを強化学習や模倣学習させるには、膨大な事前トレーニング用データ(pre-trained data)を数カ月かけて収集する必要がある。しかし、このシステムでは事前のデータを一切使用することなく、ハードウェアが顧客の現場にセットアップされてからわずか5時間未満(less than 5 hours)のデータ収集で学習を完了させた。


この学習モデルを構築するのに要したコンピューティングリソースは、わずか12時間未満のGPU稼働時間(12 GPU hours)であり、極めて低コストである。この圧倒的な効率性により、顧客の工場や作業現場(オンサイト)にロボットを物理的にデプロイした後、その固有の環境に合わせて現地で微調整(ファチューニング:fine-tune)を行うだけで、即座に実稼働可能な高性能の産業用AIを納品できるシステムが実現している。


電気・ケーブル駆動の限界を超えて──「油圧式多指ハンド」がもたらす4つの技術的アドバンテージ


未来の自動化領域を開拓するため、人間の手を完全に再現するユニバーサル・エンドエフェクター(Universal End-effector)の研究開発が進められている。

約4年半前に開始されたハンド開発プロジェクトの初期段階では、電気機械式(モーター駆動:electromechanical-based)の手や、ワイヤー等で駆動するケーブル式(cable-based)の手が試作されたが、これらはいずれも耐久性の限界や関節強度の不足、精密性の問題などの重大な課題に直面した。

そこでたどり着いた、まったく新しく、かつこれまでのロボットハンドの常識を覆す独自の解決策が油圧駆動式の擬人化ロボットハンド(5本指ハンド)である。ロボットハンドに油圧(ハイドロリクス:hydraulics)技術を採用することには、圧倒的な技術的メリットが4点ある。


第一に、圧倒的な力密度(Power Density)である。従来の電気機械(モーター)駆動式のハンドに比べて、実質20倍(20x)もの極めて高い力密度(パワーと出力)を、手のひらや指先の極小スペースの中に実現できる。

第二に、極めて高速な応答時間(Fast Response Time)である。

第三に、指先の高い精密制御(High Fingertip Precision)である。

第四に、最高レベルの熱効率(Energy Efficient Actuation)である。最大の難関であった、連続動作時に指の内部に熱が蓄積・オーバーヒート(heat or buildup)する問題が、エネルギー効率の高い油圧アクチュエーションによって一切発生しない。


独自に極限まで小型化(マイクロ化)して開発されたミニチュアピストン(miniaturized pistons)とアクチュエータは、設計の自由度(デザインスペース)を極限まで広げ、人間の手の複雑な関節構造や対向運動(親指と他指の対向など)をほぼ完璧に複製(レプリケート)することを可能にした。


1カットデモが示す圧倒的なコントロール性能と、人間レベルの触覚フィードバック


開発された油圧式多指ロボットハンドを用いて、テレオペレーター(遠隔操作者)が極めて複雑な組み立て作業(アセンブリタスク:assembly task)を行う実演動画では、その性能の高さが証明されている。

このタスクは多くの複雑なサブステップを必要とするため、単純な2本指グリッパーでは決して処理できない。ロボットは、小さな金属パーツを指先で器用につまみ、それを固定用の器具(治具)に正確にはめ込み、さらにもう一方の手でボルト(ナット:nut)を指先で掴み、ネジ山に這わせて回転させて締め付ける作業(スレッディング:threading)を行う。


この人間レベルの制御精度をもたらしているのが、ロボットの指先(指腹部)にびっしりと搭載された高精度な触覚センサー(tactile sensors)である。触覚センサーが、ボルトを締め付ける際の圧力、ネジ山のひっかかり、摩擦といったリアルタイムの物理的感覚を、遠隔地にいるオペレーターの操作デバイスへと正確にフィードバックする。

オペレーターはこの指先の感触を得ることで、どれほど強くボルトを握り、どれほどの力加減で回転させて締め付けるべきか(how tightly they have to squeeze)を人間の手の感覚そのままに把握し、ネジ山を潰すことなく極めてスムーズなスレッディング動作を完遂できる。


この複雑な一連の組み立てデモは、途中で映像のカット(編集や継ぎ接ぎ)を一切入れていない、正真正銘の1カット・ノーカットの通し映像(one cut demo)として公開されている。これは、遠隔操作システムの追従性が極めて優秀であることの証明であり、何よりも、このリアルな操作を通じて将来的に自律AIポリシーを訓練するための、極めて高精度で高品質な学習用データ(high quality data)がシームレスに採取できていることの裏付けとなる。


また、油圧システムは非常に強靭であるため、重い金属パーツを楽々と持ち上げながら、同時に繊細な手の器用さを完全に維持できるのも大きな特徴である。ロボットハンドは、工場で一般的に使用される市販の手工具(電動ドリルドライバーなど:hand tools)を器用に握り、操作することができる。重い工具をグリップし、トリガーを引く強さを微細に調節(モジュレート:modulate)し、さらに回転するドリルのビット先端を小さなボルトヘッド(ネジ穴)に対して寸分の狂いもなく正確に位置合わせ(アライメント)する動作は、極めて難解(harder than it looks)な工学的偉業である。


イノベーターのジレンマに学ぶ──油圧駆動が引き起こす破壊的技術のアナロジー


既存の産業用ロボットや今後のモバイルシステム、そして高度な油圧ハンドシステムをすべて統合した、あらゆる種類のエンドエフェクターに適用可能なAIプラットフォームの展開は、現在のロボットハンド市場において決定的なゲームチェンジャーになると確信されている。ここには、クレイトン・クリステンセン氏の名著『イノベーターのジレンマ(The Innovators)』に描かれるような、歴史的な技術転換のアナロジーが存在する。


かつて、世界の建設機械や土木掘削(ショベル)業界は、鋼鉄製のワイヤーとプーリー、ケーブルで稼働するケーブル式掘削機(cable-based excavators)によって完全に市場が支配されていた。そこに、当時はまだ登場したばかりで新興技術に過ぎなかった油圧駆動(hydraulics)というイノベーションが導入された。


結果として、登場からわずか10年(10 years)の間に、油圧式ショベルは圧倒的なパワー密度と応答速度によって既存のケーブル式ショベルの市場シェアを100%完全に奪い去った。そして、かつて世界市場を独占していた旧来のケーブル式ショベルメーカーのほぼすべて(全人口のメーカー:almost the entire population of mechanical shovel manufacturers)が、この油圧という破壊的技術(disruptive technology)の荒波によって市場から跡形もなく一掃され、歴史の闇へと消え去った。


ロボットハンドの駆動技術の歴史においても、この油圧多指ハンドが全く同一の破壊的な劇的パラダイムシフトを引き起こすと確信されている。

最新記事

bottom of page