近年、グローバルなAI分野では目覚ましい「オープンソース旋風」が吹き荒れています。その主役は、中国のテクノロジー大手Antグループ傘下のAnt LingBotと、AIの巨人Googleの間で繰り広げられる激しい競争です。この対決は、世界のAIコミュニティの熱気を高めただけでなく、業界の勢力図に大きな波紋を広げています。
AI世界モデルに「オープンソース旋風」が到来
全ての始まりは、Ant LingBotによる「電撃戦」でした。1月27日以降、Ant LingBotチームはわずか4日間で、4つの主要なAIモデルを立て続けにオープンソース化しました。中でも最も注目を集めたのは、GoogleのGenie 3の強力なライバルと目される世界モデル「LingBot-World」です。この発表は連鎖的な反応を引き起こしました。Googleは迅速に戦略を調整し、1月30日には世界モデル体験プラットフォーム「Project Genie」を特定のユーザー向けに公開したのです。
この二大大手による相次ぐ動きは、海外のソーシャルメディアプラットフォームX(旧Twitter)で関連トピックをトレンドのトップに押し上げ、RedditなどのコミュニティAI掲示板でもヘッドラインを飾るほどの熱狂を生み出しました。
Ant LingBot-Worldが切り開く新境地
LingBot-Worldの衝撃は、従来のAI世界モデルの技術的限界を打ち破った点にあります。デモ映像を見ると、このモデルは視覚効果においてGenie 3に引けを取らないだけでなく、約10分間の連続したロスレス生成を実現しています。物体の安定性、シーンロジックの自己完結性、インタラクティブな応答の即時性といった点でも、業界トップレベルに達しています。
ユーザーはキーボードやマウスでキャラクターやカメラアングルを操作でき、指示に応じてリアルタイムで画面が変化します。テキストコマンドで天候やスタイルなどの環境変化を引き起こすことも可能です。さらに驚くべきは、カメラを60秒間移動させてから戻しても、目標とする物体が構造と外観の一貫性を保つことです。エンドツーエンドのインタラクション遅延は1秒以内、生成フレームレートは16FPSに達し、まるでカクつき感のないスムーズな体験を提供します。
このモデルのもう一つの大きな強みは、「Zero-shot汎化能力」です。開発者は、一枚の現実の写真やゲームのスクリーンショットを入力するだけで、インタラクティブなビデオストリームを生成できます。特定のシーンのための追加トレーニングやデータ収集は不要です。これは、高コストと汎化能力の低さが課題だった業界の痛点を直接解決するものです。LingBot-Worldのオープンソース化は、世界の開発者にとって「すぐに使える」産業レベルのツールキットを提供することに等しいと言えるでしょう。
Antグループの野心:ロボットAIの「目」から「脳」まで
Antグループの野心は、LingBot-Worldだけに留まりません。同時にオープンソース化された他の3つのモデル、「高精度空間知覚モデルLingBot-Depth」「身体性大規模モデルLingBot-VLA」「身体性世界モデルLingBot-VA」は、「知覚」から「行動」、そして「認識」へと至る包括的な技術チェーンを構築します。
- LingBot-Depth:透明・反射物の把持といったロボット業界の難題解決に特化しており、「ロボットの目」とも称されます。
- LingBot-VLA:2万時間以上の実ロボット操作データでトレーニングされたモデルで、9種類の主流の双腕ロボットモデルに対応可能。「ロボットの汎用的な脳」と呼べる存在です。
- LingBot-VA:ビデオ生成とロボット制御を深く融合させ、ロボットが「推論しながら行動する」能力を持たせます。実機評価では、複数の性能で業界ベンチマークであるPi0.5を上回る結果を出しています。
AI業界の勢力図が塗り替えられるか?
このオープンソース旋風の背後には、AI業界の深い変革があります。これまで、GoogleやOpenAIといった巨大企業は、ハイエンドなAIモデルの分野を独占し、クローズドソース戦略で高い技術障壁を築いてきました。その結果、中小企業やスタートアップは、資金や計算能力の不足から、最先端技術に触れることが困難でした。
Antグループのオープンソース化は、AI技術へのアクセスを民主化し、イノベーションの加速を促す可能性を秘めています。この動きは、これまでの巨人たちによるAI市場の独占構造に一石を投じ、新たな競争と協力の時代を切り開くかもしれません。日本の開発者にとっても、高性能なAIモデルが手軽に利用できるようになることで、新たなアプリケーションやサービスの創出が期待されます。
元記事: pcd
Photo by Google DeepMind on Pexels












