中国の巨大IT企業ByteDance(バイトダンス)が開発したAIアシスタント「豆包(Doubao)」を搭載した「AIスマホ」が、メディアやユーザーの間で大きな注目を集めています。公式には「豆包がスマホを開発する計画はない」とされていますが、その革新的な機能から多くの人が「豆包スマホ」と呼んでいます。この記事では、このAIスマホが日常のタスクから、なんとゲームのプレイまで、どこまで自律的にこなせるのかを詳細に検証した中国のレビュー記事を、日本の読者向けに再構成してご紹介します。
AIがスマホを“乗っ取る”?「豆包スマホ」の衝撃
筆者が手にしたのは、Qualcomm Snapdragon 8シリーズのプロセッサーと「豆包手机助手技術プレビュー版」を搭載した、白いNubia M153という機種です。しかし、中興通訊(ZTE)やNubiaのアカウントログインは不要で、Googleアカウントの案内もありません。求められるのは自分の豆包アカウントへのログインのみ。さらに、スマホ左側には豆包を呼び出すための専用物理ボタンまで設置されています。
このスマホは、ByteDanceが自社開発したOS「Obric UI」を搭載しており、製造元であるNubiaの存在をほとんど感じさせません。まさにAndroidシステム上で動作する「豆包の器」と化しています。デスクトップには「豆包」以外にプリインストールアプリが一切なく、まるで一般的な中国製スマホとは一線を画すクリーンさです。簡単な設定後、筆者は声紋を登録し、豆包を内蔵アシスタントとして新たな関係を築きました。
Siriや小愛同学を超えるAIの能力
これまでのSiriや小愛同学(シャオアイ同学)といったAIアシスタントは、アラーム設定や天気予報、スマートホーム機器の操作が主な用途でした。しかし、豆包はそれらをはるかに超える能力を発揮します。なんと、画面を直接読み取り、スマホの操作を引き継ぐことができるのです。
筆者は、京東(JD.com)でアイスアメリカーノを注文するよう豆包に指示しました。簡単な認証後、画面はまるで意思を持っているかのように動き出しました。豆包は自動でアプリを開き、検索欄にキーワードを入力し、店舗を選び、さらに決済時にはデリバリークーポンまで適用して、最終的にTimsのアメリカーノを注文することに成功しました。この体験は、まるで幼い頃に遊んだゲームの自動スクリプトを思い出させます。プログラミング不要で、しかも非常にスマートに見えるのです。しかし、このAIが購入したコーヒーを飲みながら、筆者はある問題に気づきました。「豆包スマホ」では、アリババ、美団、そして一部のテンセント系アプリが正常にログイン・使用できない状態だったのです。AIに現実世界への介入をさらに深めてもらうことは難しいのかもしれません。
AIスマホはゲームで“無双”できるのか?
筆者が豆包スマホを手に入れた目的は、他でもありませんでした。それは、ゲームの世界でAIがどこまで活躍できるかを見極めること。しかし、残念ながら筆者が手にした時点では、ByteDanceは競技ゲームにおける豆包の機能使用に制限を加えていました。『王者栄耀(Honor of Kings)』をプレイするよう指示すると、豆包は「豆包によるスマホ操作はラボ機能であり、現在『王者栄耀』の操作はサポートしていません」と返答しました。
「無制限版」での衝撃的な真実
無制限版の豆包の能力を知るため、筆者は「豆包スマホ」発売初日に購入したという張柏樹氏に話を聞きました。彼はBilibiliの人気UP主、何同学がiPhone 17について語った動画を見て、未来のスマホが自動で出前を頼んだり、価格比較をしたり、雑務をこなしたりする姿に感動。「アイアンマン」のAI執事ジャービスのようだと感じたそうです。そしてわずか3ヶ月後、「豆包スマホ」がその構想を現実のものにしたことに驚きました。
張氏もモバイルゲームプレイヤーで、『崩壊:スターレイル』や『デルタフォース・モバイル』をよくプレイしています。豆包の能力を試すため、彼は『デルタフォース・モバイル』でAI兵士の前にキャラクターを移動させました。豆包は縦画面でしか起動できないため、一度ホーム画面に戻り、スマホを横にしてからサイドボタンを長押しし、「『デルタフォース・モバイル』で目の前の敵を倒してくれ」と指示。画面がゲームに戻ると、豆包はなんと30秒間も考え込み、ようやく発砲ボタンの押し方を理解しました。しかし、その時には敵兵はすでに逃げ去っており、豆包は虚空に向かって弾丸を撃ち尽くしました。
撃破に失敗した豆包は新たな試みを始め、移動、エイム、射撃のボタン機能を理解しました。しかし、ようやく敵を狙って発砲ボタンを押しても、反動で銃口はすぐに上を向いてしまいます。これは、豆包の現在のシミュレートされたタッチ操作が、単一の点触れや直線的なスライドしか処理できず、人間のように二本指で同時に操作(左手でスティックを動かし、右手で照準を調整しつつ反動を抑える)ができないためです。さらに致命的だったのは、豆包が画面情報を処理するのに約5秒もの遅延があることでした。これは、AIの演算がスマホ内ではなくサーバーで行われるためで、高速な応答が求められるFPSゲームでは、最も愚かなAIよりもさらにぎこちなく感じられました。
競技ゲームは門前払い、カードゲームも苦手
張氏は『王者栄耀』でも豆包を試しました。『デルタフォース・モバイル』での大失敗を受け、期待値を下げて新規アカウントを作成し、豆包にチュートリアルをプレイさせました。しかし、豆包が操作する安琪拉(アンジェラ)が数歩進んだだけで、最初のスキルを出す間もなく、画面には「環境異常」の警告が表示され、アカウントは強制的にオフラインに。豆包はゲーム外ツールのようなアンチチート対策を行うはずもなく、テンセントのアンチチートシステムから見れば、豆包は不正なスクリプトと区別されなかったのです。Androidシステムの最も危険な権限の一つである「INJECT_EVENTS」権限(アプリがユーザー入力をシミュレートすることを許可する)を使った自動操作は、ゲーム側から見れば自動化スクリプトと判断されるのでした。
張氏は『炉石传说(Hearthstone)』や『欢乐斗地主(Happy Landlords)』のようなカードゲームも試しました。『Hearthstone』では、豆包は確かにカードを出すことができましたが、背後にある戦略を全く理解していませんでした。嘲諷(挑発)ミニオンの意味も、いつどの手札を出すべきかも、どうすればゲームに勝利できるのかも、全く分かっていなかったのです。『Happy Landlords』では、豆包の画面読み取りの反応時間の長さがゲームの持ち時間を超えてしまい、結局ゲームシステムがAIに操作を委託。このゲームはバイトダンスのAIとテンセントのAIが協力して完成させるという皮肉な結果となりました。
張氏が唯一驚きを感じたゲームは、カジュアルパズルゲームの『开心消消乐(Candy Crush Sagaのようなゲーム)』でした。簡単な指示の後、豆包は一局全てをクリア。即時反応や素早い操作が不要なこうしたカジュアルゲームには、より適性があるようです。
AIが得意なゲーム、苦手なゲーム
筆者自身も「豆包スマホ」に、競技ゲームの制限を受けない戦略性のあるカジュアルゲームを操作させてみました。「TapTapで『2048』をダウンロードして」と指示すると、豆包はすぐにブラウザを開いて「TapTap」を検索し、公式サイトを確認してダウンロードボタンをクリック。インストール確認の時だけコントロールが筆者に戻される以外は、全て自動で完了しました。『2048』のダウンロード後、筆者は新たなタスクを与えました。「一つのブロックを2048まで合成して」。
豆包は画面を引き継ぎ、ゲームを開始しました。2と2を合成して4に、4と4を合成して8に、といった合成の仕方は理解しているようでした。しかし、「合成した大きな数字を隅に寄せ、小さな数字を合成するスペースを確保する」という戦略は全く理解していません。ただ目の前の消去に集中し、ゆっくりと、しかし無作為に画面をスライドさせます。約10分後、マス目が埋まってゲームオーバー。豆包はすぐに「リセット」ボタンをクリックし、新たなゲームを再開。まるで2048の合成を誓っているかのようでした。しかし、約20分後、「実行エラー、タスクを早期終了しました」というウィンドウが表示され、目標達成には至りませんでした。
よりシンプルな『合成大西瓜(Merge Big Watermelon)』を試させると、豆包の画面認識とクリック能力はうまく機能しました。フルーツの合成方法を素早く理解し、落とす位置を正確に見つけて二つの同じフルーツを衝突させることができました。27分後、豆包は見事に大西瓜を合成してみせたのです。
最後に、筆者は古典的な『テトリス(ロシア方塊)』を豆包にプレイさせました。結果は、なんと第一段階すらクリアできませんでした。落下速度が豆包の反応速度を上回り、ブロックはあっという間に高く積み上がり、豆包は一行も消すことができずに「0点」という残念な結果に終わりました。しかし、ゲーム広告をスキップする速度には驚かされました。筆者が広告内の正しい「×」ボタンを見つける前に、豆包は画面を読み取り、正確にクリックしてポップアップを閉じていたのです。
『テトリス』での失敗後、筆者は豆包の操作制限と反応の遅さという弱点を避けられるゲームを考えました。そこで思いついたのが『バロラント(小丑牌)』でした。しかし、モバイル版のダウンロード先がすぐには思いつきません。そこで、筆者は豆包に直接インターネット上でインストールパッケージを検索するよう依頼。豆包はすぐにその要求を受け、ブラウザで検索を開始。いくつかのウェブページを上下にスクロールした後、ゲームアプリストアのようなソフトウェア「悟饭游戏厅」のダウンロードを提案するところまで進みました。
まとめ:AIスマホ「豆包」の現在地と未来
今回の検証を通じて、「豆包スマホ」が示すAIの可能性と限界が明らかになりました。
- 強み:日常的なタスクの自動化(アプリダウンロード、オンライン注文、情報検索)、シンプルなカジュアルゲーム(『开心消消乐』『合成大西瓜』)のプレイ、広告の自動スキップなど、定型的で即時反応や複雑な戦略を必要としない操作においては、驚くほどの能力を発揮します。OSレベルでのAI統合により、ユーザーの利便性を飛躍的に向上させる可能性を秘めています。
- 課題:競技ゲームや高度な戦略・即時反応が求められるゲーム(FPS、MOBA、カード戦略ゲーム、テトリスなど)では、その能力はまだ十分ではありません。特に、複数指操作の不自由さ、サーバー側での演算による画面認識・操作の遅延、そしてゲームのアンチチートシステムとの衝突が大きな壁となっています。
「豆包スマホ」は、AIが単なる音声アシスタントの枠を超え、OS全体に深く統合され、自律的にデバイスを操作する未来を垣間見せてくれました。現在のところ、ゲーム分野での活躍は限定的ですが、今後のAI技術の進化、特にデバイス内での演算能力向上や、ゲーム開発者との連携が進めば、その可能性は大きく広がっていくでしょう。このAIスマホが日本の市場にどのような影響をもたらすか、そして私たちのモバイルライフをどう変えていくのか、今後の動向に注目が集まります。
元記事: chuapp
Photo by Tima Miroshnichenko on Pexels












