Manusの最新対話全文:エージェント支払いを試みる、会社RRRは近く1億ドル

著者|李 淵(リー・ユアン)

編集 | Jing Yu

シンガポールに移住したManusは、汎用AIエージェントについての考えを止めていない。

本日シンガポールで開催された Stripe Tour では、Manus の共同創業者兼チーフサイエンティストである Peak が、Stripe のアジア太平洋地域および日本担当最高収益責任者である Paul Harapin 氏と対談しました。

夕食会で、Manus AIは最近の営業データを公開し、Manus AIの収益ランレート(RRR)は9,000万ドルに達し、まもなく1億ドルに達する予定です。

Manus AIの肖弘は、Revenue Run Rateが当月のRevenue *12を指し、Cash Incomeとは異なることを即刻強調しました。多くのAI製品には年払いオプションがあり、この部分はあくまで前払い金として扱われ、Revenueとして計上することはできません。「このような【誤った方法】で開示した場合、1.2億ドル以上の数値を算出することができます。」と肖弘は述べました。

経営データの他に、季逸超はManusチームが汎用エージェントの次のステップをどのように考えているか、そしてAIエージェントとAGIの未来にはどのような違いがあるかを共有しました。

「今、皆はほとんどすべてをエージェントと呼んでいます。例えば、マイクロフォンを「環境認識エージェント」と呼ぶ人もいます。」と季逸超は冗談を言いました。

彼は、汎用エージェント機能の拡張に向けた次の2つの主要な方向性を示しました。第一に、複数のエージェントが協力して実行規模を広げること(例えば、大規模な調査の中で数百の並行するサブエージェントが派生すること);第二に、エージェントに「ツール面」をより広げること、能力を少数のプリセットAPIに固定するのではなく、プログラマーのようにオープンソースエコシステムを呼び出し、ライブラリをインストールし、さらには可視化後に画像を自己検査して修正を行うことです。

季逸超はまた、今日のデジタル世界が依然として「人間に使わせる」パラダイムで構築されていることに言及しました——API化されていないウェブページ、CAPTCHA、プロセスの「ミニゲーム化」が大量の摩擦を引き起こし、ボトルネックはモデルの知性ではなく、生態系や制度の制約のようです。

これもManusがStripeの活動に参加する理由の一つです:両者はエージェント内での支払いを進めており、「研究—決定—注文/決済」を一つのサイクルに結びつけ、インフラストラクチャの協力によって世界の摩擦を解消しようとしています。

以下は対話の要点で、Geek Parkによって編集整理されています:

質問:観客に簡単に自己紹介をしてもらえますか。最近の「コンテクストエンジニアリング」に関するブログは非常に刺激的で、ここにいるAIエージェントを開発している人には必見だと思います。エンジニアたちとランチに行くたびに、彼らはいつもこの話題をしているので、私は今は別の場所に座るしかありません(笑)。しかし、現場でManusにあまり馴染みのない人のために、あなたの経験とビジョンを共有していただけますか?

答:ありがとう、ポール。来られて嬉しいです。マヌスは汎用AIエージェントを構築しています。

多くの研究機関や企業は、実際に脳を構築しようとしており、大規模な言語モデルを作成しています。しかし、私たちは消費者の視点から見ると、これは実際には良いことではないと考えています。AIは本当に行動を起こし、物事を完了させるべきであるため、私たちはManusを構築しました。

私たちの方法は、AIが人類の歴史上最も偉大な発明の一つである汎用コンピュータを使用できるようにすることです。AIにコンピュータを与えると、AIは人間ができるすべてのことを行うことができます。Manusは本当にタスクを完了することができます。たとえば、プレゼンテーションを作成したり、旅行を計画したり、さらにはソーシャルメディアを運営する手助けをすることもできます—ただし、実際にそうすることをお勧めするわけではありません。

私たちのユーザーは本当にManusが大好きです。私たちは3月にManusをリリースし、現在約9000万の収益運営率(RRR、Revenue Run Rate)を実現しており、まもなく1億を突破するでしょう。

私はこれが私たちのような小規模なスタートアップにとって非常に大きなことだと思います。しかし、より重要なのは、これはAIエージェントがもはや研究分野の流行語ではなく、実際に適用され、根付いていることを示しています。

私たちがManusを構築する過程での小さな物語を皆さんと共有できます。

私たちは実際にエージェントコーディングのアプリケーションから多くのインスピレーションを得ました。例えば、カーソルのようなAIプログラミング製品は、以前から多くの注目を集めています。

エンジニアとして、私たちは自然にカーソルを使用します。しかし、驚くべきことに、社内の多くの非エンジニアの同僚もカーソルを使っています。もちろん、彼らはソフトウェアを作成しているわけではなく、データ可視化を行ったり、いくつかの文章を書いたりするために使用しています。彼らは左側のコード部分を無視し、AIと対話して作業を完了します。

これにより、私たちはこの方法を一般化し、非プログラマーに力を与えるべきであることを認識しました。これがAIの一つのユースケースです。

質問:私たちはますます多くの人々がAIエージェントとAGIについて話しているのを耳にします。これらの2つの概念をより明確に区別する手助けをしてもらえますか?AIエージェントとAGIは、あなたやManusにとってそれぞれ何を意味しますか?

答:私たちはこれは非常に良い質問だと考えています。

今、皆がほとんどすべてを「エージェント」と呼んでいます。例えば、マイクロフォンについては、「環境認識のある収音エージェント」と言う人もいます。

しかし、少なくとも私たちは、エージェントは応用型AIの一部であるべきだと主張しています。少し引いて、一般的なAIアプリケーションのカテゴリを見てみましょう。

ほとんどの人は二つのタイプに慣れています:一つはチャットボット、例えば ChatGPT;もう一つは生成ツール、例えば MidJourney または Sora。これらのシステムでは、通常二つの役割しかありません:ユーザーとモデル。あなたはモデルと対話し、出力を得ます。しかし、エージェントの違いは、ユーザーとモデルに加えて、第三の重要な要素——環境を導入する点です。

この「環境」の概念は、エージェントのタイプによって異なります。たとえば、設計型エージェントでは、環境はキャンバスやコードの一部かもしれません。一方、Manusでは、私たちの目標はエージェントを仮想マシンやさらにはインターネット全体に出現させることです。こうすることで、エージェントは環境を観察し、次に何をするかを決定し、行動を通じて環境を変えることができます。これにより、非常に強力になります。

例えば、Manusでは、あなたのニーズを表現することができ、それがブラウザを開き、ウェブページを公開し、飛行機のチケットを予約してくれます。この例がとても好きです。なぜなら、飛行機のチケットを予約することは一見簡単に思えるかもしれませんが、実際にはAIが現実世界を直接変えているからです。結果はモデルの出力ではなく、手元にあるチケットです。AIが本当にあなたの世界に介入しているのです。これが私たちが言うエージェントです。

簡単に言うと、エージェントはユーザーと環境との相互作用を代表できるAIシステムです。

AGIについてですが、この言葉はよく取り上げられ、多くの人がそれをスーパーインテリジェンスと同一視しています。私たちは、AGIをAIモデルの汎用的な能力を利用し、特別な設計なしに多くのタスクを完了できるシステムと考えています。

私たちは「エージェントコーディング」が実際にはAGIへの道の一つであると考えています。それは特定の分野の能力ではなく、コンピュータにそれを与えれば、ほぼ何でもコンピュータ上で行うことができるのです。したがって、私たちにとってAGIの条件は、この能力を発揮できる十分に整った環境を構築することです。

質問:AIは今日、どのようなシーンで実際に役立っているのでしょうか?未来にはどのような場所で役立つのでしょうか?iPhoneの瞬間はいつ訪れるのでしょうか?

答:エージェントに関して言えば、モデルの能力だけを見れば、現在のフラッグシップモデルは非常に驚くべきもので、ほぼ「スーパーマン」レベルです。彼らは数学コンペティションや論理推論において、私たちのほとんどを凌駕することができます。

しかし、私はモデルが「瓶の中の脳」のようなものであると思います。もし本当に力を発揮したいのであれば、現実世界と相互作用し、現実に触れる必要があります。しかし残念ながら、これが問題が始まる場所です。

例えば、AIにいくつかの事務的なタスクをさせると、繰り返しのタスクにおいて確かに得意です。例えば、Deep Researchのような製品は、情報を集約して結果を出すだけで、その出力は単にそこに現れるだけです。

例えば、現在ほとんどすべてのものは人間のために設計されています。物理的な世界だけでなく、デジタルの世界でもそうです。例えば、ウェブツールは、まるでミニゲームのように、APIや標準インターフェースを提供していません。 CAPTCHAの確認コードは至る所にあり、エージェントをあちこちで遮断しています。

したがって、私はAIが閉じた自己完結型のタスクで優れたパフォーマンスを発揮すると思いますが、実世界に関わると障害に直面するでしょう。

未来、iPhoneの瞬間はいつ訪れるのでしょうか?私はこれが技術的な問題ではなく、むしろ制度的な制約のように思います。これは私たちのようなエージェント起業家が単独で解決できることではありません。

私はこれが段階的な変化を必要とし、エコシステム全体が共に進化することを要求すると考えています。また、Stripeのような企業がインフラ層で取り組む必要があります。例えば、私たちは新しいStripeのAgentic決済APIを統合しています。みんなで協力しています。

質問:では、ユーザーがManusを使用する際のいくつかの典型的なシーンについて具体的に話すことはできますか?彼らはどのように使用していますか?この中でどのような力が表れていますか?

答:はい、私たちは現在の世代のエージェントから来ていますが、すでに多くの素晴らしいユースケースを見ています。

例えば、私たちはシンガポールに引っ越したばかりで、住居を探すために不動産仲介業者を雇う必要があります。リアルなエージェントです(笑)。

そして今、これらの仲介業者はManusを使用しています:彼らは顧客のニーズに基づいて、Manusを使って会社の所在地や従業員が住みたい地域を分析し、それに応じた推奨を生成します。

私はこれが非常に興味深いと思います。なぜなら、これは「ロングテールの需要」に属するからです。一般的に言って、この具体的なシーンに特化したAI製品は存在しませんが、Manusは汎用エージェントであるため、これらのニーズを満たすことができます。私たちはロングテールの需要に非常に注目すべきだと考えています。

マクロの観点から見ると、それはロングテールかもしれませんが、特定のユーザーにとっては、それが彼らの日常業務そのものです。このようなシナリオは特に価値があります。

これは今日の検索エンジンの状況に似ています。もしあなたが一般的な内容を検索するだけなら、GoogleでもBingでも、結果の質はほぼ同じです。それなら、なぜ人々はどちらかを選ぶのでしょうか?それは、特定の時点である検索エンジンが彼らにより適切な結果を提供したからかもしれません。そして、もしあなたが非常に個性的または専門的な内容を検索するなら、違いがより顕著になります。だからこそ、私たちは汎用型エージェントの利点はここにあると考えています。

それをより良くするにはどうすればいいのでしょうか?私たちは長い間考えてきました。なぜなら、すべてがプログラミングに関わっていると考えているからです。コンピュータをAIに渡すと、実際には環境との相互作用の仕方はプログラミングを通じて行われます。

私たちは2つの側面から改善できると考えています。第一はスケール化です。しかし、もしエージェントの能力を100倍に拡大できたらどうなるでしょうか?

最近、Manusが新しい機能「Wide Research」を発表しました。その基本的な考え方は、1つのエージェントがさらに数百のエージェントを派生させてタスクを完了することを可能にすることです。ご存知のように、AIに小さなことを手伝ってもらうだけなら、多くの場合、あなた自身でも完了できます。しかし、タスクが非常に大きい場合、1人では到底完了できません。例えば、大規模な研究を行う必要がある場合、数百のエージェントが並行して作業を行うことで、非常に強力になります。

次に、エージェントがコンピュータをより柔軟に使用できるようにする必要があります。例えば、AIエージェントにプリセットツールだけを設定した場合、その行動範囲はこれらのツールに制限されます。しかし、もしあなたがプログラマーであれば、オープンソースコミュニティ全体のリソースを呼び出すことができると想像してみてください。

例えば、3Dプリントをしているときに、モデルのパラメータを直接変更するのは難しいですが、GitHub上で適切なライブラリを見つけて直接インストールすれば、問題を解決できます。Manusでは、汎用性を最適化し、「ツールのネットワーク効果」という概念を提案しました。

面白い例があります:多くのユーザーがManusを使用してデータの視覚化を行っています。ご存知のように、アジアでは時々問題に直面することがあります。例えば、チャートに中国語を表示する際にフォントエラーが発生することがあります。おそらく、いくつかの専門的なユーザーは、出力する韓国語にどのフォントを使用すべきかというハードコーディングルールを書いているでしょう。しかし、この方法ではシステムがますます硬直化してしまいます。

私たちが採用した方法は、システムに非常にシンプルな機能を追加することでした:画像を見ることです。結果は驚くべきものでした——今日のモデルはすでに非常に賢く、視覚的な画像を生成した後に自分でチェックし、エラーに気づいて自動的に修正することができます。私たちは、ツールの柔軟性を高めることが、ハードコーディングされたルールよりも多くの問題を解決できることを発見しました。

質問:これは刺激的な時代です。私は本当に興奮していて、もう一度30歳に若返りたいと思っています(笑)。医療研究について言えば、Manusもこの分野で非常に強いことを知っています。あなたたちは、Manusを使用して医療研究を行っているユーザーがいることに気づきましたか?

答:多くの人々がManusを使って研究を行っていますが、医学研究に限ったことではありません。私たちはこれが非常に興味深いと考えています。なぜなら、現在「深い研究」と呼ばれる製品がたくさんあり、それらは大量の情報を収集し、いくつかの分析を行いますが、最終的にはただのmarkdownファイルや文書を提供するだけだからです。これは遠く及びません。

多くの場合、研究者が本当に必要としているのは、上司やチームに直接提供できる成果です。そこで、私たちはManusで研究成果の出力を強化しました。例えば、医学研究では、正式な報告書、スライド報告などを生成する必要があることが多いです。したがって、私たちは研究者のニーズを満たすためにAIの出力能力を最適化する必要があります。これは「ツール化された」体験です。

例えば、現在多くのユーザーはまずManusを使って研究を行い、その後直接ウェブサイトを生成します。これは従来のウェブサイト構築方法とは全く異なると感じるでしょう。

ウェブサイトを構築すること自体は難しくありませんが、データの信頼性と正確性を確保することが難しいのです。だからこそ、私たちは、一度の会話、一つの共有されたコンテキスト内でプロセス全体を完了することが最善であると考えています。そうすることで、あなたの研究や洞察が最終成果にシームレスに変換されます。これが私たちがManusで行っていることです。

質問:多くの国が議論しているテーマがあります。それは、AI時代における人類の未来と経済的影響についてです。あなたは、雇用が置き換えられることについてどう思いますか?また、新たにどのような仕事の機会が生まれるでしょうか?

答:私たちの友人や投資家もよくこの質問をします。Manusをリリースしたとき、最初はこのようなエージェントを構築できれば、人々の多くの時間を節約し、みんなが簡単にお金を稼げると考えていました。

しかし実際には、このビジョンは完全には実現されていないことがわかりました。多くのユーザー調査を通じて、ユーザーが使用した後、彼らは逆にもっと働くようになったことがわかりました。なぜなら、彼らはより効率的になり、実際に自分たちがもともと得意とすることをもっとできるようになったからです。これが第一点です。

次に、私たちはManusが全く新しい空間を開いていると考えています。私たちは常に仮想マシンやクラウドコンピューティングについて話し合っています。私たちはManusが「個人クラウドコンピューティングプラットフォーム」としての役割を果たしていると感じています。例えば、クラウドコンピューティングは数十年前から存在していますが、それは主にエンジニアの特権であり、プログラミングを通じてのみクラウドの力を呼び出すことができました。一般的な知識労働者は使用できません。

しかし、今ではManusのようなAIエージェントが登場し、人々は自然言語で指示を出してAIに実行させることができます。これは全く新しい生産性の解放に等しいです。これが私たちがもたらしたものです。

そして最後に、「代替」についてですが、実際には非常に難しいと思います。例えば、不動産仲介業者は、毎日 Manus を使って日常の業務をこなしています。しかし、あなたも知っているように、AI は仲介業者がクライアントと対面する際のコミュニケーションスタイルを決して代替することはできません。私たちは AI 会社ですが、Manus のリリース動画も Manus が書いた脚本によるものですが、動画に登場するのは私です。なぜなら、これは信頼に関する問題だからです。そして、信頼は完全に AI に任せることはできません。

AGENT-3.75%
原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
0/400
コメントなし
いつでもどこでも暗号資産取引
qrCode
スキャンしてGateアプリをダウンロード
コミュニティ
日本語
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)