Текст останньої розмови Manus: спроба оплати через Agent, компанія RRR близько 100 мільйонів доларів

Автор|Li Yuan

Редактор|Цзінь Юй

Манус, який переїхав до Сінгапуру, не припиняє розмірковувати про універсального AI-агента.

Сьогодні на Stripe Tour, що відбувається в Сінгапурі, співзасновник і головний науковець Manus Цзі Ічао (Peak) провів бесіду з головним директором з доходів Stripe в Азійсько-Тихоокеанському регіоні та Японії Полом Харапіним.

На зустрічі Manus AI розкрила нещодавні фінансові дані, Revenue Run Rate (RRR) компанії Manus AI вже досягла 90 мільйонів доларів США і незабаром перевищить 100 мільйонів.

Крім того, Шяо Хун з Manus AI спеціально зазначив в Instant, що Revenue Run Rate означає дохід за поточний місяць *12 і не дорівнює Cash Income. Багато AI продуктів мають можливість річної оплати, ця частина може бути лише зарахована як попередній внесок і не може бути врахована як Revenue. «Якщо ми будемо розкривати інформацію таким чином [помилково], можна отримати число, що перевищує 120 мільйонів доларів США», - зазначив Шяо Хун.

Окрім даних про бізнес, Цзі Ічжао також поділився тим, як команда Manus думає про наступний крок загального агенту, а також у чому насправді полягає різниця між AI агентами та AGI в майбутньому.

«Зараз усі майже все називають агентом. Наприклад, мікрофон, деякі називають його «агентом звуку з чутливістю до навколишнього середовища». Цзі Ічао жартував.»

Він також виклав два основні напрямки для наступного кроку розширення загальних можливостей агентів: по-перше, співпраця кількох агентів для розширення масштабу виконання (наприклад, в рамках великомасштабного дослідження створити сотні паралельних підагентів); по-друге, відкрити агентам більш широкий "інструментальний простір", не прив'язуючи можливості до обмеженої кількості попередньо налаштованих API, а дозволяючи використовувати відкриту екосистему, встановлювати бібліотеки, навіть після візуалізації перевіряти графіки та вносити зміни.

Цзі Іччао також зазначив, що сьогоднішній цифровий світ все ще будується за парадигмою "для людей" — небезпечні API веб-сторінки, CAPTCHA, ігрові процеси "маленьких ігор" створюють велику кількість тертя, а вузькі місця більше схожі на екологічні та інституційні обмеження, а не на інтелект моделей.

Це також одна з причин, чому Manus бере участь у заходах Stripe: обидві сторони просувають завершення платежів в Agent, з'єднуючи «дослідження — рішення — замовлення/розрахунок» у замкнуте коло, використовуючи інфраструктурну співпрацю для усунення тертя у світі.

Нижче наведено основні моменти бесіди, відредаговані та впорядковані Geek Park:

Запитання: Розкажіть глядачам про себе. Ваш блог про «контекстну інженерію» останнім часом дуже надихаючий, я вважаю, що це обов'язкове читання для всіх, хто розробляє AI Agent. Кожного разу, коли я обідаю з інженерами, вони завжди говорять про це, тому я тепер можу лише сидіти в іншому місці (сміх). Але для тих, хто може не бути знайомим з Manus, ви можете поділитися своїм досвідом та баченням?

Відповідь: Дякую, Пол. Радий бути тут. Manus розробляє універсального AI-агента.

Багато наукових установ і компаній насправді намагаються створити мозок — створити велику мовну модель. Але ми вважаємо, що з точки зору споживача це насправді не добре. ШІ має дійсно діяти, виконувати завдання, тому ми створили Manus.

Наш спосіб полягає в тому, щоб дати ШІ можливість використовувати одне з найбільших винаходів в історії людства — універсальний комп'ютер. Даючи ШІ комп'ютер, він може робити все, що може зробити людина. Manus може справді виконувати завдання. Наприклад, він може допомогти вам зробити презентацію, спланувати подорож, навіть допомогти вам вести соціальні мережі — хоча я не рекомендую вам насправді це робити.

Наші користувачі дійсно люблять Manus. Ми випустили Manus у березні, і зараз ми вже досягли приблизно 90 мільйонів доларів доходу (RRR, Revenue Run Rate), скоро ми подолаємо 100 мільйонів.

Я вважаю, що це дуже велике для нас, як для маленької стартап-компанії. Але ще важливіше те, що це показує, що AI Agent вже не просто модне слово в дослідницькій сфері, а насправді застосовується, закріплюється на місці.

Я можу поділитися з усіма маленькою історією про те, як ми будували Manus.

Ми насправді отримали багато натхнення від застосування Agent coding. Наприклад, такі AI програмні продукти, як Cursor, вже привернули багато уваги.

Як інженери, ми звичайно будемо використовувати Cursor. Але нас вразило, що багато колег неінженерів у компанії також використовують Cursor. Звісно, вони не пишуть програмне забезпечення, а використовують його для візуалізації даних або навіть для написання деяких статей. Вони ігнорують ліву частину коду і просто спілкуються з AI, щоб виконати свою роботу.

Це змусило нас усвідомити: ми повинні узагальнити цей підхід, надати можливості непрофесійним програмістам. Це один з випадків використання ШІ.

Питання: Ми все частіше чуємо, як люди говорять про AI Agent і AGI. Чи можете ви допомогти нам чіткіше розрізнити ці два поняття? Що для вас і Manus означає AI Agent і AGI?

Відповідь: Ми вважаємо, що це дуже хороше питання.

Зараз всі майже все називають «Agent». Наприклад, мікрофон, хтось може сказати, що це «агент з чутливістю до навколишнього середовища».

Але, принаймні, ми стверджуємо, що агент повинен бути підмножиною прикладного ШІ. Можемо зробити крок назад і подивитися на поширені категорії застосування ШІ.

Більшість людей вже знайомі з двома категоріями: одна категорія - це чат-боти, такі як ChatGPT; інша категорія - це генеративні інструменти, такі як MidJourney або Sora. У цих системах зазвичай є лише дві ролі: користувач і модель. Ви взаємодієте з моделлю, отримуючи вихідні дані. А відмінність Agent полягає в тому, що, крім користувача та моделі, він також вводить третій ключовий елемент - середовище.

Концепція «середовища» буде змінюватися в залежності від типу агента. Наприклад, у дизайновому агенті середовище може бути полотном або фрагментом коду; а в Manus наша мета полягає в тому, щоб агенти з'являлися у віртуальних машинах або навіть в усьому Інтернеті. Таким чином, агенти можуть спостерігати за середовищем, приймати рішення про наступні дії та змінювати середовище через свої дії. Це робить їх надзвичайно потужними.

Наприклад, у Manus ви можете висловити потребу, і він відкриє браузер, опублікує веб-сторінку, допоможе вам забронювати квиток. Мені дуже подобається цей приклад, тому що хоча бронювання квитка здається дуже простим, насправді це AI безпосередньо змінює реальний світ — результатом є не вихід моделі, а квиток у ваших руках. AI справді втручається у ваш світ. Ось що ми називаємо агентом.

Простими словами, Агент - це AI-система, яка може представляти користувача у взаємодії з навколишнім середовищем.

Щодо AGI, це слово також часто згадується, багато людей ототожнюють його з надінтелектом. Ми вважаємо, що AGI – це система, яка може використовувати загальні можливості AI-моделей для виконання багатьох завдань без спеціального дизайну.

Ми вважаємо, що «Agent coding» насправді є шляхом до AGI. Це не є здатність у вертикальній області, а якщо ви надасте її комп'ютеру, він зможе робити майже все на комп'ютері. Тому для нас умовою AGI є створення достатньо досконалого середовища, щоб ця здатність могла проявитися.

Питання: Де саме штучний інтелект сьогодні справді проявляє свою роль? Де він може проявити свою роль у майбутньому? Коли відбудеться момент, подібний до iPhone?

Відповідь: Що стосується агентів, якщо дивитися лише на можливості моделей, то нинішні флагманські моделі вже вражаючі, вони майже на рівні «супермена». Вони можуть перевершити більшість з нас у математичних змаганнях або логічних розумуваннях.

Але я вважаю, що модель все ще схожа на «мозок у пляшці», і якщо вона хоче справді реалізувати свій потенціал, їй потрібно взаємодіяти з реальним світом, досягати реальності. Але, на жаль, саме тут починаються проблеми.

Наприклад, якщо ви попросите ШІ виконати деякі рутинні завдання, він дійсно дуже вміло справляється з повторними завданнями. Наприклад, такі продукти, як Deep Research, просто агрегують інформацію і надають результат, їх вихід просто з'являється там.

Наприклад, зараз майже все створено для людей, не тільки фізичний світ, а й цифровий світ. Наприклад, веб-інструменти, вони схожі на міні-ігри, не надають API або стандартного інтерфейсу. CAPTCHA скрізь, постійно перешкоджає агентам.

Тому я вважаю, що ШІ добре виконує закриті самодостатні завдання, але як тільки йдеться про реальний світ, виникають перешкоди.

Коли в майбутньому з'явиться момент iPhone? Я вважаю, що це більше не технічна проблема, а скоріше інституційне обмеження. Це не питання, яке можуть вирішити такі стартапи, як ми, агентства.

Я вважаю, що це потребує поступової трансформації, що вимагає спільної еволюції всієї екосистеми. Це також потребує зусиль таких компаній, як Stripe, на рівні інфраструктури. Наприклад, ми інтегруємо новий агентний платіжний API від Stripe. Усі працюють разом.

Запитання: Чи можемо ми детально обговорити деякі типові сцени використання Manus користувачами? Як вони його використовують? Яка сила проявляється в цьому?

Відповідь: Так, хоча ми походять з цього покоління агентів, ми вже бачили багато чудових випадків використання.

Наприклад, ми щойно переїхали до Сінгапуру і нам потрібно найняти ріелтора, щоб допомогти нам знайти житло. Це людина-агент (сміється).

А тепер ці посередники вже користуються Manus: вони аналізують місце розташування компанії та райони, де хочуть жити співробітники, відповідно до потреб клієнтів, і генерують відповідні рекомендації.

Я вважаю, що це дуже цікаво, оскільки це належить до категорії «довгий хвіст». Як правило, немає спеціальних продуктів AI, розроблених для таких конкретних сценаріїв, але оскільки Manus є універсальним агентом, він може задовольнити ці потреби. Ми вважаємо, що довгий хвіст дуже вартий уваги.

З макроекономічної точки зору це може бути довгий хвіст, але для конкретного користувача це саме те, що вони роблять щодня. Такий сценарій особливо цінний.

Це схоже на сучасний ландшафт пошукових систем. Якщо ви просто шукаєте якісь загальні речі, незалежно від того, чи використовуєте ви Google, чи Bing, якість результатів буде приблизно однаковою. То чому люди вибирають одну з них? Можливо, тому, що певна пошукова система в конкретний момент надала їм більш відповідні результати. А якщо ви шукаєте дуже персоналізований або спеціалізований контент, різниця стає ще більш помітною. Тож ми вважаємо, що перевага універсальних агентів полягає саме в цьому.

То як зробити це краще? Ми думали над цим довгий час, тому що вважаємо, що все обертається навколо програмування. Якщо ви довірите комп'ютер ШІ, то спосіб, яким він взаємодіє з навколишнім середовищем, насправді є програмуванням.

Ми вважаємо, що можна вдосконалити з двох сторін. По-перше, це масштабування. Але що станеться, якщо ви зможете збільшити можливості Агента в сто разів?

Нещодавно Manus випустила нову функцію під назвою Wide Research. Її основна ідея полягає в тому, що один агент може створити сотні інших агентів для виконання завдань. Ви знаєте, якщо просто попросити ШІ допомогти з якимись дрібницями, багато разів ви самі можете це зробити. Але якщо завдання надзвичайно велике, ви один не зможете його виконати, наприклад, якщо потрібно провести масштабне дослідження, в такому випадку залучення сотень агентів для паралельної роботи стане дуже потужним.

По-друге, нам також потрібно зробити так, щоб Агент міг більш гнучко використовувати комп'ютер. Наприклад, якщо ви лише налаштуєте попередньо визначені інструменти для AI Агента, то його простір дій буде обмежений цими інструментами. Але уявіть собі, якщо ви програміст, у вас є ресурси цілої відкритої спільноти, до яких можна звертатися.

Наприклад, коли ви займаєтеся 3D-друком, безпосередньо змінювати параметри моделі дуже складно, але якщо ви зможете знайти відповідну бібліотеку на GitHub, це зможе вирішити вашу проблему. У Manus ми оптимізуємо універсальність і пропонуємо концепцію, яка називається «мережевий ефект інструментів».

Є один дуже цікавий приклад: багато користувачів використовують Manus для візуалізації даних. Ви знаєте, що в Азії іноді виникають проблеми, наприклад, при відображенні китайської мови в графіках можуть виникати помилки шрифтів. Можливо, деякі професійні користувачі напишуть деякі жорстко закодовані правила, наприклад, який шрифт слід використовувати при виведенні корейської мови. Але такий підхід призведе до все більшої жорсткості системи.

Ми застосували простий підхід: додали до системи можливість переглядати зображення. Результат виявився приємним сюрпризом — адже сучасні моделі вже досить розумні, вони можуть самостійно перевіряти згенеровані візуальні зображення, усвідомлювати помилки і автоматично їх виправляти. Ми виявили, що гнучкість інструментів вирішує більше проблем, ніж жорстко закодовані правила.

Питання: Це захоплюючий час. Я дійсно дуже схвильований, просто бажаю, щоб я знову був тридцятирічним (сміх). Говорячи про медичні дослідження, я знаю, що Manus також сильний у цій сфері. Чи помітили ви, що деякі користувачі використовують Manus для дослідження медицини?

Відповідь: Багато людей вже використовують Manus для досліджень, не обмежуючись лише медичними дослідженнями. Нам це здається дуже цікавим, адже зараз дійсно існує багато так званих «глибоких дослідницьких» продуктів, які допомагають вам збирати величезну кількість інформації та проводити деякий аналіз, але в кінцевому підсумку вони лише надають вам markdown файл або документ. Це далеко не достатньо.

Багато разів дослідникам насправді потрібно те, що можна безпосередньо надати керівнику або команді. Тому ми посилили вихід дослідницьких результатів у Manus. Наприклад, у медичних дослідженнях часто потрібно створювати офіційні звіти, такі як слайд-звіти. Тому ми повинні оптимізувати можливості виходу ШІ, щоб задовольнити потреби дослідників. Це досвід «інструменталізації».

Наприклад, зараз багато користувачів спочатку використовують Manus для проведення досліджень, а потім безпосередньо створюють веб-сайт. Вам може здатися, що це абсолютно відрізняється від традиційних методів створення веб-сайтів.

Слід знати, що створити веб-сайт насправді не важко, важко забезпечити надійність і точність даних. Тому ми вважаємо, що було б найкраще завершити весь процес в одній розмові, в одному спільному контексті. Таким чином, ваше дослідження, ваші погляди можуть безшовно перетворитися на остаточний результат. Ось що ми робимо в Manus.

Питання: Багато країн обговорюють тему: у епоху ШІ, майбутнє людства та економічний вплив. Як ви ставитеся до заміни робочих місць? Які нові можливості для роботи можуть виникнути?

Відповідь: Наші друзі та інвестори також часто ставлять нам це питання. Коли ми запустили Manus, спочатку вважали, що якщо зможемо створити таку агенцію, вона допоможе людям заощадити багато часу та легко заробляти.

Але насправді ми виявили, що це бачення не було повністю реалізоване. Завдяки великій кількості досліджень серед користувачів, ми виявили, що після використання вони, навпаки, працюють більше. Тому що вони стали більш ефективними, вони насправді можуть робити більше того, в чому вони вже добре розбираються. Це перший момент.

По-друге, ми вважаємо, що Manus відкриває зовсім новий простір. Ми постійно обговорюємо віртуальні машини та хмарні обчислення. Нам здається, що Manus виконує роль «особистої хмарної обчислювальної платформи». Наприклад, хмарні обчислення існують вже десятиліттями, але це більше привілей інженерів, і тільки ми можемо викликати силу хмари за допомогою програмування. Звичайні знані працівники не можуть цього використовувати.

Але тепер, з такими AI Agent, як Manus, люди можуть давати команди природною мовою, дозволяючи AI виконувати їх. Це рівнозначно розблокуванню абсолютно нової продуктивності. Ось що ми приносимо.

А в кінці, щодо «заміни», я вважаю, що це насправді дуже важко. Наприклад, ріелтори щодня використовують Manus для виконання повсякденної роботи. Але ти знаєш, що AI ніколи не зможе замінити той спосіб спілкування, який ріелтор має з клієнтом. Ми є AI-компанією, навіть відео, що демонструє випуск Manus, написане сценарієм Manus, але в відео все ще з'являюся я, адже це питання довіри. А довіру не можна повністю передати AI.

AGENT-4.7%
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
0/400
Немає коментарів
  • Закріпити