نص الحوار الكامل الأخير لـ Manus: محاولة دفع الوكيل، شركة RRR تقارب 100 مليون دولار

المؤلف | لي يوان

المحرر| جينغ يو

لم تتوقف تفكير Manus، الذي انتقل إلى سنغافورة، حول وكيل الذكاء الاصطناعي العام.

في جولة Stripe التي أقيمت اليوم في سنغافورة، أجرى يي تشاو جي (Peak) المؤسس المشارك ورئيس العلوم في Manus حديثًا مع بول هارابين، رئيس الإيرادات في Stripe لمنطقة آسيا والمحيط الهادئ واليابان.

خلال الاجتماع، كشفت Manus AI عن بياناتها التشغيلية الأخيرة، حيث وصلت معدل إيرادات Manus AI (RRR) إلى 90 مليون دولار، ومن المتوقع أن تصل قريبًا إلى أكثر من 100 مليون.

صرح شياو هونغ من مانوس AI في اللحظة نفسها أن معدل الإيرادات السنوية يشير إلى الإيرادات الشهرية *12، ولا يساوي الدخل النقدي. تحتوي العديد من منتجات الذكاء الاصطناعي على خيارات الدفع السنوي، وهذه الجزء يمكن اعتباره فقط كإيداع مسبق، ولا يمكن تسجيله كإيرادات. "إذا كشفنا بهذه الطريقة 【الخاطئة】، يمكننا حساب رقم أكبر من 120 مليون دولار." أضاف شياو هونغ.

بالإضافة إلى بيانات التشغيل، شارك جي ييتشاو أيضًا كيف تفكر فريق مانوس في الخطوة التالية لوكيل عام، وما الفرق حقًا بين وكيل الذكاء الاصطناعي والذكاء الاصطناعي العام.

"الآن الجميع تقريبًا يسمي كل شيء عميل. على سبيل المثال، ميكروفون، قد يسميه البعض "عميل تسجيل الصوت ذو الوعي البيئي". joked Ji Yichao.

لقد قدم أيضًا خطتي تطوير رئيسيتين للقدرات العامة لوكيل التوسع: الأولى، التعاون بين عدة وكلاء لتوسيع نطاق التنفيذ (مثل استنباط مئات من الوكلاء الفرعيين المتوازين في دراسات واسعة النطاق)؛ والثانية، فتح "واجهة أدوات" أكبر للوكلاء، وعدم ربط القدرات بعدد قليل من واجهات برمجة التطبيقات المسبقة، بل استدعاء النظام البيئي المفتوح، وتثبيت المكتبات، وحتى إجراء الفحص الذاتي والتعديل بعد التصور، تمامًا مثل المبرمجين.

ذكر جي ييتشاو أيضًا أن العالم الرقمي اليوم لا يزال مبنيًا وفقًا لنموذج "للاستخدام البشري" - صفحات الويب غير المبرمجة بواسطة API ، وCAPTCHA ، والألعاب الصغيرة في العمليات تجعل هناك الكثير من الاحتكاك ، والعقبات تبدو أكثر مثل القيود البيئية والمؤسسية بدلاً من ذكاء النموذج.

هذا هو أحد الأسباب التي تجعل Manus تشارك في أنشطة Stripe: كلا الجانبين يقدمان الدفع داخل الوكيل، ويربطان "البحث - القرار - الطلب/التسوية" في حلقة مغلقة، ويعملان معًا على البنية التحتية لتخفيف الاحتكاكات في العالم.

فيما يلي ملخص الحوار، تم تحريره وتنظيمه بواسطة Geek Park:

س: هل يمكنك أن تعطي الجمهور مقدمة بسيطة عن نفسك؟ كانت مدونتك الأخيرة حول "هندسة السياق" ملهمة للغاية، وأعتقد أنها قراءة ضرورية لأي شخص هنا يعمل على تطوير وكيل ذكاء اصطناعي. في كل مرة أذهب فيها لتناول الغداء مع المهندسين، يكونون دائمًا يتحدثون عن هذا، لذا لا أستطيع سوى الجلوس في مكان آخر (ضحك). ولكن بالنسبة لأولئك الذين قد لا يكونون على دراية بـ Manus، هل يمكنك مشاركة تجربتك ورؤيتك؟

الإجابة: شكراً بول. سعيد جداً أن أكون هنا. مانوس يبني وكيل ذكاء اصطناعي عام.

الكثير من مؤسسات البحث والشركات تحاول في الواقع إنشاء دماغ - إنشاء نموذج لغة كبير. لكننا نعتقد أنه من منظور المستهلكين، هذا ليس جيداً حقاً. يجب أن تكون الذكاء الاصطناعي قادراً على اتخاذ الإجراءات الحقيقية وإنجاز الأمور، لذا قمنا ببناء Manus.

طريقتنا هي السماح للذكاء الاصطناعي باستخدام واحدة من أعظم اختراعات التاريخ البشري - الكمبيوتر العام. عندما نمنح الذكاء الاصطناعي الكمبيوتر، يمكنه القيام بكل ما يمكن أن يفعله البشر. يمكن لـ Manus إتمام المهام بشكل حقيقي. على سبيل المثال، يمكنه مساعدتك في إعداد العروض التقديمية، مساعدتك في تخطيط رحلة، وحتى مساعدتك في إدارة وسائل التواصل الاجتماعي - على الرغم من أنني لا أوصي بأن تفعل ذلك حقًا.

يحب مستخدمونا حقًا Manus. أطلقنا Manus في مارس، وقد حققنا الآن معدل إيرادات سنوي يبلغ حوالي 90 مليون، وسنحقق قريبًا 100 مليون.

أعتقد أن هذا كبير جدًا بالنسبة لشركة ناشئة صغيرة مثلنا. لكن الأهم من ذلك، فهذا يدل على أن وكيل الذكاء الاصطناعي لم يعد مجرد مصطلح شائع في مجال البحث، بل يتم تطبيقه بالفعل وتأسيسه.

يمكنني أن أشارككم قصة صغيرة عن عملية بناء Manus.

لقد حصلنا في الواقع على الكثير من الإلهام من تطبيقات ترميز الوكلاء. على سبيل المثال ، مثل منتجات البرمجة الذكية مثل Cursor ، التي جذبت الكثير من الانتباه من قبل.

بصفتنا مهندسين، نستخدم بالطبع Cursor. لكن ما يفاجئنا هو أن العديد من الزملاء غير المهندسين في الشركة يستخدمون أيضًا Cursor. بالطبع، هم ليسوا بصدد كتابة البرمجيات، بل يستخدمونه لتصور البيانات، وحتى كتابة بعض المقالات. إنهم يتجاهلون الجزء الأيسر من الشيفرة، ويتحدثون فقط مع الذكاء الاصطناعي لإنجاز العمل.

هذا يجعلنا ندرك: يجب أن نعمل على تعميم هذه الطريقة وتمكين غير المبرمجين. هذه هي إحدى حالات استخدام الذكاء الاصطناعي.

س: نحن نسمع بشكل متزايد الناس يتحدثون عن وكيل الذكاء الاصطناعي و AGI. هل يمكنك مساعدتنا في توضيح الفرق بين هذين المفهومين بشكل أفضل؟ ماذا يعني وكيل الذكاء الاصطناعي و AGI بالنسبة لك و Manus؟

الإجابة: نعتقد أن هذه مسألة جيدة جدًا.

الآن الجميع تقريبًا يطلقون على كل شيء اسم "عميل". على سبيل المثال، ميكروفون، قد يقول البعض إنه "عميل جمع الصوت مع الوعي البيئي".

لكن على الأقل نؤكد أن الوكيل يجب أن يكون مجموعة فرعية من الذكاء الاصطناعي التطبيقي. دعونا نأخذ خطوة للوراء وننظر إلى الفئات الشائعة لتطبيقات الذكاء الاصطناعي.

معظم الناس على دراية بنوعين: النوع الأول هو الدردشة الآلية، مثل ChatGPT؛ والنوع الآخر هو أدوات التوليد، مثل MidJourney أو Sora. في هذه الأنظمة، عادة ما يكون هناك دورين فقط: المستخدم والنموذج. أنت تتفاعل مع النموذج، وتحصل على المخرجات. لكن ما يميز الوكيل هو أنه، بالإضافة إلى المستخدم والنموذج، يقدم عنصرًا ثالثًا أساسيًا - البيئة.

سيتغير مفهوم "البيئة" بناءً على نوع الوكيل، على سبيل المثال، في وكيل التصميم، قد تكون البيئة عبارة عن لوحة أو جزء من الشيفرة؛ بينما هنا في Manus، هدفنا هو جعل الوكيل يظهر في الآلة الافتراضية أو حتى في الإنترنت بأسره. بهذه الطريقة، يمكن للوكيل مراقبة البيئة، وتحديد ما يجب القيام به بعد ذلك، وتغيير البيئة من خلال العمل. وهذا يجعلها قوية للغاية.

على سبيل المثال في Manus، يمكنك التعبير عن الطلب، وسوف يفتح المتصفح، وينشر الصفحة، ويساعدك في حجز تذكرة طيران. أنا أحب هذا المثال لأنه على الرغم من أن حجز تذكرة طيران يبدو سهلاً، إلا أن هذا في الحقيقة هو تدخل الذكاء الاصطناعي في تغيير العالم الحقيقي - النتيجة ليست مخرجات النموذج، بل هي تذكرة الطيران في يدك. لقد تدخل الذكاء الاصطناعي حقًا في عالمك. هذا هو ما نسميه الوكيل.

ببساطة، الوكيل هو نظام ذكاء اصطناعي يمكنه تمثيل المستخدم للتفاعل مع البيئة.

بالنسبة لـ AGI، غالبًا ما يتم ذكر هذه الكلمة، حيث يساويها الكثيرون بالذكاء الخارق. نعتقد أن AGI هو نظام قادر على إتمام العديد من المهام بقدرة عامة تستخدم نماذج الذكاء الاصطناعي، دون الحاجة إلى تصميم خاص.

نعتقد أن "برمجة العملاء" هي في الواقع أحد المسارات نحو الذكاء الاصطناعي العام. إنها ليست قدرة في مجال عمودي، بل إذا منحتها للكمبيوتر، يمكنها أن تفعل تقريبًا أي شيء على الكمبيوتر. لذا بالنسبة لنا، الشرط لتحقيق الذكاء الاصطناعي العام هو بناء بيئة مثالية بما يكفي للسماح لهذه القدرة بالتعبير عن نفسها.

س: في أي السيناريوهات لعبت الذكاء الاصطناعي دورًا بالفعل اليوم؟ وأين سيلعب دورًا في المستقبل؟ متى ستظهر لحظة آيفون؟

الإجابة: بالنسبة للوكيل، إذا نظرنا فقط إلى قدرات النموذج، فإن النموذج الرائد الحالي مذهل جداً، فهو تقريباً في مستوى "سوبرمان". يمكنهم التفوق على معظمنا في مسابقات الرياضيات أو الاستدلال المنطقي.

لكنني أعتقد أن النموذج لا يزال مثل "دماغ داخل زجاجة"، إذا أراد أن يحقق قوته الحقيقية، يجب أن يتفاعل مع العالم الحقيقي، ويصل إلى الواقع. لكن للأسف، هذه هي النقطة التي يبدأ فيها المشكلة.

على سبيل المثال، إذا طلبت من ذكاء اصطناعي القيام ببعض المهام الروتينية، فإنه يتفوق في المهام المتكررة. مثل منتج Deep Research، فهو يجمع المعلومات ثم يعطي نتيجة، ومخرجاته تظهر ببساطة هناك.

خذ مثالاً، الآن تقريبًا كل شيء مصمم للبشر، ليس فقط في العالم المادي، حتى في العالم الرقمي هو كذلك. على سبيل المثال، أدوات الويب، تشبه الألعاب الصغيرة، ولم تقدم واجهة برمجة التطبيقات أو واجهات قياسية. CAPTCHA موجود في كل مكان، حيث تقوم دائمًا بإيقاف العميل.

لذا أعتقد أن الذكاء الاصطناعي يعمل بشكل جيد في المهام المغلقة والمكتفية ذاتيًا، ولكن بمجرد أن يتعلق الأمر بالعالم الحقيقي، فإنه سيواجه عقبات.

متى ستظهر لحظة آيفون في المستقبل؟ أعتقد أن هذه ليست مشكلة تقنية، بل هي أقرب إلى قيود نظامية. ليست هذه مسألة يمكن لشركة ناشئة مثل وكيلنا حلها بمفردها.

أعتقد أن هذا يتطلب تحولًا تدريجيًا، يتطلب من النظام البيئي بأكمله التطور معًا. وهذا يتطلب أيضًا من الشركات مثل Stripe العمل على مستوى البنية التحتية. على سبيل المثال، نحن ندمج واجهة برمجة تطبيقات الدفع Agentic الجديدة من Stripe. الجميع يعمل معًا.

س: هل يمكننا التحدث بشكل محدد عن بعض السيناريوهات النموذجية التي يستخدم فيها المستخدمون Manus؟ كيف يستخدمونها؟ ما هي القوة التي تعكسها؟

الإجابة: نعم، على الرغم من أننا من الجيل الحالي من الوكلاء، إلا أننا شهدنا العديد من حالات الاستخدام الرائعة.

على سبيل المثال، لقد انتقلنا للتو إلى سنغافورة، ونحتاج إلى توظيف وكيل عقارات لمساعدتنا في العثور على سكن. إنه وكيل حقيقي (يضحك).

والآن أصبحت هذه الوسائط تستخدم Manus: حيث يقومون بتحليل موقع الشركة ومنطقة الإقامة التي يرغب الموظفون في السكن فيها بناءً على احتياجات العملاء، ويقدمون التوصيات المناسبة.

أعتقد أن هذا مثير للاهتمام لأنّه ينتمي إلى نوع من "الطلب الطويل الذيل". بشكل عام، لا توجد منتجات ذكاء اصطناعي مصممة خصيصًا لهذا السيناريو المحدد، لكن نظرًا لأن Manus هو وكيل عام، فإنه يمكنه تلبية هذه الاحتياجات. نحن نعتقد أن الطلب الطويل الذيل يستحق اهتمامًا كبيرًا.

من منظور شامل، قد تكون هذه ذيل طويل، لكن بالنسبة للمستخدمين المحددين، فإنها تمثل بالضبط عملهم اليومي. هذا السيناريو ذو قيمة خاصة.

هذا يشبه نمط محركات البحث اليوم. إذا كنت تبحث فقط عن بعض المحتويات الشائعة، سواء باستخدام Google أو Bing، فإن جودة النتائج تكون متشابهة تقريبًا. فلماذا يختار الناس واحدة منها؟ ربما لأن إحدى محركات البحث قدمت لهم نتائج أكثر ملاءمة في لحظة معينة. وإذا كنت تبحث عن محتوى مخصص للغاية أو متخصص، فإن الفروق تكون أكثر وضوحًا. لذلك نعتقد أن ميزة الوكيل العام تكمن هنا.

كيف نجعل هذا أفضل؟ لقد فكرنا طويلا لأننا نعتقد أن كل شيء مرتبط بالبرمجة. إذا سلمت الكمبيوتر للذكاء الاصطناعي، فإن الطريقة التي يتفاعل بها مع البيئة هي في الواقع من خلال البرمجة.

نعتقد أنه يمكن تحسين الأمر من جانبين. الأول هو التوسع. ولكن ماذا لو كنت قادرًا على زيادة قدرة الوكيل بمقدار مئة ضعف؟

مؤخراً، أصدرت Manus ميزة جديدة تُدعى Wide Research. الفكرة الأساسية هي السماح لوكيل واحد بتوليد مئات الوكلاء الآخرين للعمل معًا على إكمال المهام. كما تعلم، إذا كان الأمر يتعلق بإنجاز بعض الأمور الصغيرة، يمكنك غالبًا القيام بذلك بنفسك. ولكن إذا كانت المهمة ضخمة جدًا، فلا يمكنك إكمالها بمفردك، مثل الحاجة إلى إجراء بحث على نطاق واسع، في هذه الحالة، سيكون من القوي جدًا أن تعمل مئات الوكلاء بشكل متوازي.

ثانياً، نحتاج أيضاً إلى جعل الوكيل أكثر مرونة في استخدام الحاسوب. على سبيل المثال، إذا كنت قد حددت أدوات مسبقة لوكيل الذكاء الاصطناعي فقط، فإن مساحة حركته ستقتصر على هذه الأدوات. لكن تخيل، إذا كنت مبرمجاً، فلديك موارد مجتمع المصدر المفتوح بالكامل للاستفادة منها.

على سبيل المثال، عندما تقوم بالطباعة ثلاثية الأبعاد، فإنه من الصعب تعديل معلمات النموذج مباشرة، ولكن إذا كنت تستطيع العثور على المكتبة المناسبة على GitHub، فيمكنك تثبيتها مباشرة لحل مشكلتك. في Manus، نحن نعمل على تحسين العمومية، وقد قدمنا مفهومًا يسمى "أثر الشبكة للأدوات".

هناك مثال مثير للاهتمام: يستخدم العديد من المستخدمين Manus للقيام بعمليات تصور البيانات. كما تعلمون، في آسيا، قد نواجه أحيانًا مشاكل، مثل حدوث أخطاء في الخط عند عرض النصوص الصينية في المخططات. ربما يكتب بعض المستخدمين المحترفين بعض القواعد المشفرة، مثل أي خط يجب استخدامه عند إخراج النصوص الكورية. لكن هذه الطريقة ستجعل النظام يصبح أكثر صلابة.

لقد قمنا بإضافة قدرة بسيطة جداً إلى النظام: عرض الصور. وكانت النتيجة مدهشة - لأن نماذج اليوم بالفعل ذكية، فهي تتحقق من نفسها بعد إنشاء الصور المرئية، وتدرك الأخطاء، ثم تقوم بتصحيحها تلقائياً. وجدنا أن زيادة مرونة الأدوات يمكن أن تحل المزيد من المشكلات مقارنةً بترميز القواعد.

س: هذه حقبة مثيرة. أنا حقاً متحمس، فقط أتمنى لو كنت أصغر سناً بعمر الثلاثين (يضحك). عند الحديث عن الأبحاث الطبية، أعلم أن Manus قوية في هذا المجال أيضاً. هل لاحظتم أن بعض المستخدمين يستخدمون Manus لدراسة الطب؟

الإجابة: يستخدم الكثير من الناس Manus للبحث، وليس فقط في الأبحاث الطبية. نحن نجد أن هذا مثير للاهتمام، لأنه يوجد الآن بالفعل العديد من المنتجات التي تسمى "أبحاث عميقة"، والتي ستساعدك في جمع كميات كبيرة من المعلومات وإجراء بعض التحليلات، ولكنها في النهاية تعطيك فقط ملف markdown أو وثيقة. هذا غير كافٍ على الإطلاق.

في كثير من الأحيان، ما يحتاجه الباحثون حقًا هو نتائج يمكن تسليمها مباشرة إلى المدير أو الفريق. لذلك، قمنا بتعزيز إنتاج نتائج البحث في Manus. على سبيل المثال، في الأبحاث الطبية، غالبًا ما يتطلب الأمر إنشاء تقارير رسمية، مثل تقارير العروض التقديمية وما إلى ذلك. لذلك، يجب علينا تحسين قدرة الذكاء الاصطناعي على الإنتاج لتلبية احتياجات الباحثين. هذه تجربة "أدوات".

على سبيل المثال، يقوم العديد من المستخدمين الآن أولاً بإجراء الأبحاث باستخدام Manus، ثم يقومون بإنشاء موقع ويب مباشرة. هل تعتقد أن هذا مختلف تمامًا عن الطرق التقليدية لبناء المواقع؟

من المهم أن نعرف أن بناء موقع ويب ليس بالأمر الصعب في حد ذاته، بل الصعوبة تكمن في كيفية ضمان موثوقية البيانات ودقتها. لذلك نعتقد أنه من الأفضل أن يتم إتمام العملية بأكملها في محادثة واحدة، وفي سياق مشترك. بهذه الطريقة، يمكن أن تتحول أبحاثك وآرائك بسلاسة إلى النتائج النهائية. هذا ما نقوم به في Manus.

س: تتحدث العديد من البلدان عن موضوع: في عصر الذكاء الاصطناعي، مستقبل الإنسانية وتأثيره على الاقتصاد. ما رأيك في استبدال الوظائف؟ وما هي فرص العمل الجديدة التي قد تظهر؟

الجواب: أصدقاؤنا ومستثمرونا يسألوننا هذا السؤال كثيرًا. عندما أطلقنا Manus، كنا نعتقد في البداية أنه إذا تمكنا من بناء مثل هذا الوكيل، فسيساعد الناس على توفير الكثير من الوقت وجعل الجميع يكسب المال بسهولة.

لكن في الواقع، اكتشفنا أن هذه الرؤية لم تتحقق بالكامل. من خلال العديد من أبحاث المستخدمين، وجدنا أن المستخدمين بعد الاستخدام، أصبحوا يعملون أكثر. لأنهم أصبحوا أكثر كفاءة، يمكنهم بالفعل القيام بمزيد من الأشياء التي كانوا بارعين فيها. هذه هي النقطة الأولى.

ثانيًا ، نعتقد أن Manus قد فتح مساحة جديدة تمامًا. لقد كنا نتحدث عن الآلات الافتراضية والحوسبة السحابية. نشعر أن Manus يلعب دور "منصة الحوسبة السحابية الشخصية". على سبيل المثال ، كانت الحوسبة السحابية موجودة منذ عقود ، لكنها كانت أكثر امتيازًا للمهندسين ، حيث يمكننا فقط استدعاء قوة السحابة من خلال البرمجة. لا يمكن للعاملين في المعرفة العاديين استخدامها.

ولكن الآن مع وجود وكلاء الذكاء الاصطناعي مثل Manus، يمكن للناس إعطاء التعليمات بلغة طبيعية، مما يسمح للذكاء الاصطناعي بتنفيذها. وهذا يعادل فتح نوع جديد تمامًا من الإنتاجية. هذا ما نقدمه.

وأخيرًا، فيما يتعلق بـ "البديل"، أعتقد أنه من الصعب جدًا. على سبيل المثال، وسطاء العقارات، يستخدمون Manus يوميًا لإنجاز أعمالهم اليومية. ولكن كما تعلم، لا يمكن أن تحل AI محل طريقة التواصل التي يستخدمها الوسطاء عند التعامل مع العملاء. نحن شركة AI، حتى أن الفيديو الترويجي لـ Manus تم كتابته بواسطة Manus، لكن الشخص الذي يظهر في الفيديو هو أنا، لأن الأمر يتعلق بالثقة. والثقة لا يمكن تركها بالكامل لـ AI.

AGENT4.31%
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
0/400
لا توجد تعليقات
  • تثبيت