Полный текст последнего диалога Manus: попытка оплаты через Agent, компания RRR почти 100 миллионов долларов

Автор|Li Yuan

Редактор| Цзинь Юй

Манус, переехавший в Сингапур, не прекращал размышлять о универсальном ИИ-агенте.

Сегодня на Stripe Tour, проходящем в Сингапуре, соучредитель и главный научный сотрудник Manus Цзи Ичао (Peak) провел беседу с главным директором по доходам Stripe в Азиатско-Тихоокеанском регионе и Японии Полом Харапиным.

На встрече Manus AI раскрыла недавние операционные данные, доходный темп Manus AI (RRR, Revenue Run Rate) уже достиг 90 миллионов долларов и скоро превысит 100 миллионов.

Шиао Хун из Manus AI также специально отметил в моменте, что Revenue Run Rate означает доход за месяц *12 и не равен Cash Income. Многие ИИ-продукты имеют годовой платежный вариант, эта часть может считаться только как предоплата, а не как доход. «Если мы будем раскрывать эти данные таким образом [ошибочным способом], можно получить число больше 120 миллионов долларов», - сказал Шиао Хун.

Помимо операционных данных, Цзи Ичао также поделился тем, как команда Manus думает о следующем шаге универсального агента, а также в чем на самом деле разница между AI-агентом и AGI в будущем.

«Теперь все почти называют все Агентом. Например, микрофон, кто-то может назвать его «агентом звукопередачи с восприятием окружающей среды». Цзи Ичао пошутил.

Он также предложил два основных направления для следующего этапа расширения универсальных возможностей агентов: во-первых, использовать сотрудничество нескольких агентов для увеличения масштаба выполнения (например, в ходе масштабного исследования выводить сотни параллельных подагентов); во-вторых, предоставить агентам более широкий «инструментальный интерфейс», не ограничивая их возможности лишь несколькими предустановленными API, а позволяя им, как программистам, обращаться к открытому экосистеме, устанавливать библиотеки и даже после визуализации проверять изображения и вносить изменения.

Цзи Ичао также упомянул, что сегодняшний цифровой мир все еще строится по парадигме «для людей» — не API-ориентированные веб-страницы, CAPTCHA, «геймификация» процессов создают много трений, и узкие места больше похожи на экосистемные и институциональные ограничения, а не на интеллектуальные модели.

Это также одна из причин, по которой Manus участвует в мероприятиях Stripe: обе стороны стремятся завершить платежи в Agent, связав "исследование — решение — заказ/расчет" в единый цикл, используя инфраструктурное сотрудничество для устранения трений в мире.

Ниже приведены основные моменты беседы, обработанные и отредактированные Geek Park:

Вопрос: Расскажите немного о себе для зрителей. Ваш недавний блог о «контекстной инженерии» очень вдохновляет, и я считаю, что это должно быть обязательным чтением для всех, кто разрабатывает AI-агентов. Каждый раз, когда я обедаю с инженерами, они всегда обсуждают это, так что теперь мне приходится сидеть в другом месте (смеется). Но для тех, кто, возможно, не очень знаком с Manus, можете поделиться своим опытом и видением?

Ответ: Спасибо, Пол. Рад быть здесь. Manus строит универсального AI-агента.

Многие исследовательские учреждения и компании на самом деле пытаются создать мозг — создать большую языковую модель. Но мы считаем, что с точки зрения потребителей это на самом деле не так хорошо. ИИ должен действительно быть в состоянии действовать и выполнять задачи, поэтому мы разработали Manus.

Наш способ заключается в том, чтобы позволить ИИ использовать одно из величайших изобретений человечества — универсальный компьютер. Дав ИИ компьютер, он может делать всё, что может сделать человек. Manus действительно может выполнять задачи. Например, он может помочь вам создать презентацию, спланировать поездку и даже управлять вашими социальными сетями — хотя я не рекомендую вам на самом деле это делать.

Наши пользователи действительно любят Manus. Мы выпустили Manus в марте, и сейчас он достиг приблизительно 90 миллионов дохода (RRR, Revenue Run Rate), и скоро преодолеет 100 миллионов.

Я думаю, что это очень важно для нашей небольшой стартап-компании. Но что еще более важно, это показывает, что AI Agent больше не просто модное слово в области исследований, а действительно используется и укореняется.

Я могу поделиться с вами небольшой историей о том, как мы строили Manus.

Мы на самом деле получили много вдохновения из применения Agent coding. Например, такие AI-программные продукты, как Cursor, уже привлекли много внимания.

Как инженеры, мы, естественно, будем использовать Cursor. Но нас удивило, что многие неинженерные коллеги в компании также используют Cursor. Конечно, они не пишут программное обеспечение, а используют его для визуализации данных и даже для написания некоторых статей. Они игнорируют левую часть с кодом и просто общаются с ИИ, чтобы выполнить свою работу.

Это заставило нас осознать, что мы должны обобщить этот подход и предоставить возможности непрофессиональным программистам. Это один из примеров использования ИИ.

Вопрос: Мы все чаще слышим, как люди говорят об AI агенте и AGI. Можешь помочь нам более четко различить эти два понятия? Что для тебя и Manus означают AI агент и AGI?

Ответ: Мы считаем, что это очень хороший вопрос.

Теперь почти все называют «Агентом». Например, микрофон, кто-то может сказать, что это «Агент звукозаписи с восприятием окружающей среды».

Но, по крайней мере, мы утверждаем, что агент должен быть подмножеством прикладного ИИ. Давайте сделаем шаг назад и посмотрим на общие категории применения ИИ.

Большинство людей уже знакомы с двумя категориями: одна категория — это чат-боты, такие как ChatGPT; другая категория — это генеративные инструменты, такие как MidJourney или Sora. В этих системах обычно всего два участника: пользователь и модель. Вы взаимодействуете с моделью, получая вывод. Однако отличие Агентства в том, что оно, помимо пользователя и модели, вводит третий ключевой элемент — среду.

Концепция «окружения» будет меняться в зависимости от типа агента, например, в проектировочном агенте окружением может быть холст или фрагмент кода; а в Manus наша цель состоит в том, чтобы агенты появлялись в виртуальной машине или даже в Интернете в целом. Таким образом, агенты смогут наблюдать за окружением, решать, что делать дальше, и изменять окружение с помощью действий. Это делает их очень мощными.

Например, в Manus вы можете выразить свои потребности, и он откроет браузер, опубликует веб-страницу, поможет вам забронировать билет на самолет. Мне очень нравится этот пример, потому что хотя бронирование билета звучит просто, на самом деле это AI, который напрямую изменяет реальный мир — результатом является не вывод модели, а билет в ваших руках. AI действительно вмешивается в ваш мир. Это то, что мы называем агентом.

Простыми словами, агент — это AI-система, которая может представлять пользователя в взаимодействии с окружающей средой.

Что касается AGI, этот термин также часто упоминается, и многие люди приравнивают его к суперинтеллекту. Мы считаем, что AGI – это система, обладающая универсальной способностью использовать модели ИИ для выполнения множества задач без специального проектирования.

Мы считаем, что «кодирование агентов» на самом деле является одним из путей к AGI. Это не способность в узкой области, а если вы предоставите ее компьютеру, он сможет делать практически все. Поэтому для нас условием AGI является создание достаточно совершенной среды, чтобы эта способность могла проявиться.

Вопрос: В каких именно сценариях AI действительно сыграл свою роль сегодня? Где он будет играть роль в будущем? Когда произойдет момент, подобный iPhone?

Ответ: Что касается агента, если смотреть только на возможности модели, то нынешние флагманские модели уже очень впечатляющи, почти на уровне "супермена". Они могут превзойти большинство из нас в математических соревнованиях или логическом мышлении.

Но я считаю, что модель по-прежнему похожа на «мозг в бутылке». Если мы хотим, чтобы она действительно проявила свою силу, ей нужно взаимодействовать с реальным миром и соприкасаться с реальностью. Но, к сожалению, именно здесь начинаются проблемы.

Например, если вы заставите ИИ выполнять некоторые рутинные задачи, он действительно хорош в повторяющихся заданиях. Например, такой продукт, как Deep Research, просто агрегирует информацию и дает результат, его вывод просто появляется там.

Например, сейчас практически все вещи разработаны для человека, не только физический мир, но и цифровой мир. Например, веб-инструменты, они похожи на мини-игры, не предоставляя API или стандартного интерфейса. Проверочные коды CAPTCHA повсюду, они везде блокируют Agent.

Поэтому я считаю, что ИИ хорошо справляется с замкнутыми, самодостаточными задачами, но как только речь заходит о реальном мире, он сталкивается с препятствиями.

Когда в будущем появится момент iPhone? Я думаю, что это не технологическая проблема, а скорее институциональное ограничение. Это не то, что такие стартапы, как наши Agent, могут решить в одиночку.

Я считаю, что это требует постепенного изменения, которое потребует совместной эволюции всей экосистемы. Это также требует усилий со стороны компаний, таких как Stripe, на уровне инфраструктуры. Например, мы интегрируем новый платежный API Agentic от Stripe. Все должны работать вместе.

Вопрос: Можем ли мы поговорить о некоторых типичных сценариях использования Manus пользователями? Как они его используют? Какую силу это демонстрирует?

Ответ: Да, хотя мы и представляем текущее поколение агентов, мы уже видели много отличных примеров использования.

Например, мы только что переехали в Сингапур и нам нужно нанять агентство недвижимости, чтобы помочь нам найти жилье. Это настоящий агент (смеется).

А сейчас эти посредники уже используют Manus: они будут анализировать местоположение компании и районы, где сотрудники хотят жить, в зависимости от потребностей клиентов, и генерировать соответствующие рекомендации.

Мне это кажется очень интересным, потому что это относится к «долгому хвосту спроса». Обычно нет специальных ИИ-продуктов, разработанных для таких конкретных сценариев, но поскольку Manus является универсальным агентом, он может удовлетворить эти потребности. Мы считаем, что долгий хвост спроса заслуживает особого внимания.

С макроэкономической точки зрения это может быть длинный хвост, но для конкретного пользователя это именно то, что они делают каждый день. Этот сценарий особенно ценен.

Это похоже на сегодняшнюю ситуацию с поисковыми системами. Если вы просто ищете что-то общее, независимо от того, используете ли вы Google или Bing, качество результатов будет примерно одинаковым. Так почему же люди выбирают один из них? Возможно, потому что какая-то поисковая система в определенный момент предоставила им более подходящие результаты. А если вы ищете что-то очень персонализированное или специализированное, различия становятся более очевидными. Поэтому мы считаем, что преимущество универсального агента заключается именно в этом.

Как же сделать это лучше? Мы долго думали над этим, потому что считаем, что всё сводится к программированию. Если вы передадите компьютер ИИ, то его взаимодействие с окружающей средой будет происходить именно через программирование.

Мы считаем, что можно улучшить с двух сторон. Первое – это масштабирование. Но что, если вы сможете увеличить способности Агента в сто раз?

Недавно Manus выпустил новую функцию под названием Wide Research. Основная идея заключается в том, чтобы позволить одному Агенту порождать сотни других Агентов для совместного выполнения задач. Вы знаете, если просто попросить ИИ помочь вам с мелкими делами, вы часто можете справиться с этим самостоятельно. Но если задача очень большая, вы в одиночку совершенно не сможете ее выполнить, например, если требуется провести масштабное исследование, в этом случае использование сотен Агентов для параллельной работы становится очень мощным.

Во-вторых, нам также нужно сделать так, чтобы агент мог более гибко использовать компьютерные ресурсы. Например, если вы настроите ИИ-агента только на использование предустановленных инструментов, то его поле действий будет ограничено этими инструментами. Но представьте, если бы вы были программистом и у вас были бы ресурсы всего открытого сообщества, к которым вы могли бы обращаться.

Например, когда вы печатаете на 3D-принтере, напрямую изменять параметры модели довольно сложно, но если вы сможете найти подходящую библиотеку на GitHub, то установка её решит вашу проблему. В Manus мы оптимизируем универсальность и представили концепцию, называемую «сетевая эффект инструментов».

Есть очень интересный пример: многие пользователи используют Manus для визуализации данных. Вы знаете, что в Азии иногда возникают проблемы, например, при отображении китайских символов в графиках могут возникать ошибки шрифта. Возможно, некоторые профессиональные пользователи напишут некоторые жесткие правила кодирования, например, какой шрифт следует использовать при выводе на корейском. Но такой подход сделает систему все более ригидной.

Мы приняли решение добавить в систему очень простую возможность: просматривать изображения. Результат оказался удивительным — потому что сегодняшние модели уже очень умные, они проверяют себя после генерации визуализированных изображений, осознают ошибки и затем автоматически исправляют их. Мы обнаружили, что увеличение гибкости инструментов решает больше проблем, чем жестко закодированные правила.

Вопрос: Это захватывающее время. Я действительно взволнован и только надеюсь, что мог бы быть моложе на тридцать лет (смеюсь). Говоря о медицинских исследованиях, я знаю, что Manus тоже в этом преуспевает. Вы заметили, что некоторые пользователи используют Manus для исследования медицины?

Ответ: Многие уже используют Manus для исследований, не ограничиваясь только медицинскими исследованиями. Нам это кажется интересным, потому что сейчас действительно существует много так называемых «глубоких исследовательских» продуктов, которые помогают вам собирать огромное количество информации и проводить некоторый анализ, но в конечном итоге вы получаете только файл markdown или документ. Этого недостаточно.

Во многих случаях исследователям действительно нужно то, что можно прямо передать начальнику или команде. Поэтому мы усилили вывод результатов исследований в Manus. Например, в медицинских исследованиях часто требуется создавать официальные отчеты, такие как слайды и подобные вещи. Поэтому мы должны оптимизировать возможности вывода ИИ, чтобы удовлетворить потребности исследователей. Это своего рода «инструментальный» опыт.

Например, сейчас многие пользователи сначала используют Manus для исследований, а затем напрямую создают сайт. Вы можете заметить, что это совершенно отличается от традиционного способа создания сайтов.

Следует понимать, что создать веб-сайт на самом деле не сложно, сложно обеспечить надежность и точность данных. Поэтому мы считаем, что лучше всего завершить весь процесс в одном сеансе, в одном общем контексте. Таким образом, ваши исследования и ваши идеи могут бесшовно преобразоваться в конечный результат. Именно это мы и делаем в Manus.

Вопрос: Во многих странах обсуждают одну тему: в эпоху искусственного интеллекта будущее человечества и экономическое влияние. Как вы относитесь к замещению рабочих мест? Какие новые рабочие возможности могут появиться?

Ответ: Наши друзья и инвесторы тоже часто задают нам этот вопрос. Когда мы запустили Manus, изначально мы думали, что если удастся создать такой Агент, он сможет сэкономить людям много времени и позволить им зарабатывать легко.

Но на самом деле мы обнаружили, что эта цель не была полностью достигнута. Проведя множество исследований среди пользователей, мы выяснили, что после использования они на самом деле стали работать больше. Потому что они стали более эффективными и на самом деле могут делать больше того, что им изначально хорошо удается. Это первый пункт.

Во-вторых, мы считаем, что Manus открывает совершенно новое пространство. Мы постоянно обсуждаем виртуальные машины и облачные вычисления. Мы считаем, что Manus выполняет роль «персональной облачной вычислительной платформы». Например, облачные вычисления существуют уже десятилетия, но это больше привилегия инженеров, которые могут использовать программирование для вызова мощи облака. Обычные работники знаний не могут это использовать.

Но теперь с помощью таких AI-агентов, как Manus, люди могут давать команды на естественном языке, позволяя ИИ выполнять их. Это эквивалентно разблокировке совершенно новой производительности. Вот что мы предлагаем.

А в конечном итоге, говоря о «замене», я считаю, что это на самом деле очень сложно. Например, риелторы, они каждый день используют Manus для выполнения своей повседневной работы. Но вы знаете, AI никогда не сможет заменить тот способ общения агента с клиентом. Мы компания AI, даже видео выпуска Manus было написано по сценарию Manus, но в видео все равно появляюсь я, потому что это вопрос доверия. А доверие нельзя полностью передать AI.

AGENT4.38%
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
0/400
Нет комментариев
  • Закрепить