A Manus que se mudou para Singapura não parou de pensar sobre o Agente de IA Genérico.
Hoje, durante o Stripe Tour realizado em Cingapura, o cofundador e cientista-chefe da Manus, Ji Yichao (Peak), teve uma conversa com Paul Harapin, Diretor de Receita da Stripe para a região da Ásia-Pacífico e Japão.
Durante o evento, a Manus AI revelou os dados operacionais recentes, com a Taxa de Receita em Funcionamento (RRR, Revenue Run Rate) da Manus AI já atingindo 90 milhões de dólares, e em breve ultrapassará a marca de 100 milhões.
O Xiao Hong da Manus AI também afirmou no instante que a Taxa de Execução de Receita refere-se à Receita do mês *12, e não é igual à Receita em Dinheiro. Muitos produtos de IA têm opções de pagamento anual, e essa parte só pode ser considerada como um depósito antecipado, não pode ser contabilizada como Receita. "Se divulgarmos dessa maneira [errada], podemos calcular um número ainda maior do que 120 milhões de dólares", afirmou Xiao Hong.
Além dos dados operacionais, Ji Yichao também compartilhou como a equipe Manus está pensando nos próximos passos do agente genérico e qual é a diferença entre o agente de IA e a AGI no futuro.
"Agora quase tudo é chamado de Agent. Por exemplo, um microfone, algumas pessoas o chamam de 'Agent de captação de som com percepção ambiental.' Ji Yichao brincou."
Ele também apresentou duas direções principais para a próxima etapa da capacidade do Agente Geral Expandido: a primeira, ampliar a escala de execução usando a cooperação de múltiplos Agentes (como gerar centenas de subagentes paralelos em uma pesquisa em larga escala); a segunda, abrir um "espaço de ferramentas" maior para os Agentes, não restringindo suas capacidades a poucas APIs pré-definidas, mas permitindo que eles chamem ecossistemas de código aberto, instalem bibliotecas e até mesmo realizem autoanálises e correções visuais.
Ji Yichao também mencionou que o mundo digital de hoje ainda é construído segundo o paradigma "para uso humano" - páginas web não API, CAPTCHA, a "gamificação" de processos traz muita fricção, e os gargalos parecem mais restrições ecológicas e institucionais do que inteligência de modelos.
Esta é também uma das razões pelas quais a Manus participa nas atividades da Stripe: ambas as partes estão a avançar para completar os pagamentos dentro do Agent, ligando "pesquisa – decisão – encomenda/ liquidação" em um ciclo fechado, utilizando a colaboração de infraestruturas para dissipar as fricções do mundo.
A seguir estão os destaques da conversa, editados e organizados pela Geek Park:
Pergunta: Pode dar uma breve introdução sobre você aos espectadores? Seu blog recente sobre "engenharia de contexto" é extremamente inspirador e eu acho que é leitura obrigatória para qualquer um aqui que esteja desenvolvendo um Agente de IA. Toda vez que vou almoçar com os engenheiros, eles estão sempre conversando sobre isso, então agora só consigo sentar em outro lugar (risos). Mas para aqueles que podem não estar muito familiarizados com o Manus, você pode compartilhar sua experiência e visão?
Resposta: Obrigado Paul. Fico feliz por estar aqui. Manus está a construir um Agente de IA genérico.
Muitas instituições de pesquisa e empresas estão, na verdade, tentando criar um cérebro - criar um grande modelo de linguagem. Mas acreditamos que, do ponto de vista do consumidor, isso na verdade não é bom. A IA deve ser capaz de realmente agir e realizar tarefas, por isso construímos o Manus.
A nossa abordagem é permitir que a IA utilize uma das maiores invenções da história da humanidade — o computador geral. Dando à IA um computador, ela pode fazer tudo o que os humanos podem fazer. O Manus pode realmente realizar tarefas. Por exemplo, pode ajudá-lo a fazer uma apresentação, a planear uma viagem, e até a gerir as redes sociais — embora eu não recomende que faça isso realmente.
Os nossos utilizadores realmente gostam do Manus. Lançámos o Manus em março e agora já alcançámos uma taxa de receita anualizada (RRR, Revenue Run Rate) de cerca de 90 milhões, e em breve vamos ultrapassar os 100 milhões.
Eu acho que isso é imenso para uma pequena startup como a nossa. Mas, mais importante, isso mostra que o Agente de IA não é mais apenas uma palavra da moda na área de pesquisa, mas está realmente sendo aplicado e se enraizando.
Posso compartilhar com todos uma pequena história sobre o processo de construção do Manus.
Na verdade, obtivemos muita inspiração da aplicação de Agent coding. Por exemplo, produtos de programação em IA como o Cursor já atraíram muita atenção anteriormente.
Como engenheiros, naturalmente usamos o Cursor. Mas o que nos surpreende é que muitos colegas não engenheiros na empresa também estão a usar o Cursor. Claro, eles não estão a escrever software, mas a usá-lo para fazer visualização de dados e até a escrever alguns artigos. Eles ignoram a parte do código à esquerda e apenas dialogam com a IA para completar o trabalho.
Isso nos fez perceber que devemos generalizar essa abordagem e capacitar não programadores. Esse é um caso de uso da IA.
Pergunta: Estamos a ouvir cada vez mais pessoas a falar sobre AI Agent e AGI. Podes ajudar-nos a distinguir melhor estes dois conceitos? O que significam AI Agent e AGI para ti e para o Manus?
Resposta: Achamos que esta é uma questão muito boa.
Agora, quase tudo é chamado de "Agent". Por exemplo, um microfone, algumas pessoas diriam que é um "Agent de captação de som com percepção ambiental".
Mas pelo menos defendemos que o Agente deve ser um subconjunto da IA aplicada. Vamos dar um passo atrás e analisar as categorias comuns de aplicações de IA.
A maioria das pessoas já está familiarizada com duas categorias: uma é a chatbot, como o ChatGPT; a outra é a ferramenta geradora, como o MidJourney ou o Sora. Nestes sistemas, normalmente só existem dois papéis: o usuário e o modelo. Você interage com o modelo e obtém uma saída. A diferença do Agent é que, além do usuário e do modelo, ele introduz um terceiro elemento chave - o ambiente.
O conceito de "ambiente" varia de acordo com o tipo de agente. Por exemplo, em um Agente de Design, o ambiente pode ser uma tela ou um trecho de código; já aqui no Manus, o nosso objetivo é fazer com que o Agente apareça na máquina virtual ou até mesmo em toda a internet. Assim, o Agente pode observar o ambiente, decidir o que fazer a seguir e alterar o ambiente por meio de suas ações. Isso o torna extremamente poderoso.
Por exemplo, no Manus, você pode expressar uma necessidade, ele abrirá o navegador, publicará uma página da web e ajudará você a reservar um voo. Eu gosto muito deste exemplo, porque embora reservar um voo pareça simples, na verdade é a IA que está mudando diretamente o mundo real - o resultado não é a saída do modelo, mas o bilhete de avião em sua mão. A IA realmente entrou no seu mundo. É disso que falamos quando mencionamos o Agent.
Em termos simples, um Agente é um sistema de IA que pode representar o usuário na interação com o ambiente.
Quanto ao AGI, este termo também é frequentemente mencionado, e muitas pessoas o equiparam à superinteligência. Acreditamos que AGI é um sistema que pode utilizar a capacidade geral dos modelos de IA para completar muitas tarefas sem um design especial.
Acreditamos que "Agent coding" é na verdade um caminho para a AGI. Não é uma capacidade de um domínio vertical, mas se você a atribuir a um computador, ele pode fazer quase qualquer coisa no computador. Portanto, para nós, a condição para a AGI é construir um ambiente suficientemente completo para permitir que essa capacidade se manifeste.
Pergunta: Em quais cenários a IA realmente desempenhou um papel hoje? Onde ela irá desempenhar um papel no futuro? Quando teremos um momento semelhante ao do iPhone?
Resposta: Em termos de Agente, se olharmos apenas para a capacidade do modelo, os modelos de ponta atuais já são impressionantes, quase em nível "super-humano". Eles podem superar a maioria de nós em competições de matemática ou raciocínio lógico.
Mas eu acho que o modelo ainda é como um "cérebro dentro de um frasco"; para realmente liberar seu potencial, deve-se permitir que interajam com o mundo real e alcancem a realidade. Mas, infelizmente, é exatamente aí que os problemas começam.
Por exemplo, se você deixar uma IA fazer algumas tarefas administrativas, ela realmente se sai bem em tarefas repetitivas. Produtos como o Deep Research apenas agregam informações e fornecem um resultado; a sua saída é simplesmente apresentada ali.
Por exemplo, quase tudo agora é projetado para os humanos, não apenas o mundo físico, mas também o mundo digital. Por exemplo, ferramentas de página da web, que são como pequenos jogos, não oferecem API ou interfaces padrão. Captchas estão por toda parte, interceptando agentes em todos os lugares.
Portanto, eu acho que a IA se sai bem em tarefas fechadas e autossuficientes, mas quando se trata do mundo real, ela encontra obstáculos.
Quando é que poderá surgir o momento do iPhone no futuro? Eu acho que não é uma questão técnica, mas sim uma limitação institucional. Não é algo que empresas de startup como a nossa, a Agent, consigam resolver sozinhas.
Acredito que isso exige uma transição gradual, exigindo que todo o ecossistema evolua em conjunto. Isso também requer que empresas como a Stripe atuem a nível de infraestrutura. Por exemplo, estamos integrando a nova API de pagamentos Agentic da Stripe. Todos se esforçando juntos.
Pergunta: Podemos falar sobre alguns cenários típicos de como os usuários utilizam o Manus? Como é que eles o utilizam? Que forças isso revela?
Resposta: Sim, embora sejamos da geração atual de Agentes, já vimos muitos casos de uso incríveis.
Por exemplo, acabámos de nos mudar para Singapura e precisamos de contratar um agente imobiliário para nos ajudar a encontrar uma casa. É um agente humano (risos).
E agora esses intermediários já estão usando o Manus: eles analisam a localização da empresa e a área onde os funcionários desejam viver, gerando as recomendações correspondentes, de acordo com as necessidades dos clientes.
Eu acho isso muito interessante, porque pertence a uma "demanda de cauda longa". De um modo geral, não existem produtos de IA específicos projetados para esse tipo de cenário, mas como o Manus é um Agente genérico, ele consegue atender a essas necessidades. Acreditamos que a demanda de cauda longa merece muita atenção.
Do ponto de vista macroeconômico, pode ser uma cauda longa, mas para usuários específicos, é exatamente o que faz parte do seu trabalho diário. Este cenário é especialmente valioso.
Isso é semelhante ao cenário atual dos motores de busca. Se você apenas pesquisa por alguns conteúdos comuns, não importa se é no Google ou no Bing, a qualidade dos resultados é mais ou menos a mesma. Então, por que as pessoas escolheriam um ou outro? Pode ser porque um dos motores de busca lhes deu resultados mais adequados em um momento específico. E se você estiver pesquisando por conteúdos muito personalizados ou especializados, as diferenças se tornam ainda mais evidentes. Portanto, acreditamos que a vantagem de um Agente genérico está aqui.
Então, como podemos melhorá-lo? Pensamos por muito tempo, porque acreditamos que tudo gira em torno da programação. Se você entregar um computador à IA, a maneira como ele interage com o ambiente é, na verdade, através da programação.
Acreditamos que podemos melhorar em dois aspectos. O primeiro é a escalabilidade. Mas e se você conseguir aumentar a capacidade do Agente em cem vezes?
Recentemente, a Manus lançou uma nova funcionalidade chamada Wide Research. A ideia básica é permitir que um Agente derive centenas de outros Agentes para completar tarefas juntos. Você sabe, se for apenas para deixar a IA fazer algumas pequenas coisas, muitas vezes você mesmo consegue fazer. Mas se a tarefa for muito grande, você não conseguirá completá-la sozinho, como em uma pesquisa em larga escala, nesse momento, deixar centenas de Agentes trabalhando em paralelo se torna extremamente poderoso.
Em segundo lugar, precisamos permitir que o Agente use o computador de forma mais flexível. Por exemplo, se você apenas configurar ferramentas predefinidas para um Agente de IA, então seu espaço de ação estará limitado a essas ferramentas. Mas imagine se você fosse um programador e tivesse todos os recursos da comunidade de código aberto à sua disposição.
Por exemplo, quando você está imprimindo em 3D, é muito difícil modificar os parâmetros do modelo diretamente, mas se você conseguir encontrar uma biblioteca adequada no GitHub, a instalação direta pode resolver seu problema. Na Manus, estamos otimizando a versatilidade e propusemos um conceito chamado "efeito de rede das ferramentas".
Há um exemplo muito interessante: muitos usuários usam o Manus para visualização de dados. Vocês sabem que, na Ásia, às vezes encontramos problemas, como a possível ocorrência de erros de fonte ao exibir caracteres chineses em gráficos. Talvez alguns usuários profissionais escrevam algumas regras de codificação rígidas, como qual fonte deve ser usada ao produzir texto em coreano. Mas essa abordagem tornará o sistema cada vez mais rígido.
A abordagem que adotamos foi adicionar uma capacidade muito simples ao sistema: visualizar imagens. O resultado foi surpreendente – porque os modelos de hoje já são muito inteligentes, eles verificam por conta própria após gerar imagens visualizadas, percebem os erros e, em seguida, corrigem automaticamente. Descobrimos que aumentar a flexibilidade das ferramentas pode resolver mais problemas do que codificar regras rígidas.
Pergunta: Este é um tempo emocionante. Estou realmente entusiasmado, só espero que eu pudesse ser mais jovem, como aos trinta anos (risos). Em relação à pesquisa médica, sei que a Manus também é forte nesta área. Vocês notaram que alguns usuários estão usando a Manus para pesquisar na área da saúde?
Resposta: Muitas pessoas já estão usando o Manus para fazer pesquisas, não se limitando apenas à pesquisa médica. Achamos isso muito interessante, porque atualmente realmente existem muitos produtos chamados de "pesquisa aprofundada", que ajudam a coletar uma grande quantidade de informações e a fazer algumas análises, mas no final só oferecem um arquivo markdown ou um documento. Isso está muito longe de ser suficiente.
Muitas vezes, o que os pesquisadores realmente precisam são resultados que possam ser entregues diretamente ao chefe ou à equipe. Por isso, reforçamos a saída dos resultados da pesquisa na Manus. Por exemplo, em pesquisas médicas, muitas vezes é necessário gerar relatórios formais, como apresentações em slides. Portanto, precisamos otimizar a capacidade de saída da IA para atender às necessidades dos pesquisadores. Esta é uma experiência "ferramental".
Por exemplo, agora muitos usuários vão primeiro usar o Manus para fazer pesquisas e depois gerar um site diretamente. Você achará que isso é completamente diferente da forma tradicional de construção de sites.
É importante saber que construir um site em si não é difícil, o desafio é garantir a confiabilidade e a precisão dos dados. Portanto, acreditamos que o ideal é conseguir realizar todo o processo em uma única conversa, em um contexto compartilhado. Assim, sua pesquisa e suas percepções podem se transformar de forma fluida no resultado final. É isso que fazemos no Manus.
Pergunta: Muitos países estão discutindo um tópico: no era da IA, o futuro da humanidade e o impacto econômico. O que você pensa sobre o emprego sendo substituído? Que novas oportunidades de trabalho podem surgir?
Resposta: Os nossos amigos e investidores também nos fazem frequentemente esta pergunta. Quando lançámos o Manus, inicialmente pensávamos que se conseguíssemos construir um Agent assim, ele poderia ajudar as pessoas a economizar muito tempo e a ganhar dinheiro facilmente.
Mas na verdade, descobrimos que essa visão não foi completamente realizada. Através de uma grande quantidade de pesquisa com usuários, descobrimos que, após usarem, os usuários acabaram trabalhando mais. Porque eles se tornaram mais eficientes, na verdade conseguem fazer mais das coisas que já eram muito bons. Esse é o primeiro ponto.
Em segundo lugar, acreditamos que o Manus abriu um novo espaço. Temos discutido sobre máquinas virtuais e computação em nuvem. Acreditamos que o Manus está a desempenhar um papel de "plataforma de computação em nuvem pessoal". Por exemplo, a computação em nuvem já existe há décadas, mas é mais um privilégio de engenheiros, sendo que apenas nós conseguimos invocar o poder da nuvem através da programação. Os trabalhadores do conhecimento comuns não conseguem utilizá-la.
Mas agora, com agentes de IA como o Manus, as pessoas podem dar instruções em linguagem natural para que a IA execute. Isso equivale a desbloquear uma nova forma de produtividade. É isso que trouxemos.
E por fim, sobre "substituição", eu realmente acho que é muito difícil. Por exemplo, os agentes imobiliários, eles usam o Manus todos os dias para realizar seu trabalho diário. Mas você sabe, a IA nunca poderá substituir a forma de comunicação que o agente tem ao lidar com os clientes. Somos uma empresa de IA, até mesmo o vídeo de lançamento do Manus foi escrito pelo Manus, mas quem aparece no vídeo sou eu, porque isso se trata de confiança. E a confiança não pode ser totalmente delegada à IA.
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
Texto completo da última conversa da Manus: Tentativa de pagamento do Agente, a empresa RRR perto de 100 milhões de dólares
Autor | Li Yuan
Editor| Jingyu
A Manus que se mudou para Singapura não parou de pensar sobre o Agente de IA Genérico.
Hoje, durante o Stripe Tour realizado em Cingapura, o cofundador e cientista-chefe da Manus, Ji Yichao (Peak), teve uma conversa com Paul Harapin, Diretor de Receita da Stripe para a região da Ásia-Pacífico e Japão.
Durante o evento, a Manus AI revelou os dados operacionais recentes, com a Taxa de Receita em Funcionamento (RRR, Revenue Run Rate) da Manus AI já atingindo 90 milhões de dólares, e em breve ultrapassará a marca de 100 milhões.
O Xiao Hong da Manus AI também afirmou no instante que a Taxa de Execução de Receita refere-se à Receita do mês *12, e não é igual à Receita em Dinheiro. Muitos produtos de IA têm opções de pagamento anual, e essa parte só pode ser considerada como um depósito antecipado, não pode ser contabilizada como Receita. "Se divulgarmos dessa maneira [errada], podemos calcular um número ainda maior do que 120 milhões de dólares", afirmou Xiao Hong.
Além dos dados operacionais, Ji Yichao também compartilhou como a equipe Manus está pensando nos próximos passos do agente genérico e qual é a diferença entre o agente de IA e a AGI no futuro.
"Agora quase tudo é chamado de Agent. Por exemplo, um microfone, algumas pessoas o chamam de 'Agent de captação de som com percepção ambiental.' Ji Yichao brincou."
Ele também apresentou duas direções principais para a próxima etapa da capacidade do Agente Geral Expandido: a primeira, ampliar a escala de execução usando a cooperação de múltiplos Agentes (como gerar centenas de subagentes paralelos em uma pesquisa em larga escala); a segunda, abrir um "espaço de ferramentas" maior para os Agentes, não restringindo suas capacidades a poucas APIs pré-definidas, mas permitindo que eles chamem ecossistemas de código aberto, instalem bibliotecas e até mesmo realizem autoanálises e correções visuais.
Ji Yichao também mencionou que o mundo digital de hoje ainda é construído segundo o paradigma "para uso humano" - páginas web não API, CAPTCHA, a "gamificação" de processos traz muita fricção, e os gargalos parecem mais restrições ecológicas e institucionais do que inteligência de modelos.
Esta é também uma das razões pelas quais a Manus participa nas atividades da Stripe: ambas as partes estão a avançar para completar os pagamentos dentro do Agent, ligando "pesquisa – decisão – encomenda/ liquidação" em um ciclo fechado, utilizando a colaboração de infraestruturas para dissipar as fricções do mundo.
A seguir estão os destaques da conversa, editados e organizados pela Geek Park:
Pergunta: Pode dar uma breve introdução sobre você aos espectadores? Seu blog recente sobre "engenharia de contexto" é extremamente inspirador e eu acho que é leitura obrigatória para qualquer um aqui que esteja desenvolvendo um Agente de IA. Toda vez que vou almoçar com os engenheiros, eles estão sempre conversando sobre isso, então agora só consigo sentar em outro lugar (risos). Mas para aqueles que podem não estar muito familiarizados com o Manus, você pode compartilhar sua experiência e visão?
Resposta: Obrigado Paul. Fico feliz por estar aqui. Manus está a construir um Agente de IA genérico.
Muitas instituições de pesquisa e empresas estão, na verdade, tentando criar um cérebro - criar um grande modelo de linguagem. Mas acreditamos que, do ponto de vista do consumidor, isso na verdade não é bom. A IA deve ser capaz de realmente agir e realizar tarefas, por isso construímos o Manus.
A nossa abordagem é permitir que a IA utilize uma das maiores invenções da história da humanidade — o computador geral. Dando à IA um computador, ela pode fazer tudo o que os humanos podem fazer. O Manus pode realmente realizar tarefas. Por exemplo, pode ajudá-lo a fazer uma apresentação, a planear uma viagem, e até a gerir as redes sociais — embora eu não recomende que faça isso realmente.
Os nossos utilizadores realmente gostam do Manus. Lançámos o Manus em março e agora já alcançámos uma taxa de receita anualizada (RRR, Revenue Run Rate) de cerca de 90 milhões, e em breve vamos ultrapassar os 100 milhões.
Eu acho que isso é imenso para uma pequena startup como a nossa. Mas, mais importante, isso mostra que o Agente de IA não é mais apenas uma palavra da moda na área de pesquisa, mas está realmente sendo aplicado e se enraizando.
Posso compartilhar com todos uma pequena história sobre o processo de construção do Manus.
Na verdade, obtivemos muita inspiração da aplicação de Agent coding. Por exemplo, produtos de programação em IA como o Cursor já atraíram muita atenção anteriormente.
Como engenheiros, naturalmente usamos o Cursor. Mas o que nos surpreende é que muitos colegas não engenheiros na empresa também estão a usar o Cursor. Claro, eles não estão a escrever software, mas a usá-lo para fazer visualização de dados e até a escrever alguns artigos. Eles ignoram a parte do código à esquerda e apenas dialogam com a IA para completar o trabalho.
Isso nos fez perceber que devemos generalizar essa abordagem e capacitar não programadores. Esse é um caso de uso da IA.
Pergunta: Estamos a ouvir cada vez mais pessoas a falar sobre AI Agent e AGI. Podes ajudar-nos a distinguir melhor estes dois conceitos? O que significam AI Agent e AGI para ti e para o Manus?
Resposta: Achamos que esta é uma questão muito boa.
Agora, quase tudo é chamado de "Agent". Por exemplo, um microfone, algumas pessoas diriam que é um "Agent de captação de som com percepção ambiental".
Mas pelo menos defendemos que o Agente deve ser um subconjunto da IA aplicada. Vamos dar um passo atrás e analisar as categorias comuns de aplicações de IA.
A maioria das pessoas já está familiarizada com duas categorias: uma é a chatbot, como o ChatGPT; a outra é a ferramenta geradora, como o MidJourney ou o Sora. Nestes sistemas, normalmente só existem dois papéis: o usuário e o modelo. Você interage com o modelo e obtém uma saída. A diferença do Agent é que, além do usuário e do modelo, ele introduz um terceiro elemento chave - o ambiente.
O conceito de "ambiente" varia de acordo com o tipo de agente. Por exemplo, em um Agente de Design, o ambiente pode ser uma tela ou um trecho de código; já aqui no Manus, o nosso objetivo é fazer com que o Agente apareça na máquina virtual ou até mesmo em toda a internet. Assim, o Agente pode observar o ambiente, decidir o que fazer a seguir e alterar o ambiente por meio de suas ações. Isso o torna extremamente poderoso.
Por exemplo, no Manus, você pode expressar uma necessidade, ele abrirá o navegador, publicará uma página da web e ajudará você a reservar um voo. Eu gosto muito deste exemplo, porque embora reservar um voo pareça simples, na verdade é a IA que está mudando diretamente o mundo real - o resultado não é a saída do modelo, mas o bilhete de avião em sua mão. A IA realmente entrou no seu mundo. É disso que falamos quando mencionamos o Agent.
Em termos simples, um Agente é um sistema de IA que pode representar o usuário na interação com o ambiente.
Quanto ao AGI, este termo também é frequentemente mencionado, e muitas pessoas o equiparam à superinteligência. Acreditamos que AGI é um sistema que pode utilizar a capacidade geral dos modelos de IA para completar muitas tarefas sem um design especial.
Acreditamos que "Agent coding" é na verdade um caminho para a AGI. Não é uma capacidade de um domínio vertical, mas se você a atribuir a um computador, ele pode fazer quase qualquer coisa no computador. Portanto, para nós, a condição para a AGI é construir um ambiente suficientemente completo para permitir que essa capacidade se manifeste.
Pergunta: Em quais cenários a IA realmente desempenhou um papel hoje? Onde ela irá desempenhar um papel no futuro? Quando teremos um momento semelhante ao do iPhone?
Resposta: Em termos de Agente, se olharmos apenas para a capacidade do modelo, os modelos de ponta atuais já são impressionantes, quase em nível "super-humano". Eles podem superar a maioria de nós em competições de matemática ou raciocínio lógico.
Mas eu acho que o modelo ainda é como um "cérebro dentro de um frasco"; para realmente liberar seu potencial, deve-se permitir que interajam com o mundo real e alcancem a realidade. Mas, infelizmente, é exatamente aí que os problemas começam.
Por exemplo, se você deixar uma IA fazer algumas tarefas administrativas, ela realmente se sai bem em tarefas repetitivas. Produtos como o Deep Research apenas agregam informações e fornecem um resultado; a sua saída é simplesmente apresentada ali.
Por exemplo, quase tudo agora é projetado para os humanos, não apenas o mundo físico, mas também o mundo digital. Por exemplo, ferramentas de página da web, que são como pequenos jogos, não oferecem API ou interfaces padrão. Captchas estão por toda parte, interceptando agentes em todos os lugares.
Portanto, eu acho que a IA se sai bem em tarefas fechadas e autossuficientes, mas quando se trata do mundo real, ela encontra obstáculos.
Quando é que poderá surgir o momento do iPhone no futuro? Eu acho que não é uma questão técnica, mas sim uma limitação institucional. Não é algo que empresas de startup como a nossa, a Agent, consigam resolver sozinhas.
Acredito que isso exige uma transição gradual, exigindo que todo o ecossistema evolua em conjunto. Isso também requer que empresas como a Stripe atuem a nível de infraestrutura. Por exemplo, estamos integrando a nova API de pagamentos Agentic da Stripe. Todos se esforçando juntos.
Pergunta: Podemos falar sobre alguns cenários típicos de como os usuários utilizam o Manus? Como é que eles o utilizam? Que forças isso revela?
Resposta: Sim, embora sejamos da geração atual de Agentes, já vimos muitos casos de uso incríveis.
Por exemplo, acabámos de nos mudar para Singapura e precisamos de contratar um agente imobiliário para nos ajudar a encontrar uma casa. É um agente humano (risos).
E agora esses intermediários já estão usando o Manus: eles analisam a localização da empresa e a área onde os funcionários desejam viver, gerando as recomendações correspondentes, de acordo com as necessidades dos clientes.
Eu acho isso muito interessante, porque pertence a uma "demanda de cauda longa". De um modo geral, não existem produtos de IA específicos projetados para esse tipo de cenário, mas como o Manus é um Agente genérico, ele consegue atender a essas necessidades. Acreditamos que a demanda de cauda longa merece muita atenção.
Do ponto de vista macroeconômico, pode ser uma cauda longa, mas para usuários específicos, é exatamente o que faz parte do seu trabalho diário. Este cenário é especialmente valioso.
Isso é semelhante ao cenário atual dos motores de busca. Se você apenas pesquisa por alguns conteúdos comuns, não importa se é no Google ou no Bing, a qualidade dos resultados é mais ou menos a mesma. Então, por que as pessoas escolheriam um ou outro? Pode ser porque um dos motores de busca lhes deu resultados mais adequados em um momento específico. E se você estiver pesquisando por conteúdos muito personalizados ou especializados, as diferenças se tornam ainda mais evidentes. Portanto, acreditamos que a vantagem de um Agente genérico está aqui.
Então, como podemos melhorá-lo? Pensamos por muito tempo, porque acreditamos que tudo gira em torno da programação. Se você entregar um computador à IA, a maneira como ele interage com o ambiente é, na verdade, através da programação.
Acreditamos que podemos melhorar em dois aspectos. O primeiro é a escalabilidade. Mas e se você conseguir aumentar a capacidade do Agente em cem vezes?
Recentemente, a Manus lançou uma nova funcionalidade chamada Wide Research. A ideia básica é permitir que um Agente derive centenas de outros Agentes para completar tarefas juntos. Você sabe, se for apenas para deixar a IA fazer algumas pequenas coisas, muitas vezes você mesmo consegue fazer. Mas se a tarefa for muito grande, você não conseguirá completá-la sozinho, como em uma pesquisa em larga escala, nesse momento, deixar centenas de Agentes trabalhando em paralelo se torna extremamente poderoso.
Em segundo lugar, precisamos permitir que o Agente use o computador de forma mais flexível. Por exemplo, se você apenas configurar ferramentas predefinidas para um Agente de IA, então seu espaço de ação estará limitado a essas ferramentas. Mas imagine se você fosse um programador e tivesse todos os recursos da comunidade de código aberto à sua disposição.
Por exemplo, quando você está imprimindo em 3D, é muito difícil modificar os parâmetros do modelo diretamente, mas se você conseguir encontrar uma biblioteca adequada no GitHub, a instalação direta pode resolver seu problema. Na Manus, estamos otimizando a versatilidade e propusemos um conceito chamado "efeito de rede das ferramentas".
Há um exemplo muito interessante: muitos usuários usam o Manus para visualização de dados. Vocês sabem que, na Ásia, às vezes encontramos problemas, como a possível ocorrência de erros de fonte ao exibir caracteres chineses em gráficos. Talvez alguns usuários profissionais escrevam algumas regras de codificação rígidas, como qual fonte deve ser usada ao produzir texto em coreano. Mas essa abordagem tornará o sistema cada vez mais rígido.
A abordagem que adotamos foi adicionar uma capacidade muito simples ao sistema: visualizar imagens. O resultado foi surpreendente – porque os modelos de hoje já são muito inteligentes, eles verificam por conta própria após gerar imagens visualizadas, percebem os erros e, em seguida, corrigem automaticamente. Descobrimos que aumentar a flexibilidade das ferramentas pode resolver mais problemas do que codificar regras rígidas.
Pergunta: Este é um tempo emocionante. Estou realmente entusiasmado, só espero que eu pudesse ser mais jovem, como aos trinta anos (risos). Em relação à pesquisa médica, sei que a Manus também é forte nesta área. Vocês notaram que alguns usuários estão usando a Manus para pesquisar na área da saúde?
Resposta: Muitas pessoas já estão usando o Manus para fazer pesquisas, não se limitando apenas à pesquisa médica. Achamos isso muito interessante, porque atualmente realmente existem muitos produtos chamados de "pesquisa aprofundada", que ajudam a coletar uma grande quantidade de informações e a fazer algumas análises, mas no final só oferecem um arquivo markdown ou um documento. Isso está muito longe de ser suficiente.
Muitas vezes, o que os pesquisadores realmente precisam são resultados que possam ser entregues diretamente ao chefe ou à equipe. Por isso, reforçamos a saída dos resultados da pesquisa na Manus. Por exemplo, em pesquisas médicas, muitas vezes é necessário gerar relatórios formais, como apresentações em slides. Portanto, precisamos otimizar a capacidade de saída da IA para atender às necessidades dos pesquisadores. Esta é uma experiência "ferramental".
Por exemplo, agora muitos usuários vão primeiro usar o Manus para fazer pesquisas e depois gerar um site diretamente. Você achará que isso é completamente diferente da forma tradicional de construção de sites.
É importante saber que construir um site em si não é difícil, o desafio é garantir a confiabilidade e a precisão dos dados. Portanto, acreditamos que o ideal é conseguir realizar todo o processo em uma única conversa, em um contexto compartilhado. Assim, sua pesquisa e suas percepções podem se transformar de forma fluida no resultado final. É isso que fazemos no Manus.
Pergunta: Muitos países estão discutindo um tópico: no era da IA, o futuro da humanidade e o impacto econômico. O que você pensa sobre o emprego sendo substituído? Que novas oportunidades de trabalho podem surgir?
Resposta: Os nossos amigos e investidores também nos fazem frequentemente esta pergunta. Quando lançámos o Manus, inicialmente pensávamos que se conseguíssemos construir um Agent assim, ele poderia ajudar as pessoas a economizar muito tempo e a ganhar dinheiro facilmente.
Mas na verdade, descobrimos que essa visão não foi completamente realizada. Através de uma grande quantidade de pesquisa com usuários, descobrimos que, após usarem, os usuários acabaram trabalhando mais. Porque eles se tornaram mais eficientes, na verdade conseguem fazer mais das coisas que já eram muito bons. Esse é o primeiro ponto.
Em segundo lugar, acreditamos que o Manus abriu um novo espaço. Temos discutido sobre máquinas virtuais e computação em nuvem. Acreditamos que o Manus está a desempenhar um papel de "plataforma de computação em nuvem pessoal". Por exemplo, a computação em nuvem já existe há décadas, mas é mais um privilégio de engenheiros, sendo que apenas nós conseguimos invocar o poder da nuvem através da programação. Os trabalhadores do conhecimento comuns não conseguem utilizá-la.
Mas agora, com agentes de IA como o Manus, as pessoas podem dar instruções em linguagem natural para que a IA execute. Isso equivale a desbloquear uma nova forma de produtividade. É isso que trouxemos.
E por fim, sobre "substituição", eu realmente acho que é muito difícil. Por exemplo, os agentes imobiliários, eles usam o Manus todos os dias para realizar seu trabalho diário. Mas você sabe, a IA nunca poderá substituir a forma de comunicação que o agente tem ao lidar com os clientes. Somos uma empresa de IA, até mesmo o vídeo de lançamento do Manus foi escrito pelo Manus, mas quem aparece no vídeo sou eu, porque isso se trata de confiança. E a confiança não pode ser totalmente delegada à IA.