A revolução dos navegadores na era da IA: da pesquisa ao agente inteligente
A terceira guerra dos navegadores está se desenrolando silenciosamente. Olhando para a história, desde o Netscape até o IE, passando pelo Firefox e Chrome, a disputa dos navegadores sempre foi uma manifestação concentrada do controle da plataforma e da mudança de paradigmas tecnológicos. O Chrome conquistou a posição de domínio graças à sua velocidade de atualização e à interconexão do ecossistema, enquanto o Google, através da estrutura de "duopólio" entre busca e navegador, formou um ciclo fechado de entrada de informações.
No entanto, este padrão está a ser abalado. A ascensão dos grandes modelos de linguagem (LLM) está a fazer com que cada vez mais utilizadores completem tarefas na página de resultados de busca com "zero cliques", reduzindo o comportamento de clicar em páginas web tradicionais. Ao mesmo tempo, os rumores de que a Apple pretende substituir o motor de busca padrão no Safari ameaçam ainda mais a base de lucros da Alphabet, e o mercado já começou a mostrar inquietação em relação à "ortodoxia da busca".
O próprio navegador também está enfrentando uma reconfiguração de seu papel. Ele não é apenas uma ferramenta para exibir páginas da web, mas sim um recipiente que reúne várias capacidades, como entrada de dados, comportamento do usuário e identidade de privacidade. Embora o Agente de IA seja poderoso, para realizar interações complexas em páginas, chamar dados de identidade locais e controlar elementos da página, ainda é necessário recorrer às fronteiras de confiança e ao sandbox funcional do navegador. O navegador está se transformando de uma interface humana em uma plataforma de chamadas de sistema para Agentes.
O que realmente pode quebrar o atual paradigma do mercado de navegadores não é outro "Chrome melhor", mas sim uma nova estrutura de interação: não a exibição de informações, mas a invocação de tarefas. O navegador do futuro deve ser projetado para Agentes de IA - que não apenas podem ler, mas também escrever e executar. Projetos como Browser Use estão tentando semantizar a estrutura das páginas, transformando a interface visual em texto estruturado que pode ser chamado por LLM, realizando o mapeamento de páginas para comandos e reduzindo significativamente o custo de interação.
Os projetos principais no mercado começaram a experimentar: a Perplexity construiu o navegador nativo Comet, substituindo os resultados de pesquisa tradicionais por IA; a Brave combinou proteção de privacidade com raciocínio local, usando LLM para melhorar as funções de pesquisa e bloqueio; enquanto projetos nativos de Crypto como o Donut visam uma nova entrada para a interação entre IA e ativos em blockchain. A característica comum desses projetos é: tentar reestruturar a entrada do navegador, em vez de embelezar sua camada de saída.
Para os empreendedores, as oportunidades estão escondidas na relação triangular entre entrada, estrutura e agentes. O navegador, como a interface que chama o mundo no futuro Agent, significa que quem puder fornecer "blocos de capacidade" estruturados, chamáveis e confiáveis, poderá se tornar parte integrante da nova geração de plataformas. Desde SEO até AEO (Otimização do Motor de Agentes), desde o tráfego de páginas até a chamada de cadeias de tarefas, as formas de produtos e o pensamento de design estão sendo reestruturados. A terceira guerra dos navegadores ocorre na "entrada" e não na "exibição"; o que decide o vencedor não é mais quem chama a atenção do usuário, mas quem ganha a confiança do agente e obtém a entrada para a chamada.
A arquitetura antiga dos navegadores modernos
O fluxo de trabalho típico do motor de busca do Google inclui os seguintes passos chave:
Entrada do cliente no front-end: consulta ao Google Front End mais próximo entregue via HTTPS, completando a descriptografia TLS, amostragem de QoS e roteamento geográfico.
Compreensão da consulta: a interface precisa entender o significado das palavras digitadas pelo usuário, incluindo correção ortográfica, expansão de sinônimos e interpretação de intenções.
Recuperação de candidatos: O Google utiliza técnicas de indexação invertida e indexação vetorial para realizar uma triagem inicial, selecionando cerca de cem mil páginas candidatas de um grande volume de páginas da web.
Classificação em múltiplos níveis: através de características leves como BM25 e TF-IDF, reduzir as páginas candidatas para cerca de 1000.
Aprendizado profundo de classificação principal: uso de tecnologias como RankBrain e Neural Matching para compreensão semântica e correspondência de relevância.
Reordenação profunda: utilização do modelo BERT para uma classificação mais refinada dos documentos previamente selecionados.
No entanto, na era da IA e dos grandes dados, os utilizadores geraram novas exigências para a interação com os navegadores, a arquitetura tradicional já não é suficiente para satisfazer essas mudanças.
Por que a IA vai remodelar os navegadores
O navegador, como uma plataforma universal, não é apenas a entrada para leitura de dados, mas também a entrada universal para inserção de dados. Os usuários precisam interagir com os dados, e o navegador é um excelente local para armazenar as impressões digitais dos usuários. Comportamentos complexos de usuários e comportamentos automatizados devem ser realizados através do navegador.
Os futuros modos de interação podem evoluir para: usuário → chamar o Agente de IA → navegador.
O navegador é um local de armazenamento de conteúdo personalizado:
A maioria dos grandes modelos está hospedada na nuvem, tornando difícil a chamada direta de dados sensíveis locais.
Todos os dados enviados para modelos de terceiros precisam de uma nova autorização do usuário.
Muitas operações devem ser realizadas dentro do sandbox do navegador.
O contexto dos dados depende fortemente do navegador.
A profunda transformação das formas de interação
Os grandes modelos de IA mudaram profundamente a eficiência e a maneira como lemos dados. Estudos mostram que cerca de 63% das pesquisas no Google são comportamentos de "nenhum clique", com os usuários habituados a obter informações diretamente da página de resultados de busca.
No entanto, o navegador AI ainda precisa explorar formas de interação adequadas, especialmente na leitura de dados, uma vez que o "problema da ilusão" dos modelos atuais ainda não foi resolvido.
O que realmente pode desencadear uma transformação em grande escala nos navegadores é a camada de interação de dados. Os usuários estão cada vez mais inclinados a usar linguagem natural para descrever tarefas complexas, e essas Tarefas Agenticas estão sendo gradualmente assumidas por Agentes de IA.
Os navegadores do futuro devem ser projetados para a automação total, considerando como equilibrar a experiência de leitura humana e a interpretabilidade do agente de IA, bem como como servir simultaneamente os usuários e os modelos de agentes na mesma página.
Análise dos principais projetos de navegador AI
Uso do Navegador
Browser Use construiu uma camada semântica no verdadeiro sentido da palavra, para construir uma arquitetura de reconhecimento semântico para a próxima geração de navegadores. Ele redecodifica o DOM tradicional em "DOM semântico", permitindo que os agentes operem com precisão sem a necessidade de "coordenadas de pontos de visualização". Este método substitui OCR visual ou coordenadas Selenium por "texto estruturado → chamadas de função", executando mais rapidamente, consumindo menos tokens e cometendo menos erros.
Arc (A Empresa do Navegador)
A Browser Company planeia focar-se no navegador DIA, completamente orientado para a IA. No entanto, algumas das suas previsões sobre o futuro do mercado de navegadores são discutíveis. Em particular, a ideia de que as páginas da web deixariam de ser a principal interface de interação pode subestimar o papel central dos navegadores na apresentação de informações e na experiência personalizada.
Perplexidade
Perplexity é um motor de busca AI, com uma avaliação recente de 14 mil milhões de dólares. A sua principal característica é a capacidade de resumir páginas em tempo real, o que lhe confere uma vantagem na obtenção de informações instantâneas. A Perplexity está a construir um navegador nativo chamado Comet, com o plano de integrar tarefas de AI profundamente na base do navegador.
No entanto, apenas imitar funcionalidades dificilmente representa uma verdadeira ameaça ao Google. O que realmente pode estabelecer uma nova ordem é a reestruturação da arquitetura do navegador desde a base, incorporando LLM profundamente no núcleo do navegador, realizando uma transformação fundamental na forma de interação.
Brave
Brave é um dos primeiros e bem-sucedidos navegadores da indústria Crypto, baseado na arquitetura Chromium. Atraí os usuários com a promessa de privacidade e a possibilidade de ganhar Tokens enquanto navegam. No entanto, a demanda por privacidade ainda está principalmente concentrada em grupos de usuários específicos, dificultando a disrupção dos gigantes existentes.
O plano Brave é atualizar para um navegador de IA focado em privacidade, mas é limitado por ter menos dados dos usuários e um nível de personalização mais baixo. Seu assistente de IA, Leo, é mais parecido com um plug-in e ainda não há uma estratégia clara para uma transição completa para um Agente de IA.
Donut
Donut é um projeto emergente na indústria de criptomoedas, com a visão de realizar uma capacidade integrada de "exploração - decisão - execução nativa de criptografia". Seu núcleo reside na combinação de um caminho de execução automática nativa de criptografia, alinhado com a tendência futura de que agentes possam substituir os motores de busca como principais entradas de tráfego.
Conselhos para empreendedores
Padronização da estrutura da interface: garantir que o produto tenha a capacidade de ser chamado por agentes inteligentes, considerando a padronização e a abstração da estrutura da informação.
Identidade e Acesso: Tornar-se um intermediário confiável ao realizar transações, invocar pagamentos ou ativos como agente de IA.
Reinterpretação do mecanismo de fluxo: da SEO para AEO (Otimização do Motor de Agentes) ou ATF (Cumprimento de Tarefas Agenciais).
Os empreendedores devem reimaginar o produto como componentes de API, permitindo que os agentes não apenas "entendam" isso, mas também "chamem" isso. O foco futuro não é recriar um navegador, mas fazer com que os navegadores existentes sirvam aos agentes, estabelecendo uma ponte para a nova geração de "fluxos de instrução".
Se o Web2 se baseia na UI para captar a atenção dos utilizadores, então a era do Web3 + AI Agent baseia-se na chamada da cadeia para captar a intenção de execução do Agent.
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
8 Curtidas
Recompensa
8
5
Repostar
Compartilhar
Comentário
0/400
EyeOfTheTokenStorm
· 16h atrás
Do ponto de vista técnico, o Google já mostrou sinais de fraqueza, recomendo que todos sigam as oportunidades em novas áreas, com negociação diária como foco.
Ver originalResponder0
SchroedingerMiner
· 16h atrás
A indústria dos navegadores vai revolucionar.
Ver originalResponder0
SchrodingerGas
· 16h atrás
Mais uma rodada de jogos de reconstrução do mercado começou. O melhor ainda está por vir.
Ver originalResponder0
TokenVelocityTrauma
· 16h atrás
O Chrome ainda tem que morrer.
Ver originalResponder0
OnChain_Detective
· 16h atrás
suspeito af... esta guerra dos navegadores parece outra tentativa de poder por parte da grande tecnologia. mantenham-se vigilantes família
Revolução do navegador na era da IA: de motores de busca a plataformas de agentes inteligentes
A revolução dos navegadores na era da IA: da pesquisa ao agente inteligente
A terceira guerra dos navegadores está se desenrolando silenciosamente. Olhando para a história, desde o Netscape até o IE, passando pelo Firefox e Chrome, a disputa dos navegadores sempre foi uma manifestação concentrada do controle da plataforma e da mudança de paradigmas tecnológicos. O Chrome conquistou a posição de domínio graças à sua velocidade de atualização e à interconexão do ecossistema, enquanto o Google, através da estrutura de "duopólio" entre busca e navegador, formou um ciclo fechado de entrada de informações.
No entanto, este padrão está a ser abalado. A ascensão dos grandes modelos de linguagem (LLM) está a fazer com que cada vez mais utilizadores completem tarefas na página de resultados de busca com "zero cliques", reduzindo o comportamento de clicar em páginas web tradicionais. Ao mesmo tempo, os rumores de que a Apple pretende substituir o motor de busca padrão no Safari ameaçam ainda mais a base de lucros da Alphabet, e o mercado já começou a mostrar inquietação em relação à "ortodoxia da busca".
O próprio navegador também está enfrentando uma reconfiguração de seu papel. Ele não é apenas uma ferramenta para exibir páginas da web, mas sim um recipiente que reúne várias capacidades, como entrada de dados, comportamento do usuário e identidade de privacidade. Embora o Agente de IA seja poderoso, para realizar interações complexas em páginas, chamar dados de identidade locais e controlar elementos da página, ainda é necessário recorrer às fronteiras de confiança e ao sandbox funcional do navegador. O navegador está se transformando de uma interface humana em uma plataforma de chamadas de sistema para Agentes.
O que realmente pode quebrar o atual paradigma do mercado de navegadores não é outro "Chrome melhor", mas sim uma nova estrutura de interação: não a exibição de informações, mas a invocação de tarefas. O navegador do futuro deve ser projetado para Agentes de IA - que não apenas podem ler, mas também escrever e executar. Projetos como Browser Use estão tentando semantizar a estrutura das páginas, transformando a interface visual em texto estruturado que pode ser chamado por LLM, realizando o mapeamento de páginas para comandos e reduzindo significativamente o custo de interação.
Os projetos principais no mercado começaram a experimentar: a Perplexity construiu o navegador nativo Comet, substituindo os resultados de pesquisa tradicionais por IA; a Brave combinou proteção de privacidade com raciocínio local, usando LLM para melhorar as funções de pesquisa e bloqueio; enquanto projetos nativos de Crypto como o Donut visam uma nova entrada para a interação entre IA e ativos em blockchain. A característica comum desses projetos é: tentar reestruturar a entrada do navegador, em vez de embelezar sua camada de saída.
Para os empreendedores, as oportunidades estão escondidas na relação triangular entre entrada, estrutura e agentes. O navegador, como a interface que chama o mundo no futuro Agent, significa que quem puder fornecer "blocos de capacidade" estruturados, chamáveis e confiáveis, poderá se tornar parte integrante da nova geração de plataformas. Desde SEO até AEO (Otimização do Motor de Agentes), desde o tráfego de páginas até a chamada de cadeias de tarefas, as formas de produtos e o pensamento de design estão sendo reestruturados. A terceira guerra dos navegadores ocorre na "entrada" e não na "exibição"; o que decide o vencedor não é mais quem chama a atenção do usuário, mas quem ganha a confiança do agente e obtém a entrada para a chamada.
A arquitetura antiga dos navegadores modernos
O fluxo de trabalho típico do motor de busca do Google inclui os seguintes passos chave:
Entrada do cliente no front-end: consulta ao Google Front End mais próximo entregue via HTTPS, completando a descriptografia TLS, amostragem de QoS e roteamento geográfico.
Compreensão da consulta: a interface precisa entender o significado das palavras digitadas pelo usuário, incluindo correção ortográfica, expansão de sinônimos e interpretação de intenções.
Recuperação de candidatos: O Google utiliza técnicas de indexação invertida e indexação vetorial para realizar uma triagem inicial, selecionando cerca de cem mil páginas candidatas de um grande volume de páginas da web.
Classificação em múltiplos níveis: através de características leves como BM25 e TF-IDF, reduzir as páginas candidatas para cerca de 1000.
Aprendizado profundo de classificação principal: uso de tecnologias como RankBrain e Neural Matching para compreensão semântica e correspondência de relevância.
Reordenação profunda: utilização do modelo BERT para uma classificação mais refinada dos documentos previamente selecionados.
No entanto, na era da IA e dos grandes dados, os utilizadores geraram novas exigências para a interação com os navegadores, a arquitetura tradicional já não é suficiente para satisfazer essas mudanças.
Por que a IA vai remodelar os navegadores
O navegador, como uma plataforma universal, não é apenas a entrada para leitura de dados, mas também a entrada universal para inserção de dados. Os usuários precisam interagir com os dados, e o navegador é um excelente local para armazenar as impressões digitais dos usuários. Comportamentos complexos de usuários e comportamentos automatizados devem ser realizados através do navegador.
Os futuros modos de interação podem evoluir para: usuário → chamar o Agente de IA → navegador.
O navegador é um local de armazenamento de conteúdo personalizado:
A profunda transformação das formas de interação
Os grandes modelos de IA mudaram profundamente a eficiência e a maneira como lemos dados. Estudos mostram que cerca de 63% das pesquisas no Google são comportamentos de "nenhum clique", com os usuários habituados a obter informações diretamente da página de resultados de busca.
No entanto, o navegador AI ainda precisa explorar formas de interação adequadas, especialmente na leitura de dados, uma vez que o "problema da ilusão" dos modelos atuais ainda não foi resolvido.
O que realmente pode desencadear uma transformação em grande escala nos navegadores é a camada de interação de dados. Os usuários estão cada vez mais inclinados a usar linguagem natural para descrever tarefas complexas, e essas Tarefas Agenticas estão sendo gradualmente assumidas por Agentes de IA.
Os navegadores do futuro devem ser projetados para a automação total, considerando como equilibrar a experiência de leitura humana e a interpretabilidade do agente de IA, bem como como servir simultaneamente os usuários e os modelos de agentes na mesma página.
Análise dos principais projetos de navegador AI
Uso do Navegador
Browser Use construiu uma camada semântica no verdadeiro sentido da palavra, para construir uma arquitetura de reconhecimento semântico para a próxima geração de navegadores. Ele redecodifica o DOM tradicional em "DOM semântico", permitindo que os agentes operem com precisão sem a necessidade de "coordenadas de pontos de visualização". Este método substitui OCR visual ou coordenadas Selenium por "texto estruturado → chamadas de função", executando mais rapidamente, consumindo menos tokens e cometendo menos erros.
Arc (A Empresa do Navegador)
A Browser Company planeia focar-se no navegador DIA, completamente orientado para a IA. No entanto, algumas das suas previsões sobre o futuro do mercado de navegadores são discutíveis. Em particular, a ideia de que as páginas da web deixariam de ser a principal interface de interação pode subestimar o papel central dos navegadores na apresentação de informações e na experiência personalizada.
Perplexidade
Perplexity é um motor de busca AI, com uma avaliação recente de 14 mil milhões de dólares. A sua principal característica é a capacidade de resumir páginas em tempo real, o que lhe confere uma vantagem na obtenção de informações instantâneas. A Perplexity está a construir um navegador nativo chamado Comet, com o plano de integrar tarefas de AI profundamente na base do navegador.
No entanto, apenas imitar funcionalidades dificilmente representa uma verdadeira ameaça ao Google. O que realmente pode estabelecer uma nova ordem é a reestruturação da arquitetura do navegador desde a base, incorporando LLM profundamente no núcleo do navegador, realizando uma transformação fundamental na forma de interação.
Brave
Brave é um dos primeiros e bem-sucedidos navegadores da indústria Crypto, baseado na arquitetura Chromium. Atraí os usuários com a promessa de privacidade e a possibilidade de ganhar Tokens enquanto navegam. No entanto, a demanda por privacidade ainda está principalmente concentrada em grupos de usuários específicos, dificultando a disrupção dos gigantes existentes.
O plano Brave é atualizar para um navegador de IA focado em privacidade, mas é limitado por ter menos dados dos usuários e um nível de personalização mais baixo. Seu assistente de IA, Leo, é mais parecido com um plug-in e ainda não há uma estratégia clara para uma transição completa para um Agente de IA.
Donut
Donut é um projeto emergente na indústria de criptomoedas, com a visão de realizar uma capacidade integrada de "exploração - decisão - execução nativa de criptografia". Seu núcleo reside na combinação de um caminho de execução automática nativa de criptografia, alinhado com a tendência futura de que agentes possam substituir os motores de busca como principais entradas de tráfego.
Conselhos para empreendedores
Padronização da estrutura da interface: garantir que o produto tenha a capacidade de ser chamado por agentes inteligentes, considerando a padronização e a abstração da estrutura da informação.
Identidade e Acesso: Tornar-se um intermediário confiável ao realizar transações, invocar pagamentos ou ativos como agente de IA.
Reinterpretação do mecanismo de fluxo: da SEO para AEO (Otimização do Motor de Agentes) ou ATF (Cumprimento de Tarefas Agenciais).
Os empreendedores devem reimaginar o produto como componentes de API, permitindo que os agentes não apenas "entendam" isso, mas também "chamem" isso. O foco futuro não é recriar um navegador, mas fazer com que os navegadores existentes sirvam aos agentes, estabelecendo uma ponte para a nova geração de "fluxos de instrução".
Se o Web2 se baseia na UI para captar a atenção dos utilizadores, então a era do Web3 + AI Agent baseia-se na chamada da cadeia para captar a intenção de execução do Agent.