Revolución del navegador en la era de la IA: De la búsqueda a los agentes inteligentes
La tercera guerra de los navegadores está ocurriendo en silencio. Al mirar hacia atrás en la historia, desde Netscape hasta IE, y luego Firefox y Chrome, la lucha entre navegadores ha sido una manifestación concentrada del control de la plataforma y la transformación de los paradigmas tecnológicos. Chrome ha logrado la posición dominante gracias a su velocidad de actualización y a la conexión con el ecosistema, mientras que Google ha formado un ciclo cerrado de entrada de información a través de la estructura de "duopolio" entre el buscador y el navegador.
Sin embargo, este patrón está tambaleándose. El auge de los modelos de lenguaje de gran tamaño (LLM) ha llevado a que cada vez más usuarios completen tareas en la página de resultados de búsqueda con "cero clics", lo que está reduciendo el comportamiento tradicional de hacer clic en páginas web. Al mismo tiempo, los rumores de que Apple tiene la intención de reemplazar el motor de búsqueda predeterminado en Safari amenazan aún más la base de ganancias de Alphabet, y el mercado ha comenzado a mostrar inquietud por la "ortodoxia de la búsqueda".
Los navegadores también están enfrentando una reconfiguración de sus roles. No solo son herramientas para mostrar páginas web, sino que también son contenedores que agrupan múltiples capacidades como la entrada de datos, el comportamiento del usuario y la identidad de privacidad. Aunque los Agentes de IA son poderosos, para completar interacciones complejas en las páginas, acceder a datos de identidad locales y controlar elementos de la página web, aún se necesita el límite de confianza y el sandbox funcional del navegador. Los navegadores están pasando de ser interfaces humanas a convertirse en plataformas de llamadas del sistema para Agentes.
Lo que realmente podría romper el actual panorama del mercado de navegadores no es otro "mejor Chrome", sino una nueva estructura de interacción: no la presentación de la información, sino la invocación de tareas. El futuro de los navegadores debe estar diseñado para el Agente de IA - no solo que pueda leer, sino también escribir y ejecutar. Proyectos como Browser Use están intentando semantizar la estructura de las páginas, convirtiendo la interfaz visual en texto estructurado que puede ser invocado por LLM, logrando así un mapeo de página a instrucción y reduciendo drásticamente el costo de interacción.
Los proyectos principales en el mercado han comenzado a experimentar: Perplexity está construyendo el navegador nativo Comet, utilizando IA en lugar de resultados de búsqueda tradicionales; Brave combina la protección de la privacidad con el razonamiento local, mejorando las funciones de búsqueda y bloqueo con LLM; mientras que proyectos nativos de Crypto como Donut apuntan a una nueva entrada para la interacción entre IA y activos en cadena. La característica común de estos proyectos es que intentan reconstruir el extremo de entrada del navegador, en lugar de embellecer su capa de salida.
Para los emprendedores, las oportunidades se encuentran en la relación triangular entre la entrada, la estructura y el agente. El navegador, como la interfaz que invoca el mundo en el futuro, significa que quien pueda proporcionar "bloques de capacidad" que sean estructurables, invocables y de confianza, podrá convertirse en parte de la nueva generación de plataformas. Desde SEO hasta AEO (Optimización del Motor de Agentes), desde el tráfico de páginas hasta la invocación de cadenas de tareas, las formas de producto y el pensamiento de diseño están siendo reconstruidos. La tercera guerra de los navegadores ocurre en la "entrada" y no en la "exhibición"; lo que determina la victoria ya no es quién capta la atención del usuario, sino quién gana la confianza del agente y obtiene la entrada a la invocación.
La arquitectura obsoleta de los navegadores modernos
El flujo de trabajo típico del motor de búsqueda de Google incluye los siguientes pasos clave:
Entrada del cliente en el frontend: consulta el Google Front End más cercano entregado a través de HTTPS, completa la descifrado TLS, muestreo de QoS y enrutamiento geográfico.
Comprensión de la consulta: el frontend necesita entender el significado de las palabras que el usuario escribe, incluyendo la corrección ortográfica, la expansión de sinónimos y la interpretación de intenciones.
Recuperación de candidatos: Google utiliza la técnica de índices invertidos y de índices vectoriales para realizar una selección preliminar, filtrando alrededor de cien mil páginas candidatas de una gran cantidad de páginas web.
Clasificación por múltiples niveles: A través de características ligeras como BM25 y TF-IDF, se reduce el número de páginas candidatas a aproximadamente 1000.
Ordenación principal del aprendizaje profundo: utilizar tecnologías como RankBrain y Neural Matching para la comprensión semántica y la coincidencia de relevancia.
Reordenamiento profundo: se utiliza el modelo BERT para realizar un ordenamiento más preciso de los documentos preliminarmente seleccionados.
Sin embargo, en la era de la IA y los grandes datos, los usuarios han generado nuevas demandas de interacción con el navegador, y la arquitectura tradicional ya no es suficiente para satisfacer estos cambios.
¿Por qué la IA está redefiniendo los navegadores?
El navegador, como plataforma universal, no solo es la entrada para leer datos, sino también la entrada universal para ingresar datos. Los usuarios necesitan interactuar con los datos, y el navegador es un lugar excelente para almacenar las huellas digitales de los usuarios. Los comportamientos complejos de los usuarios y los comportamientos automatizados deben llevarse a cabo a través del navegador.
El modo de interacción del futuro podría evolucionar a: usuario → invocación del agente de IA → navegador.
El navegador es un lugar de almacenamiento de contenido personalizado:
La mayoría de los modelos grandes están alojados en la nube, lo que dificulta la llamada directa a los datos sensibles locales.
Todos los datos enviados a un modelo de terceros deben obtener nuevamente la autorización del usuario.
Muchas operaciones deben completarse dentro del sandbox del navegador.
El contexto de los datos depende en gran medida del navegador.
Transformación profunda de la forma de interacción
Los grandes modelos de IA han cambiado profundamente la eficiencia y la forma en que leemos los datos. Las investigaciones muestran que cerca del 63% de las consultas en Google son comportamientos de "cero clics", donde los usuarios suelen obtener información directamente de la página de resultados de búsqueda.
Sin embargo, los navegadores de IA aún necesitan explorar formas de interacción adecuadas, especialmente en lo que respecta a la lectura de datos, ya que el "problema de alucinación" de los modelos grandes aún no se ha erradicado.
Lo que realmente podría desencadenar una transformación masiva en los navegadores es la capa de interacción de datos. Los usuarios tienden cada vez más a describir tareas complejas en lenguaje natural, y estas Tareas Agénticas están siendo gradualmente asumidas por Agentes de IA.
El navegador del futuro debe ser diseñado para la automatización total, considerando cómo equilibrar la experiencia de lectura humana con la legibilidad para agentes de IA, así como cómo servir simultáneamente a los usuarios y a los modelos de agentes en la misma página.
Análisis de proyectos principales de navegadores AI
Uso del navegador
Browser Use ha construido una capa semántica en el verdadero sentido de la palabra, estableciendo una arquitectura de reconocimiento semántico para la próxima generación de navegadores. Re-decoding el DOM tradicional en "DOM semántico", permite que los agentes operen con precisión sin necesidad de "coordenadas de puntos de visualización". Este enfoque reemplaza el "texto estructurado → llamada de función" en lugar de OCR visual o Selenium de coordenadas, ejecutándose más rápido, utilizando menos tokens y cometiendo menos errores.
Arc (La Empresa del Navegador)
La compañía Browser planea centrarse en el navegador DIA completamente orientado a la IA. Sin embargo, algunas de sus predicciones sobre el futuro del mercado de navegadores son discutibles. En particular, la opinión de que las páginas web ya no serán la principal interfaz de interacción podría subestimar el papel central del navegador en la presentación de información y en la experiencia personalizada.
Perplejidad
Perplexity es un motor de búsqueda de IA, con una valoración reciente de 14 mil millones de dólares. Su característica principal es que puede resumir páginas en tiempo real, lo que le da una ventaja en la obtención de información instantánea. Perplexity está construyendo un navegador nativo llamado Comet, con el plan de integrar tareas de IA profundamente en el núcleo del navegador.
Sin embargo, la mera imitación de funciones no puede constituir una verdadera amenaza para Google. Lo que realmente podría establecer un nuevo orden sería la reconstrucción desde la base de la arquitectura del navegador, integrando profundamente los LLM en el núcleo del navegador, logrando un cambio radical en la forma de interacción.
Valiente
Brave es un navegador exitoso y de los primeros en la industria de las criptomonedas, basado en la arquitectura Chromium. Su enfoque en la privacidad y en ganar Tokens a través de la navegación atrae a los usuarios. Sin embargo, la demanda de privacidad sigue concentrada principalmente en grupos de usuarios específicos, lo que dificulta desafiar a los gigantes existentes.
El plan de Brave es actualizarse a un navegador de IA centrado en la privacidad, pero se ve limitado por la obtención de pocos datos de los usuarios y un bajo nivel de personalización. Su asistente de IA, Leo, se asemeja más a un complemento externo y aún no tiene una estrategia clara para convertirse en un Agente de IA.
Donut
Donut es un proyecto emergente en la industria de las criptomonedas, con la visión de lograr una capacidad integrada de "exploración - decisión - ejecución nativa de criptografía". Su núcleo radica en combinar caminos de ejecución automática nativos de criptografía, alineándose con la tendencia futura de que los agentes podrían reemplazar los motores de búsqueda como la principal entrada de tráfico.
Consejos para emprendedores
Estandarización de la estructura de la interfaz: asegurar que el producto tenga la capacidad de ser llamado por agentes inteligentes, considerando la estandarización y abstracción de la estructura de la información.
Identidad y acceso: convertirse en un intermediario confiable al completar transacciones, invocar pagos o activos como agente de IA.
Nueva comprensión del mecanismo de tráfico: pasar de SEO a AEO (Optimización del Motor de Agentes) o ATF (Cumplimiento de Tareas Agenciales).
Los emprendedores deben reimaginar el producto como un componente de API, permitiendo que los agentes no solo "entiendan" sino que también "llamen" a él. El enfoque futuro no es recrear un navegador, sino hacer que los navegadores existentes sirvan a los agentes, estableciendo puentes para la nueva generación de "flujos de instrucciones".
Si Web2 se basa en la interfaz de usuario para captar la atención de los usuarios, entonces la era de Web3 + AI Agent se basa en invocar la cadena para captar la intención de ejecución del agente.
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
8 me gusta
Recompensa
8
6
Republicar
Compartir
Comentar
0/400
MEVHunterLucky
· hace8h
Si te quedas atrás, recibirás golpes. Si el navegador no se reforma, se quedará atrás.
Ver originalesResponder0
EyeOfTheTokenStorm
· 08-14 20:15
Desde el punto de vista técnico, Google ya muestra signos de debilidad, se recomienda a todos seguir las oportunidades en nuevas áreas, comercio intradía como enfoque principal.
Ver originalesResponder0
SchroedingerMiner
· 08-14 20:13
La industria de los navegadores va a revolucionarse.
Ver originalesResponder0
SchrodingerGas
· 08-14 20:11
Ha comenzado otra ronda de la reestructuración del mercado. Lo mejor está por venir.
Ver originalesResponder0
TokenVelocityTrauma
· 08-14 19:53
Chrome aún tiene que morir.
Ver originalesResponder0
OnChain_Detective
· 08-14 19:51
sospechoso af... esta guerra de navegadores parece otro intento de poder por parte de gran tecnología. mantente alerta familia
Revolución del navegador en la era de la IA: de motores de búsqueda a plataformas de agentes inteligentes
Revolución del navegador en la era de la IA: De la búsqueda a los agentes inteligentes
La tercera guerra de los navegadores está ocurriendo en silencio. Al mirar hacia atrás en la historia, desde Netscape hasta IE, y luego Firefox y Chrome, la lucha entre navegadores ha sido una manifestación concentrada del control de la plataforma y la transformación de los paradigmas tecnológicos. Chrome ha logrado la posición dominante gracias a su velocidad de actualización y a la conexión con el ecosistema, mientras que Google ha formado un ciclo cerrado de entrada de información a través de la estructura de "duopolio" entre el buscador y el navegador.
Sin embargo, este patrón está tambaleándose. El auge de los modelos de lenguaje de gran tamaño (LLM) ha llevado a que cada vez más usuarios completen tareas en la página de resultados de búsqueda con "cero clics", lo que está reduciendo el comportamiento tradicional de hacer clic en páginas web. Al mismo tiempo, los rumores de que Apple tiene la intención de reemplazar el motor de búsqueda predeterminado en Safari amenazan aún más la base de ganancias de Alphabet, y el mercado ha comenzado a mostrar inquietud por la "ortodoxia de la búsqueda".
Los navegadores también están enfrentando una reconfiguración de sus roles. No solo son herramientas para mostrar páginas web, sino que también son contenedores que agrupan múltiples capacidades como la entrada de datos, el comportamiento del usuario y la identidad de privacidad. Aunque los Agentes de IA son poderosos, para completar interacciones complejas en las páginas, acceder a datos de identidad locales y controlar elementos de la página web, aún se necesita el límite de confianza y el sandbox funcional del navegador. Los navegadores están pasando de ser interfaces humanas a convertirse en plataformas de llamadas del sistema para Agentes.
Lo que realmente podría romper el actual panorama del mercado de navegadores no es otro "mejor Chrome", sino una nueva estructura de interacción: no la presentación de la información, sino la invocación de tareas. El futuro de los navegadores debe estar diseñado para el Agente de IA - no solo que pueda leer, sino también escribir y ejecutar. Proyectos como Browser Use están intentando semantizar la estructura de las páginas, convirtiendo la interfaz visual en texto estructurado que puede ser invocado por LLM, logrando así un mapeo de página a instrucción y reduciendo drásticamente el costo de interacción.
Los proyectos principales en el mercado han comenzado a experimentar: Perplexity está construyendo el navegador nativo Comet, utilizando IA en lugar de resultados de búsqueda tradicionales; Brave combina la protección de la privacidad con el razonamiento local, mejorando las funciones de búsqueda y bloqueo con LLM; mientras que proyectos nativos de Crypto como Donut apuntan a una nueva entrada para la interacción entre IA y activos en cadena. La característica común de estos proyectos es que intentan reconstruir el extremo de entrada del navegador, en lugar de embellecer su capa de salida.
Para los emprendedores, las oportunidades se encuentran en la relación triangular entre la entrada, la estructura y el agente. El navegador, como la interfaz que invoca el mundo en el futuro, significa que quien pueda proporcionar "bloques de capacidad" que sean estructurables, invocables y de confianza, podrá convertirse en parte de la nueva generación de plataformas. Desde SEO hasta AEO (Optimización del Motor de Agentes), desde el tráfico de páginas hasta la invocación de cadenas de tareas, las formas de producto y el pensamiento de diseño están siendo reconstruidos. La tercera guerra de los navegadores ocurre en la "entrada" y no en la "exhibición"; lo que determina la victoria ya no es quién capta la atención del usuario, sino quién gana la confianza del agente y obtiene la entrada a la invocación.
La arquitectura obsoleta de los navegadores modernos
El flujo de trabajo típico del motor de búsqueda de Google incluye los siguientes pasos clave:
Entrada del cliente en el frontend: consulta el Google Front End más cercano entregado a través de HTTPS, completa la descifrado TLS, muestreo de QoS y enrutamiento geográfico.
Comprensión de la consulta: el frontend necesita entender el significado de las palabras que el usuario escribe, incluyendo la corrección ortográfica, la expansión de sinónimos y la interpretación de intenciones.
Recuperación de candidatos: Google utiliza la técnica de índices invertidos y de índices vectoriales para realizar una selección preliminar, filtrando alrededor de cien mil páginas candidatas de una gran cantidad de páginas web.
Clasificación por múltiples niveles: A través de características ligeras como BM25 y TF-IDF, se reduce el número de páginas candidatas a aproximadamente 1000.
Ordenación principal del aprendizaje profundo: utilizar tecnologías como RankBrain y Neural Matching para la comprensión semántica y la coincidencia de relevancia.
Reordenamiento profundo: se utiliza el modelo BERT para realizar un ordenamiento más preciso de los documentos preliminarmente seleccionados.
Sin embargo, en la era de la IA y los grandes datos, los usuarios han generado nuevas demandas de interacción con el navegador, y la arquitectura tradicional ya no es suficiente para satisfacer estos cambios.
¿Por qué la IA está redefiniendo los navegadores?
El navegador, como plataforma universal, no solo es la entrada para leer datos, sino también la entrada universal para ingresar datos. Los usuarios necesitan interactuar con los datos, y el navegador es un lugar excelente para almacenar las huellas digitales de los usuarios. Los comportamientos complejos de los usuarios y los comportamientos automatizados deben llevarse a cabo a través del navegador.
El modo de interacción del futuro podría evolucionar a: usuario → invocación del agente de IA → navegador.
El navegador es un lugar de almacenamiento de contenido personalizado:
Transformación profunda de la forma de interacción
Los grandes modelos de IA han cambiado profundamente la eficiencia y la forma en que leemos los datos. Las investigaciones muestran que cerca del 63% de las consultas en Google son comportamientos de "cero clics", donde los usuarios suelen obtener información directamente de la página de resultados de búsqueda.
Sin embargo, los navegadores de IA aún necesitan explorar formas de interacción adecuadas, especialmente en lo que respecta a la lectura de datos, ya que el "problema de alucinación" de los modelos grandes aún no se ha erradicado.
Lo que realmente podría desencadenar una transformación masiva en los navegadores es la capa de interacción de datos. Los usuarios tienden cada vez más a describir tareas complejas en lenguaje natural, y estas Tareas Agénticas están siendo gradualmente asumidas por Agentes de IA.
El navegador del futuro debe ser diseñado para la automatización total, considerando cómo equilibrar la experiencia de lectura humana con la legibilidad para agentes de IA, así como cómo servir simultáneamente a los usuarios y a los modelos de agentes en la misma página.
Análisis de proyectos principales de navegadores AI
Uso del navegador
Browser Use ha construido una capa semántica en el verdadero sentido de la palabra, estableciendo una arquitectura de reconocimiento semántico para la próxima generación de navegadores. Re-decoding el DOM tradicional en "DOM semántico", permite que los agentes operen con precisión sin necesidad de "coordenadas de puntos de visualización". Este enfoque reemplaza el "texto estructurado → llamada de función" en lugar de OCR visual o Selenium de coordenadas, ejecutándose más rápido, utilizando menos tokens y cometiendo menos errores.
Arc (La Empresa del Navegador)
La compañía Browser planea centrarse en el navegador DIA completamente orientado a la IA. Sin embargo, algunas de sus predicciones sobre el futuro del mercado de navegadores son discutibles. En particular, la opinión de que las páginas web ya no serán la principal interfaz de interacción podría subestimar el papel central del navegador en la presentación de información y en la experiencia personalizada.
Perplejidad
Perplexity es un motor de búsqueda de IA, con una valoración reciente de 14 mil millones de dólares. Su característica principal es que puede resumir páginas en tiempo real, lo que le da una ventaja en la obtención de información instantánea. Perplexity está construyendo un navegador nativo llamado Comet, con el plan de integrar tareas de IA profundamente en el núcleo del navegador.
Sin embargo, la mera imitación de funciones no puede constituir una verdadera amenaza para Google. Lo que realmente podría establecer un nuevo orden sería la reconstrucción desde la base de la arquitectura del navegador, integrando profundamente los LLM en el núcleo del navegador, logrando un cambio radical en la forma de interacción.
Valiente
Brave es un navegador exitoso y de los primeros en la industria de las criptomonedas, basado en la arquitectura Chromium. Su enfoque en la privacidad y en ganar Tokens a través de la navegación atrae a los usuarios. Sin embargo, la demanda de privacidad sigue concentrada principalmente en grupos de usuarios específicos, lo que dificulta desafiar a los gigantes existentes.
El plan de Brave es actualizarse a un navegador de IA centrado en la privacidad, pero se ve limitado por la obtención de pocos datos de los usuarios y un bajo nivel de personalización. Su asistente de IA, Leo, se asemeja más a un complemento externo y aún no tiene una estrategia clara para convertirse en un Agente de IA.
Donut
Donut es un proyecto emergente en la industria de las criptomonedas, con la visión de lograr una capacidad integrada de "exploración - decisión - ejecución nativa de criptografía". Su núcleo radica en combinar caminos de ejecución automática nativos de criptografía, alineándose con la tendencia futura de que los agentes podrían reemplazar los motores de búsqueda como la principal entrada de tráfico.
Consejos para emprendedores
Estandarización de la estructura de la interfaz: asegurar que el producto tenga la capacidad de ser llamado por agentes inteligentes, considerando la estandarización y abstracción de la estructura de la información.
Identidad y acceso: convertirse en un intermediario confiable al completar transacciones, invocar pagos o activos como agente de IA.
Nueva comprensión del mecanismo de tráfico: pasar de SEO a AEO (Optimización del Motor de Agentes) o ATF (Cumplimiento de Tareas Agenciales).
Los emprendedores deben reimaginar el producto como un componente de API, permitiendo que los agentes no solo "entiendan" sino que también "llamen" a él. El enfoque futuro no es recrear un navegador, sino hacer que los navegadores existentes sirvan a los agentes, estableciendo puentes para la nueva generación de "flujos de instrucciones".
Si Web2 se basa en la interfaz de usuario para captar la atención de los usuarios, entonces la era de Web3 + AI Agent se basa en invocar la cadena para captar la intención de ejecución del agente.