La révolution des navigateurs à l'ère de l'IA : de la recherche aux agents intelligents
La troisième guerre des navigateurs est en train de se dérouler discrètement. En regardant l'histoire, de Netscape à IE, puis à Firefox et Chrome, la bataille des navigateurs a toujours été une expression concentrée du contrôle de la plateforme et des changements de paradigme technologique. Chrome a acquis une position dominante grâce à sa rapidité de mise à jour et à ses liens écologiques, tandis que Google, à travers la structure "duopole" de recherche et de navigateur, a formé une boucle fermée d'accès à l'information.
Cependant, cette configuration est en train de vaciller. L'émergence des modèles de langage de grande taille (LLM) permet à de plus en plus d'utilisateurs d'accomplir des tâches sur la page de résultats de recherche sans cliquer, ce qui réduit le comportement traditionnel de clic sur les pages web. Parallèlement, les rumeurs selon lesquelles Apple envisage de remplacer le moteur de recherche par défaut dans Safari menacent encore davantage les bases des bénéfices d'Alphabet, et le marché commence à montrer des signes d'inquiétude face à la "doctrine de la recherche".
Le navigateur lui-même fait également face à une reconfiguration de son rôle. Il n'est pas seulement un outil pour afficher des pages web, mais aussi un conteneur polyvalent pour des capacités telles que l'entrée de données, le comportement des utilisateurs et l'identité privée. Bien que l'agent AI soit puissant, pour réaliser des interactions complexes sur les pages, accéder aux données d'identité locales et contrôler les éléments des pages web, il doit encore s'appuyer sur les frontières de confiance et le bac à sable fonctionnel du navigateur. Le navigateur est en train de passer d'une interface humaine à une plateforme d'appels système pour les agents.
Ce qui pourrait vraiment briser le paysage actuel du marché des navigateurs n'est pas un autre "meilleur Chrome", mais une nouvelle structure d'interaction : ce n'est pas l'affichage de l'information, mais l'appel à des tâches. Les navigateurs futurs doivent être conçus pour les agents IA - capables non seulement de lire, mais aussi d'écrire et d'exécuter. Des projets comme Browser Use tentent de sémantiser la structure des pages, transformant les interfaces visuelles en textes structurés pouvant être appelés par des LLM, réalisant ainsi la cartographie des pages aux instructions, ce qui réduit considérablement le coût d'interaction.
Les projets principaux sur le marché ont commencé à explorer : Perplexity construit un navigateur natif Comet, remplaçant les résultats de recherche traditionnels par de l'IA ; Brave combine la protection de la vie privée avec le raisonnement local, améliorant la recherche et les fonctions de blocage grâce à LLM ; tandis que des projets natifs comme Donut visent à établir une nouvelle entrée pour l'interaction entre l'IA et les actifs sur la chaîne. Ces projets ont en commun de tenter de reconstruire l'entrée du navigateur, plutôt que d'embellir sa couche de sortie.
Pour les entrepreneurs, les opportunités se cachent dans la relation triangulaire entre l'entrée, la structure et l'agent. Le navigateur, en tant qu'interface d'appel du monde pour les agents futurs, signifie que ceux qui peuvent fournir des "blocs de capacité" structurés, appelables et dignes de confiance pourront faire partie de la nouvelle génération de plateformes. De l'optimisation SEO à l'optimisation AEO (Agent Engine Optimization), du trafic de page à l'appel de chaînes de tâches, la forme et la pensée de conception des produits sont en cours de reconstruction. La troisième guerre des navigateurs se joue sur "l'entrée" plutôt que sur "l'affichage" ; ce n'est plus celui qui attire l'œil de l'utilisateur qui décide du vainqueur, mais celui qui gagne la confiance de l'agent et obtient l'entrée d'appel.
Ancienne architecture des navigateurs modernes
Le workflow typique d'un moteur de recherche Google comprend les étapes clés suivantes :
Point d'entrée du client côté front : interroger le Google Front End le plus proche envoyé par HTTPS, compléter le déchiffrement TLS, l'échantillonnage QoS et le routage géographique.
Compréhension de la recherche : Le front-end doit comprendre le sens des mots saisis par l'utilisateur, y compris la correction orthographique, l'expansion des synonymes et l'analyse des intentions.
Rappel des candidats : Google utilise des techniques d'indexation inversée et d'indexation vectorielle pour effectuer un premier filtrage, sélectionnant environ cent mille pages candidates parmi un grand nombre de pages web.
Tri multi-niveaux : Réduire le nombre de pages candidates à environ 1000 à l'aide de légères caractéristiques telles que BM25 et TF-IDF.
Apprentissage profond de l'ordre principal : utilisation de technologies telles que RankBrain et Neural Matching pour la compréhension sémantique et le matching de pertinence.
Réorganisation approfondie : utilisation du modèle BERT pour un classement plus précis des documents préalablement sélectionnés.
Cependant, à l'ère de l'IA et des Big Data, les utilisateurs ont de nouveaux besoins en matière d'interaction avec les navigateurs, et l'architecture traditionnelle ne suffit plus à répondre à ces changements.
Pourquoi l'IA va remodeler les navigateurs
Le navigateur, en tant que plateforme universelle, n'est pas seulement une porte d'entrée pour lire les données, mais aussi une porte d'entrée universelle pour saisir des données. Les utilisateurs doivent interagir avec les données, et le navigateur est un endroit idéal pour stocker les empreintes digitales des utilisateurs. Les comportements complexes des utilisateurs et les comportements automatisés doivent se faire via le navigateur.
Les modes d'interaction futurs pourraient évoluer comme suit : utilisateur → appel de l'agent IA → navigateur.
Le navigateur est un lieu de stockage de contenu personnalisé :
La plupart des grands modèles sont hébergés dans le cloud, ce qui rend difficile l'appel direct des données sensibles sur l'appareil.
Toutes les données envoyées à un modèle tiers doivent être réautorisées par l'utilisateur.
De nombreuses opérations doivent être effectuées dans le bac à sable du navigateur.
Le contexte des données dépend fortement du navigateur.
Profonde transformation des formes d'interaction
Les grands modèles d'IA ont profondément changé notre efficacité et notre manière de lire les données. Des études montrent que près de 63 % des recherches sur Google sont des comportements de "zéro clic", les utilisateurs ayant l'habitude d'obtenir des informations directement à partir de la page de résultats de recherche.
Cependant, les navigateurs AI doivent encore explorer des formes d'interaction appropriées, en particulier en ce qui concerne la lecture des données, car le "problème d'illusion" des grands modèles n'est pas encore résolu.
La véritable couche susceptible de déclencher une transformation massive des navigateurs est celle de l'interaction des données. Les utilisateurs sont de plus en plus enclins à utiliser un langage naturel pour décrire des tâches complexes, et ces tâches agentiques sont progressivement prises en charge par des agents IA.
Les navigateurs de demain doivent être conçus pour une automatisation totale, en tenant compte de la manière de concilier l'expérience de lecture humaine et la lisibilité par les agents IA, ainsi que la façon de servir à la fois l'utilisateur et le modèle d'agent sur la même page.
Analyse des principaux projets de navigateur AI
Utilisation du navigateur
Browser Use a construit un véritable niveau sémantique, créant une architecture de reconnaissance sémantique pour la prochaine génération de navigateurs. Il redécodera le DOM traditionnel en "DOM sémantique", permettant aux agents d'opérer avec précision sans avoir besoin de "coordonnées de points de vue". Cette méthode remplace l'OCR visuel ou Selenium par "texte structuré → appel de fonction", offrant une exécution plus rapide, une consommation de jetons réduite et moins d'erreurs.
Arc (La Société du Navigateur)
La Browser Company prévoit de se concentrer sur un navigateur entièrement axé sur l'IA, le DIA. Cependant, certaines de ses prévisions concernant le marché futur des navigateurs sont discutables. En particulier, l'idée que les pages Web ne seront plus l'interface principale d'interaction pourrait sous-estimer le rôle central du navigateur dans la présentation de l'information et l'expérience personnalisée.
Perplexité
Perplexity est un moteur de recherche AI, dont la dernière évaluation atteint 14 milliards de dollars. Il se caractérise par sa capacité à résumer les pages en temps réel, ce qui lui confère un avantage dans l'obtention d'informations instantanées. Perplexity est en train de construire un navigateur natif, Comet, avec l'intention d'intégrer des tâches d'IA profondément dans le noyau du navigateur.
Cependant, il est difficile de constituer une véritable menace pour Google uniquement par une imitation des fonctionnalités. La véritable possibilité d'établir un nouvel ordre résidera dans la reconstruction de l'architecture du navigateur à la base, en intégrant profondément les LLM dans le noyau du navigateur, et en réalisant une transformation fondamentale des modes d'interaction.
Brave
Brave est un navigateur précoce et réussi dans l'industrie de la crypto, basé sur l'architecture Chromium. Il attire les utilisateurs en s'appuyant sur la confidentialité et en permettant de gagner des Tokens. Cependant, la demande de confidentialité reste principalement centrée sur un groupe d'utilisateurs spécifique, ce qui rend difficile de renverser les géants existants.
Le projet Brave prévoit de passer à un navigateur AI axé sur la confidentialité, mais il est limité par la collecte de données utilisateur faible et un faible degré de personnalisation. Son assistant AI Leo ressemble davantage à un plugin externe, sans stratégie claire pour une transition complète vers un agent AI.
Donut
Donut est un projet émergent dans l'industrie de la crypto, dont la vision est de réaliser une capacité intégrée d'"exploration - décision - exécution native de la cryptographie". Son cœur réside dans la combinaison de chemins d'exécution automatique natifs à la cryptographie, en accord avec la tendance selon laquelle les agents pourraient remplacer les moteurs de recherche en tant que principal point d'entrée de trafic à l'avenir.
Conseils pour les entrepreneurs
Normalisation de la structure des interfaces : s'assurer que le produit a la capacité d'être appelé par des agents intelligents, en tenant compte de la normalisation et de l'abstraction de la structure de l'information.
Identité et passage : devenir un intermédiaire de confiance lors de l'exécution de transactions, de l'appel de paiements ou d'actifs en tant qu'agent AI.
Nouvelle compréhension du mécanisme de flux : passer du SEO à l'AEO (Agent Engine Optimization) ou à l'ATF (Agentic Task Fulfilment).
Les entrepreneurs devraient réimaginer leurs produits en tant que composants API, permettant aux agents non seulement de les "comprendre", mais aussi de les "appeler". L'accent dans le futur ne sera pas sur la création d'un nouveau navigateur, mais sur la mise au service des navigateurs existants pour les agents, établissant un pont pour la nouvelle génération de "flux d'instructions".
Si le Web2 attire l'attention des utilisateurs grâce à l'interface utilisateur, alors l'ère Web3 + Agent IA attire l'intention d'exécution des agents grâce à l'appel de la chaîne.
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
8 J'aime
Récompense
8
6
Reposter
Partager
Commentaire
0/400
MEVHunterLucky
· Il y a 12m
Si on reste à la traîne, on va se faire frapper. Si le navigateur ne se réforme pas, il va disparaître.
Voir l'originalRépondre0
EyeOfTheTokenStorm
· Il y a 18h
D'un point de vue technique, Google montre déjà des signes de faiblesse. Je conseille à tout le monde de suivre les opportunités dans de nouveaux secteurs, en faisant du day trading.
Voir l'originalRépondre0
SchroedingerMiner
· Il y a 18h
L'industrie des navigateurs va connaître une révolution.
Voir l'originalRépondre0
SchrodingerGas
· Il y a 18h
Une nouvelle ronde de jeux de reconstruction du marché a commencé. Le meilleur est à venir.
Voir l'originalRépondre0
TokenVelocityTrauma
· Il y a 18h
Chrome doit encore mourir.
Voir l'originalRépondre0
OnChain_Detective
· Il y a 18h
suspect af... cette guerre des navigateurs ressemble à une nouvelle prise de pouvoir par les grandes technologies. restez vigilants fam
Révolution des navigateurs à l'ère de l'IA : des moteurs de recherche à la plateforme d'agents intelligents
La révolution des navigateurs à l'ère de l'IA : de la recherche aux agents intelligents
La troisième guerre des navigateurs est en train de se dérouler discrètement. En regardant l'histoire, de Netscape à IE, puis à Firefox et Chrome, la bataille des navigateurs a toujours été une expression concentrée du contrôle de la plateforme et des changements de paradigme technologique. Chrome a acquis une position dominante grâce à sa rapidité de mise à jour et à ses liens écologiques, tandis que Google, à travers la structure "duopole" de recherche et de navigateur, a formé une boucle fermée d'accès à l'information.
Cependant, cette configuration est en train de vaciller. L'émergence des modèles de langage de grande taille (LLM) permet à de plus en plus d'utilisateurs d'accomplir des tâches sur la page de résultats de recherche sans cliquer, ce qui réduit le comportement traditionnel de clic sur les pages web. Parallèlement, les rumeurs selon lesquelles Apple envisage de remplacer le moteur de recherche par défaut dans Safari menacent encore davantage les bases des bénéfices d'Alphabet, et le marché commence à montrer des signes d'inquiétude face à la "doctrine de la recherche".
Le navigateur lui-même fait également face à une reconfiguration de son rôle. Il n'est pas seulement un outil pour afficher des pages web, mais aussi un conteneur polyvalent pour des capacités telles que l'entrée de données, le comportement des utilisateurs et l'identité privée. Bien que l'agent AI soit puissant, pour réaliser des interactions complexes sur les pages, accéder aux données d'identité locales et contrôler les éléments des pages web, il doit encore s'appuyer sur les frontières de confiance et le bac à sable fonctionnel du navigateur. Le navigateur est en train de passer d'une interface humaine à une plateforme d'appels système pour les agents.
Ce qui pourrait vraiment briser le paysage actuel du marché des navigateurs n'est pas un autre "meilleur Chrome", mais une nouvelle structure d'interaction : ce n'est pas l'affichage de l'information, mais l'appel à des tâches. Les navigateurs futurs doivent être conçus pour les agents IA - capables non seulement de lire, mais aussi d'écrire et d'exécuter. Des projets comme Browser Use tentent de sémantiser la structure des pages, transformant les interfaces visuelles en textes structurés pouvant être appelés par des LLM, réalisant ainsi la cartographie des pages aux instructions, ce qui réduit considérablement le coût d'interaction.
Les projets principaux sur le marché ont commencé à explorer : Perplexity construit un navigateur natif Comet, remplaçant les résultats de recherche traditionnels par de l'IA ; Brave combine la protection de la vie privée avec le raisonnement local, améliorant la recherche et les fonctions de blocage grâce à LLM ; tandis que des projets natifs comme Donut visent à établir une nouvelle entrée pour l'interaction entre l'IA et les actifs sur la chaîne. Ces projets ont en commun de tenter de reconstruire l'entrée du navigateur, plutôt que d'embellir sa couche de sortie.
Pour les entrepreneurs, les opportunités se cachent dans la relation triangulaire entre l'entrée, la structure et l'agent. Le navigateur, en tant qu'interface d'appel du monde pour les agents futurs, signifie que ceux qui peuvent fournir des "blocs de capacité" structurés, appelables et dignes de confiance pourront faire partie de la nouvelle génération de plateformes. De l'optimisation SEO à l'optimisation AEO (Agent Engine Optimization), du trafic de page à l'appel de chaînes de tâches, la forme et la pensée de conception des produits sont en cours de reconstruction. La troisième guerre des navigateurs se joue sur "l'entrée" plutôt que sur "l'affichage" ; ce n'est plus celui qui attire l'œil de l'utilisateur qui décide du vainqueur, mais celui qui gagne la confiance de l'agent et obtient l'entrée d'appel.
Ancienne architecture des navigateurs modernes
Le workflow typique d'un moteur de recherche Google comprend les étapes clés suivantes :
Point d'entrée du client côté front : interroger le Google Front End le plus proche envoyé par HTTPS, compléter le déchiffrement TLS, l'échantillonnage QoS et le routage géographique.
Compréhension de la recherche : Le front-end doit comprendre le sens des mots saisis par l'utilisateur, y compris la correction orthographique, l'expansion des synonymes et l'analyse des intentions.
Rappel des candidats : Google utilise des techniques d'indexation inversée et d'indexation vectorielle pour effectuer un premier filtrage, sélectionnant environ cent mille pages candidates parmi un grand nombre de pages web.
Tri multi-niveaux : Réduire le nombre de pages candidates à environ 1000 à l'aide de légères caractéristiques telles que BM25 et TF-IDF.
Apprentissage profond de l'ordre principal : utilisation de technologies telles que RankBrain et Neural Matching pour la compréhension sémantique et le matching de pertinence.
Réorganisation approfondie : utilisation du modèle BERT pour un classement plus précis des documents préalablement sélectionnés.
Cependant, à l'ère de l'IA et des Big Data, les utilisateurs ont de nouveaux besoins en matière d'interaction avec les navigateurs, et l'architecture traditionnelle ne suffit plus à répondre à ces changements.
Pourquoi l'IA va remodeler les navigateurs
Le navigateur, en tant que plateforme universelle, n'est pas seulement une porte d'entrée pour lire les données, mais aussi une porte d'entrée universelle pour saisir des données. Les utilisateurs doivent interagir avec les données, et le navigateur est un endroit idéal pour stocker les empreintes digitales des utilisateurs. Les comportements complexes des utilisateurs et les comportements automatisés doivent se faire via le navigateur.
Les modes d'interaction futurs pourraient évoluer comme suit : utilisateur → appel de l'agent IA → navigateur.
Le navigateur est un lieu de stockage de contenu personnalisé :
Profonde transformation des formes d'interaction
Les grands modèles d'IA ont profondément changé notre efficacité et notre manière de lire les données. Des études montrent que près de 63 % des recherches sur Google sont des comportements de "zéro clic", les utilisateurs ayant l'habitude d'obtenir des informations directement à partir de la page de résultats de recherche.
Cependant, les navigateurs AI doivent encore explorer des formes d'interaction appropriées, en particulier en ce qui concerne la lecture des données, car le "problème d'illusion" des grands modèles n'est pas encore résolu.
La véritable couche susceptible de déclencher une transformation massive des navigateurs est celle de l'interaction des données. Les utilisateurs sont de plus en plus enclins à utiliser un langage naturel pour décrire des tâches complexes, et ces tâches agentiques sont progressivement prises en charge par des agents IA.
Les navigateurs de demain doivent être conçus pour une automatisation totale, en tenant compte de la manière de concilier l'expérience de lecture humaine et la lisibilité par les agents IA, ainsi que la façon de servir à la fois l'utilisateur et le modèle d'agent sur la même page.
Analyse des principaux projets de navigateur AI
Utilisation du navigateur
Browser Use a construit un véritable niveau sémantique, créant une architecture de reconnaissance sémantique pour la prochaine génération de navigateurs. Il redécodera le DOM traditionnel en "DOM sémantique", permettant aux agents d'opérer avec précision sans avoir besoin de "coordonnées de points de vue". Cette méthode remplace l'OCR visuel ou Selenium par "texte structuré → appel de fonction", offrant une exécution plus rapide, une consommation de jetons réduite et moins d'erreurs.
Arc (La Société du Navigateur)
La Browser Company prévoit de se concentrer sur un navigateur entièrement axé sur l'IA, le DIA. Cependant, certaines de ses prévisions concernant le marché futur des navigateurs sont discutables. En particulier, l'idée que les pages Web ne seront plus l'interface principale d'interaction pourrait sous-estimer le rôle central du navigateur dans la présentation de l'information et l'expérience personnalisée.
Perplexité
Perplexity est un moteur de recherche AI, dont la dernière évaluation atteint 14 milliards de dollars. Il se caractérise par sa capacité à résumer les pages en temps réel, ce qui lui confère un avantage dans l'obtention d'informations instantanées. Perplexity est en train de construire un navigateur natif, Comet, avec l'intention d'intégrer des tâches d'IA profondément dans le noyau du navigateur.
Cependant, il est difficile de constituer une véritable menace pour Google uniquement par une imitation des fonctionnalités. La véritable possibilité d'établir un nouvel ordre résidera dans la reconstruction de l'architecture du navigateur à la base, en intégrant profondément les LLM dans le noyau du navigateur, et en réalisant une transformation fondamentale des modes d'interaction.
Brave
Brave est un navigateur précoce et réussi dans l'industrie de la crypto, basé sur l'architecture Chromium. Il attire les utilisateurs en s'appuyant sur la confidentialité et en permettant de gagner des Tokens. Cependant, la demande de confidentialité reste principalement centrée sur un groupe d'utilisateurs spécifique, ce qui rend difficile de renverser les géants existants.
Le projet Brave prévoit de passer à un navigateur AI axé sur la confidentialité, mais il est limité par la collecte de données utilisateur faible et un faible degré de personnalisation. Son assistant AI Leo ressemble davantage à un plugin externe, sans stratégie claire pour une transition complète vers un agent AI.
Donut
Donut est un projet émergent dans l'industrie de la crypto, dont la vision est de réaliser une capacité intégrée d'"exploration - décision - exécution native de la cryptographie". Son cœur réside dans la combinaison de chemins d'exécution automatique natifs à la cryptographie, en accord avec la tendance selon laquelle les agents pourraient remplacer les moteurs de recherche en tant que principal point d'entrée de trafic à l'avenir.
Conseils pour les entrepreneurs
Normalisation de la structure des interfaces : s'assurer que le produit a la capacité d'être appelé par des agents intelligents, en tenant compte de la normalisation et de l'abstraction de la structure de l'information.
Identité et passage : devenir un intermédiaire de confiance lors de l'exécution de transactions, de l'appel de paiements ou d'actifs en tant qu'agent AI.
Nouvelle compréhension du mécanisme de flux : passer du SEO à l'AEO (Agent Engine Optimization) ou à l'ATF (Agentic Task Fulfilment).
Les entrepreneurs devraient réimaginer leurs produits en tant que composants API, permettant aux agents non seulement de les "comprendre", mais aussi de les "appeler". L'accent dans le futur ne sera pas sur la création d'un nouveau navigateur, mais sur la mise au service des navigateurs existants pour les agents, établissant un pont pour la nouvelle génération de "flux d'instructions".
Si le Web2 attire l'attention des utilisateurs grâce à l'interface utilisateur, alors l'ère Web3 + Agent IA attire l'intention d'exécution des agents grâce à l'appel de la chaîne.