Web3 AI doit explorer de nouvelles voies pour surmonter les barrières technologiques de Web2 AI.

2025-07-09 17:32:36

Création du résumé en cours

Les barrières technologiques de l'IA Web2 s'approfondissent, l'IA Web3 doit chercher des points de rupture différenciés

Récemment, l'évolution des modèles multimodaux n'a pas eu d'impact sur les entreprises d'IA grand public, mais a plutôt renforcé l'avantage technologique de l'IA Web2. De l'alignement sémantique à la compréhension visuelle, des embeddings de haute dimension à la fusion de caractéristiques, des modèles complexes intègrent à une vitesse sans précédent diverses modalités d'expression, construisant ainsi un bastion de l'IA de plus en plus fermé. Cette tendance est presque sans rapport avec le domaine des cryptomonnaies.

Les récentes tentatives de Web3 AI dans le domaine des agents semblent mal orientées. Essayer d'assembler un système modulaire multimodal de style Web2 avec une structure décentralisée représente en réalité un double décalage technique et de pensée. Aujourd'hui, avec une forte couplage des modules, une distribution des caractéristiques hautement instable et une demande de puissance de calcul de plus en plus concentrée, il est difficile pour le modulaire multimodal de s'établir dans l'environnement Web3.

L'avenir de l'IA Web3 ne devrait pas se contenter d'imiter aveuglément, mais devrait adopter un contournement stratégique. De l'alignement sémantique dans un espace de haute dimension, aux goulets d'étranglement d'information dans les mécanismes d'attention, en passant par l'alignement des caractéristiques sous une puissance de calcul hétérogène, l'IA Web3 doit explorer de nouvelles voies et trouver des points de rupture différenciés.

Il est difficile d'atteindre un alignement sémantique de haute dimension avec l'IA Web3

Dans les systèmes multimodaux de l'IA Web2 moderne, "l'alignement sémantique" est une technologie clé pour mapper des informations de différentes modalités dans le même espace sémantique. Cela nécessite un espace d'embedding de haute dimension comme condition préalable pour réaliser la compréhension et la comparaison sémantiques entre les modalités.

Cependant, le protocole Web3 Agent a du mal à réaliser des embeddings de haute dimension. La plupart des Agents Web3 ne font que encapsuler les API existantes en modules indépendants, manquant d'un espace d'embedding centralisé unifié et d'un mécanisme d'attention inter-modules. Cela conduit à une incapacité à interagir les informations entre les modules sous plusieurs angles et niveaux, ne pouvant être traitées que selon un flux linéaire, rendant difficile la formation d'une optimisation en boucle fermée globale.

Pour réaliser un agent intelligent à chaîne complète avec des barrières sectorielles, il est nécessaire de partir de la modélisation conjointe de bout en bout, de l'intégration unifiée entre les modules, ainsi que d'un ingénierie systématique pour l'entraînement et le déploiement collaboratifs. Cependant, le marché actuel ne présente pas de telle demande, et il manque naturellement des points de douleur correspondants.

L'espace de faible dimension limite la conception précise des mécanismes d'attention

Les modèles multimodaux de haut niveau nécessitent des mécanismes d'attention soigneusement conçus. Ce mécanisme permet au modèle de se concentrer dynamiquement sur les parties les plus pertinentes lors du traitement des entrées. Cependant, le bon fonctionnement du mécanisme d'attention repose sur le fait que le multimodal possède des représentations de haute dimension.

L'IA Web2, lors de la conception de mécanismes d'attention, a adopté des architectures complexes telles que Query-Key-Value, réalisant ainsi un focus d'information efficace et précis. En revanche, l'IA Web3, basée sur des modules, a du mal à réaliser une planification d'attention unifiée. Les formats et distributions des données retournées par chaque API indépendante varient, manquant d'un niveau d'intégration unifié, ce qui empêche la formation d'un espace Q/K/V interactif.

De plus, l'architecture modulaire de l'IA Web3 rend difficile la mise en œuvre d'une attention multi-têtes parallèle et d'une allocation dynamique des poids basée sur le contexte global. Ces limitations font que l'IA Web3 a du mal à atteindre le niveau de performance de l'IA Web2 lorsqu'il s'agit de traiter des tâches multimodales complexes.

Fusion des caractéristiques se limite à un assemblage statique superficiel

Dans l'IA Web2, la fusion des caractéristiques consiste à combiner en profondeur les vecteurs de caractéristiques traités à partir de différentes modalités sur la base de l'alignement et de l'attention. Cependant, l'IA Web3, en raison du manque de représentations de haute dimension et de mécanismes d'attention précis, sa fusion des caractéristiques reste souvent au stade le plus simple de la concaténation.

L'IA Web2 tend à utiliser un entraînement joint de bout en bout, traitant des caractéristiques multimodales dans un même espace de haute dimension, en optimisant de manière collaborative avec les tâches en aval via des couches d'attention et de fusion. En revanche, l'IA Web3 utilise souvent des modules discrets assemblés, encapsulant divers API en agents indépendants, combinant simplement leurs sorties, sans objectif d'entraînement unifié ni flux de gradients transmodules.

De plus, l'IA Web2 peut utiliser des mécanismes d'attention pour ajuster dynamiquement les stratégies de fusion, tandis que l'IA Web3 utilise souvent des poids fixes ou des règles simples. En termes de dimensions de caractéristiques et de complexité d'interaction, l'IA Web3 a également du mal à rivaliser avec l'IA Web2 qui est mappée dans un espace de haute dimension. Ces écarts entraînent une mauvaise performance de l'IA Web3 dans le traitement de tâches complexes multimodales.

Les barrières à l'entrée dans l'industrie de l'IA se renforcent, mais les opportunités ne se sont pas encore manifestées

Le système multimodal de l'IA Web2 est un vaste projet d'ingénierie qui nécessite d'énormes quantités de données, une puissance de calcul puissante, des algorithmes avancés et une mise en œuvre technique complexe. Cela crée de fortes barrières à l'entrée dans l'industrie et constitue également le noyau de la compétitivité des rares équipes en tête.

Cependant, l'IA Web3 ne doit pas suivre aveuglément. Elle doit se concentrer sur les avantages de la décentralisation et rechercher des opportunités dans des scénarios tels que le calcul en périphérie. Les tâches adaptées à l'IA Web3 incluent des structures légères, des tâches faciles à paralléliser et incitatives, telles que le réglage fin LoRA, l'alignement comportemental après l'entraînement, le traitement des données en crowdsourcing, l'entraînement de petits modèles de base, etc.

Actuellement, les barrières de l'IA Web2 ne commencent à se former que, c'est une phase précoce de la concurrence entre les grandes entreprises. L'IA Web3 doit attendre que les points douloureux laissés par la diminution des bénéfices de l'IA Web2 se manifestent pour trouver de véritables opportunités d'entrée. Avant cela, l'IA Web3 devrait choisir ses points d'entrée avec prudence, adopter une stratégie de "l'enveloppement des villes par les campagnes", accumuler de l'expérience à partir de scénarios marginaux et maintenir sa flexibilité pour répondre aux besoins du marché en constante évolution.

AGENT-1.96%

Voir l'original

Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.

15 J'aime