Écosystème AI+Web3 en panorama : de la Puissance de calcul partagée aux nouvelles opportunités de calcul de la vie privée

IA+Web3 : Tours et places

TL;DR

  1. Les projets Web3 basés sur l'IA deviennent des cibles d'attraction de fonds sur les marchés primaire et secondaire.

  2. Les opportunités de Web3 dans l'industrie de l'IA se manifestent par : l'utilisation d'incitations distribuées pour coordonner les fournisseurs potentiels dans la longue traîne ------ à travers les données, le stockage et le calcul ; en même temps, établir un modèle open source ainsi qu'un marché décentralisé pour les agents IA.

  3. L'IA dans l'industrie Web3 trouve principalement son utilité dans la finance sur blockchain (paiements cryptographiques, transactions, analyse de données) ainsi que dans le développement d'assistance.

  4. L'utilité de l'AI+Web3 réside dans la complémentarité des deux : Web3 promet de lutter contre la centralisation de l'AI, tandis que l'AI promet d'aider Web3 à sortir de son cercle.

Introduction

Au cours des deux dernières années, le développement de l'IA a été comme si un bouton d'accélération avait été pressé, cette aile de papillon provoquée par Chatgpt a non seulement ouvert un nouveau monde de l'intelligence artificielle générative, mais a également suscité une dynamique dans le Web3.

Sous l'impulsion du concept d'IA, le financement du marché des cryptomonnaies, qui ralentit, montre un net regain. Selon les médias, rien qu'au premier semestre 2024, 64 projets Web3+IA ont achevé leur financement, et le système d'exploitation basé sur l'intelligence artificielle Zyber365 a réalisé un montant de financement record de 100 millions de dollars lors de sa série A.

Le marché secondaire est de plus en plus prospère, les données du site agrégateur de crypto-monnaies Coingecko montrent qu'en un peu plus d'un an, la capitalisation totale du secteur de l'IA a atteint 48,5 milliards de dollars, avec un volume d'échanges sur 24 heures proche de 8,6 milliards de dollars ; les avancées des technologies IA sont clairement bénéfiques, après la publication du modèle de conversion texte-en-vidéo Sora d'une certaine société, le prix moyen du secteur IA a augmenté de 151 % ; l'effet IA s'étend également à l'un des segments de collecte de fonds en crypto-monnaies, les Memes : le premier concept de MemeCoin basé sur un agent IA ------ GOAT a rapidement gagné en popularité et a obtenu une valorisation de 1,4 milliard de dollars, déclenchant avec succès une frénésie de Memes IA.

La recherche et les sujets autour de l'AI+Web3 sont également en pleine effervescence, allant de l'AI+Depin à l'AI Memecoin, puis aux actuels AI Agent et AI DAO. La peur de manquer quelque chose (FOMO) ne suit déjà plus la vitesse de rotation des nouveaux récits.

AI+Web3, cette combinaison de termes remplie d'argent facile, de tendances et de fantasmes futurs, ne peut que être considérée comme un mariage arrangé orchestré par le capital. Il semble que nous ayons du mal à distinguer, sous cette somptueuse robe, si c'est le terrain de jeu des spéculateurs ou la veille de l'éruption de l'aube ?

Pour répondre à cette question, une réflexion clé pour les deux parties est : est-ce que cela s'améliorerait avec l'autre ? Peut-on bénéficier des modèles de l'autre ? Dans cet article, nous essayons également de nous appuyer sur les travaux des pionniers pour examiner ce schéma : comment le Web3 peut-il jouer un rôle à chaque étape de la pile technologique de l'IA, et qu'est-ce que l'IA peut apporter de nouveau au Web3 ?

AI+Web3 : Tours et places

Partie 1 Quelles opportunités Web3 sous la pile AI ?

Avant d'aborder ce sujet, nous devons comprendre la pile technologique des grands modèles AI :

Exprimer l'ensemble du processus dans un langage plus simple : un "grand modèle" est comme le cerveau humain. Au début, ce cerveau appartient à un bébé qui vient de naître, et il doit observer et ingérer une quantité massive d'informations de l'environnement pour comprendre le monde. C'est la phase de "collecte" des données. Étant donné que les ordinateurs ne possèdent pas les sens visuels et auditifs des humains, avant l'entraînement, les vastes informations non étiquetées de l'extérieur doivent être transformées par "prétraitement" en un format d'information que l'ordinateur peut comprendre et utiliser.

Après avoir saisi les données, l'IA construit un modèle ayant des capacités de compréhension et de prédiction grâce à un « entraînement », ce qui peut être considéré comme le processus par lequel un bébé comprend et apprend progressivement le monde extérieur. Les paramètres du modèle sont comme les capacités linguistiques d'un bébé qui s'ajustent constamment au cours du processus d'apprentissage. Lorsque le contenu appris commence à être spécialisé, ou que des retours d'échanges avec d'autres personnes permettent des corrections, on entre alors dans la phase de « fine-tuning » du grand modèle.

Les enfants, en grandissant et en apprenant à parler, peuvent comprendre le sens dans de nouvelles conversations et exprimer leurs sentiments et pensées. Cette étape est similaire au « raisonnement » des grands modèles d'IA, où le modèle peut prédire et analyser de nouvelles entrées linguistiques et textuelles. Les bébés expriment leurs émotions, décrivent des objets et résolvent divers problèmes grâce à leurs compétences linguistiques, ce qui est également comparable à l'application des grands modèles d'IA dans la phase de raisonnement pour des tâches spécifiques après avoir terminé l'entraînement, comme la classification d'images, la reconnaissance vocale, etc.

L'Agent IA tend à être la prochaine forme des grands modèles------capable d'exécuter des tâches de manière autonome et de poursuivre des objectifs complexes, non seulement doté de capacités de réflexion, mais également capable de mémoriser, de planifier et d'utiliser des outils pour interagir avec le monde.

Actuellement, en réponse aux points de douleur de l'IA dans diverses piles, le Web3 a commencé à former un écosystème multi-niveaux et interconnecté, couvrant toutes les étapes du processus des modèles d'IA.

AI+Web3 : Tours et Places

I. Couche de base : Airbnb de la puissance de calcul et des données

▎Puissance de calcul

Actuellement, l'un des coûts les plus élevés de l'IA est la puissance de calcul et l'énergie requises pour entraîner et inférer les modèles.

Un exemple est que le LLAMA3 d'une certaine entreprise nécessite 16 000 H100GPU produits par une certaine entreprise (qui est une unité de traitement graphique haut de gamme conçue pour les charges de travail d'intelligence artificielle et de calcul haute performance). Il faut 30 jours pour achever l'entraînement. Le prix unitaire de la version 80 Go se situe entre 30 000 et 40 000 dollars, ce qui nécessite un investissement en matériel informatique de 400 à 700 millions de dollars (GPU + puces réseau). De plus, l'entraînement mensuel consomme 1,6 milliard de kilowattheures, avec des dépenses énergétiques approchant les 20 millions de dollars par mois.

La décompression de la puissance de calcul AI est précisément le domaine où Web3 a le plus tôt croisé l'IA-----DePin (réseau d'infrastructure physique décentralisé). Actuellement, le site de données DePin Ninja a répertorié plus de 1400 projets, parmi lesquels les projets représentatifs de partage de puissance de calcul GPU incluent io.net, Aethir, Akash, Render Network, etc.

La logique principale réside dans le fait que : la plateforme permet aux particuliers ou aux entités disposant de ressources GPU inutilisées de contribuer leur puissance de calcul de manière décentralisée sans autorisation, en créant un marché en ligne pour les acheteurs et les vendeurs similaire à certaines plateformes de covoiturage ou de location de logements, augmentant ainsi le taux d'utilisation des ressources GPU sous-utilisées. Les utilisateurs finaux bénéficient ainsi de ressources de calcul efficaces à moindre coût ; en même temps, le mécanisme de staking garantit que si des violations des mécanismes de contrôle de la qualité ou des interruptions de réseau surviennent, les fournisseurs de ressources subissent des sanctions appropriées.

Ses caractéristiques sont :

  • Rassembler des ressources GPU non utilisées : les fournisseurs sont principalement des opérateurs de petits et moyens centres de données indépendants tiers, des mines de cryptomonnaies, etc., disposant de ressources de calcul excédentaires, et le mécanisme de consensus est le matériel minier PoS, tel que les mineurs FileCoin et ETH. Actuellement, il existe également des projets visant à lancer des équipements avec une barrière d'entrée plus faible, comme exolab qui utilise des appareils locaux tels que MacBook, iPhone, iPad, pour établir un réseau de calcul pour l'inférence de grands modèles.

  • Faire face au marché de la longue traîne de la puissance de calcul AI :

a. "Du point de vue technique", le marché de la puissance de calcul décentralisée est plus adapté aux étapes d'inférence. L'entraînement dépend davantage de la capacité de traitement des données apportée par des GPU à grande échelle, tandis que l'inférence nécessite des performances de calcul GPU relativement plus faibles, comme Aethir qui se concentre sur le rendu à faible latence et les applications d'inférence AI.

b. Du point de vue de la demande, les petites et moyennes entreprises ne formeront pas leurs propres grands modèles, mais choisiront plutôt d'optimiser et de peaufiner autour de quelques grands modèles de tête, et ces scénarios conviennent naturellement aux ressources de calcul inutilisées et distribuées.

  • Propriété décentralisée : La signification technique de la blockchain réside dans le fait que les propriétaires de ressources conservent toujours le contrôle de leurs ressources, ajustent de manière flexible en fonction de la demande, tout en réalisant des bénéfices.

▎Données

Les données sont la base de l'IA. Sans données, le calcul est aussi inutile qu'une feuille flottante, et la relation entre les données et le modèle est similaire à l'expression "Garbage in, Garbage out". La quantité de données et la qualité des entrées déterminent la qualité de sortie du modèle final. En ce qui concerne l'entraînement des modèles d'IA actuels, les données déterminent la capacité linguistique, la capacité de compréhension, et même les valeurs et les performances humanisées du modèle. Actuellement, les défis de la demande de données pour l'IA se concentrent principalement sur les quatre aspects suivants :

  • Soif de données : L'entraînement des modèles d'IA dépend d'un grand volume d'entrées de données. Les documents publics montrent qu'une certaine entreprise a entraîné GPT-4 avec un nombre de paramètres atteignant le billion.

  • Qualité des données : Avec la combinaison de l'IA et des différents secteurs, la temporalité des données, la diversité des données, la spécialisation des données sectorielles et l'intégration de nouvelles sources de données telles que les émotions sur les réseaux sociaux posent de nouvelles exigences à leur qualité.

  • Problèmes de confidentialité et de conformité : Actuellement, les différents pays et entreprises prennent progressivement conscience de l'importance des ensembles de données de qualité et commencent à imposer des restrictions sur le scraping des ensembles de données.

  • Coût élevé de traitement des données : volume de données important, processus de traitement complexe. Les données publiques montrent que plus de 30 % des coûts de R&D des entreprises d'IA sont consacrés à la collecte et au traitement des données de base.

Actuellement, les solutions web3 se manifestent dans les quatre domaines suivants :

  1. Collecte de données : La disponibilité des données réelles extraites gratuitement s'épuise rapidement, et les dépenses des entreprises d'IA pour les données augmentent chaque année. Cependant, en même temps, ces dépenses ne profitent pas aux véritables contributeurs de données, les plateformes profitant entièrement de la création de valeur apportée par les données, comme cette plateforme sociale qui a réalisé un revenu total de 203 millions de dollars grâce à un contrat de licence de données signé avec une entreprise d'IA.

Permettre aux utilisateurs qui contribuent réellement de participer également à la création de valeur générée par les données, et d'accéder à des données plus privées et plus précieuses à moindre coût grâce à un réseau distribué et à des mécanismes d'incitation, tel est le vision de Web3.

  • Grass est une couche de données et un réseau décentralisés, permettant aux utilisateurs de contribuer avec leur bande passante inutilisée et leur trafic de relais en exécutant des nœuds Grass pour capturer des données en temps réel provenant de l'ensemble d'Internet, et de recevoir des récompenses en tokens ;

  • Vana introduit un concept unique de pool de liquidité de données (DLP), permettant aux utilisateurs de télécharger leurs données privées (telles que les historiques d'achats, les habitudes de navigation, les activités sur les réseaux sociaux, etc.) dans un DLP spécifique, et de choisir de manière flexible s'ils souhaitent autoriser l'utilisation de ces données par des tiers spécifiques ;

  • Dans PublicAI, les utilisateurs peuvent utiliser #AI 或#Web3 comme étiquette de classification sur une certaine plateforme sociale et @PublicAI pour collecter des données.

  1. Prétraitement des données : Dans le processus de traitement des données de l'IA, les données collectées sont souvent bruyantes et contiennent des erreurs, elles doivent donc être nettoyées et converties en un format utilisable avant d'entraîner le modèle, ce qui implique des tâches répétées de normalisation, de filtrage et de traitement des valeurs manquantes. Cette étape est l'un des rares moments manuels de l'industrie de l'IA, et elle a donné naissance à l'industrie des annotateurs de données. Avec l'augmentation des exigences de qualité des données par les modèles, le seuil d'entrée pour les annotateurs de données a également été relevé, et cette tâche est naturellement adaptée au mécanisme d'incitation décentralisé de Web3.
  • Actuellement, Grass et OpenLayer envisagent tous deux d'intégrer l'étape clé de l'annotation des données.

  • Synesis a proposé le concept de « Train2earn », mettant l'accent sur la qualité des données, les utilisateurs peuvent obtenir des récompenses en fournissant des données étiquetées, des annotations ou d'autres formes de contribution.

  • Le projet de marquage de données Sapien gamifie les tâches de marquage et permet aux utilisateurs de miser des points pour en gagner davantage.

  1. Confidentialité et sécurité des données : Il est important de clarifier que la confidentialité et la sécurité des données sont deux concepts différents. La confidentialité des données concerne le traitement des données sensibles, tandis que la sécurité des données protège les informations des données contre les accès, destructions et vols non autorisés. Ainsi, les avantages des technologies de confidentialité Web3 et les scénarios d'application potentiels se manifestent de deux manières : (1) Entraînement de données sensibles ; (2) Collaboration des données : plusieurs propriétaires de données peuvent participer ensemble à l'entraînement de l'IA sans avoir à partager leurs données brutes.

Les technologies de confidentialité actuellement courantes dans le Web3 comprennent :

  • Environnement d'exécution de confiance ( TEE ), tel que Super Protocol ;

  • Cryptographie homomorphe complète (FHE), par exemple BasedAI, Fhenix.io ou Inco Network ;

  • La technologie à connaissance nulle (zk), comme le Reclaim Protocol qui utilise la technologie zkTLS, génère des preuves à connaissance nulle pour le trafic HTTPS, permettant aux utilisateurs d'importer en toute sécurité des données d'activités, de réputation et d'identité depuis des sites externes, sans exposer d'informations sensibles.

Cependant, le domaine est encore à un stade précoce, la plupart des projets étant encore en phase d'exploration. L'un des dilemmes actuels est le coût de calcul.

Voir l'original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Récompense
  • 7
  • Partager
Commentaire
0/400
pumpamentalistvip
· 07-12 03:49
Cette vague est un peu cool ! Bouteille violette ~
Voir l'originalRépondre0
RektDetectivevip
· 07-11 10:52
Les gens ont trop été pris pour des idiots, maintenant ils n'osent même plus entrer sur le marché.
Voir l'originalRépondre0
Blockblindvip
· 07-09 18:23
Cette vague est trop forte.
Voir l'originalRépondre0
ConsensusBotvip
· 07-09 18:17
Chercher de l'argent, hein?
Voir l'originalRépondre0
ZenMinervip
· 07-09 18:08
Creuser sans relâche, quand on est fatigué, acheter des jetons.
Voir l'originalRépondre0
EthSandwichHerovip
· 07-09 18:01
À vrai dire, notre Web3 a l'air assez fiable avec cette vague d'IA.
Voir l'originalRépondre0
SignatureDeniedvip
· 07-09 18:01
Le monopole est la source du problème.
Voir l'originalRépondre0
  • Épingler
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)