AI+Web3 злиття нової ери: стимулювання довгого хвоста розподілу та Відкритий вихідний код моделі ринку

AI+Web3:Вежі та площі

Короткий виклад

  1. Проекти Web3 з концепцією ШІ стали об'єктами залучення капіталу на первинних та вторинних ринках.

  2. Можливості Web3 в індустрії ШІ проявляються у: використанні розподілених стимулів для координації потенційних постачальників у довгому хвості ( по даним, зберіганню та обчисленням ); водночас створюючи відкриті моделі та децентралізований ринок агентів ШІ.

  3. ШІ в індустрії Web3 в основному використовується для фінансів на блокчейні( криптооплат, торгівлі, аналізу даних) та допомоги в розробці.

  4. Корисність AI+Web3 проявляється у взаємодоповнюваності обох: Web3 має надію протистояти централізації AI, а AI має надію допомогти Web3 вийти за межі.

Вступ

Протягом останніх двох років розвиток ШІ, здається, був прискорений, а ця метафорична «метелика» ефект, спричинений Chatgpt, не лише відкрив новий світ генеративного штучного інтелекту, але й викликав хвилю в сфері Web3.

Під впливом концепції ШІ, фінансування в крипто-ринку, яке сповільнилося, помітно підвищилося. Згідно з даними ЗМІ, лише в першій половині 2024 року 64 проекти Web3+AI завершили фінансування, а операційна система на базі штучного інтелекту Zyber365 досягла максимального фінансування в 100 мільйонів доларів на раунді A.

Ринок другорядних активів став більш процвітаючим: дані агрегаторів криптовалют свідчать, що всього за трохи більше року загальна капіталізація сектора AI досягла 48,5 мільярда доларів, а обсяг торгів за 24 години наблизився до 8,6 мільярда доларів. Явні переваги, що виникають внаслідок прогресу в основних AI-технологіях, стали очевидними: після випуску моделі Sora тексту в відео від OpenAI середня ціна в секторі AI зросла на 151%. Ефект AI також охоплює один з розділів криптовалют, що залучають капітал, - Meme: перший концепт AI Agent MemeCoin - GOAT швидко став популярним і отримав оцінку в 1,4 мільярда доларів, успішно запустивши бум AI Meme.

Дослідження та теми, пов'язані з AI+Web3, також набули популярності, починаючи від AI+DePIN до AI Memecoin і, нарешті, до поточних AI Agent та AI DAO, емоція FOMO вже не встигає за швидкістю чергування нових наративів.

AI+Web3, це поєднання термінів, наповнене гарячими грошима, трендами та фантазіями про майбутнє, неминуче сприймається як шлюб, організований капіталом, і нам здається, що важко розрізнити під цією розкішною накидкою, чи це справжня арена спекулянтів, чи переддень вибуху світанку?

Щоб відповісти на це питання, важливим роздумом для обох сторін є те, чи стане їм краще завдяки один одному? Чи можуть вони отримати вигоду з моделей один одного? У цій статті ми також намагаємося стати на плечі попередників, щоб розглянути цю структуру: як Web3 може відігравати роль на різних етапах технологічного стеку ШІ, і що нового може принести ШІ для Web3?

! AI+Web3: Вежі та Плази

Частина 1 Які можливості має Web3 під AI стеком?

Перш ніж розгорнути цю тему, нам потрібно зрозуміти технологічний стек великих моделей ШІ:

Використовуючи більш просту мову, щоб описати весь процес: «велика модель» схожа на людський мозок. На ранньому етапі цей мозок належить немовляті, яке щойно з'явилося на світ, і йому потрібно спостерігати та споживати величезну кількість інформації з навколишнього світу, щоб зрозуміти цей світ. Це етап «збирання» даних; оскільки комп'ютер не має людських зорових, слухових та інших відчуттів, перед навчанням масивна немічена інформація ззовні має бути перетворена через «попередню обробку» у формат інформації, зрозумілий та корисний для комп'ютера.

Після введення даних AI за допомогою «тренування» створив модель, яка має здатність розуміти та прогнозувати, що можна розглядати як процес, в якому немовля поступово розуміє та вивчає навколишній світ. Параметри моделі схожі на мовні здібності немовляти, які постійно коригуються під час навчання. Коли вивчений матеріал починає спеціалізуватися, або коли спілкування з людьми дає зворотний зв'язок та корекцію, відбувається етап «дослідження» великої моделі.

Діти, які поступово виростають і навчаються говорити, можуть розуміти значення у нових розмовах та висловлювати свої почуття і думки. Цей етап схожий на "інференцію" в великих моделях ШІ, де модель може передбачати та аналізувати нові мовні та текстові входи. Діти використовують мовні навички для висловлення почуттів, опису предметів та вирішення різних проблем, що також схоже на те, як великі моделі ШІ використовуються в стадії інференції для виконання різних специфічних завдань після завершення навчання, таких як класифікація зображень, розпізнавання мови тощо.

А AI Agent наближається до наступної форми великої моделі - здатної самостійно виконувати завдання та переслідувати складні цілі, що має не лише здатність до мислення, але й може запам'ятовувати, планувати та взаємодіяти з світом за допомогою інструментів.

Наразі, враховуючи проблеми AI на різних рівнях, Web3 наразі починає формувати багаторівневу, взаємопов'язану екосистему, яка охоплює всі етапи процесу моделей AI.

! AI+Web3: Вежі та Квадрати

Один. Базовий шар: потужність обчислень та дані Airbnb

Потужність

Наразі однією з найвищих витрат штучного інтелекту є обчислювальні потужності та енергія, необхідні для навчання моделей та їх застосування.

Один із прикладів - це великий мовний модель технологічного гіганта, яка потребує 16000 високопродуктивних GPU, вироблених певним виробником GPU, для завершення навчання протягом 30 днів. Ціна за одиницю 80GB версії коливається від 30 000 до 40 000 доларів, що потребує інвестицій у обчислювальне обладнання в розмірі від 400 до 700 мільйонів доларів (GPU+мережевий чіп ), при цьому щомісячне навчання вимагає споживання 1,6 мільярда кіловат-годин, а витрати на енергію щомісяця становлять майже 20 мільйонів доларів.

Розвантаження обчислювальної потужності AI є однією з перших областей перетворення Web3 з AI - DePIN( децентралізовані фізичні інфраструктурні мережі) на сьогоднішній день відповідні веб-сайти з даними вже представили понад 1400 проектів, серед яких проекти з обміну GPU обчислювальною потужністю представлені кількома відомими платформами.

Основна логіка полягає в тому, що платформа дозволяє особам або організаціям, які мають невикористані ресурси GPU, вносити свій обчислювальний потенціал у децентралізований спосіб без ліцензування. Це підвищує використання невикористаних ресурсів GPU через онлайн-ринок для покупців і продавців, подібний до Uber або Airbnb, що також дозволяє кінцевим користувачам отримувати більш ефективні обчислювальні ресурси за нижчою вартістю. Одночасно механізм стейкінгу забезпечує відповідні покарання для постачальників ресурсів у разі порушення механізму контролю якості або переривання мережі.

Його особливістю є:

  • Збір вільних ресурсів GPU: Постачальниками в основному є незалежні середні та малі дата-центри, оператори крипто-майнінгових ферм тощо, які мають надлишкові обчислювальні ресурси, а механізм консенсусу - PoS, такі як майнери FileCoin та ETH. Наразі також є проекти, що прагнуть розпочати з обладнанням з нижчим порогом входження, наприклад, за допомогою MacBook, iPhone, iPad та інших локальних пристроїв для створення обчислювальної мережі, що виконує інференцію великих моделей.

  • Перед обличчям довгого хвоста ринку обчислювальної потужності ШІ:

a. «З технічної точки зору» децентралізований ринок обчислювальної потужності більше підходить для етапів висновку. Навчання більше залежить від обробної потужності, яку забезпечують надвеликий кластер GPU, тоді як для висновку вимоги до продуктивності GPU відносно нижчі, наприклад, деякі платформи зосереджуються на рендерингу з низькою затримкою та застосуваннях AI для висновку.

b. «З точки зору попиту» замовники з невеликою обчислювальною потужністю не будуть окремо навчати свої великі моделі, а просто оберуть оптимізацію та доопрацювання навколо кількох провідних великих моделей, а ці сценарії природно підходять для розподілених невикористаних обчислювальних ресурсів.

  • Децентралізоване володіння: технологічне значення блокчейну полягає в тому, що власники ресурсів завжди зберігають контроль над своїми ресурсами, гнучко регулюючи їх відповідно до попиту, одночасно отримуючи прибуток.

Дані

Дані є основою штучного інтелекту. Якщо немає даних, обчислення будуть безглузді, як ряска на воді, а зв'язок між даними та моделлю нагадує народну мудрість "Сміття на вході, сміття на виході". Кількість даних та якість введення визначають кінцеву якість виходу моделі. Що стосується навчання сучасних AI-моделей, дані визначають мовні можливості моделі, здатність до розуміння, навіть цінності та гуманістичні прояви. На сьогоднішній день труднощі в потребах даних для AI зосереджені на чотирьох основних аспектах:

  • Голод даних: Тренування AI-моделей залежить від великої кількості вхідних даних. Відкриті джерела показують, що параметри мовних моделей, натренованих відомою компанією в сфері AI, досягають трильйонного рівня.

  • Якість даних: Зі злиттям ШІ з різними галузями виникають нові вимоги до якості даних, такі як своєчасність даних, різноманітність даних, професійність вертикальних даних, а також введення нових джерел даних, таких як емоції в соціальних медіа.

  • Проблеми конфіденційності та відповідності: В даний час різні країни та компанії поступово звертають увагу на важливість якісних наборів даних і вводять обмеження на збори даних.

  • Високі витрати на обробку даних: велика кількість даних, складний процес обробки. Відкриті дані показують, що більше 30% витрат на дослідження та розробки в AI компаній ідуть на збори та обробку базових даних.

На даний момент рішення web3 реалізовані в чотирьох основних аспектах:

  1. Збір даних: можливість безкоштовно надавати зібрані дані з реального світу швидко вичерпується, витрати AI-компаній на дані зростають з року в рік. Але водночас ці витрати не повертаються до справжніх постачальників даних, а платформи повністю користуються цінністю, яку приносить дані, як, наприклад, одна соціальна платформа отримала 203 мільйони доларів доходу завдяки укладенню угод про ліцензування даних з AI-компаніями.

Дати можливість справжнім користувачам брати участь у створенні цінності, яку приносить дані, а також отримувати більш приватні та цінні дані за допомогою дистрибуційної мережі та механізмів стимулювання з низькими витратами – це бачення Web3.

  • Деякі платформи є децентралізованим рівнем даних і мережею, де користувачі можуть запускати вузли, вносячи вільну смугу пропускання та ретранслюючи трафік для захоплення в режимі реального часу даних з усієї Інтернету та отримувати токен-накопичення;

  • Деякі платформи впровадили унікальну концепцію пули ліквідності даних (DLP), де користувачі можуть завантажувати свої приватні дані (, такі як записи покупок, звички перегляду, активність у соціальних мережах тощо ) до певного DLP і гнучко обирати, чи надавати ці дані для використання певним третім особам;

  • На деяких платформах користувачі можуть використовувати певні теги на соціальних платформах і @платформу для збору даних.

  1. Передобробка даних: під час обробки даних AI, оскільки зібрані дані зазвичай є шумними та містять помилки, їх необхідно очистити та перетворити в придатний формат перед навчанням моделі, що включає стандартизацію, фільтрацію та обробку відсутніх значень. Ця стадія є однією з небагатьох ручних фаз у галузі AI, що призвела до виникнення професії аналітика даних, і з підвищенням вимог моделі до якості даних, поріг входу для аналітиків даних також підвищується, а це завдання природним чином підходить для децентралізованої системи стимулів Web3.
  • Наразі кілька платформ розглядають можливість приєднання до цього ключового етапу позначення даних.

  • Деякі проекти висунули концепцію «Train2earn», підкреслюючи якість даних; користувачі можуть отримувати винагороди за надання маркованих даних, коментарів або інших форм внесків.

  • Проект маркування даних перетворює завдання на гру та дозволяє користувачам ставити свої бали, щоб заробити більше балів.

  1. Приватність та безпека даних: потрібно зрозуміти, що приватність та безпека даних - це два різні поняття. Приватність даних стосується обробки чутливих даних, тоді як безпека даних захищає інформацію від несанкціонованого доступу, знищення та крадіжки. Таким чином, переваги технологій приватності Web3 та потенційні сценарії застосування проявляються в двох аспектах: (1) навчання чутливих даних; (2) співпраця даних: декілька власників даних можуть спільно брати участь у навчанні ШІ, не ділячись своїми оригінальними даними.

Поточні технології конфіденційності, які є поширеними в Web3, включають:

  • Достовірне виконуване середовище(TEE)

  • Повна гомоморфна криптація ( FHE )

  • Технологія нульових знань ( zk ), як деякі протоколи, що використовують технологію zkTLS, генерують нульові докази для HTTPS-трафіку, дозволяючи користувачам безпечно імпортувати активи, репутацію та дані особистості з зовнішніх сайтів, не розкриваючи чутливу інформацію.

Проте, наразі ця сфера все ще на ранній стадії, більшість проектів все ще в процесі дослідження, а нинішнім викликом є занадто висока вартість обчислень, деякі приклади:

  • Деяка zkML рамка потребує близько 80 хвилин для генерації доказу моделі 1M-nanoGPT.

  • Згідно з даними однієї лабораторії, витрати на zkML перевищують витрати на чисті обчислення більш ніж у 1000 разів.

  1. Зберігання даних: після отримання даних також потрібне місце для зберігання даних в ланцюгу, а також LLM, створеного за допомогою цих даних. Основною проблемою є доступність даних (DA), до оновлення Danksharding в Ethereum, його пропускна здатність становила 0,08 МБ. Тим часом навчання AI моделей та реальний інференс зазвичай потребують пропускної здатності даних від 50 до 100 ГБ на секунду. Така різниця в порядках робить існуючі рішення в ланцюзі безсилими перед "ресурсомісткими AI застосунками".
  • Деякі платформи є представниками цієї категорії. Це централізоване сховище, спроектоване для високих вимог до продуктивності AI, його ключові характеристики включають: висока
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • 8
  • Поділіться
Прокоментувати
0/400
MoonBoi42vip
· 07-31 08:17
Інновації постійно рухаються вперед
Переглянути оригіналвідповісти на0
GateUser-bd883c58vip
· 07-30 11:02
Майбутнє виглядає обнадійливо
Переглянути оригіналвідповісти на0
BearMarketBardvip
· 07-30 11:02
Чекаємо на булран.
Переглянути оригіналвідповісти на0
GasFeeBarbecuevip
· 07-30 11:01
обдурювати людей, як лохів знову прийшло
Переглянути оригіналвідповісти на0
PumpingCroissantvip
· 07-30 11:01
Розумно дивитися на цей тренд
Переглянути оригіналвідповісти на0
AirdropHunterXMvip
· 07-30 10:52
бичачий цей сектор
Переглянути оригіналвідповісти на0
PebbleHandervip
· 07-30 10:43
Сяюче майбутнє вперед!
Переглянути оригіналвідповісти на0
BearMarketBuyervip
· 07-30 10:39
Ведмежий ринок безстрашні йдуть вперед
Переглянути оригіналвідповісти на0
  • Закріпити