# AIデータトラックの可能性とWeb3 DataFiの台頭最近、AI界で最も注目を集めているのは、Metaが示した強力な実力です。ザッカーバーグは人材を広く募集し、中国系の研究者を中心とした豪華なAIチームを結成しました。その中で、わずか28歳のアレクサンダー・ワンがリーダーに就任しました。ワンは290億ドルの評価を受けたScale AIを設立し、アメリカ軍、OpenAI、Anthropic、Metaを含む多くのAI大手にデータサービスを提供しています。Scale AIのコアビジネスは、大量の正確なラベル付けデータを提供することです。Scale AIが多くのユニコーンの中で際立っている理由は、AI産業におけるデータの重要性を早くから認識していたことにあります。計算能力、モデル、データはAIモデルの三大柱です。大きなモデルを人に例えるなら、モデルは体、計算能力は食べ物、データは知識と情報です。大規模言語モデルの急速な発展の中で、業界の焦点はモデルから計算力への移行を経験しました。現在、ほとんどのモデルはフレームワークとしてtransformerを採用しており、時折MoEやMoReなどの革新があります。主要企業は自社でスーパーコンピュータクラスターを構築するか、AWSなどのクラウドサービスプロバイダーと長期契約を結んでいます。計算力という基礎的な問題が解決された後、データの重要性が徐々に浮き彫りになっています。従来のTo Bビッグデータ企業とは異なり、Scale AIはAIモデルのために堅固なデータ基盤を構築することに専念しています。ビジネスは既存データの掘り起こしだけでなく、より長期的なデータ生成ビジネスも含まれています。会社はまた、異なる分野の人工専門家で構成されるAIトレーニングチームを編成し、AIモデルにより高品質なトレーニングデータを提供しています。モデルのトレーニングは、事前トレーニングとファインチューニングの二つの段階に分かれます。事前トレーニング段階は、赤ちゃんが話すことを学ぶプロセスに似ており、AIモデルにインターネットから収集した大量のテキストやコードなどの情報を入力する必要があります。ファインチューニング段階は、学校教育に似ており、通常は明確な正誤、答え、方向性があります。特定のデータセットを通じて、モデルに必要な能力を育成することができます。したがって、必要なデータは2つのカテゴリに分けられます。一つは、過度な処理を必要としない大量のデータで、通常はReddit、Twitter、GithubなどのUGCプラットフォームからのクローリングデータ、公開文献データベース、企業のプライベートデータベースから得られます。もう一つは、モデルの特定の優れた特性を育成するために精密に設計され、選別される必要があり、データのクリーニング、選別、アノテーション、および人間のフィードバックなどの作業が必要です。モデルの能力がさらに向上するにつれて、より精巧で専門的なトレーニングデータがモデルの能力にとって重要な影響要因となります。長期的に見れば、AIデータは雪球効果を持つ長期的な投資分野であり、初期の作業の蓄積により、データ資産は複利効果を持つようになり、古くなるほど価値が高まります。Web3の分野では、DataFiの概念が登場しました。Web3 DataFiには多くの利点があります:1. スマートコントラクトはデータの主権、安全性、プライバシーを保証します2. 自然な地理的アービトラージの利点が、最も適したグローバル分散型労働力を引き付ける3. ブロックチェーンの明確なインセンティブと決済の利点4. より効率的でオープンな「ワンストップ」データ市場の構築に貢献する! [資産としてのデータ:DataFiは新しいブルーオーシャンを開く](https://img-cdn.gateio.im/social/moments-833187943a7b99d3f3b1aa6c4281e397)一般のユーザーにとって、DataFiは参加するのに最も有利な分散型AIプロジェクトです。ユーザーはデータファクトリー契約を締結する必要はなく、ウォレットにログインするだけで、データの提供、モデル評価、AIツールを使った簡単な創作、データ取引への参加など、さまざまな簡単なタスクを完了することで参加できます。現在、Web3 DataFi分野には、Sahara AI、Yupp、Vana、Chainbase、Sapien、Prisma X、Masa、Irys、ORO、Gataなどの一連の潜在的なプロジェクトが登場しています。これらのプロジェクトは、それぞれデータ収集、モデル評価、個人データのマネタイズ、オンチェーンデータのインデックスなど、異なるデータサービス分野に特化しています。! [資産としてのデータ:DataFiは新しい青い海を開いています](https://img-cdn.gateio.im/social/moments-3b7474fe7d6a646b19d553dc21b7d42d)現在、これらのプロジェクトの障壁は一般的に高くありませんが、一旦ユーザーとエコシステムの粘着性が蓄積されると、プラットフォームの優位性は迅速に蓄積されます。したがって、初期のプロジェクトはインセンティブとユーザー体験に重点を置くべきです。同時に、これらのデータプラットフォームは、人件費を管理し、データ生成の質を確保する方法を考慮する必要があります。劣った通貨が優れた通貨を追い出す事態を避けるために。さらに、透明性の向上も現在のオンチェーンプロジェクトが直面している重要な課題の一つです。ますます多くのプロジェクトが、Web3 DataFiの健全な発展を促進するために、公に、透明な長期的な決意を示す必要があります。DataFiの大規模なアプリケーションパスは、二つの側面を含んでいます。一つは、十分な数の一般ユーザーをデータ収集と生成に参加させ、AI経済の消費者グループを形成することです。もう一つは、主流の大企業からの認識を得ることであり、短期的にはそれらが依然としてデータの大規模な供給元であるからです。全体として、DataFiは人間の知性が長期にわたって機械の知性を育成するプロセスを表し、スマートコントラクトを通じて人間の労働の利益を保証し、最終的には機械の知性が人間に恩返しをすることを実現します。AI時代に不確実性を感じている人々にとって、DataFiに参加することはトレンドに沿った賢明な選択と言えるでしょう。! [資産としてのデータ:DataFiは新しい青い海を開いています](https://img-cdn.gateio.im/social/moments-c629c990916b7e1fbd4699663c3cbcff)
Web3 DataFiの台頭:AIデータトラックは無限の可能性を秘めています
AIデータトラックの可能性とWeb3 DataFiの台頭
最近、AI界で最も注目を集めているのは、Metaが示した強力な実力です。ザッカーバーグは人材を広く募集し、中国系の研究者を中心とした豪華なAIチームを結成しました。その中で、わずか28歳のアレクサンダー・ワンがリーダーに就任しました。ワンは290億ドルの評価を受けたScale AIを設立し、アメリカ軍、OpenAI、Anthropic、Metaを含む多くのAI大手にデータサービスを提供しています。Scale AIのコアビジネスは、大量の正確なラベル付けデータを提供することです。
Scale AIが多くのユニコーンの中で際立っている理由は、AI産業におけるデータの重要性を早くから認識していたことにあります。計算能力、モデル、データはAIモデルの三大柱です。大きなモデルを人に例えるなら、モデルは体、計算能力は食べ物、データは知識と情報です。
大規模言語モデルの急速な発展の中で、業界の焦点はモデルから計算力への移行を経験しました。現在、ほとんどのモデルはフレームワークとしてtransformerを採用しており、時折MoEやMoReなどの革新があります。主要企業は自社でスーパーコンピュータクラスターを構築するか、AWSなどのクラウドサービスプロバイダーと長期契約を結んでいます。計算力という基礎的な問題が解決された後、データの重要性が徐々に浮き彫りになっています。
従来のTo Bビッグデータ企業とは異なり、Scale AIはAIモデルのために堅固なデータ基盤を構築することに専念しています。ビジネスは既存データの掘り起こしだけでなく、より長期的なデータ生成ビジネスも含まれています。会社はまた、異なる分野の人工専門家で構成されるAIトレーニングチームを編成し、AIモデルにより高品質なトレーニングデータを提供しています。
モデルのトレーニングは、事前トレーニングとファインチューニングの二つの段階に分かれます。事前トレーニング段階は、赤ちゃんが話すことを学ぶプロセスに似ており、AIモデルにインターネットから収集した大量のテキストやコードなどの情報を入力する必要があります。ファインチューニング段階は、学校教育に似ており、通常は明確な正誤、答え、方向性があります。特定のデータセットを通じて、モデルに必要な能力を育成することができます。
したがって、必要なデータは2つのカテゴリに分けられます。一つは、過度な処理を必要としない大量のデータで、通常はReddit、Twitter、GithubなどのUGCプラットフォームからのクローリングデータ、公開文献データベース、企業のプライベートデータベースから得られます。もう一つは、モデルの特定の優れた特性を育成するために精密に設計され、選別される必要があり、データのクリーニング、選別、アノテーション、および人間のフィードバックなどの作業が必要です。
モデルの能力がさらに向上するにつれて、より精巧で専門的なトレーニングデータがモデルの能力にとって重要な影響要因となります。長期的に見れば、AIデータは雪球効果を持つ長期的な投資分野であり、初期の作業の蓄積により、データ資産は複利効果を持つようになり、古くなるほど価値が高まります。
Web3の分野では、DataFiの概念が登場しました。Web3 DataFiには多くの利点があります:
! 資産としてのデータ:DataFiは新しいブルーオーシャンを開く
一般のユーザーにとって、DataFiは参加するのに最も有利な分散型AIプロジェクトです。ユーザーはデータファクトリー契約を締結する必要はなく、ウォレットにログインするだけで、データの提供、モデル評価、AIツールを使った簡単な創作、データ取引への参加など、さまざまな簡単なタスクを完了することで参加できます。
現在、Web3 DataFi分野には、Sahara AI、Yupp、Vana、Chainbase、Sapien、Prisma X、Masa、Irys、ORO、Gataなどの一連の潜在的なプロジェクトが登場しています。これらのプロジェクトは、それぞれデータ収集、モデル評価、個人データのマネタイズ、オンチェーンデータのインデックスなど、異なるデータサービス分野に特化しています。
! 資産としてのデータ:DataFiは新しい青い海を開いています
現在、これらのプロジェクトの障壁は一般的に高くありませんが、一旦ユーザーとエコシステムの粘着性が蓄積されると、プラットフォームの優位性は迅速に蓄積されます。したがって、初期のプロジェクトはインセンティブとユーザー体験に重点を置くべきです。同時に、これらのデータプラットフォームは、人件費を管理し、データ生成の質を確保する方法を考慮する必要があります。劣った通貨が優れた通貨を追い出す事態を避けるために。
さらに、透明性の向上も現在のオンチェーンプロジェクトが直面している重要な課題の一つです。ますます多くのプロジェクトが、Web3 DataFiの健全な発展を促進するために、公に、透明な長期的な決意を示す必要があります。
DataFiの大規模なアプリケーションパスは、二つの側面を含んでいます。一つは、十分な数の一般ユーザーをデータ収集と生成に参加させ、AI経済の消費者グループを形成することです。もう一つは、主流の大企業からの認識を得ることであり、短期的にはそれらが依然としてデータの大規模な供給元であるからです。
全体として、DataFiは人間の知性が長期にわたって機械の知性を育成するプロセスを表し、スマートコントラクトを通じて人間の労働の利益を保証し、最終的には機械の知性が人間に恩返しをすることを実現します。AI時代に不確実性を感じている人々にとって、DataFiに参加することはトレンドに沿った賢明な選択と言えるでしょう。
! 資産としてのデータ:DataFiは新しい青い海を開いています