Web3におけるAIスタックの機会探求:コンピューティングパワーの共有からデータプライバシーまで

AI+Web3: タワーとプラザ

TL; 博士

  1. AI概念のWeb3プロジェクトは、一次市場と二次市場で資金を集める標的となっています。

  2. Web3 における AI 業界の機会は、データ、ストレージ、計算を横断する潜在的な供給を調整するために分散インセンティブを使用することに現れています。同時に、オープンソースモデルと AI エージェントの分散型市場を構築します。

  3. AIがWeb3業界で主に活躍する場は、オンチェーン金融(暗号支払い、取引、データ分析)および開発支援です。

  4. AI+Web3の有用性は、両者の補完性に現れます:Web3はAIの集中化に対抗することが期待され、AIはWeb3が境界を越える手助けをすることが期待されています。

! AI+Web3: タワー&プラザ

はじめに

ここ2年、AIの発展は加速キーが押されたかのようで、Chatgptによって引き起こされた蝶の羽は、生成的人工知能の新しい世界を開くだけでなく、対岸のWeb3でも潮流を巻き起こしています。

AIのコンセプトの加護の下、停滞している暗号市場における資金調達が明らかに活性化しています。メディアの統計によると、2024年上半期だけで、64のWeb3+AIプロジェクトが資金調達を完了しました。人工知能に基づくオペレーティングシステムZyber365は、Aラウンドで1億ドルの最高資金調達額を達成しました。

二次市場はさらに繁栄しており、ある暗号集約サイトのデータによると、わずか1年余りの間にAI分野の総市場価値は485億ドルに達し、24時間の取引量は86億ドルに近づいています。主流のAI技術の進展による恩恵は明らかで、ある会社のSoraテキストから映像へのモデルが発表された後、AIセクターの平均価格は151%上昇しました。また、AIの影響は暗号通貨の収益を上げるセクターの一つであるMemeにも波及しています。初のAIエージェント概念を持つMemeCoin------GOATは急速に人気を博し、14億ドルの評価額を獲得し、AI Memeブームを成功裏に巻き起こしました。

AI+Web3に関する研究や話題も非常に盛り上がっています。AI+DepinからAI Memecoin、そして現在のAI AgentやAI DAOに至るまで、FOMOの感情は新しいストーリーの入れ替えの速度についていけていません。

AI+Web3、この熱い資金、流行と未来の幻想に満ちた用語の組み合わせは、資本によって結びつけられた強制的な結婚と見なされるのは避けられません。この華麗なローブの下で、結局のところ、投機者の舞台なのか、それとも夜明けの爆発の前夜なのか、私たちは区別するのが難しいようです。

この質問に答えるためには、双方にとって重要な考察が必要です。それは、相手がいることで本当に良くなるのか?相手のモデルから利益を得ることができるのか?この記事では、先人の肩の上に立ってこのパターンを考察しようとしています:Web3 が AI 技術スタックの各段階でどのように機能するか、そして AI が Web3 にどのような新しい活力をもたらすことができるのか?

Part.1 AIスタック下のWeb3にはどのような機会があるのか?

このトピックを展開する前に、AI大モデルの技術スタックを理解する必要があります。

! AI+Web3:タワー&スクエア

よりわかりやすい言葉で全体のプロセスを表現すると、「大モデル」は人間の脳のようなもので、初期段階ではこの脳は人間社会に現れたばかりの赤ちゃんに属し、周囲からの膨大な情報を観察し摂取してこの世界を理解する必要があります。これがデータの「収集」段階です。コンピュータは人間の視覚や聴覚などの感覚を持っていないため、トレーニングの前に外部の大規模な無標識情報は「前処理」を通じてコンピュータが理解できる有用な情報形式に変換する必要があります。

データを入力すると、AIは「トレーニング」を通じて理解と予測能力を持つモデルを構築します。これは、赤ちゃんが外界を理解し学習していく過程と見ることができます。モデルのパラメータは、赤ちゃんが学習する過程で調整される言語能力のようなものです。学習内容が分野ごとに分かれたり、人との交流を通じてフィードバックを得て修正が行われると、大規模モデルの「ファインチューニング」段階に入ります。

子供は成長し、話すことを学ぶと、新しい会話の中で意味を理解し、自分の感情や考えを表現できるようになります。この段階はAI大モデルの「推論」に似ており、モデルは新しい言語やテキスト入力に対して予測や分析を行うことができます。赤ちゃんは言語能力を通じて感情を表現し、物体を説明し、さまざまな問題を解決します。これは、AI大モデルが訓練を完了し、使用に投入された後、推論段階で特定のタスクに適用されることにも似ています。例えば、画像分類や音声認識などです。

AIエージェントは、次の大規模モデルの形態に近づいています------独立してタスクを実行し、複雑な目標を追求できるだけでなく、思考能力を備え、記憶、計画ができ、ツールを使って世界と相互作用することができます。

現在、AIの各スタックの痛点に対処するために、Web3は現在、AIモデルプロセスの各段階をカバーする多層的で相互接続されたエコシステムを初めて形成しています。

1. 基本レイヤー: Airbnb (計算能力とデータ)

ハッシュレート

現在、AI の最高コストの一つは、モデルのトレーニングと推論に必要な計算能力とエネルギーです。

一例として、ある会社のLLAMA3は、特定のメーカーが製造した16000個のH100GPU(これは人工知能と高性能計算のワークロード向けに設計されたトップクラスのグラフィックス処理ユニット)を必要とし、トレーニングには30日かかります。後者の80GBバージョンの単価は30,000ドルから40,000ドルの間であり、4億から7億ドルの計算ハードウェア投資(GPU+ネットワークチップ)が必要です。また、毎月のトレーニングには16億キロワット時を消費し、エネルギー支出は毎月約2000万ドルに達します。

AIの計算能力の解放は、Web3がAIと最初に交差した分野であり-----DePin(分散型物理インフラネットワーク)です。現在、あるデータサイトには1400以上のプロジェクトが展示されています。その中で、GPU計算能力を共有する代表的なプロジェクトには、io.net、Aethir、Akash、Render Networkなどがあります。

その主な論理は、プラットフォームが余剰のGPUリソースを持つ個人または団体に、許可なしで分散型の方法で計算能力を提供することを許可することにあります。これは、あるタクシー配車アプリや短期レンタルプラットフォームの買い手と売り手のオンライン市場に似ており、未活用のGPUリソースの使用率を向上させ、最終ユーザーはその結果、より低コストで効率的な計算リソースを得ることができます。同時に、ステーキングメカニズムにより、品質管理メカニズムに違反したりネットワークが中断された場合には、リソース提供者に相応の罰則が科せられることも保証されます。

その特徴は次のとおりです:

  • 余剰のGPUリソースを集める:供給者は主に第三者の独立した中小型データセンターや暗号マイニングファームなどのオペレーターの過剰な計算能力リソースで、コンセンサスメカニズムはPoSのマイニングハードウェア、例えばあるストレージネットワークとある主要なパブリックチェーンのマイニングマシンです。現在、exolabがあるブランドのノートパソコン、スマートフォン、タブレットなどのローカルデバイスを利用して大規模モデル推論の計算ネットワークを構築するなど、より低い参入障壁を持つデバイスを立ち上げることに取り組んでいるプロジェクトもあります。

  • AI計算力のロングテール市場に直面して:

a.「技術的な観点から見ると」去中心化された計算力市場は推論ステップにより適しています。トレーニングは超大規模なGPUクラスタによるデータ処理能力に依存するのに対し、推論はGPUの計算性能に対する依存度が相対的に低いです。例えば、Aethirは低遅延のレンダリング作業とAI推論アプリケーションに焦点を当てています。

b.「需要側に関して」中小の計算力需要者は自分自身の大規模モデルを単独で訓練することはなく、少数のリーディング大規模モデルの周りで最適化やファインチューニングを選択するだけです。そして、これらのシナリオは分散した未使用の計算資源に自然に適しています。

  • 分散型所有権:ブロックチェーンの技術的意義は、リソースの所有者が常にリソースに対するコントロールを保持し、需要に応じて柔軟に調整し、同時に利益を得ることができることです。

データ

データは、AIの基盤です。データがなければ、計算は浮草のように無意味になり、データとモデルの関係は「ガーベジ・イン、ガーベジ・アウト」ということわざのようです。データの量と入力の質が最終的なモデルの出力品質を決定します。現在のAIモデルのトレーニングにおいて、データはモデルの言語能力、理解能力、さらには価値観や人間らしさを決定します。現在、AIのデータ需要の困難は主に以下の4つの側面に集中しています:

  • データの渇望:AIモデルの訓練は大量のデータ入力に依存しています。公開された資料によると、ある企業がGPT-4を訓練するために使用したパラメータの数は兆のレベルに達しました。

  • データ品質:AIと各業界の結びつきが進む中で、データのタイムリーさ、データの多様性、特化データの専門性、ソーシャルメディアの感情などの新興データソースの取り入れが、その品質に新たな要求をもたらしています。

  • プライバシーとコンプライアンスの問題:現在、各国や企業は高品質なデータセットの重要性に徐々に気づき、データセットのクローリングに制限をかけています。

  • データ処理コストが高い:データ量が多く、処理プロセスが複雑です。公開資料によると、AI企業の30%以上の研究開発コストは基礎データの収集と処理に使用されています。

現在、web3 のソリューションは以下の四つの側面に現れています:

1、データ収集:無料で提供される実世界のデータの収集が急速に枯渇しており、AI企業のデータへの支出は年々増加しています。しかし、その一方で、この支出はデータの真の貢献者には還元されておらず、プラットフォームはデータによる価値創造を享受しています。例えば、あるソーシャルプラットフォームはAI企業とのデータライセンス契約を通じて合計2.03億ドルの収入を実現しています。

真に貢献するユーザーがデータによる価値創造に参加し、分散型ネットワークとインセンティブメカニズムを通じて、低コストでよりプライベートで価値のあるデータを取得することがWeb3のビジョンです。

  • Grassは、ユーザーがGrassノードを運営することで、未使用の帯域幅と中継トラフィックを提供し、インターネット全体からリアルタイムデータをキャッチし、トークン報酬を得ることができる分散型データ層とネットワークです;

  • Vanaは、ユーザーが自分のプライベートデータ(ショッピング履歴、ブラウジング習慣、ソーシャルメディア活動など)を特定のデータ流動性プール(DLP)にアップロードし、これらのデータを特定の第三者に使用するための権限を与えるかどうかを柔軟に選択できる独自のDLPコンセプトを導入しました;

  • PublicAI では、ユーザーは特定のソーシャルプラットフォーム上で #AI 或#Web3 をカテゴリタグとして使用し、@PublicAI することでデータ収集を実現できます。

2、データ前処理:AI のデータ処理プロセスでは、収集されたデータが通常ノイズを含んでおり、エラーがあるため、モデルのトレーニングの前にそれをクリーンアップし、使用可能な形式に変換する必要があります。これは標準化、フィルタリング、欠損値の処理などの繰り返しタスクを含みます。この段階は AI 業界で数少ない手作業のプロセスであり、データアノテーションの専門職が生まれました。モデルがデータ品質に対する要求を高めるにつれて、データアノテーションの専門家のハードルも上がっています。このタスクは、Web3 の分散型インセンティブメカニズムに自然に適しています。

  • 現在、GrassとOpenLayerはデータアノテーションという重要なステップを追加することを検討しています。

  • Synesisは「Train2earn」のコンセプトを提唱しており、データの質を強調しています。ユーザーは、ラベル付けされたデータ、注釈、またはその他の形式の入力を提供することで報酬を得ることができます。

  • データラベリングプロジェクトSapienは、ラベリングタスクをゲーム化し、ユーザーがポイントをステーキングしてより多くのポイントを獲得できるようにします。

3、データプライバシーとセキュリティ:明確にする必要があるのは、データプライバシーとセキュリティは異なる概念であるということです。データプライバシーはセンシティブデータの取り扱いに関わり、データセキュリティはデータ情報を無許可のアクセス、破壊、盗難から保護します。したがって、Web3プライバシー技術の利点と潜在的な適用シーンは二つの側面に現れます:(1)センシティブデータのトレーニング;(2)データ協力:複数のデータ所有者が元のデータを共有することなくAIトレーニングに共同で参加できます。

現在の Web3 で一般的なプライバシー技術には、以下が含まれます:

  • Trusted Execution Environment (TEE) (例: Super Protocol);

  • BasedAI、Fhenix.io、Inco Networkなどの完全準同型暗号化(FHE)。

  • ゼロ知識技術(zk)、例えば Reclaim Protocol は zkTLS 技術を使用して、HTTPSトラフィックのゼロ知識証明を生成し、ユーザーが外部サイトから活動、評判、そしてアイデンティティデータを安全にインポートできるようにし、敏感な情報を公開することなく行います。

しかし、現在この分野はまだ初期段階にあり、ほとんどのプロジェクトはまだ探索中です。現在の一つのジレンマは計算コストが高すぎることであり、いくつかの例は次のとおりです:

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • 5
  • 共有
コメント
0/400
HashBanditvip
· 12時間前
私のマイニング時代には、本当の分散化がありました... このAIのハイプのナンセンスではなく、ため息。
原文表示返信0
CoconutWaterBoyvip
· 12時間前
お金があれば一緒に稼ぎましょう〜
原文表示返信0
CryptoTherapistvip
· 12時間前
ちょっと深呼吸のエクササイズをして、このAI-Web3の統合による不安を処理してくるね、正直に言うと。
原文表示返信0
SleepTradervip
· 12時間前
またコンセプトを炒めていますね、資金を集める道具に過ぎません。
原文表示返信0
shadowy_supercodervip
· 13時間前
aiはお金を稼ぐだけです。
原文表示返信0
いつでもどこでも暗号資産取引
qrCode
スキャンしてGateアプリをダウンロード
コミュニティ
日本語
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)