OpenLedger:データ駆動型のエージェント経済インフラを構築する

OpenLedgerデプス研究報告:データ駆動型、モデルコンポーザブルなエージェント経済の構築

一、引言 | Crypto AIのモデルレイヤーのジャンプ

データ、モデルと算力はAIインフラストラクチャの三大コア要素であり、燃料(データ)、エンジン(モデル)、エネルギー(算力)の類似性から、どれも欠かすことができません。従来のAI業界のインフラストラクチャの進化パスに似て、Crypto AI分野も同様の段階を経てきました。2024年初頭、市場は一時的に分散型GPUプロジェクトによって主導され、一般的に「算力を競う」粗放な成長ロジックを強調していました。しかし、2025年に入ると、業界の関心は徐々にモデルとデータ層に移行し、Crypto AIが基盤資源の競争から、より持続可能で応用価値のある中層構築へと移行していることを示しています。

General Large Model(LLM)とSpecialized Model(SLM)

従来の大規模言語モデル(LLM)トレーニングは、大規模データセットと複雑な分散アーキテクチャに高度に依存しており、パラメータの規模は70B~500Bに及び、トレーニング1回のコストは数百万ドルに達することが一般的です。一方、SLM(Specialized Language Model)は、再利用可能なベースモデルの軽量微調整のパラダイムとして、通常LLaMA、Mistral、DeepSeekなどのオープンソースモデルに基づき、少量の高品質専門データとLoRAなどの技術を組み合わせ、特定の分野知識を備えた専門モデルを迅速に構築し、トレーニングコストと技術的ハードルを大幅に低下させます。

注目すべきは、SLMはLLMの重みには統合されず、エージェントアーキテクチャの呼び出し、プラグインシステムによる動的ルーティング、LoRAモジュールのホットプラグ、RAG(検索強化生成)などの方法でLLMと協力して動作することです。このアーキテクチャはLLMの広範なカバレッジ能力を保持しつつ、ファインチューニングモジュールにより専門的なパフォーマンスを強化し、高度に柔軟な組み合わせ型インテリジェントシステムを形成しています。

Crypto AIのモデル層における価値と境界

Crypto AIプロジェクトは本質的に大規模言語モデル(LLM)のコア能力を直接向上させることが難しい。その核心的な理由は、

  • 技術的なハードルが高すぎる:Foundation Modelの訓練に必要なデータ規模、計算リソース、エンジニアリング能力は非常に膨大であり、現在は一部のテクノロジー大手のみがその能力を持っている。
  • オープンソースエコシステムの制限:主流の基盤モデルであるLLaMAやMixtralはオープンソース化されているが、モデルの突破を促進する真の鍵は依然として研究機関とクローズドソースのエンジニアリングシステムに集中しており、チェーン上プロジェクトのコアモデル層への参加の余地は限られている。

しかし、オープンソースの基盤モデルの上に、Crypto AIプロジェクトは依然として特化した言語モデル(SLM)を微調整し、Web3の検証性とインセンティブメカニズムを組み合わせることで価値の拡張を実現できます。AI産業チェーンの「周辺インターフェース層」として、2つのコア方向に体現されています:

  • 信頼できる検証層:チェーン上にモデル生成の経路、データの貢献と使用状況を記録することで、AI出力のトレース可能性と改ざん耐性を強化します。
  • インセンティブメカニズム:ネイティブトークンを利用して、データのアップロード、モデルの呼び出し、エージェント(Agent)の実行などの行動を促進し、モデルのトレーニングとサービスの正のサイクルを構築します。

AIモデルタイプ分類とブロックチェーンの適用性分析

ここから、モデル型Crypto AIプロジェクトの実現可能なポイントは、主に小型SLMの軽量化の微調整、RAGアーキテクチャのオンチェーンデータの接続と検証、そしてEdgeモデルのローカル展開とインセンティブに集中していることがわかります。ブロックチェーンの検証可能性とトークンメカニズムを組み合わせることで、Cryptoはこれらの中低リソースモデルシナリオに特有の価値を提供し、AIの"インターフェース層"の差別化された価値を形成することができます。

データとモデルに基づくブロックチェーンAIチェーンは、各データとモデルの貢献元を明確かつ改ざん不可能な形でオンチェーン記録することができ、データの信頼性とモデルのトレーニングのトレーサビリティを大幅に向上させます。同時に、スマートコントラクトのメカニズムを通じて、データやモデルが呼び出されると自動的に報酬分配がトリガーされ、AIの行動を測定可能で取引可能なトークン化された価値に変換し、持続可能なインセンティブ体系を構築します。さらに、コミュニティのユーザーはトークン投票を通じてモデルのパフォーマンスを評価したり、ルールの策定や反復に参加したりして、分散型ガバナンス構造を改善できます。

! [OpenLedger In-Depth Research Report: Building a Data-Driven, Model-Composable Agent Economy Based on OP Stack+EigenDA](https://img-cdn.gateio.im/social/ モーメント-62B3FA1E810F4772AABA3D91C74C1AA6)

二、プロジェクト概要 | OpenLedgerのAIチェーンビジョン

OpenLedgerは現在の市場で数少ない、データとモデルのインセンティブメカニズムに特化したブロックチェーンAIプロジェクトです。 "Payable AI"の概念を初めて提唱し、公平で透明かつコンポーザブルなAI実行環境を構築することを目指しています。データ貢献者、モデル開発者、AIアプリケーション構築者が同じプラットフォームで協力し、実際の貢献に基づいてオンチェーンの収益を得るようにします。

OpenLedgerは"データ提供"から"モデルデプロイ"、さらには"呼び出し分配"までの全チェーンのクローズドループを提供しており、そのコアモジュールには以下が含まれます:

  • モデルファクトリー:プログラミングなしで、オープンソースLLMに基づいてLoRA微調整トレーニングを使用し、カスタムモデルを展開できます;
  • OpenLoRA:千のモデルの共存をサポートし、必要に応じて動的にロードし、展開コストを大幅に削減します;
  • PoA(アトリビューションの証明):チェーン上の呼び出し記録を通じて貢献度の測定と報酬の配分を実現する;
  • Datanets:特定の垂直シーンに向けた構造化データネットワークで、コミュニティの協力によって構築・検証される;
  • モデル提案プラットフォーム(Model Proposal Platform):組み合わせ可能、呼び出し可能、支払い可能なオンチェーンモデルマーケット。

上記のモジュールを通じて、OpenLedgerはデータ駆動型でモデルが組み合わせ可能な「スマートエコノミーインフラ」を構築し、AIバリューチェーンのオンチェーン化を推進しています。

そして、ブロックチェーン技術の採用において、OpenLedgerはOP Stack + EigenDAを基盤として、AIモデルのために高性能、低コスト、検証可能なデータと契約の実行環境を構築しました。

  • OPスタックに基づいて構築:Optimism技術スタックに基づき、高いスループットと低コストの実行をサポート;
  • イーサリアムメインネットでの決済: 取引の安全性と資産の完全性を確保する;
  • EVM互換:開発者がSolidityに基づいて迅速にデプロイおよび拡張するのに便利;
  • EigenDAはデータの可用性をサポート:ストレージコストを大幅に削減し、データの検証可能性を確保します。

いくつかのより基盤的で、データ主権と「AI Agents on BOS」アーキテクチャを主打とした汎用AIチェーンと比較して、OpenLedgerはデータとモデルのインセンティブに特化したAI専用チェーンの構築により重点を置いています。モデルの開発と呼び出しがチェーン上で追跡可能、組み合わせ可能、持続可能な価値のクローズドループを実現することに努めています。それはWeb3の世界におけるモデルインセンティブのインフラストラクチャであり、HuggingFaceスタイルのモデルホスティング、Stripeスタイルの使用課金、Infuraスタイルのチェーン上の組み合わせ可能なインターフェースを組み合わせ、「モデルは資産」という実現の道筋を推進しています。

! [OpenLedger In-Depth Research Report: Building a Data-Driven, Model-Composable Agent Economy Based on OP Stack+EigenDA](https://img-cdn.gateio.im/social/ モーメント-19C2276FCCC616CCF9260FB7E35C9C24)

三、OpenLedgerのコアコンポーネントと技術アーキテクチャ

3.1 モデルファクトリー、コード不要のモデルファクトリー

ModelFactoryはOpenLedgerエコシステムの下にある大規模言語モデル(LLM)微調整プラットフォームです。従来の微調整フレームワークとは異なり、ModelFactoryは完全にグラフィカルなインターフェース操作を提供し、コマンドラインツールやAPI統合は不要です。ユーザーはOpenLedger上で完了したデータセットに基づいてモデルを微調整できます。データの権限付与、モデルのトレーニング、デプロイメントの統合ワークフローを実現しており、そのコアプロセスには以下が含まれます:

  • データアクセス制御: ユーザーがデータリクエストを提出し、提供者が審査承認し、データが自動的にモデル訓練インターフェースに接続されます。
  • モデル選択と設定: 主流のLLM(LLaMA、Mistralなど)をサポートし、GUIを通じてハイパーパラメータを設定できます。
  • 軽量化微調: 内蔵LoRA / QLoRAエンジン、リアルタイムでトレーニング進行状況を表示。
  • モデル評価とデプロイ:内蔵評価ツール、エクスポートデプロイまたはエコシステム共有呼び出しをサポート。
  • インタラクティブ検証インターフェース: チャット形式のインターフェースを提供し、モデルの質問応答能力を直接テストしやすくします。
  • RAG生成トレーサビリティ: 出所の引用を含む回答により、信頼性と監査可能性を強化します。

Model Factoryシステムアーキテクチャは、6つの主要モジュールを含み、アイデンティティ認証、データ権限、モデル微調整、評価展開、RAGトレーサビリティを通じて、安全で制御可能、リアルタイムインタラクション、持続可能な収益化を実現する統合モデルサービスプラットフォームを構築します。

ModelFactoryが現在サポートしている大規模言語モデルの能力の概要は以下の通りです:

  • LLaMAシリーズ:エコシステムが最も広く、コミュニティが活発で、汎用性能が強い、現在最も主流のオープンソース基盤モデルの一つです。
  • Mistral:アーキテクチャが効率的で、推論性能が非常に優れており、柔軟なデプロイメントやリソースが限られたシーンに適しています。
  • Qwen:アリババ製、中文タスクのパフォーマンスが優れており、総合能力が高く、国内の開発者に最適です。
  • ChatGLM:中文対話効果が突出しており、垂直型カスタマーサービスやローカライズシーンに適しています。
  • Deepseek:コード生成と数学的推論に優れており、スマート開発支援ツールに適しています。
  • Gemma:Googleが提供する軽量モデルで、構造が明確で、迅速に使い始めたり実験したりしやすい。
  • Falcon:かつては性能のベンチマークであり、基礎研究や比較テストに適していましたが、コミュニティの活性度は減少しています。
  • BLOOM:多言語サポートが強いが、推論性能は弱めで、言語カバレッジ型の研究に適しています。
  • GPT-2:古典的初期モデルで、教育や検証目的にのみ適しており、実際の展開には推奨されません。

OpenLedgerのモデルの組み合わせには最新の高性能MoEモデルやマルチモーダルモデルは含まれていないが、その戦略は時代遅れではなく、チェーン上のデプロイメントの現実的な制約(推論コスト、RAG適合、LoRA互換性、EVM環境)に基づいた"実用優先"の構成がなされている。

Model Factoryはノーコードツールチェーンとして、すべてのモデルに貢献証明メカニズムが組み込まれており、データ提供者とモデル開発者の権利を確保しています。低いハードル、収益化可能性、そして組み合わせ可能性という利点を持ち、従来のモデル開発ツールと比較して:

  • 開発者向け:モデルのインキュベーション、配布、収入の完全なパスを提供;
  • プラットフォームについて:モデル資産の流通と組み合わせエコシステムを形成する;
  • アプリケーション利用者に対して:モデルやエージェントをAPIを呼び出すように組み合わせて使用できます。

! [OpenLedger In-Depth Research Report: Building a Data-Driven, Model-Composable Agent Economy Based on OP Stack+EigenDA](https://img-cdn.gateio.im/social/ モーメント-F23F47F09226573B1FCACEBDCFB8C1F3)

3.2 OpenLoRA、微調整モデルのオンチェーンアセット化

LoRA(Low-Rank Adaptation)は、効率的なパラメータ微調整方法であり、事前学習された大規模モデルに「低秩行列」を挿入することで新しいタスクを学ぶことができ、元のモデルのパラメータを変更することなく、トレーニングコストとストレージの要件を大幅に削減します。従来の大規模言語モデル(例えばLLaMA、GPT-3)は、通常数十億から千億のパラメータを持っています。それらを特定のタスク(法律質問応答や医療相談など)に使用するためには、微調整(fine-tuning)が必要です。LoRAの核心的な戦略は、「元の大規模モデルのパラメータを固定し、新しく挿入したパラメータ行列のみをトレーニングすること」です。これにより、パラメータ効率が高く、トレーニングが迅速で、展開が柔軟であり、現在のWeb3モデルの展開と組み合わせ呼び出しに最も適した主流の微調整方法となっています。

OpenLoRAはOpenLedgerが構築した、複数モデルの展開とリソース共有のために特別に設計された軽量推論フレームワークです。これの核心的な目標は、現在のAIモデル展開において一般的な高コスト、低再利用、GPUリソースの無駄遣いなどの問題を解決し、"可支払AI"(Payable AI)の実行を推進することです。

OpenLoRAシステムアーキテクチャのコアコンポーネントは、モジュール設計に基づき、モデルストレージ、推論実行、リクエストルーティングなどの重要なプロセスをカバーし、高効率で低コストのマルチモデルデプロイメントと呼び出し能力を実現します。

  • LoRAアダプタストレージモジュール (LoRAアダプタストレージ):微調整されたLoRAアダプタはOpenLedgerにホストされ、必要に応じてロードされるため、すべてのモデルをメモリに事前にロードすることを避け、リソースを節約します。
  • モデルホスティングとダイナミックマージングレイヤー (Model Hosting & Adapter Merging Layer):すべてのファインチューニングモデルは基本の大モデル(base model)を共有し、推論時にLoRAアダプターが動的にマージされ、複数のアダプターの共同推論(ensemble)をサポートし、性能を向上させます。
  • 推論エンジン:Flash-Attention、Paged-Attention、SGMV最適化など、複数のCUDA最適化技術を統合します。
  • リクエストルーターとトークンストリーミングモジュール (Request Router & Token Streaming): リクエストに必要なモデルに基づいて正しいアダプターに動的にルーティングし、最適化されたカーネルを通じてトークンレベルのストリーミング生成を実現します。

OpenLoRAの推論プロセスは、技術的な側面で「成熟した一般的な」モデルサービスの「プロセス」に属します。以下の通りです:

  • 基本モデルのロード:システムはLLaMA 3、Mistralなどの基本的な大規模モデルをGPUメモリにプリロードします。 ※LoRAダイナミックリトリーブ:リクエストを受けた後、Hugging Face、Predibase、Benから
原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • 4
  • 共有
コメント
0/400
FrogInTheWellvip
· 08-03 20:43
誰が暗号化の世界は炒めるだけだと言ったのか
原文表示返信0
MevHuntervip
· 08-03 20:37
コンピューティングパワーが動かなくなった データに移行しよう
原文表示返信0
MEVSandwichMakervip
· 08-03 20:33
正直言って、全然理解できない。スマートボディ
原文表示返信0
PaperHandSistervip
· 08-03 20:20
うーん、もうGPUに飽きちゃったね。
原文表示返信0
いつでもどこでも暗号資産取引
qrCode
スキャンしてGateアプリをダウンロード
コミュニティ
日本語
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)