AIが暗号資産の代理人として- AIエージェントの進化

中級1/27/2025, 7:42:00 AM
AIは暗号資産のエージェントであり、これは現在のAIの急増を暗号通貨の視点から見るための最良の注釈です。暗号資産のAIへの熱狂は他の産業と異なり、特にそれと金融資産の発行と運用を統合することを目指しています。

暗号資産のエージェントとしてのAI

「芸術作品は決して完成されることはなく、ただ放棄されるだけです。」

みんなAIエージェントについて話していますが、彼らが言っていることは同じではありません。それが、私たちの視点、一般の視点、そしてAIの実践者の視点からAIエージェントの異なる理解につながっています。

かなり前に、私はそれを書いた暗号資産はAIの幻想です. それ以来、暗号資産とAIの組み合わせは一方的な恋愛関係のままです。AIの専門家はほとんどWeb3やブロックチェーンについて言及せず、一方暗号資産の愛好家はAIに深く夢中です。AIエージェントフレームワークがトークン化される現象を目の当たりにした後、AIの専門家が本当に私たちの世界に参入することができるのかは不確かです。

AIは暗号資産のエージェントです。現在のAIの急増を見るために、暗号資産の観点から最高の注釈です。暗号資産は他の産業とは異なり、特に金融資産の発行と運用を統合することを望んでいます。

エージェントの進化:テクニカルマーケティングの起源

AI エージェントは少なくとも3つのソースを持っています。OpenAI の AGI(Artificial General Intelligence)はこれを重要な一歩と捉え、その用語を技術サークルを超えて人気のある言葉に変えました。しかし、本質的には、エージェントは新しい概念ではありません。AI の力を借りても、それが革命的な技術トレンドであるとは言い難いです。

最初のソースは、OpenAIによって見られるAIエージェントです。自動運転のレベルL3と同様に、AIエージェントはある程度の高度な支援能力を持っていると見なすことができますが、まだ完全に人間を置き換えることはできません。

画像キャプション:OpenAI計画のAGIフェーズ

画像の出所: https://www.bloomberg.com/

第2のソースは、その名前が示す通り、AIによって強化されたエージェントであるAIエージェントです。コンピューティングの分野では、エージェンシーと委任メカニズムのコンセプトは新しいものではありません。しかし、OpenAIのビジョンの下では、エージェントは会話形式(ChatGPTのような)や推論形式(さまざまなボットのような)に続くL3の段階になります。この段階のキーフィーチャーは、「特定の振る舞いを自律的に行う」という能力であり、LangChainの創設者であるHarrison Chaseが定義するように、「AIエージェントはプログラム内で制御フローの決定を行うためにLLM(Large Language Model)を使用するシステムです」。
ここが興味深くなるところです。LLMの出現以前は、エージェントは主に人間が設定した自動化プロセスを実行していました。たとえば、Webスクレイパーを設計するときに、プログラマーはユーザーエージェントを設定して、実際のユーザーが使用しているブラウザバージョンやオペレーティングシステムなどの詳細をシミュレートしました。より正確に人間の行動を模倣するためにAIエージェントが使用されれば、AIエージェントベースのWebスクレイパーフレームワークが作成され、スクレイパーが「より人間らしく」なります。
このような移行では、AIエージェントの導入は既存のシナリオに統合されなければならず、まったく新しい分野はほとんど存在しません。CurosrやGithub Copilotなどのツールでのコード補完や生成能力も、LSP(Language Server Protocol)の枠組み内での機能の強化に過ぎず、そのような進化の数々がある。

  • Apple: AppleScript (Script Editor) → Alfred → Siri → Shortcuts → Apple Intelligence
  • Terminal:Terminal(macOS)/ PowerShell(Windows)→ iTerm 2 → Warp(AI Native)
  • ヒューマンコンピュータインタラクション:Web 1.0 CLI TCP/IP Netscapeブラウザ → Web 2.0 GUI / REST API / 検索エンジン / Google / スーパーアプリ → Web 3.0 AIエージェント + Dapp?

Web 1.0のGUIとブラウザの組み合わせは、WindowsとIEの組み合わせによって、一般の人々が障壁なくコンピュータを利用できるようになりました。APIはインターネットの背後にあるデータの抽象化と伝送の標準となり、Web 2.0時代にはChromeのようなブラウザが登場し、モバイルへのシフトが人々のインターネット利用の習慣を変えました。WeChatのようなスーパーアプリやMetaプラットフォームは、現在、人々の生活のあらゆる側面をカバーしています。

第三のソースは、暗号資産空間における「意図」という概念であり、これがAIエージェントに関心が高まる原動力となっています。ただし、これは暗号資産内でのみ適用されることに注意してください。ビットコインの機能が限定されたスクリプトからイーサリアムのスマートコントラクトまで、エージェントの概念自体が広く使用されています。その後のクロスチェーンブリッジ、チェーン抽象化、EOA(外部所有アカウント)からAA(アカウント抽象化)ウォレットの登場は、この考え方の自然な拡張です。したがって、AIエージェントが暗号資産に「侵入」すると、DeFiシナリオに自然につながることは驚くべきことではありません。

ここで、AIエージェントの概念をめぐる混乱が生じます。クリプトの文脈では、私たちが実際に達成しようとしているのは、「自動化された財務管理、自動化されたミーム生成」エージェントです。しかし、OpenAIの定義では、このようなリスクの高いシナリオでは、L4またはL5を真に実装する必要があります。一方、一般の人々は、自動コード生成やAIを活用した要約と執筆支援を実験していますが、これらは私たちが追求している目標と同じレベルではありません。

私たちが本当に望むものを理解すると、AIエージェントの組織論に焦点を当てることができます。技術的な詳細はその後に続きます。AIエージェントの概念は、結局のところ、大規模なテクノロジーの導入の障壁を取り除くことに関するものであり、ブラウザが個人用PC業界を革新したように。私たちの焦点は2つのポイントに置かれます。人間とコンピュータの相互作用の観点からAIエージェントを検討し、AIエージェントとLLMの違いと関連を理解することが、最終的には暗号資産とAIエージェントの組み合わせが最終的に残すものにつながります。

let AI_Agent = LLM+API;

会話型の人間コンピュータインタラクションモデルであるChatGPTなどの以前は、人間コンピュータインタラクションの主な形態はGUI(グラフィカルユーザインターフェース)とCLI(コマンドラインインターフェース)でした。GUIの考え方は、さまざまな具体的な形態、ブラウザやアプリなどに進化しましたが、CLIとシェルの組み合わせはほとんど変わりませんでした。

しかし、これは単なる人間とコンピュータのインタラクションの「フロントエンド」に過ぎません。インターネットが進化するにつれて、データ量と種類の増加は、データ間およびアプリケーション間の「バックエンド」の相互作用の増加につながりました。これら2つの側面はお互いに依存しており、単純なウェブ閲覧行動でさえ、実際にはその協力が必要となります。

もしブラウザやアプリとの人間のやり取りがユーザーのエントリーポイントと考えられるなら、API間のリンクや遷移がインターネットの実際の動作をサポートしています。実際、これもエージェントの一部です。一般のユーザーはコマンドラインやAPIのような用語を理解する必要はありません。自分の目標を達成するためには。

LLMsについても同じです。今、ユーザーはさらに進むことができます。もう検索する必要はありません。全プロセスは次の手順で説明できます。

  1. ユーザーはチャットウィンドウを開きます。
  2. ユーザーは、テキストや音声を通じて自然な言語で自分のニーズを説明します。
  3. LLMはこれを手順に変換します。
  4. LLMは結果をユーザーに返します。

このプロセスでは、最大の課題はGoogleであることがわかります。なぜなら、ユーザーは検索エンジンを開く必要はなく、さまざまなGPTのようなダイアログウィンドウを使用し、トラフィックの入り口が静かに変化しているからです。このため、一部の人々は、このLLMが検索エンジンの生活を革新すると考えています。

では、このプロセスにおいてAIエージェントはどのような役割を果たすのでしょうか?

要するに、AIエージェントはLLMの特化した拡張機能です。

現行のLLMはAGI(人工汎用知能)ではなく、OpenAIの構想するL5オーガナイザーからは程遠いです。その能力は著しく制限されています。例えば、LLMはユーザー入力をあまりにも多く与えると幻覚を起こしやすいです。その主な理由の1つはトレーニングメカニズムにあります。例えば、1+1=3と何度もGPTに伝えると、1+1+1=?について尋ねられた際に4と答える可能性があります。

これは、GPTのフィードバックが完全にユーザーの入力に基づいているために起こります。モデルがインターネットに接続されていない場合、入力によって操作が変更され、1+1=3としか「知らない」モデルになる可能性があります。ただし、モデルがインターネットに接続できる場合、そのフィードバックメカニズムはより多様になります。なぜなら、オンラインデータのほとんどが1+1=2であることを確認するからです。

では、もしLLMsをローカルで使用しなければならず、そういった問題を避けたい場合はどうすればよいでしょうか?

簡単な解決策は、2つのLLMを同時に使用し、エラーの可能性を減らすために相互に検証することです。これだけでは不十分な場合、もう1つのアプローチは、2人のユーザーが1つのプロセスを担当し、質問をする一方で、もう一方がそれを洗練させて言語をより正確で論理的にすることです。

もちろん、インターネットに接続しているからといって、問題が完全になくなるわけではありません。たとえば、LLMが信頼できないソースから回答を取得すると、状況が悪化する可能性があります。ただし、このようなデータを避けると、利用可能な情報の量が減少します。これに対処するために、既存のデータを分割したり、再結合したり、古いデータセットに基づいて新しいデータを生成したりして、回答の信頼性を高めることができます。このアプローチは、本質的に自然言語理解におけるRAG(Retrieval-Augmented Generation)の概念です。

人間と機械は互いを理解する必要があります。複数のLLMsが協力し、相互作用すると、AIエージェントの操作モデルにアクセスします。これらは人間の代理として機能し、大規模なモデルや他のエージェントを含む他のリソースにアクセスします。

これにより、LLMとAIエージェントの間の接続に至ります:

LLMは、人間がチャットインターフェースを通じて対話する知識の集約です。ただし、実際には、特定のワークフローは、プログラム、ボット、または一連の手順に縮小できます。これらはエージェントとして定義されています。

AIエージェントはLLMのサブセットのままでありますが、それらと同一視されるべきではありません。AIエージェントの最も特徴的な点は、外部プログラム、LLM、および他のエージェントとの協力を重視していることにあります。これが人々がしばしばAIエージェントをLLM + APIと要約する理由です。

LLMワークフローでこれを説明するために、APIコールを介したAIエージェントの例を見てみましょう:

  1. 人間のユーザーがチャットウィンドウを開く。
  2. ユーザーは、テキストまたは音声で自然言語でニーズを説明します。
  3. LLMはリクエストをAPI呼び出し関連のAIエージェントのタスクと解釈し、会話をエージェントに移します。
  4. AIエージェントはユーザーのXアカウントとAPI資格情報を要求し、ユーザーの説明に基づいてXに接続します。
  5. AIエージェントは最終結果をユーザーに返します。

人間とコンピュータの相互作用の進化を覚えていますか? Web 1.0やWeb 2.0のブラウザ、API、およびその他の要素はまだ存在していますが、ユーザーはもはや直接それらとやり取りする必要はありません。代わりに、彼らは単にAIエージェントとやり取りすることができます。APIの呼び出しや関連するプロセスはすべて会話形式で行うことができます。これらのAPIサービスは、ローカル、オンライン、または外部アプリケーションからのいかなる種類のデータも網羅することができます。ただし、インターフェースがオープンであり、ユーザーがアクセスする必要な権限を持っている限りです。

上記のような完全なAIエージェントのワークフローでは、LLMはAIエージェントから別個のコンポーネントとして扱われるか、または1つのワークフロー内の2つのサブプロセスとして扱われます。それらがどのように分割されているかに関係なく、目標は常にユーザーのニーズを満たすことです。人間とコンピュータの対話の観点からは、ユーザーが自分自身と話しているような感覚さえあります。自分の思考を完全に表現するだけで、AI/LLM/AIエージェントが繰り返しニーズを推測します。フィードバックメカニズムを組み込み、LLMが現在の文脈を覚えていることを確認することにより、AIエージェントは自分のタスクを見失うことを避けます。

要約すると、AIエージェントは従来のスクリプトや自動化ツールとは異なり、より個人化され、人間らしい創造物です。彼らは個人の助手のように振る舞い、ユーザーの実際のニーズを考慮します。ただし、この個人化は確率的推論に基づいていることに注意することが重要です。L3レベルのAIエージェントは人間レベルの理解力や表現力を持っていないため、外部APIとの統合には本質的なリスクが伴います。

AIフレームワークの商品化後

AIフレームワークを収益化できる能力は、私が暗号資産に興味を持ち続ける主な理由の1つです。従来のAI技術スタックでは、フレームワークは特に重要ではありません。データと計算能力と比較しても、フレームワークはあまり重要ではありません。AIアルゴリズムとモデルフレームワークのほとんどはオープンソースですので、AI製品の収益化はほとんどがフレームワークから始まることはありません。データのような機密要素が独占的なものとなります。

基本的に、AIフレームワークまたはモデルはアルゴリズムのコンテナと組み合わせであり、まるでガチョウを煮込むための鍋のようです。しかし、ガチョウの品質と料理の過程の熟練度こそが本当の味を定義します。理論上、販売対象の製品はガチョウであるべきですが、Web3の顧客はガチョウを捨てて鍋を購入することを好むようです。

これは複雑な理由ではありません。ほとんどのWeb3 AI製品は、既存のAIフレームワーク、アルゴリズム、製品をベースにしており、それらを自分たちの目的に合わせてカスタマイズしています。実際、異なる暗号資産AIフレームワークの技術原則は大きく異なるものではありません。技術自体に差別化がないため、注意はブランディング、アプリケーションシナリオ、およびその他の表面的な違いに移ります。その結果、AIフレームワークへのわずかな調整さえも、さまざまなトークンをサポートするための基盤となり、暗号資産AIエージェントエコシステム内でフレームワークのバブルが生まれます。

トレーニングデータやアルゴリズムへの大規模な投資は必要ありませんので、名前によるフレームワークの差別化は特に重要です。DeepSeek V3のような手頃なフレームワークでも、GPUのパワーや電力、労力にかなりのコストがかかります。

ある意味では、これはWeb3の最近のトレンドと一致しています。トークンを発行するプラットフォームのほうが、トークン自体よりも価値が高いことがよくあります。Pump.FunやHyperliquidのようなプロジェクトは、これを象徴しています。元々、エージェントはアプリケーションや資産を表すものでしたが、エージェントを発行するフレームワークが今では最も注目される商品となっています。

これは価値のアンカリングの形を反映しています。エージェントには差別化がないため、エージェントの発行のためのフレームワークはより安定し、資産発行のための価値吸引効果を生み出します。これは暗号通貨とAIエージェントの統合の1.0バージョンを示しています。

現在、DeFiとAIエージェントの融合に代表される2.0バージョンが登場しています。DeFAIのコンセプトは、市場の誇大広告によって引き起こされた可能性がありますが、次の傾向を詳しく見ると、そうではないことが示唆されます。

  • Morphoは、Aaveなどの確立された貸出プラットフォームに挑戦しています。
  • Hyperliquidは、dYdXなどのオンチェーンデリバティブを置き換え、さらにバイナンスのCEXリストに挑戦しています。
  • ステーブルコインは、オフチェーンシナリオの支払いツールになりつつあります。

このようなDeFiトランスフォーメーションを背景に、AIはDeFiの基本的なロジックを再構築しています。以前は、DeFiのコアロジックはスマートコントラクトの実現可能性を検証することでした。現在、AIエージェントはDeFiの製造ロジックを変えています。DeFi製品を作成するためにDeFiを理解する必要はもうありません。これは、チェーンの抽象化を超えた一歩であり、より深い基礎的なエンパワーメントを提供します。

プログラマーになれる時代が近づいています。複雑な計算はAIエージェントの背後にあるLLMとAPIに外部委託することができ、個人はアイデアに集中することができます。自然言語は効率的にプログラミングロジックに変換することができます。

結論

この記事では、Cookie.Funがすでに優れた仕事をしており、AIエージェント情報の集約とトークンの発見を行うプラットフォームであるため、この記事にはCrypto AIエージェントトークンやフレームワークについて言及されていません。そしてAIエージェントフレームワーク、そしてエージェントトークンの一過性の登場と消滅に続きます。ここでそのような情報をリストアップすることはほとんど価値がありません。

しかしながら、この期間中の観察を通じて、市場はまだ暗号資産AIエージェントが最終的に何を指しているのかについての意味のある議論が不足している。私たちはポインタに焦点を当て続けることはできません;本質はメモリレベルで起こっている変化にある。

暗号資産の魅力は、さまざまな資産をトークン化する能力の進化によって生まれます。

免責事項:

  1. この記事は[から転載されていますZuoye Waibo Mountain]、著作権は元の作者に帰属します[左葉武保山]. If you have any objection to the reprint, please contact gate ラーン, チームは関連手続きに従ってできるだけ早く対応します。
  2. 免責事項:本記事に表明されている見解や意見は、著者個人の見解を示すものであり、投資アドバイスを構成しません。
  3. 記事の他の言語版はGate Learnチームによって翻訳されました。それ以外に明示的に記載されていない限り、翻訳された記事のコピー、配布、盗作はできません。

AIが暗号資産の代理人として- AIエージェントの進化

中級1/27/2025, 7:42:00 AM
AIは暗号資産のエージェントであり、これは現在のAIの急増を暗号通貨の視点から見るための最良の注釈です。暗号資産のAIへの熱狂は他の産業と異なり、特にそれと金融資産の発行と運用を統合することを目指しています。

暗号資産のエージェントとしてのAI

「芸術作品は決して完成されることはなく、ただ放棄されるだけです。」

みんなAIエージェントについて話していますが、彼らが言っていることは同じではありません。それが、私たちの視点、一般の視点、そしてAIの実践者の視点からAIエージェントの異なる理解につながっています。

かなり前に、私はそれを書いた暗号資産はAIの幻想です. それ以来、暗号資産とAIの組み合わせは一方的な恋愛関係のままです。AIの専門家はほとんどWeb3やブロックチェーンについて言及せず、一方暗号資産の愛好家はAIに深く夢中です。AIエージェントフレームワークがトークン化される現象を目の当たりにした後、AIの専門家が本当に私たちの世界に参入することができるのかは不確かです。

AIは暗号資産のエージェントです。現在のAIの急増を見るために、暗号資産の観点から最高の注釈です。暗号資産は他の産業とは異なり、特に金融資産の発行と運用を統合することを望んでいます。

エージェントの進化:テクニカルマーケティングの起源

AI エージェントは少なくとも3つのソースを持っています。OpenAI の AGI(Artificial General Intelligence)はこれを重要な一歩と捉え、その用語を技術サークルを超えて人気のある言葉に変えました。しかし、本質的には、エージェントは新しい概念ではありません。AI の力を借りても、それが革命的な技術トレンドであるとは言い難いです。

最初のソースは、OpenAIによって見られるAIエージェントです。自動運転のレベルL3と同様に、AIエージェントはある程度の高度な支援能力を持っていると見なすことができますが、まだ完全に人間を置き換えることはできません。

画像キャプション:OpenAI計画のAGIフェーズ

画像の出所: https://www.bloomberg.com/

第2のソースは、その名前が示す通り、AIによって強化されたエージェントであるAIエージェントです。コンピューティングの分野では、エージェンシーと委任メカニズムのコンセプトは新しいものではありません。しかし、OpenAIのビジョンの下では、エージェントは会話形式(ChatGPTのような)や推論形式(さまざまなボットのような)に続くL3の段階になります。この段階のキーフィーチャーは、「特定の振る舞いを自律的に行う」という能力であり、LangChainの創設者であるHarrison Chaseが定義するように、「AIエージェントはプログラム内で制御フローの決定を行うためにLLM(Large Language Model)を使用するシステムです」。
ここが興味深くなるところです。LLMの出現以前は、エージェントは主に人間が設定した自動化プロセスを実行していました。たとえば、Webスクレイパーを設計するときに、プログラマーはユーザーエージェントを設定して、実際のユーザーが使用しているブラウザバージョンやオペレーティングシステムなどの詳細をシミュレートしました。より正確に人間の行動を模倣するためにAIエージェントが使用されれば、AIエージェントベースのWebスクレイパーフレームワークが作成され、スクレイパーが「より人間らしく」なります。
このような移行では、AIエージェントの導入は既存のシナリオに統合されなければならず、まったく新しい分野はほとんど存在しません。CurosrやGithub Copilotなどのツールでのコード補完や生成能力も、LSP(Language Server Protocol)の枠組み内での機能の強化に過ぎず、そのような進化の数々がある。

  • Apple: AppleScript (Script Editor) → Alfred → Siri → Shortcuts → Apple Intelligence
  • Terminal:Terminal(macOS)/ PowerShell(Windows)→ iTerm 2 → Warp(AI Native)
  • ヒューマンコンピュータインタラクション:Web 1.0 CLI TCP/IP Netscapeブラウザ → Web 2.0 GUI / REST API / 検索エンジン / Google / スーパーアプリ → Web 3.0 AIエージェント + Dapp?

Web 1.0のGUIとブラウザの組み合わせは、WindowsとIEの組み合わせによって、一般の人々が障壁なくコンピュータを利用できるようになりました。APIはインターネットの背後にあるデータの抽象化と伝送の標準となり、Web 2.0時代にはChromeのようなブラウザが登場し、モバイルへのシフトが人々のインターネット利用の習慣を変えました。WeChatのようなスーパーアプリやMetaプラットフォームは、現在、人々の生活のあらゆる側面をカバーしています。

第三のソースは、暗号資産空間における「意図」という概念であり、これがAIエージェントに関心が高まる原動力となっています。ただし、これは暗号資産内でのみ適用されることに注意してください。ビットコインの機能が限定されたスクリプトからイーサリアムのスマートコントラクトまで、エージェントの概念自体が広く使用されています。その後のクロスチェーンブリッジ、チェーン抽象化、EOA(外部所有アカウント)からAA(アカウント抽象化)ウォレットの登場は、この考え方の自然な拡張です。したがって、AIエージェントが暗号資産に「侵入」すると、DeFiシナリオに自然につながることは驚くべきことではありません。

ここで、AIエージェントの概念をめぐる混乱が生じます。クリプトの文脈では、私たちが実際に達成しようとしているのは、「自動化された財務管理、自動化されたミーム生成」エージェントです。しかし、OpenAIの定義では、このようなリスクの高いシナリオでは、L4またはL5を真に実装する必要があります。一方、一般の人々は、自動コード生成やAIを活用した要約と執筆支援を実験していますが、これらは私たちが追求している目標と同じレベルではありません。

私たちが本当に望むものを理解すると、AIエージェントの組織論に焦点を当てることができます。技術的な詳細はその後に続きます。AIエージェントの概念は、結局のところ、大規模なテクノロジーの導入の障壁を取り除くことに関するものであり、ブラウザが個人用PC業界を革新したように。私たちの焦点は2つのポイントに置かれます。人間とコンピュータの相互作用の観点からAIエージェントを検討し、AIエージェントとLLMの違いと関連を理解することが、最終的には暗号資産とAIエージェントの組み合わせが最終的に残すものにつながります。

let AI_Agent = LLM+API;

会話型の人間コンピュータインタラクションモデルであるChatGPTなどの以前は、人間コンピュータインタラクションの主な形態はGUI(グラフィカルユーザインターフェース)とCLI(コマンドラインインターフェース)でした。GUIの考え方は、さまざまな具体的な形態、ブラウザやアプリなどに進化しましたが、CLIとシェルの組み合わせはほとんど変わりませんでした。

しかし、これは単なる人間とコンピュータのインタラクションの「フロントエンド」に過ぎません。インターネットが進化するにつれて、データ量と種類の増加は、データ間およびアプリケーション間の「バックエンド」の相互作用の増加につながりました。これら2つの側面はお互いに依存しており、単純なウェブ閲覧行動でさえ、実際にはその協力が必要となります。

もしブラウザやアプリとの人間のやり取りがユーザーのエントリーポイントと考えられるなら、API間のリンクや遷移がインターネットの実際の動作をサポートしています。実際、これもエージェントの一部です。一般のユーザーはコマンドラインやAPIのような用語を理解する必要はありません。自分の目標を達成するためには。

LLMsについても同じです。今、ユーザーはさらに進むことができます。もう検索する必要はありません。全プロセスは次の手順で説明できます。

  1. ユーザーはチャットウィンドウを開きます。
  2. ユーザーは、テキストや音声を通じて自然な言語で自分のニーズを説明します。
  3. LLMはこれを手順に変換します。
  4. LLMは結果をユーザーに返します。

このプロセスでは、最大の課題はGoogleであることがわかります。なぜなら、ユーザーは検索エンジンを開く必要はなく、さまざまなGPTのようなダイアログウィンドウを使用し、トラフィックの入り口が静かに変化しているからです。このため、一部の人々は、このLLMが検索エンジンの生活を革新すると考えています。

では、このプロセスにおいてAIエージェントはどのような役割を果たすのでしょうか?

要するに、AIエージェントはLLMの特化した拡張機能です。

現行のLLMはAGI(人工汎用知能)ではなく、OpenAIの構想するL5オーガナイザーからは程遠いです。その能力は著しく制限されています。例えば、LLMはユーザー入力をあまりにも多く与えると幻覚を起こしやすいです。その主な理由の1つはトレーニングメカニズムにあります。例えば、1+1=3と何度もGPTに伝えると、1+1+1=?について尋ねられた際に4と答える可能性があります。

これは、GPTのフィードバックが完全にユーザーの入力に基づいているために起こります。モデルがインターネットに接続されていない場合、入力によって操作が変更され、1+1=3としか「知らない」モデルになる可能性があります。ただし、モデルがインターネットに接続できる場合、そのフィードバックメカニズムはより多様になります。なぜなら、オンラインデータのほとんどが1+1=2であることを確認するからです。

では、もしLLMsをローカルで使用しなければならず、そういった問題を避けたい場合はどうすればよいでしょうか?

簡単な解決策は、2つのLLMを同時に使用し、エラーの可能性を減らすために相互に検証することです。これだけでは不十分な場合、もう1つのアプローチは、2人のユーザーが1つのプロセスを担当し、質問をする一方で、もう一方がそれを洗練させて言語をより正確で論理的にすることです。

もちろん、インターネットに接続しているからといって、問題が完全になくなるわけではありません。たとえば、LLMが信頼できないソースから回答を取得すると、状況が悪化する可能性があります。ただし、このようなデータを避けると、利用可能な情報の量が減少します。これに対処するために、既存のデータを分割したり、再結合したり、古いデータセットに基づいて新しいデータを生成したりして、回答の信頼性を高めることができます。このアプローチは、本質的に自然言語理解におけるRAG(Retrieval-Augmented Generation)の概念です。

人間と機械は互いを理解する必要があります。複数のLLMsが協力し、相互作用すると、AIエージェントの操作モデルにアクセスします。これらは人間の代理として機能し、大規模なモデルや他のエージェントを含む他のリソースにアクセスします。

これにより、LLMとAIエージェントの間の接続に至ります:

LLMは、人間がチャットインターフェースを通じて対話する知識の集約です。ただし、実際には、特定のワークフローは、プログラム、ボット、または一連の手順に縮小できます。これらはエージェントとして定義されています。

AIエージェントはLLMのサブセットのままでありますが、それらと同一視されるべきではありません。AIエージェントの最も特徴的な点は、外部プログラム、LLM、および他のエージェントとの協力を重視していることにあります。これが人々がしばしばAIエージェントをLLM + APIと要約する理由です。

LLMワークフローでこれを説明するために、APIコールを介したAIエージェントの例を見てみましょう:

  1. 人間のユーザーがチャットウィンドウを開く。
  2. ユーザーは、テキストまたは音声で自然言語でニーズを説明します。
  3. LLMはリクエストをAPI呼び出し関連のAIエージェントのタスクと解釈し、会話をエージェントに移します。
  4. AIエージェントはユーザーのXアカウントとAPI資格情報を要求し、ユーザーの説明に基づいてXに接続します。
  5. AIエージェントは最終結果をユーザーに返します。

人間とコンピュータの相互作用の進化を覚えていますか? Web 1.0やWeb 2.0のブラウザ、API、およびその他の要素はまだ存在していますが、ユーザーはもはや直接それらとやり取りする必要はありません。代わりに、彼らは単にAIエージェントとやり取りすることができます。APIの呼び出しや関連するプロセスはすべて会話形式で行うことができます。これらのAPIサービスは、ローカル、オンライン、または外部アプリケーションからのいかなる種類のデータも網羅することができます。ただし、インターフェースがオープンであり、ユーザーがアクセスする必要な権限を持っている限りです。

上記のような完全なAIエージェントのワークフローでは、LLMはAIエージェントから別個のコンポーネントとして扱われるか、または1つのワークフロー内の2つのサブプロセスとして扱われます。それらがどのように分割されているかに関係なく、目標は常にユーザーのニーズを満たすことです。人間とコンピュータの対話の観点からは、ユーザーが自分自身と話しているような感覚さえあります。自分の思考を完全に表現するだけで、AI/LLM/AIエージェントが繰り返しニーズを推測します。フィードバックメカニズムを組み込み、LLMが現在の文脈を覚えていることを確認することにより、AIエージェントは自分のタスクを見失うことを避けます。

要約すると、AIエージェントは従来のスクリプトや自動化ツールとは異なり、より個人化され、人間らしい創造物です。彼らは個人の助手のように振る舞い、ユーザーの実際のニーズを考慮します。ただし、この個人化は確率的推論に基づいていることに注意することが重要です。L3レベルのAIエージェントは人間レベルの理解力や表現力を持っていないため、外部APIとの統合には本質的なリスクが伴います。

AIフレームワークの商品化後

AIフレームワークを収益化できる能力は、私が暗号資産に興味を持ち続ける主な理由の1つです。従来のAI技術スタックでは、フレームワークは特に重要ではありません。データと計算能力と比較しても、フレームワークはあまり重要ではありません。AIアルゴリズムとモデルフレームワークのほとんどはオープンソースですので、AI製品の収益化はほとんどがフレームワークから始まることはありません。データのような機密要素が独占的なものとなります。

基本的に、AIフレームワークまたはモデルはアルゴリズムのコンテナと組み合わせであり、まるでガチョウを煮込むための鍋のようです。しかし、ガチョウの品質と料理の過程の熟練度こそが本当の味を定義します。理論上、販売対象の製品はガチョウであるべきですが、Web3の顧客はガチョウを捨てて鍋を購入することを好むようです。

これは複雑な理由ではありません。ほとんどのWeb3 AI製品は、既存のAIフレームワーク、アルゴリズム、製品をベースにしており、それらを自分たちの目的に合わせてカスタマイズしています。実際、異なる暗号資産AIフレームワークの技術原則は大きく異なるものではありません。技術自体に差別化がないため、注意はブランディング、アプリケーションシナリオ、およびその他の表面的な違いに移ります。その結果、AIフレームワークへのわずかな調整さえも、さまざまなトークンをサポートするための基盤となり、暗号資産AIエージェントエコシステム内でフレームワークのバブルが生まれます。

トレーニングデータやアルゴリズムへの大規模な投資は必要ありませんので、名前によるフレームワークの差別化は特に重要です。DeepSeek V3のような手頃なフレームワークでも、GPUのパワーや電力、労力にかなりのコストがかかります。

ある意味では、これはWeb3の最近のトレンドと一致しています。トークンを発行するプラットフォームのほうが、トークン自体よりも価値が高いことがよくあります。Pump.FunやHyperliquidのようなプロジェクトは、これを象徴しています。元々、エージェントはアプリケーションや資産を表すものでしたが、エージェントを発行するフレームワークが今では最も注目される商品となっています。

これは価値のアンカリングの形を反映しています。エージェントには差別化がないため、エージェントの発行のためのフレームワークはより安定し、資産発行のための価値吸引効果を生み出します。これは暗号通貨とAIエージェントの統合の1.0バージョンを示しています。

現在、DeFiとAIエージェントの融合に代表される2.0バージョンが登場しています。DeFAIのコンセプトは、市場の誇大広告によって引き起こされた可能性がありますが、次の傾向を詳しく見ると、そうではないことが示唆されます。

  • Morphoは、Aaveなどの確立された貸出プラットフォームに挑戦しています。
  • Hyperliquidは、dYdXなどのオンチェーンデリバティブを置き換え、さらにバイナンスのCEXリストに挑戦しています。
  • ステーブルコインは、オフチェーンシナリオの支払いツールになりつつあります。

このようなDeFiトランスフォーメーションを背景に、AIはDeFiの基本的なロジックを再構築しています。以前は、DeFiのコアロジックはスマートコントラクトの実現可能性を検証することでした。現在、AIエージェントはDeFiの製造ロジックを変えています。DeFi製品を作成するためにDeFiを理解する必要はもうありません。これは、チェーンの抽象化を超えた一歩であり、より深い基礎的なエンパワーメントを提供します。

プログラマーになれる時代が近づいています。複雑な計算はAIエージェントの背後にあるLLMとAPIに外部委託することができ、個人はアイデアに集中することができます。自然言語は効率的にプログラミングロジックに変換することができます。

結論

この記事では、Cookie.Funがすでに優れた仕事をしており、AIエージェント情報の集約とトークンの発見を行うプラットフォームであるため、この記事にはCrypto AIエージェントトークンやフレームワークについて言及されていません。そしてAIエージェントフレームワーク、そしてエージェントトークンの一過性の登場と消滅に続きます。ここでそのような情報をリストアップすることはほとんど価値がありません。

しかしながら、この期間中の観察を通じて、市場はまだ暗号資産AIエージェントが最終的に何を指しているのかについての意味のある議論が不足している。私たちはポインタに焦点を当て続けることはできません;本質はメモリレベルで起こっている変化にある。

暗号資産の魅力は、さまざまな資産をトークン化する能力の進化によって生まれます。

免責事項:

  1. この記事は[から転載されていますZuoye Waibo Mountain]、著作権は元の作者に帰属します[左葉武保山]. If you have any objection to the reprint, please contact gate ラーン, チームは関連手続きに従ってできるだけ早く対応します。
  2. 免責事項:本記事に表明されている見解や意見は、著者個人の見解を示すものであり、投資アドバイスを構成しません。
  3. 記事の他の言語版はGate Learnチームによって翻訳されました。それ以外に明示的に記載されていない限り、翻訳された記事のコピー、配布、盗作はできません。
今すぐ始める
登録して、
$100
のボーナスを獲得しよう!
It seems that you are attempting to access our services from a Restricted Location where Gate is unable to provide services. We apologize for any inconvenience this may cause. Currently, the Restricted Locations include but not limited to: the United States of America, Canada, Cambodia, Thailand, Cuba, Iran, North Korea and so on. For more information regarding the Restricted Locations, please refer to the User Agreement. Should you have any other questions, please contact our Customer Support Team.