.NET 開発基盤部会 Wiki」は、「Open棟梁Project」,「OSSコンソーシアム .NET開発基盤部会」によって運営されています。

目次

概要

エージェントの定義

エージェントらしさ

最近の、LLMエージェント研究や実装では、次の要素が増えるほど「エージェントっぽい」とされる(≒ 自律性)。

デザインパターン

Anthropic社が提示するデザインパターンが適用されている。

エージェントの

開発スタイル

AIエージェントをどう作るか?

タイプ特徴代表的なツール/例
コーディング型LangGraph等のライブラリやPythonなどのプログラミング言語を用いてエージェントを実装する。柔軟性が高く、細かな制御やカスタマイズが可能。LangGraph、LangChainOpenAI Agents SDK
ローコード・ワークフロー型GUIやノーコード環境で複数のアクションをつなぎ、チャットフローやツール呼び出しを組み立てる。業務担当者でも扱いやすいが、複雑なロジックは実装しにくい。DifyLangFlow、n8nなど
プロンプト・エンジニアリング型MS Copilot Studioのようなツールでプロンプトやルールを記述し、LLMが内部的にエージェントを組み立てる。素早く試作できるが、動作のブラックボックス化に注意。MS Copilot Studio、LibreChat?、Watsonx Orchestrator

※ 上から下に、プリミティブ → ハイ・レベル。

パーソナライズ

AIエージェントの業務特化性能(現場適応レベル)

レベル概要対応ツール・技術
Human-in-theLoop人の詳細な指示と知識DBからの情報を生成AIに入力し、その結果出力して要求に対応RAG等
事前に人が定義した計画(フロー)に即して生成AIや知識DB、ツール等活用し要求に対応プロンプト・フロー
Human-on-theLoop要求理解・計画立案・行動/ツール活用にも生成AIを活用し、自律的に要求に対応ユーザがAgentにインストラクション
レベル3に加え、利用者に応じたパーソナライズした要求理解や要求対応を実施Text-to-LoRA等、コンテキストを踏まえた回答生成容易化
Human-out-of-theLoopレベル4に加え、継続的な自己改善の能力を持ち、成長し続けることが可能Agentの外部・内部の振舞いの可視化を通じた自己改善

※ Human-x-theLoop とは、業務特化型AI(現場適応型AI)において、人間(Human)がAIの自律的成長(theLoop)に、どの程度(x)介入(監督・判断)するかを表す。
フレームワークで実装したエージェントは、レベル2〜3を確実に実現し、レベル4の一部にも到達するが、プロダクションや企業の業務での導入はまだこれからとされている。

例と工夫

以下の5つの分野の有名なAIエージェントとその工夫

リサーチ

GPT Researcher

シミュレーション

Generative Agents

ゲーム

ソフトウェア開発

汎用のコンピュータ操作

詳細

構成要素

LLMエージェントは通常、以下のような構成要素を持つ

LLM本体

自然言語の理解・生成を担当する中核部分。タスクの実行や推論を行う。

メモリ

ツール / プラグイン

コントローラー

プランナー

アクション実行器

思考ループ(Reasoning Loop)

タスクの理解(Goal Recognition)

ユーザーから与えられた指示や問いを分析し、何を達成すべきかを明確にする。

プランの生成(Plan)

目的を達成するための一連の手順や方針(プラン)を考案する。

次のアクションの選択(Reason)

アクションの実行(Act)

観測と反省(Reflect)

再計画(Replan)

推論・行動戦略

推論・行動戦略(Reasoning & Acting Paradigms)に関する代表的アプローチ

MRKL

MRKL(Modular Reasoning, Knowledge and Language)

Reasoning LoopMRKL の対応
Goal RecognitionLLM が入力から目的を抽出
Planほぼ行わない(短期的)
Reasonどの専門モジュール(ツール)を使うかを推論
Act選択したツールを実行
Reflectツール結果を受け取り再推論
Replan必要に応じて別ツールを選択

ReAct

ReAct?(Reasoning + Acting)

Reasoning LoopReAct? の対応
Goal RecognitionLLM がタスクを理解
Plan明示的な長期計画は作らない
Reason「次に何をすべきか」を逐次推論
Act推論に基づきツール実行
Reflect観測結果を「Observation」として取り込み内省
Replan次の Reason で自然に再計画

Plan-and-Solve

Reasoning LoopPlan-and-Solve の対応
Goal Recognitionタスク理解
Plan最初に詳細な計画を生成(中核)
Reason計画に沿ってステップを推論
Act必要ならツール実行
Reflect計画との差異を確認
Replan計画が破綻した場合に再計画

LLMCompiler

Reasoning LoopLLMCompiler の対応
Goal Recognitionタスクを形式的に理解
Planタスクをプログラム構造に分解(強い)
Reasonプログラムの各ステップを推論
Act実行環境でコードを実行
Reflect実行結果を検証(テスト)
Replanコード修正(self-debug)として再計画

デファクト標準

LLM/Agent の世界では、言語生成機であるLLMを「外部システムと連携する実行エンジン」に変える基盤技術として、
Function Calling」と「Structured Outputs」が「事実上の標準(デファクト・スタンダード)」

Function calling

Structured Outputs

2つの技術の類似点

Function CallingStructured Outputs の 類似点

...

標準化

対象

団体

プロトコル

プロトコル

MCP(Model Context Protocol)

AIモデルと外部システムのやりとりを標準化するオープン・プロトコル

ACP(Agent Communication Protocol)

A2A(Agent2Agent Protocol)

マルチエージェント

LLMマルチエージェントは、LLMを用いた複数のエージェントが連携・協調・競合しながらタスクを遂行するシステムや枠組みのことを指す。

利用例

役割分担

各エージェントは専門性を持たせ、以下のような役割に分かれることが多い

PE技法

PE技法のReActは「単体エージェントの内部推論フレーム」として機能しているが、
マルチエージェントでは、PE技法のSelf-Consistency, GKP, Self-Ask, ToT, AoTを、
オーケストレーション設計によって、明示的または暗黙的にシミュレーションできる。

実装例

繋がり方

フレームワーク

全体比較(要点)

観点OpenAI Agents SDKCrewAILangGraphAutoGen
思想制御・安全人的分業状態遷移会話駆動
抽象度低〜中
再現性非常に高低〜中
本番向き
研究向き

OpenAI Agents SDK

CrewAI

LangGraph

AutoGen

参考

https://speakerdeck.com/os1ma/imakosoxue-bullmbesunoaiezientoru-men-ji-ben-de-nasikumi-slash-kai-fa-turu-slash-you-ming-naossyalun-wen-noshao-jie


トップ   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS