「.NET 開発基盤部会 Wiki」は、「Open棟梁Project」,「OSSコンソーシアム .NET開発基盤部会」によって運営されています。
最近の、LLMエージェント研究や実装では、次の要素が増えるほど「エージェントっぽい」とされる(≒ 自律性)。
Anthropic社が提示するデザインパターンが適用されている。
AIエージェントをどう作るか?
| タイプ | 特徴 | 代表的なツール/例 |
| コーディング型 | LangGraph等のライブラリやPythonなどのプログラミング言語を用いてエージェントを実装する。柔軟性が高く、細かな制御やカスタマイズが可能。 | LangGraph、LangChain、OpenAI Agents SDK等 |
| ローコード・ワークフロー型 | GUIやノーコード環境で複数のアクションをつなぎ、チャットフローやツール呼び出しを組み立てる。業務担当者でも扱いやすいが、複雑なロジックは実装しにくい。 | Dify、LangFlow、n8nなど |
| プロンプト・エンジニアリング型 | MS Copilot Studioのようなツールでプロンプトやルールを記述し、LLMが内部的にエージェントを組み立てる。素早く試作できるが、動作のブラックボックス化に注意。 | MS Copilot Studio、LibreChat?、Watsonx Orchestrator |
※ 上から下に、プリミティブ → ハイ・レベル。
AIエージェントの業務特化性能(現場適応レベル)
| レベル | 概要 | 対応ツール・技術 | |
| Human-in-theLoop | 1 | 人の詳細な指示と知識DBからの情報を生成AIに入力し、その結果出力して要求に対応 | RAG等 |
| 2 | 事前に人が定義した計画(フロー)に即して生成AIや知識DB、ツール等活用し要求に対応 | プロンプト・フロー | |
| Human-on-theLoop | 3 | 要求理解・計画立案・行動/ツール活用にも生成AIを活用し、自律的に要求に対応 | ユーザがAgentにインストラクション |
| 4 | レベル3に加え、利用者に応じたパーソナライズした要求理解や要求対応を実施 | Text-to-LoRA等、コンテキストを踏まえた回答生成容易化 | |
| Human-out-of-theLoop | 5 | レベル4に加え、継続的な自己改善の能力を持ち、成長し続けることが可能 | Agentの外部・内部の振舞いの可視化を通じた自己改善 |
※ Human-x-theLoop とは、業務特化型AI(現場適応型AI)において、人間(Human)がAIの自律的成長(theLoop)に、どの程度(x)介入(監督・判断)するかを表す。
※ フレームワークで実装したエージェントは、レベル2〜3を確実に実現し、レベル4の一部にも到達するが、プロダクションや企業の業務での導入はまだこれからとされている。
以下の5つの分野の有名なAIエージェントとその工夫
GPT Researcher
Generative Agents
LLMエージェントは通常、以下のような構成要素を持つ
自然言語の理解・生成を担当する中核部分。タスクの実行や推論を行う。
ユーザーから与えられた指示や問いを分析し、何を達成すべきかを明確にする。
目的を達成するための一連の手順や方針(プラン)を考案する。
推論・行動戦略(Reasoning & Acting Paradigms)」に関する代表的アプローチ
MRKL(Modular Reasoning, Knowledge and Language)
ReAct?(Reasoning + Acting)
※ LlamalndexやLangGraphでも利用可能とのこと。
AIモデルと外部システムのやりとりを標準化するオープン・プロトコル
LLMマルチエージェントは、LLMを用いた複数のエージェントが連携・協調・競合しながらタスクを遂行するシステムや枠組みのことを指す。
各エージェントは専門性を持たせ、以下のような役割に分かれることが多い
Self-Consistency, GKP, Self-Ask, ToT, AoTといったPEの推論促進技法の構造やアイデアを、明示的または暗黙的にシミュレーションしている。
全体比較(要点)