.NET 開発基盤部会 Wiki」は、「Open棟梁Project」,「OSSコンソーシアム .NET開発基盤部会」によって運営されています。

目次

概要

エージェントの定義

エージェントらしさ

最近の、LLMエージェント研究や実装では、次の要素が増えるほど「エージェントっぽい」とされる(≒ 自律性)。

デザインパターン

Anthropic社が提示するデザインパターンが適用されている。

エージェントの

開発スタイル

AIエージェントをどう作るか?

タイプ特徴代表的なツール/例
コーディング型LangGraph等のライブラリやPythonなどのプログラミング言語を用いてエージェントを実装する。柔軟性が高く、細かな制御やカスタマイズが可能。LangGraph、LangChainOpenAI Agents SDK
ローコード・ワークフロー型GUIやノーコード環境で複数のアクションをつなぎ、チャットフローやツール呼び出しを組み立てる。業務担当者でも扱いやすいが、複雑なロジックは実装しにくい。Dify、n8nなど
プロンプト・エンジニアリング型MS Copilot Studioのようなツールでプロンプトやルールを記述し、LLMが内部的にエージェントを組み立てる。素早く試作できるが、動作のブラックボックス化に注意。MS Copilot Studio、LibreChat?、Watsonx Orchestrator

※ 上から下に、プリミティブ → ハイ・レベル。

パーソナライズ

AIエージェントの業務特化性能(現場適応レベル)

レベル概要対応ツール・技術
Human-in-theLoop人の詳細な指示と知識DBからの情報を生成AIに入力し、その結果出力して要求に対応RAG+LangGraph
事前に人が定義した計画(フロー)に即して生成AIや知識DB、ツール等活用し要求に対応Dify等、AIエージェント開発ツール上で作成
Human-on-theLoop要求理解・計画立案・行動/ツール活用にも生成AIを活用し、自律的に要求に対応Agent Creator等、ユーザの要求からAgentを作成
レベル3に加え、利用者に応じたパーソナライズした要求理解や要求対応を実施Text-to-LoRA等、コンテキストを踏まえた回答生成容易化
Human-out-of-theLoopレベル4に加え、継続的な自己改善の能力を持ち、成長し続けることが可能Agentの外部・内部の振舞いの可視化を通じた自己改善

※ Human-x-theLoop とは、業務特化型AI(現場適応型AI)において、人間(Human)がAIの自律的成長(Loop)に、どの程度(x)介入(監督・判断)するかを表す。

詳細

構成要素

LLMエージェントは通常、以下のような構成要素を持ちます:

LLM本体

自然言語の理解・生成を担当する中核部分。タスクの実行や推論を行う。

メモリ

会話履歴やタスクの進行状況などを保持。長期的な記憶も可能。

ツール / プラグイン

Web検索、計算、コード実行、API呼び出しなど、外部リソースと連携して作業を遂行。

コントローラー

プランナーとLLMのやりとりを制御。ループを回す。

プランナー

ゴールに向けタスクを分割し、順序立てて実行計画を作る。

アクション実行器

LLMの計画した出力に従って具体的なアクションを実行するモジュール。

思考ループ(Reasoning Loop)

多くのLLMエージェントは以下のようなエージェント・ループで動作

タスクの理解(Goal Recognition)

ユーザーから与えられた指示や問いを分析し、何を達成すべきかを明確にする。

プランの生成(Plan)

目的を達成するための一連の手順や方針(プラン)を考案する。

次のアクションの選択(Reason)

アクションの実行(Act)

観測と反省(Reflect)

再計画(Replan)

応用研究

MRKL

MRKL(Modular Reasoning, Knowledge and Language)

ReAct

ReAct?(Reasoning + Acting)

Plan-and-Solve

LLMCompiler

※ LlamalndexやLangGraphでも利用可能とのこと。

例と工夫

以下の5つの分野の有名なAIエージェントとその工夫

リサーチ

GPT Researcher

シミュレーション

Generative Agents

ゲーム

ソフトウェア開発

汎用のコンピュータ操作

規約

Function calling

Structured Outputs

...

標準化

対象

団体

プロトコル

プロトコル

MCP(Model Context Protocol)

AIモデルと外部システムのやりとりを標準化するオープン・プロトコル

ACP(Agent Communication Protocol)

A2A(Agent2Agent Protocol)

マルチエージェント

LLMマルチエージェントは、LLMを用いた複数のエージェントが連携・協調・競合しながらタスクを遂行するシステムや枠組みのことを指す。

利用例

役割分担

各エージェントは専門性を持たせ、以下のような役割に分かれることが多い

PE技法

Self-Consistency, GKP, Self-Ask, ToT, AoTといったPEの推論促進技法の構造やアイデアを、明示的または暗黙的にシミュレーションしている。

実装例

繋がり方

フレームワーク

全体比較(要点)

観点OpenAI Agents SDKCrewAILangGraphAutoGen
思想制御・安全人的分業状態遷移会話駆動
抽象度低〜中
再現性非常に高低〜中
本番向き
研究向き

OpenAI Agents SDK

CrewAI

LangGraph

AutoGen

参考

https://speakerdeck.com/os1ma/imakosoxue-bullmbesunoaiezientoru-men-ji-ben-de-nasikumi-slash-kai-fa-turu-slash-you-ming-naossyalun-wen-noshao-jie


トップ   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS