.NET 開発基盤部会 Wiki」は、「Open棟梁Project」,「OSSコンソーシアム .NET開発基盤部会」によって運営されています。

目次

概要

ステージ

Loading

テキストデータを読み込む

Indexing

テキストデータからインデックスを作成する。

Storing

テキストデータとインデックスを永続化する。

Querying

インデックスを使用してテキストデータを検索する。

Evaluation

検索のリクエストレスポンスを客観的に評価。

プロバイダ

1st Party

各ステージを処理する基本的なライブラリ

3rd Party

各ステージを処理するライブラリ

詳細

斯々然々公式を読む事をオススメする。

主要機能

Loading

データの取得

データソースとして利用できる。

Indexing

インデックスの作成

Storing

データのストア

区分インデックス特性適合する NoSQL
ベクトルVectorStoreIndexベクトルデータ管理ANN Pinecone, Weaviate, Milvus, Qdrant, Redis
グラフKnowledgeGraphIndexPropertyGraphIndexグラフデータ(ノードとエッジ)管理Neo4j, ArangoDB, Amazon Neptune, TigerGraph?, JanusGraph?

Querying

データの検索

Evaluation

人手に依らない、マシンによるインデックスの評価機能を持つ。

Index

VectorStoreIndex

Semantic Searchで説明済み。

KnowledgeGraphIndex

GraphRAGで説明した処理に近いが、

PropertyGraphIndex

KeywordTableIndex

キーワード検索

TreeIndex

リーフ・ノード(チャンク)から木構造のサマリ・ノードを作成する。

SQLIndex

概要はPandas Dataframe、TextToSQLで説明済み。

SummaryIndex

チャンク自体がIndexで、検索ではQA、Refineテンプレートを繰り返しサマリをする。

DocumentSummaryIndex

HyDEそのものではないが似ている。

その他の機能

パイプライン

ワークフローの構築

エージェントの構築

最近では、システムによる自動化されたプロンプトエンジニアリング、プロンプトフローを
ReAct的プロンプトエンジニアリングを用い更にファジー化した、エージェント・システムが注目されている。

構造化データ抽出

トレースとデバッグ

LLMツールは、高度に抽象化されていることから内部でどのような処理がされているか通常は見えないことが多い。

インデックス評価

特徴VectorStoreIndexPropertyGraphIndex
データ構造ベクトルプロパティグラフ
検索方法ベクトル検索グラフクエリ言語(例:Cypher)
ノードの管理ドキュメントをノードに分割しベクトル化ノード(エンティティ)とエッジ(関係)
クエリの複雑さシンプルな意味的類似性検索複雑なCypherクエリをサポート
ハイブリッド検索なしベクトル検索とグラフを用いた検索をサポート
用途意味的な類似性に基づく検索データの関係性を重視した検索

VectorStoreIndex

PropertyGraphIndex

SummaryIndex

独自プロンプトフロー

※ 実際に、前者は網羅性が今ひとつだったが、比較的うまく機能した。類似度スコアの閾値をチューニングすると、結果は更に良くなりそうではある。

※ 後者は、実際に検証していないが、全チャンクの要約とようやく結果の検証が発生するため、に多くのコスト(LLMへの要求)が発生する。

参考

公式

LlamaIndex - LlamaIndex
https://docs.llamaindex.ai/en/stable/

Home

https://docs.llamaindex.ai/en/stable/

Learn

https://docs.llamaindex.ai/en/stable/understanding/

Use Cases

https://docs.llamaindex.ai/en/stable/use_cases/

Examples

https://docs.llamaindex.ai/en/stable/examples/

Component Guides

https://docs.llamaindex.ai/en/stable/module_guides/

非公式

LlamaIndex クイックスタートガイド|npaka

LlamaIndexのXについてやってみた(v0.10 対応)|Aya*

LlamaIndexを完全に理解するチュートリアル

その他

Indexing

Graph

サンプル

https://github.com/OpenTouryoProject/DxCommon/blob/master/Notebook/Jupyter/path/TableOfContents.ipynb


トップ   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS