「.NET 開発基盤部会 Wiki」は、「Open棟梁Project」,「OSSコンソーシアム .NET開発基盤部会」によって運営されています。
RAG(Retrieval-Augmented Generation)
ユーザ入力+取得した情報を統合して拡張。
生成部分では、統合情報を入力し、LLMがユーザーに回答を提供する。
ユーザーが知識情報を入力
Embeddingで知識情報を埋め込みベクトルに変換
ユーザーが質問を入力
Embeddingで質問を埋め込みベクトルに変換
質問の埋め込みベクトルを使用して、DB内の関連Chunkを検索
最終的にユーザーに回答を提供
Embeddingで、テキストをベクトルに変換した表現方法。
埋め込みベクトル間の類似性を内積、距離などで計算するプロセス。
RAGの拡張手法について
代表的な手法
ハイブリッド・サーチ、ハイブリッド検索
「XとYの意味をそれぞれ教えて」
Xの詳細な定義とその意味は何ですか?
Yの詳細な定義とその意味は何ですか?
Sub Query1への回答+Sub Query2への回答
以下は各種、手法の分類
適切なChunkを取得できるようにIndexingプロセス「のChunkingを」工夫する。
適切なChunkを取得できるようにIndexingプロセス「のEmbeddingを」工夫する。
適切なChunkを取得できるようにIndexingプロセス「のIndexingを」工夫する。
所謂、文書のEmbeddingによるベクトル化と内積による類似度の計算
Sentence BERTの論文(+α)を実装したもの
...
※ 分析:3種のIndexを使用した検索でそれぞれ、どのようなチャンクが取得できているか?の情報が欲しかった。
...