「.NET 開発基盤部会 Wiki」は、「Open棟梁Project」,「OSSコンソーシアム .NET開発基盤部会」によって運営されています。
分類 | 手法 |
全体調整型 | Full Fine-Tuning |
表現調整型 | ReFT (Representation Fine-Tuning), Reward Fine-Tuning |
パラメータ効率型(PEFT: Parameter-Efficient Fine-Tuning) | LoRA, QLoRA, Adapter, Prefix Tuning, BitFit? |
指示・強化学習型 | Instruction Tuning, RLHF |
ReFT (Representation Fine-Tuning)
(PEFT: Parameter-Efficient Fine-Tuning)
LoRA(Low-Rank Adaptation)
JSON: {"input": "ユーザーの質問", "output": "AIの回答"}