.NET 開発基盤部会 Wiki」は、「Open棟梁Project」,「OSSコンソーシアム .NET開発基盤部会」によって運営されています。

目次

概要

詳細

分類手法
全体調整型Full Fine-Tuning
表現調整型ReFT (Representation Fine-Tuning), Reward Fine-Tuning
パラメータ効率型(PEFT: Parameter-Efficient Fine-Tuning)LoRA, QLoRA, Adapter, Prefix Tuning, BitFit?
指示・強化学習型Instruction Tuning, RLHF

全体調整型

Full Fine-Tuning

表現調整型

ReFT

ReFT (Representation Fine-Tuning)

Reward Fine-Tuning

パラメータ効率型

(PEFT: Parameter-Efficient Fine-Tuning)

LoRA

LoRA(Low-Rank Adaptation)

QLoRA

Adapter

Prefix Tuning

BitFit?

指示・強化学習型

Instruction Tuning

RLHF


トップ   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS