.NET 開発基盤部会 Wiki」は、「Open棟梁Project」,「OSSコンソーシアム .NET開発基盤部会」によって運営されています。

目次

概要

huggingface/trl SFTTrainer

huggingface/trl

SFTTrainer

trlに含まれるトレーナー・クラス

SFTTrainerでできること

詳細

実装準備

プロキシ環境

データセット

※ kunishou/databricks-dolly-15k-jaを使う例ではcontextを使用しないのでinput(≒context)の値が空のデータに絞っている。

モデル

Instruction Tuning

Instruction Tuningは、言語モデルに 命令(Instruction)とその応答(Response)を学習させることで、指示に従う能力を高める手法

変換関数

損失計算

SFTTrainerの構成

学習・保存

LoRAによるチューニング

コードの差異

確認事項

NEFTuneによる学習

packingを用いた学習

学習結果の比較

参考

Qiita m__k #自然言語処理

Hugging Face

The AI community building the future.

github.com

https://github.com/huggingface/trl/blob/main/trl/


トップ   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS