.NET 開発基盤部会 Wiki」は、「Open棟梁Project」,「OSSコンソーシアム .NET開発基盤部会」によって運営されています。

目次

概要

色々なオプションがある。

XXに関するテクニック

学習に関するテクニック

学習に関する問題点

ニューラルネットワークの問題点には学習に関する問題点が多い

勾配(降下法)誤差逆伝播法

勾配(降下法)

誤差逆伝播法

勾配降下法アルゴリズムの選択

SGD

MomentumSGD

NesterovAG

(Nesterov Accelerated Gradient)

AdaGrad?

(Adaptive Gradient)

※ ε = 0.001

RMSprop

(Root Mean Square Propagation)

※ ε = 0.001、β = 0.9

AdaDelta?

※ β = 0.9

Adam

(ADAptive Moment estimation)

※ ε = 0.001、β1 = 0.9、β2 = 0.999

実装例

重みの初期値

0にする。

...と言う事で、重みの初期値を0にシた場合、

活性化関数の出力分布

勾配消失や表現力の制限問題を回避するよう
活性化関数の出力分布がバラけるように重みを初期値する。

Xavier、He

出力が広がりを持った分布になるように重みの初期値を設定する。

バッチ正規化

(Batch Normalization)

概要

出力を広がりを持った分布にする方法。

計算

(Bはミニバッチの集合的な意味)

実装時

学習時と推論時

過学習を抑止する方法

データ正規化

データ正規化:機械学習の正規化と同じ。

機械学習と同様の正則化

早期終了(early stopping)

ドロップアウト(Dropout)

CNNの場合は...

転移学習

概要

詳細

ファイン・チューニング

学習済みモデルに手を加えて(、重みを初期値し、)、
追加の出力層以外も新たに再度学習させモデルを作成する。

概要

転移学習との違いは、既存部分を再学習するかどうか。

詳細

転移学習との違いに関してのみ言及。

構築方法

転移学習とファイン・チューニングの違い

出力層の再学習は共通しているが、

転移学習

学習済みモデルには手を加えず、学習を行い新たにモデルを作成

ファイン・チューニング

学習済みモデルにも手を加えて、学習を行い新たにモデルを作成

参考


トップ   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS