.NET 開発基盤部会 Wiki」は、「Open棟梁Project」,「OSSコンソーシアム .NET開発基盤部会」によって運営されています。

目次

概要

色々なオプションがある。

XXに関するテクニック

学習に関するテクニック

学習に関する問題点

ニューラルネットワークの問題点には学習に関する問題点が多い

勾配(降下法)誤差逆伝播法

勾配(降下法)

誤差逆伝播法

勾配降下法アルゴリズムの選択

SGD

MomentumSGD

NesterovAG

(Nesterov Accelerated Gradient)

AdaGrad?

(Adaptive Gradient)

※ ε = 0.001

RMSprop

(Root Mean Square Propagation)

※ ε = 0.001、β = 0.9

AdaDelta?

※ β = 0.9

Adam

(ADAptive Moment estimation)

※ ε = 0.001、β1 = 0.9、β2 = 0.999

実装例

重みの初期値

0にする。

...と言う事で、重みの初期値を0にシた場合、

という事で学習が上手くできなくなるらしい。

活性化関数の出力分布

勾配消失や表現力の制限問題を回避するよう
活性化関数の出力分布がバラけるように重みを初期値する。

Xavier、He

出力が広がりを持った分布になるように重みの初期値を設定する。

バッチ正規化

(Batch Normalization)

概要

出力を広がりを持った分布にする方法。

計算

(Bはミニバッチの集合的な意味)

実装時

学習時と推論時

過学習を抑止する方法

出力の分布重みの初期値バッチ正規化

過学習の発生を軽減する一因になる。

機械学習と同様の正則化

早期終了(early stopping)

ドロップアウト(Dropout)

CNNの場合は...

転移学習

概要

詳細

ファイン・チューニング

学習済みモデルに手を加えて(、重みを初期値し、)、
追加の出力層以外も新たに再度学習させモデルを作成する。

概要

転移学習との違いは、既存部分を再学習するかどうか。

詳細

転移学習との違いに関してのみ言及。

構築方法

転移学習とファイン・チューニングの違い

出力層の再学習は共通しているが、

転移学習

学習済みモデルには手を加えず、学習を行い新たにモデルを作成

ファイン・チューニング

学習済みモデルにも手を加えて、学習を行い新たにモデルを作成

参考


トップ   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS