深層学習（deep learning）のバックアップ(No.47)

2015：
- Microsoft ResearchのResNet?（CNN）が、初めて人間のエラー率 5% を上回る精度を達成。
- ≒ 機械が目を獲得した。機械のカンブリア爆発（飛躍的進化）が予測された。
- 入力層から出力層まで伝播する値と入力層の値を足し合わせたモデルで、入力層まで、
  勾配値がきちんと伝わり、今では1000層といったかなり深い構造でも学習が可能となった。

2019：
- EfficientNet?が効率的なスケールアップ規則の採用で、
  当時、パラメタ数を大幅に減少させ最高水準の精度を上回る。
- スケール（幅：層中のニューロン数、深さ：層の深さ、解像度：入力画像の大きさ）
- 幅：α^φ、深さ：β^φ、解像度：γ^φ
- αβγをグリッドサーチで求める（φはパラメタ）
- α*β^2*γ^2 ≒ 2に制限（FLOPSは2φで増加

↑

違い †

↑

機械学習との違い †

階層的な特徴量の学習が、機械学習と決定的に異なる点。

↑

ベイズ統計との違い †

ベイズ法はトップダウン方式
AIが類例を認識すれば、様々なパターンに対応できるようになる。

深層学習はボトムアップ方式
- AIが生データで学習して成長していく。
- 大量のデータが必要で、類似問題しか解けない。
- GAN（敵対的生成ネットワーク）で弱点を補う。

↑

詳細 †

↑

CPU †

CPUは複雑で連続的な処理が得意。
複雑な処理はCPUの方が早い。

↑

GPU †

もともとグラフィックス計算のためのプロセッサ
GPUは比較的性能の良くないコアを大量に積んでいて並列的な処理が得意。
ニューラルネットワークの学習は単純な行列演算が多くを占めるので、
GPUによって高速化が期待できるので深層学習分野で使用される。

NVIDIA社のGPUでは、CUDAという深層学習用開発環境
が整えられていて、計算用の関数などが使用できる。

GPGPU
- GPUの演算資源をグラフィックス計算以外の目的に応用する技術
- グラフィック以外の目的での使用に最適化されたGPU

↑

TPU †

Google社が開発した、テンソル計算処理に最適化された演算処理装置

↑

その他 †

↑

言語・ライブラリ †

↑

フレームワーク †

↑

ファースト・ステップ †

↑

言語・ライブラリ †

↑

言語 †

↑

Python †

↑

R言語 †

↑

ライブラリ †

↑

NumPy †

↑

Matplotlib †

↑

フレームワーク †

↑

Theano †

MILAのOSS（3条項BSD）で2007年に初版リリース
2017年以降、メンテナンス・フェーズ

↑

言語 †

Python（コンパイラ、ライブラリ）

↑

特徴 †

Numpyのように計算手続きを記述するのではなく, 数式そのものを記述.

このことによって, 計算対象となる行列等の実体のプログラム内での
引き回しを考える事なく, 最適化やGPUによる高速化の恩恵が受けられる.

また, 微分を (数値的ではなく) 解析的に実行する事が出来る.

↑

参考 †

Theano 入門
http://www.chino-js.com/ja/tech/theano-rbm/

↑

Caffe †

Yangqing Jiaら当時Berkeleyのメンバーが中心に2013年頃
開発したOSS（BSD）のディープラーニングフレームワーク

Convolutional Architecture for Fast Feature Embedding.
前身はDeCAF (Deep Convolutional Activation Feature)

↑

言語 †

C++で実装、Pythonのインターフェイスあり。

↑

特徴 †

コードを書かなくても設定ファイルだけで動かせる
容易に拡張できるコード設計
PythonとMatlabからも使える
高速（C++実装、GPUをシームレスに使い分け）
Githubの活発な開発コミュニティ
画像認識向き
- 画像分類
- シーン認識
- 物体検出
- 領域分割

↑

参考 †

Caffeで始めるディープラーニング
https://www.slideshare.net/KotaYamaguchi1/caffe-71288204

↑

Chainer †

2015年に株式会社Preferred Networks（PFN）からリリース。
2019年12月5日、PyTorchに順次移行すると発表。

↑

言語 †

Python

↑

特徴 †

特⻑：様々なNNを直感的に記述可能

NNの構築をPythonのプログラムとして記述
CuPy?によるCPU/GPU agnosticなコード記述
動的なNN構築（Define-by-Runの独自コンセプト）を採用

↑

参考 †

Chainer - Wikipedia
https://ja.wikipedia.org/wiki/Chainer

ディープラーニングフレームワークChainerの紹介と⾃動チューニングへの期待
http://atrg.jp/ja/index.php?plugin=attach&pcmd=open&file=20151225-ATTA-oono.pdf&refer=ATTA2015

PFN、深層学習フレームワークを自社開発の「Chainer」から「PyTorch」に切り替え - PC Watch
https://pc.watch.impress.co.jp/docs/news/1222796.html

↑

PyTorch †

Facebookの人工知能研究グループ（FAIR）により開発された。
- 2016年にOSS（修正BSD）としてリリースされた。
- Lua言語で利用されていたTorchライブラリのPython版

Chainerに強く影響を受けている。
- Define-by-Runを踏襲
- 記法もかなりChainerに近い

研究者の間で人気
- 構文が解り易い。
- 論文でも使われる。

PDB、PyCharm?などのデバッガが使える。
動的な計算グラフ（計算の過程をグラフで視覚化して表したもの

↑

言語 †

インターフェイス

Pythonインターフェイス
洗練されており、活発に開発が行われている。

C++インターフェイス存在する。

↑

特徴 †

強力なGPUサポートを備えた（NumPyのような）テンソル演算ができる
テープベースの自動微分システムの上に構築された深層ニューラルネットワークが利用できる。

↑

参考 †

PyTorch - Wikipedia
https://ja.wikipedia.org/wiki/PyTorch

↑

CNTK †

（Microsoft Cognitive Toolkit）

2015年にMicrosoftからリリース。
2016年にMITライセンスでGitHubに公開。

↑

言語 †

C++、Python、.NET、BrainScript?

↑

特徴 †

リソース効率が良い。
ONNXを初めてサポート
コミュニティ発展が課題

↑

参考 †

Microsoft Cognitive Toolkit - Wikipedia
https://ja.wikipedia.org/wiki/Microsoft_Cognitive_Toolkit

↑

Googleの †

↑

TensorFlow †

専用項を設けた。

↑

Keras †

専用項を設けた。

↑

ONNX †

専用項を設けた。

↑

ファースト・ステップ †

↑

開発環境 †

↑

Python †

↑

NumPy †

↑

Matplotlib †

↑

アルゴリズム †

↑

パーセプトロン †

↑

ニューラルネットワーク †

↑

参考 †

↑

One Learning Theory †

KDDI-RA-201405-01-PRT.pdf
https://rp.kddi-research.jp/download/report/RA2014005

脳科学の世界には
「One Learning Theory（たった一つの学習理論）」
と呼ばれる仮説がある。

それは「視覚野」、「聴覚野」、「感覚野」など、大脳皮質の異なる領域が、
実は同一の認知機構に従って動作している、とする仮説である。

これが正しければ、視覚野の認知機構に基づくスパース・コーディングは、
単に画像認識のみならず、例えば聴覚（つまり音声認識）など他の分野にも応用できる。

↑

スパース・コーディング †

入力の一部または全体を、辞書に含まれる要素の組み合わせで表現しようというもの。

スパースなデータ表現とは、
- データを表現するための辞書を用意し、
- その要素のできるだけ少ない組み合わせでデータを表現すること。

参考
- 【スパースコーディング】スパースなデータ表現の利点 - Qiita
  http://qiita.com/IshitaTakeshi/items/5ff69d62b902446d1473

↑

Wikipedia †

ディープラーニング
https://ja.wikipedia.org/wiki/%E3%83%87%E3%82%A3%E3%83%BC%E3%83%97%E3%83%A9%E3%83%BC%E3%83%8B%E3%83%B3%E3%82%B0
Python
https://ja.wikipedia.org/wiki/Python
NumPy
https://ja.wikipedia.org/wiki/NumPy
Matplotlib
https://ja.wikipedia.org/wiki/Matplotlib

↑

YouTube? †

そうだったのか！可視化して理解するディープラーニング
https://www.youtube.com/watch?v=RJu4DeU1me8

↑

深層学習ディープラーニングの世界 †

vol. 1 ディープラーニングとは関数近似器である
https://www.youtube.com/watch?v=SyWwoMpP_P4
vol. 2 学習 - なぜ必要なのか？何をするのか？
https://www.youtube.com/watch?v=RLlTmbyJORM
vol. 3 関数 - なぜ「深さ」が AI を生み出しているのか？
https://www.youtube.com/watch?v=Mw4j4yPsFtg
vol. 4 全結合層 - それはいちばん大事な部品のお話
https://www.youtube.com/watch?v=FYDJ439Va_Y

vol. 5, 6 CNN関連

↑

ディープラーニング †

PART0：初心者のための前準備
https://www.youtube.com/watch?v=9f-y8ux_6ck
PART1：順伝播（入力層～中間層の仕組み）
https://www.youtube.com/watch?v=i0JIaEDGSCE
PART2：順伝播（出力層と誤差計算）｜softmax & cross entropy
https://www.youtube.com/watch?v=HF9gMDMuN8k
PART3：誤差逆伝播｜バックプロパゲーション｜チェインルール
https://www.youtube.com/watch?v=QddzS4gONXs
PART4：kerasでの実装｜Google Colaboratoryで演習
https://www.youtube.com/watch?v=HQo4N1R61yw

↑

某处生活_LiveSomewhere? †

ニューラルネットワーク
- 1. ノードと層
  https://www.youtube.com/watch?v=pXmmZrXyONw
- 2. アフィン変換
  https://www.youtube.com/watch?v=pV_jyrsBbkE
- 3. 活性化関数
  https://www.youtube.com/watch?v=-Wt8PQJlgZY
- 4. 順伝播から勾配法へ
  https://www.youtube.com/watch?v=rHbwmBJyV2s
- 5. 誤差逆伝播法
  https://www.youtube.com/watch?v=lctO5afCBmY

RNN関連(移動予定)
- RNN入門PART1：概要・構造・特徴
  記憶＋可変長入力｜時系列データ処理モデル
  https://www.youtube.com/watch?v=zrSBFri9sdw
- RNN入門PART2：レイヤ・誤差計算・BPTT
  https://www.youtube.com/watch?v=DWectS03wg8

↑

予備校のノリで学ぶ「大学の数学・物理」 †

【機械学習】深層学習(ディープラーニング)とは何か
https://www.youtube.com/watch?v=s5_Pk3CjhNA

絶対に理解させる誤差逆伝播法【深層学習】
https://www.youtube.com/watch?v=0itH0iDO8BE

CNNに絞った内容

↑

ゼロから作るDeep Learning †

https://www.oreilly.co.jp/books/9784873117584/

↑

サンプル †

https://github.com/oreilly-japan/deep-learning-from-scratch

↑

その他、参考 †

ゼロから作るDeep Learning - Qiita
https://qiita.com/okayu303/
- 誤差逆伝播法の概要
  https://qiita.com/okayu303/items/b67ea27ae221fb5386d1
- Affineレイヤ
  https://qiita.com/okayu303/items/8931a9076d7b867109d4
- Softmax-with-Lossレイヤ
  https://qiita.com/okayu303/items/b67ea27ae221fb5386d1

『ゼロから作るDeep Learning』の学習ノート - からっぽのしょこ

深層学習（deep learning） のバックアップ(No.47)

目次 †

概要 †

特徴 †

強み †

弱み †

対象 †

目視作業の自動化 †

異常検知の自動化 †

歴史 †

1943 †

1951 †

1957 †

1967 †

1982 †

1985 †

2006 †

2012 †

違い †

機械学習との違い †

ベイズ統計との違い †

詳細 †

再帰型ニューラルネットワーク（RNN） †

CPU、GPU、TPU †

CPU †

GPU †

TPU †

その他 †

言語・ライブラリ †

言語 †

R言語 †

ライブラリ †

フレームワーク †

Theano †

言語 †

特徴 †

参考 †

Caffe †

言語 †

特徴 †

参考 †

Chainer †

言語 †

特徴 †

参考 †

言語 †

特徴 †

参考 †

CNTK †

言語 †

特徴 †

参考 †

Googleの †

ファースト・ステップ †

開発環境 †

アルゴリズム †

参考 †

One Learning Theory †

スパース・コーディング †

Wikipedia †

YouTube? †

深層学習 ディープラーニングの世界 †

ディープラーニング †

某处生活_LiveSomewhere? †

予備校のノリで学ぶ「大学の数学・物理」 †

ゼロから作るDeep Learning †

サンプル †

その他、参考 †

深層学習（deep learning）のバックアップ(No.47)

深層学習ディープラーニングの世界 †