深層学習（deep learning）のバックアップ(No.61) - .NET 開発基盤部会 Wiki

[ トップ ] [ 新規 | 一覧 | 単語検索 | 最終更新 | ヘルプ ]

「.NET 開発基盤部会 Wiki」は、「Open棟梁Project」,「OSSコンソーシアム .NET開発基盤部会」によって運営されています。

戻る（人工知能（AI）
- 機械学習（machine learning）
- 深層学習（deep learning）
- 強化学習（Reinforcement Learning）
- 生成系AI（Generative AI）

目次 †

目次
概要
- 特徴
  - 強み
  - 弱み
- 対象
- 歴史
  - 1943
  - 1951
  - 1957
  - 1979
  - 1982
  - 1985
  - 1986
  - 1989
  - 2006
  - 2010
  - 2012
  - 2014
  - 2015
  - 2019
- 違い
  - 機械学習との違い
  - ベイズ統計との違い
詳細
言語・ライブラリ
- 言語
  - Python
  - R言語
- ライブラリ
  - NumPy
  - Matplotlib
フレームワーク
- Theano
  - 言語
  - 特徴
  - 参考
- Caffe
  - 言語
  - 特徴
  - 参考
- Chainer
  - 言語
  - 特徴
  - 参考
- PyTorch
  - 言語
  - 特徴
  - 参考
- CNTK
  - 言語
  - 特徴
  - 参考
- Googleの
  - TensorFlow
  - Keras
- ONNX
ファースト・ステップ
- 開発環境
  - Python
  - NumPy
  - Matplotlib
- アルゴリズム
  - パーセプトロン
  - ニューラルネットワーク
参考

概要 †

深層学習（deep learning）について纏める。

第３次人工知能ブームでの人工知能

教師あり学習を主体とする。

人間の神経回路を真似した学習モデルを多層化した学習モデル。

多層構造のニューラルネットワークを用いた機械学習で、
この多層化により、より複雑なルールやパターンを見つける事ができる。

以下を基にしたアルゴリズムが実装されたもの。
- 脳、特に視覚野の研究
- 「たった一つの学習理論（One Learning Theory）」
- ブルーノ・オルスホーゼン教授
  によるスパース・コーディング理論

特徴 †

ニューラルネットワークを多層（深層は３層以上）にして、
誤差逆伝播法（バックプロパゲーション）と呼ばれる方法を用いて学習

多層構造のニューラルネットワークに画像などのデータを入力すると、
情報が第1層からより深くへ伝達されるうちに、各層で学習が繰り返される。

機械学習と同じ様な事が出来るが、分布を学習するのではなく超平面的なモノの近似を行う。

観測データから本質的な情報を抽出した特徴、潜在表現、内部表現（低次元表現、特徴ベクトル表現）を学習する。

以下の強みと弱みがある。

強み †

特徴量の自動抽出とパラメタの自動調整がされる。

超平面的なモノの近似によって非構造化データの処理に強い。

弱み †

超平面的なモノの近似なので、

必要となる学習データの数が膨大になる。

パラメタの数に依存
（パラメタ数は以下に依存）
- 層の深
- 層の幅

「バーニーおじさんのルール」では、
ニューラルネットワークの重みパラメタの数に対して、
最低その10倍以上の訓練データが必要となると言われている。

必要に応じて「データ拡張（data augmentation）」する。

データ量が少なすぎる場合は、深層学習以外のアプローチを検討。
（とは言え、非構造化データの場合は深層学習が必要になる）

この結果、計算量も膨大になる。

また、

結果の解釈ができない。
（ブラック・ボックス）

過学習を起こし易い。

チューニングも難しい。

などの問題もある。

対象 †

構造化データ †

構造化データも対象にできるが、機械学習と比べ、優位性はそれほど高くない。

非構造化データ †

機械学習では精度が出なかった非構造化データを対象にできる。

言語処理 > 機械翻訳

音声処理 > 音声認識

画像処理 > 画像認識

が、特に非構造化データのベクトル化の方法がポイントになる。

目視作業の自動化 †

フロントオフィス業務で画像認識を使うケースが多い。

異常検知の自動化 †

上記を使った異常検知など。

老朽化診断
品質管理、不良品検品（不良品を認識して弾く

歴史 †

※ 参考：AIの歴史

1943 †

ニューラルネットワークの基礎

1951 †

世界初のニューラルネットワーク学習マシン（SNACR

1957 †

パーセプトロン

1979 †

福島邦彦によってCNNのネオコグニトロン提唱。

1982 †

ポップフィールドネットワーク

1985 †

ボルツマンマシン

1986 †

誤差逆伝播法（バックプロパゲーション）の再発明、以後定着

1989 †

ネオコグニトロン＋バックプロパゲーション＝LeNet?

2006 †

オートエンコーダー
トロント大学のジェフリー・ヒントンが深層学習ブームの
火付け役となったDeep Belief Network（DBN）を発表

2010 †

画像認識（CNN）で大規模画像認識競技会（ILSVRC）が始まる。

2012 †

ILSVRC
ジェフリー・ヒントン率いるSuperVision?（チーム名）
のAlexNet（CNNアーキテクチャ名）が圧倒的な勝利を収めた。

Googleの猫
- 教えることなく、AIが自発的に猫を認識することに成功した。
- AIは画像内の特徴を認識し自発的に分類できるようになった。

2014 †

ILSVRC

GoogLeNet（Google
分類、検出部門で優勝

VGGNet（オックスフォード
分類部門で2位

2015 †

ILSVRC
- Microsoft ResearchのResNetが、初めて人間のエラー率 5% を上回る精度を達成。
- ≒ 機械が目を獲得した。機械のカンブリア爆発（飛躍的進化）が予測された。

2019 †

ILSVRC
- EfficientNetが効率的なスケールアップ規則の採用で、
  当時、パラメタ数を大幅に減少させ最高水準の精度を上回る。

違い †

機械学習との違い †

階層的な特徴量の学習が、機械学習と決定的に異なる点。

ベイズ統計との違い †

ベイズ法はトップダウン方式
AIが類例を認識すれば、様々なパターンに対応できるようになる。

深層学習はボトムアップ方式
- AIが生データで学習して成長していく。
- 大量のデータが必要で、類似問題しか解けない。
- GAN（敵対的生成ネットワーク）で弱点を補う。

詳細 †

アルゴリズム †

パーセプトロン †

ニューラルネットワーク †

ニューラルネットワークの体系 †

ディープニューラルネットワーク（DNN） †

順伝播型ニューラルネットワーク（FNN） †

再帰型ニューラルネットワーク（RNN） †

長短期記憶ニューラルネットワーク（LSTM） †

自己符号化器（AE：オートエンコーダ） †

制限ボルツマン・マシン（RBM） †

畳み込みニューラルネットワーク（CNN） †

深層生成ネットワーク（DGN） †

敵対的生成ネットワーク（GAN） †

深層Ｑネットワーク（DQN） †

CPU、GPU、TPU †

CPU †

CPUは複雑で連続的な処理が得意。
複雑な処理はCPUの方が早い。

GPU †

もともとグラフィックス計算のためのプロセッサ
GPUは比較的性能の良くないコアを大量に積んでいて並列的な処理が得意。
ニューラルネットワークの学習は単純な行列演算が多くを占めるので、
GPUによって高速化が期待できるので深層学習分野で使用される。

NVIDIA社のGPUでは、CUDAという深層学習用開発環境
が整えられていて、計算用の関数などが使用できる。

GPGPU †

グラフィック以外の目的での使用に最適化されたGPU
GPUの演算資源をグラフィックス計算以外の目的に応用する技術

TPU †

Google社が開発した、テンソル計算処理に最適化された演算処理装置

その他 †

言語・ライブラリ †

フレームワーク †

ファースト・ステップ †

言語・ライブラリ †

言語 †

Python †

R言語 †

ライブラリ †

NumPy †

Matplotlib †

フレームワーク †

Theano †

MILAのOSS（3条項BSD）で2007年に初版リリース
2017年以降、メンテナンス・フェーズ

言語 †

Python（コンパイラ、ライブラリ）

特徴 †

Numpyのように計算手続きを記述するのではなく, 数式そのものを記述.

このことによって, 計算対象となる行列等の実体のプログラム内での
引き回しを考える事なく, 最適化やGPUによる高速化の恩恵が受けられる.

また, 微分を (数値的ではなく) 解析的に実行する事が出来る.

参考 †

Theano 入門
http://www.chino-js.com/ja/tech/theano-rbm/

Caffe †

Yangqing Jiaら当時Berkeleyのメンバーが中心に2013年頃
開発したOSS（BSD）のディープラーニングフレームワーク

Convolutional Architecture for Fast Feature Embedding.
前身はDeCAF (Deep Convolutional Activation Feature)

言語 †

C++で実装、Pythonのインターフェイスあり。

特徴 †

コードを書かなくても設定ファイルだけで動かせる
容易に拡張できるコード設計
PythonとMatlabからも使える
高速（C++実装、GPUをシームレスに使い分け）
Githubの活発な開発コミュニティ
画像認識向き
- 画像分類
- シーン認識
- 物体検出
- 領域分割

参考 †

Caffeで始めるディープラーニング
https://www.slideshare.net/KotaYamaguchi1/caffe-71288204

Chainer †

2015年に株式会社Preferred Networks（PFN）からリリース。
2019年12月5日、PyTorchに順次移行すると発表。

言語 †

Python

特徴 †

特⻑：様々なNNを直感的に記述可能

NNの構築をPythonのプログラムとして記述
CuPy?によるCPU/GPU agnosticなコード記述
動的なNN構築（Define-by-Runの独自コンセプト）を採用
- しかし入力データによって計算グラフの構造が変化するRNNなどCNN以外のニューラルネットワークが台頭し、
- ニューラルネットワークの構造を柔軟に制御できるDefine-by-Runが、Define-and-Runに比べて優勢に。

参考 †

Chainer - Wikipedia
https://ja.wikipedia.org/wiki/Chainer

ディープラーニングフレームワークChainerの紹介と⾃動チューニングへの期待
http://atrg.jp/ja/index.php?plugin=attach&pcmd=open&file=20151225-ATTA-oono.pdf&refer=ATTA2015

PFN、深層学習フレームワークを自社開発の「Chainer」から「PyTorch」に切り替え - PC Watch
https://pc.watch.impress.co.jp/docs/news/1222796.html

PyTorch †

Facebookの人工知能研究グループ（FAIR）により開発された。
- 2016年にOSS（修正BSD）としてリリースされた。
- Lua言語で利用されていたTorchライブラリのPython版

Chainerに強く影響を受けている。
- Define-by-Runを踏襲
- 記法もかなりChainerに近い

研究者の間で人気
- 構文が解り易い。
- 論文でも使われる。

PDB、PyCharm?などのデバッガが使える。
動的な計算グラフ（計算の過程をグラフで視覚化して表したもの

言語 †

インターフェイス

Pythonインターフェイス
洗練されており、活発に開発が行われている。

C++インターフェイス存在する。

特徴 †

強力なGPUサポートを備えた（NumPyのような）テンソル演算ができる
テープベースの自動微分システムの上に構築された深層ニューラルネットワークが利用できる。

参考 †

PyTorch - Wikipedia
https://ja.wikipedia.org/wiki/PyTorch

CNTK †

（Microsoft Cognitive Toolkit）

2015年にMicrosoftからリリース。
2016年にMITライセンスでGitHubに公開。

言語 †

C++、Python、.NET、BrainScript?

特徴 †

リソース効率が良い。
ONNXを初めてサポート
コミュニティ発展が課題

参考 †

Microsoft Cognitive Toolkit - Wikipedia
https://ja.wikipedia.org/wiki/Microsoft_Cognitive_Toolkit

Googleの †

TensorFlow †

専用項を設けた。

Keras †

専用項を設けた。

ONNX †

専用項を設けた。

ファースト・ステップ †

開発環境 †

Python †

NumPy †

Matplotlib †

アルゴリズム †

パーセプトロン †

ニューラルネットワーク †

参考 †

One Learning Theory †

KDDI-RA-201405-01-PRT.pdf
https://rp.kddi-research.jp/download/report/RA2014005

脳科学の世界には
「One Learning Theory（たった一つの学習理論）」
と呼ばれる仮説がある。

それは「視覚野」、「聴覚野」、「感覚野」など、大脳皮質の異なる領域が、
実は同一の認知機構に従って動作している、とする仮説である。

これが正しければ、視覚野の認知機構に基づくスパース・コーディングは、
単に画像認識のみならず、例えば聴覚（つまり音声認識）など他の分野にも応用できる。

スパース・コーディング †

入力の一部または全体を、辞書に含まれる要素の組み合わせで表現しようというもの。

スパースなデータ表現とは、
- データを表現するための辞書を用意し、
- その要素のできるだけ少ない組み合わせでデータを表現すること。

参考
- 【スパースコーディング】スパースなデータ表現の利点 - Qiita
  http://qiita.com/IshitaTakeshi/items/5ff69d62b902446d1473

Wikipedia †

ディープラーニング
https://ja.wikipedia.org/wiki/%E3%83%87%E3%82%A3%E3%83%BC%E3%83%97%E3%83%A9%E3%83%BC%E3%83%8B%E3%83%B3%E3%82%B0
Python
https://ja.wikipedia.org/wiki/Python
NumPy
https://ja.wikipedia.org/wiki/NumPy
Matplotlib
https://ja.wikipedia.org/wiki/Matplotlib

YouTube? †

そうだったのか！可視化して理解するディープラーニング
https://www.youtube.com/watch?v=RJu4DeU1me8

予備校のノリで学ぶ「大学の数学・物理」 †

【機械学習】深層学習(ディープラーニング)とは何か
https://www.youtube.com/watch?v=s5_Pk3CjhNA

絶対に理解させる誤差逆伝播法【深層学習】
https://www.youtube.com/watch?v=0itH0iDO8BE

CNNに絞った内容

某处生活_LiveSomewhere? †

G検定対策

ディープラーニング（≒ DNN入門

PART0：初心者のための前準備
https://www.youtube.com/watch?v=9f-y8ux_6ck

PART1：順伝播（入力層～中間層の仕組み）
https://www.youtube.com/watch?v=i0JIaEDGSCE

PART2：順伝播（出力層と誤差計算）｜softmax & cross entropy
https://www.youtube.com/watch?v=HF9gMDMuN8k

PART3：誤差逆伝播｜バックプロパゲーション｜チェインルール
https://www.youtube.com/watch?v=QddzS4gONXs

PART4：kerasでの実装｜Google Colaboratoryで演習
https://www.youtube.com/watch?v=HQo4N1R61yw

CNN入門

RNN入門

t-uesugi/videos †

機械学習概論

1 1. 人工知能と機械学習
https://www.youtube.com/watch?v=-eea-vsx-Qs

1 2. 機械学習の分類
https://www.youtube.com/watch?v=oWnquePWiuA

1 3. 機械学習の流れ
https://www.youtube.com/watch?v=wwT64eZvYkE

1 4. データの分割
https://www.youtube.com/watch?v=xBuwXzixuNc

1 5. 過学習と交差検証
https://www.youtube.com/watch?v=aGAnu3DeF1k

2 1. 精度評価指標混同行列, 正解率, 精度, 再現率, F値, 決定係数, RMSE, MAE
https://www.youtube.com/watch?v=vFCPQy-Gcj8

2 2. 代表的な機械学習手法
https://www.youtube.com/watch?v=Omf4GMV-CnQ

2 3.データの質と量
https://www.youtube.com/watch?v=-TuY3t2ZbMs

線形回帰

1.最小二乗法と勾配法、2.線形回帰を使った課題
https://www.youtube.com/watch?v=nQVmc_JgCxQ

3.Ridge回帰とLasso回帰、4.Lasso回帰を使った課題
https://www.youtube.com/watch?v=CXf2sz5lvng

5.ロジスティック回帰、6.ロジスティック回帰を使った課題
https://www.youtube.com/watch?v=JQGS2JfRt3Q

ニューラルネットワーク
- 1. ノードと層
  https://www.youtube.com/watch?v=pXmmZrXyONw
- 2. アフィン変換
  https://www.youtube.com/watch?v=pV_jyrsBbkE
- 3. 活性化関数
  https://www.youtube.com/watch?v=-Wt8PQJlgZY
- 4. 順伝播から勾配法へ
  https://www.youtube.com/watch?v=rHbwmBJyV2s
- 5. 誤差逆伝播法
  https://www.youtube.com/watch?v=lctO5afCBmY

CNNに絞った内容

AIcia Solid Project †

深層学習ディープラーニングの世界
https://www.youtube.com/playlist?list=PLhDAH9aTfnxKXf__soUoAEOrbLAOnVHCP

vol. 1 ディープラーニングとは関数近似器である
https://www.youtube.com/watch?v=SyWwoMpP_P4
vol. 2 学習 - なぜ必要なのか？何をするのか？
https://www.youtube.com/watch?v=RLlTmbyJORM
vol. 3 関数 - なぜ「深さ」が AI を生み出しているのか？
https://www.youtube.com/watch?v=Mw4j4yPsFtg
vol. 4 全結合層 - それはいちばん大事な部品のお話
https://www.youtube.com/watch?v=FYDJ439Va_Y
vol. 5 畳み込み層の本当の意味、あなたは説明できますか？
https://www.youtube.com/watch?v=vU-JfZNBdYU
vol. 6 プーリング層 - シンプルだけど大きな役割を担う層
https://www.youtube.com/watch?v=MLixg9K6oeU
...

カサゴ３点
- CNNに絞った内容
- RNNに絞った内容

強化学習Live
https://www.youtube.com/playlist?list=PLhDAH9aTfnxI0T0FSxJfHdkeH3gM7f0H-

分析
- いろんな分析シリーズ
  https://www.youtube.com/playlist?list=PLhDAH9aTfnxJGiLwq2CRS87J51ZPU5IEM
- 時系列分析
  https://www.youtube.com/playlist?list=PLhDAH9aTfnxJV9Az0hJs0Ralu2N81mO8R

数学
- 線型代数基礎シリーズ
  https://www.youtube.com/playlist?list=PLhDAH9aTfnxKfmufxF59vaZECZJD5j6rd
- ベイズ統計
  https://www.youtube.com/playlist?list=PLhDAH9aTfnxIU4Hd1G1UdIVzHpgKfyEnw
- 週末微分幾何
  https://www.youtube.com/playlist?list=PLhDAH9aTfnxLbldij-bqLXHTahD5DPv3T
- 確率微分方程式
  https://www.youtube.com/playlist?list=PLhDAH9aTfnxIhf-iRKYTVOSXPqDGgfRFP

AIのふわふわした話
https://www.youtube.com/playlist?list=PLhDAH9aTfnxI_vbIwZQvnu8250ZVVQfNO

単発動画
- 数学の単発動画
  https://www.youtube.com/playlist?list=PLhDAH9aTfnxKx8G1sulyyn2rf2xh-Ng7i
- 統計学の単発動画
  https://www.youtube.com/playlist?list=PLhDAH9aTfnxIu7Lrje-zhAMxnhThBiqsS
- 機械学習の単発動画
  https://www.youtube.com/playlist?list=PLhDAH9aTfnxJz2A0rBwtZgmeZOcpc8GFS

つまみぐい
- 線型代数つまみぐい
  https://www.youtube.com/playlist?list=PLhDAH9aTfnxKW4fdRvBu3P3cMPpxSXEu1
- 解析学つまみぐい
  https://www.youtube.com/playlist?list=PLhDAH9aTfnxLRTcq54cgSKaQGAkogxsw_

ゼロから作るDeep Learning †

Pythonで学ぶディープラーニングの理論と実装 †

https://www.oreilly.co.jp/books/9784873117584/

サンプル
https://github.com/oreilly-japan/deep-learning-from-scratch

その他、参考
- ゼロから作るDeep Learning - Qiita
  https://qiita.com/okayu303/
  - 誤差逆伝播法の概要
    https://qiita.com/okayu303/items/b67ea27ae221fb5386d1
  - Affineレイヤ
    https://qiita.com/okayu303/items/8931a9076d7b867109d4
  - Softmax-with-Lossレイヤ
    https://qiita.com/okayu303/items/b67ea27ae221fb5386d1

【学習メモ】ゼロから作るDeep Learning - Qiita
https://qiita.com/yakof11/items/
- 【～４章】
  https://qiita.com/yakof11/items/ffe4297d73ac4d7febd6
- 【5章】
  https://qiita.com/yakof11/items/5d37042f689760515072
- 【6章】
  https://qiita.com/yakof11/items/7c27ae617651e76f03ca
- 【7章】
  https://qiita.com/yakof11/items/2e187f7d9f253b500295

『ゼロから作るDeep Learning』の学習ノート - からっぽのしょこ
https://www.anarchive-beta.com/entry/2020/06/01/192900

ゼロから作るDeep Learningで素人がつまずいたことメモ: まとめ - Qiita
- （１）
  https://qiita.com/segavvy/items/4e8c36cac9c6f3543ffd
  ・１章：https://qiita.com/segavvy/items/1945aa1a0f91a1473555
  ・２章：https://qiita.com/segavvy/items/d8e9e70437e35083a459
  ・３章：https://qiita.com/segavvy/items/6d79d0c3b4367869f4ea
  ・４章：https://qiita.com/segavvy/items/bdad9fcda2f0da918e7c
  ・５章：https://qiita.com/segavvy/items/8707e4e65aa7fa357d8a
  ・６章：https://qiita.com/segavvy/items/ca4ac4c9ee1a126bff41
  ・７章：https://qiita.com/segavvy/items/8541c6ae1868d9b2b805
  ・８章：https://qiita.com/segavvy/items/3eb6ea0ea2af68c96fcf
- （２）自然言語処理編
  https://qiita.com/segavvy/items/0f2980ad746d797dd8c1
  ・１章：https://qiita.com/segavvy/items/91be1d4fc66f7e322f25
  ・２章：https://qiita.com/segavvy/items/52feabbf7867020e117d
  ・３章：https://qiita.com/segavvy/items/1510d8c264edd291e0ef
  ・４章：https://qiita.com/segavvy/items/a286143dbcc5a93100b6
  ・５章：https://qiita.com/segavvy/items/3e6a9f6bff103824598f
  ・６章：https://qiita.com/segavvy/items/fba1595cf64a2462b415
  ・７章：https://qiita.com/segavvy/items/883671d07cd7ab26fbe0
  ・８章：https://qiita.com/segavvy/items/69ca97ff2d4e8a7144fd

自然言語処理編 †

https://www.oreilly.co.jp/books/9784873118369/

サンプル
https://github.com/oreilly-japan/deep-learning-from-scratch-2
その他、参考

フレームワーク編 †

https://www.oreilly.co.jp/books/9784873119069/

サンプル
https://github.com/oreilly-japan/deep-learning-from-scratch-3
その他、参考

強化学習編 †

https://www.oreilly.co.jp/books/9784873119755/

サンプル
https://github.com/oreilly-japan/deep-learning-from-scratch-4
その他、参考