ニューラルネットワークのバックアップ(No.4) - .NET 開発基盤部会 Wiki

[ トップ ] [ 新規 | 一覧 | 単語検索 | 最終更新 | ヘルプ ]

「.NET 開発基盤部会 Wiki」は、「Open棟梁Project」,「OSSコンソーシアム .NET開発基盤部会」によって運営されています。

戻る

目次 †

概要 †

ニューラルネットワークは、

パーセプトロンの、
「重み」のパラメタ（w1, w2, θ（-b））の決定は人手によって行われる。

という問題を、データから自動で「重み」のパラメタを学習することで解決する。

パーセプトロンでは、活性化関数にステップ関数（段階関数）を使用していたが、
ニューラルネットワークでは、これ以外の活性化関数を使用する。

ネットワークにループする結合を持たず、

第０層　　　　第１層　　　　　第２層~
入力層 → 中間層（隠れ層） → 出力層

というように単一方向へのみ信号が伝播する。

活性化関数 †

ステップ関数とシグモイド関数とReUL関数がある。

ステップ関数とシグモイド関数
- 相違点
  - ステップ関数：0, 1の信号
  - シグモイド関数：連続的な実数の信号

共通点
- 非線形な関数
- 0 <= 出力信号 <= 1 に収める。
- 入力信号が重要な時に１に近い、重要でない時０に近い値を返す。

ニューラルネットワークでは、非線形な関数を使用する必要がある。
- 線形関数を用いてはならないのは、多層化の意味が無くなるため。
- 例 : 線形な h(x) = cx を多層化しても h(h(h(x))) = cccx となり１層で表現可能。

しかし、最近は、ReUL関数の利用が主流になっている。

ステップ関数 †

実装 †

なんとなくAPI仕様を知らないと難しい感じ。

パターン１

"""This is a test program."""

import numpy as np

def step_function(x_1):
    """This is a test program."""
    y_1 = x_1 > 0
    return y_1.astype(np.int)

パターン２

"""This is a test program."""

import numpy as np

def step_function(x_1):
    """This is a test program."""
    return np.array(x_1 > 0, dtype=np.int)

グラフ †

－5.0 ～ 5.0までの0.1刻みのプロットをステップ関数にかけてグラフ化する。

"""This is a test program."""

import numpy as np
import matplotlib.pylab as plt

def step_function(x_1):
    """This is a test program."""
    # 上記のいずれかの実装を選択。

X = np.arange(-5.0, 5.0, 0.1)
Y = step_function(X)
plt.plot(X, Y)
plt.ylim(-0.1, 1.1)  # 図で描画するy軸の範囲を指定
plt.show()

step関数グラフ

シグモイド関数 †

              1
h(x) = ────────
        1 + exp(-x)

exp(-x)とは、eの-x乗を意味する。
eはネイピア数(2.7182)の実数を表す。

実装 †

ポイントは、Pythonのブロードキャストによって配列も計算できる点。

"""This is a test program."""

import numpy as np

def sigmoid(x_1):
     """This is a test program."""
    return 1 / (1 + np.exp(-x_1))

グラフ †

－5.0 ～ 5.0までの0.1刻みのプロットをシグモイド関数にかけてグラフ化する。

"""This is a test program."""

import numpy as np
import matplotlib.pylab as plt

def sigmoid(x_1):
    """This is a test program."""
    return 1 / (1 + np.exp(-x_1))

X = np.arange(-5.0, 5.0, 0.1)
Y = sigmoid(X)
plt.plot(X, Y)
plt.ylim(-0.1, 1.1)
plt.show()

sigmoid関数グラフ

ReUL関数 †

ReUL(Rectified Linear Unit)関数

入力が０以下なら０を出力する。
入力が０を超えていればそのまま出力する。

           ┌
           │0 ( a <= 0 )
y = h(a) = <
           │a ( a > 0 )
           └

最近の主流。

実装 †

"""This is a test program."""

import numpy as np

def relu(x_1):
    """This is a test program."""
    return np.maximum(0, x)

グラフ †

－5.0 ～ 5.0までの0.1刻みのプロットをReUL関数にかけてグラフ化する。

"""This is a test program."""

import numpy as np
import matplotlib.pylab as plt

def relu(x_1):
    """This is a test program."""
    return np.maximum(0, x_1)

X = np.arange(-5.0, 5.0, 0.1)
Y = relu(X)
plt.plot(X, Y)
plt.ylim(-0.1, 5.1)
plt.show()

ReUL関数グラフ

行列の積による実装 †

簡単なニューラルネットワークの実装 †

対象 †

バイアスと活性化関数を省略し重みだけとする。

Ｘ行列 * Ｗ行列＝Ｙ行列

┌      ┐ ┌          ┐   ┌                               ┐
│a1  b1│ │a2  b2  c2│ = │a1a2+b1d2  a1b2+b1e2  a1c2+b1f2│
└      ┘ │          │   └                               ┘
           │d2  e2  f2│
           └          ┘
  Ｘ行列       Ｗ行列               Ｙ行列

#ref(): File not found: "simple.png" at page "ニューラルネットワーク"

┌    ┐   ┌       ┐      ┌                   ┐
│a  b│   │1  3  5│   =  │1a+2b  3a+4b  5a+6b│
└    ┘   │       │      └                   ┘
           │2  4  6│
           └       ┘
  Ｘ行列      Ｗ行列                Ｙ行列

実装 †

>>> x=np.array([1,2])
>>> x
array([1, 2])
>>> w=np.array([[1,3,5],[2,4,6]])
>>> w
array([[1, 3, 5],
       [2, 4, 6]])
>>> y=np.dot(x,w)
>>> y
array([ 5, 11, 17])

3層のニューラルネットワークの実装 †

対象 †

#ref(): File not found: "3tier.png" at page "ニューラルネットワーク"

第一層目の計算の例
- 重み付き信号とバイアスの和
  - a(1)1 = w(1)11 x1 + w(1)12 x2 + b(1)1
  - a(1)2 = w(1)21 x1 + w(1)22 x2 + b(1)2
  - a(1)3 = w(1)31 x1 + w(1)32 x2 + b(1)3

これを行列で表すと、
A(1) = x(1) W(1) + B(1)
- X(1) = [x1 x2]
- W(1)=
```
┌                    ┐
│w(1)11 w(1)21 w(1)31│
│w(1)12 w(1)22 w(1)32│
└                    ┘
```
- B(1) = [b(1)1 b(1)2 b(1)3]
- A(1) = [a(1)1 a(1)2 a(1)3]

活性関数
シグモイド関数を使用する。
```
h(A(1)) = Z(1)
```

第二層目の計算の例
第一層目と大方、同じ。

第三層目の計算の例
- 第一層目と大方、同じ。
- 活性関数だけ異なる。
  - 出力層の活性関数は問題によって異なる。
  - 恒等関数を使用する。
```
σ(A(3)) = Z(3)
```

実装 †

そのまんま実装した。

"""This is a test program."""

import numpy as np

def sigmoid(x_1):
    """sigmoid."""
    return 1 / (1 + np.exp(-x_1))

def identity_function(y_1):
    """出力層の活性関数"""
    return y_1

# 第一層
X1 = np.array([1.0, 0.5])
W1 = np.array([[0.1, 0.3, 0.5], [0.2, 0.4, 0.6]])
B1 = np.array([0.1, 0.2, 0.3])

print("第一層")
A1 = np.dot(X1, W1) + B1
print("A1:" + str(A1))
Z1 = sigmoid(A1)
print("Z1:" + str(Z1))

# 第二層
X2 = Z1
W2 = np.array([[0.1, 0.4], [0.2, 0.5], [0.3, 0.6]])
B2 = np.array([0.1, 0.2])

print("第二層")
A2 = np.dot(X2, W2) + B2
print("A2:" + str(A2))
Z2 = sigmoid(A2)
print("Z2:" + str(Z2))

# 第三層
X3 = Z2
W3 = np.array([[0.1, 0.3], [0.2, 0.4]])
B3 = np.array([0.1, 0.2])

print("第三層")
A3 = np.dot(X3, W3) + B3
print("A3:" + str(A3))
Z3 = identity_function(A3)
print("Z3:" + str(Z3))

慣例的実装 †

init_networkで、ニューラルネットワークを定義/初期化し、
forwardで入力から出力方向への伝達処理を行う。

"""This is a test program."""

import numpy as np

def sigmoid(x_1):
    """sigmoid."""
    return 1 / (1 + np.exp(-x_1))

def identity_function(y_1):
    """出力層の活性関数"""
    return y_1

def init_network():
    """ニューラルネットワーク"""
    network = {}
    networkw = {}
    networkw[0] = np.array([[0.1, 0.3, 0.5], [0.2, 0.4, 0.6]])
    networkw[1] = np.array([[0.1, 0.4], [0.2, 0.5], [0.3, 0.6]])
    networkw[2] = np.array([[0.1, 0.3], [0.2, 0.4]])
    networkb = {}
    networkb[0] = np.array([0.1, 0.2, 0.3])
    networkb[1] = np.array([0.1, 0.2])
    networkb[2] = np.array([0.1, 0.2])
    network["W"] = networkw
    network["b"] = networkb
    return network

def forward(network, zzz):
    """ニューラルネットワークの実行"""
    tier = len(network["W"])

    for num in range(tier - 1):
        print("第" + str(num + 1) + "層")
        xxx = zzz
        aaa = np.dot(xxx, network["W"][num]) + network["b"][num]
        print("A" + str(num + 1) + ":" + str(aaa))
        zzz = sigmoid(aaa)
        print("Z" + str(num + 1) + ":" + str(zzz))

    print("第" + str(tier) + "層")
    xxx = zzz
    aaa = np.dot(xxx, network["W"][tier -1]) + network["b"][tier -1]
    print("A" + str(tier) + ":" + str(aaa))
    zzz = identity_function(aaa) # 出力層の活性関数
    print("Z" + str(tier) + ":" + str(zzz))

    return zzz

print(forward(init_network(), np.array([1.0, 0.5])))

出力層の活性関数 †

ニューラルネットワークは
- 分類問題と
  - 入力データがどのクラスに属するか？
  - 例：写真から男性・女性を識別する。
- 回帰問題に
  - 入力データから連続的な数値を予測する。
  - 例：写真からその人の体重を予測する。

用いることができる。

一般的に、出力層の活性関数は、
- 分類問題 : ソフトマックス関数
- 回帰問題 : 恒等関数

を利用する。

恒等関数 †

入力をそのまま返す。

#ref(): File not found: "identity.png" at page "ニューラルネットワーク"

ソフトマックス関数 †

対象 †

            exp(Ak)
Yk = ───────────
            n
           Σexp(Ai)
           i=1

シグモイド関数の項で説明した通り、

exp(x)とは、eのx乗を意味する。
eはネイピア数(2.7182)の実数を表す。

#ref(): File not found: "softmax.png" at page "ニューラルネットワーク"

実装 †

そのまま実装

>>> a=np.array([0.3, 2.9, 4.0])
>>> a
array([ 0.3,  2.9,  4. ])
>>> exp_a = np.exp(a)
>>> exp_a
array([  1.34985881,  18.17414537,  54.59815003])
>>> sum_exp_a = np.sum(exp_a)
>>> sum_exp_a
74.122154210163302
>>> y = exp_a / sum_exp_a
>>> y
array([ 0.01821127,  0.24519181,  0.73659691])
>>>

関数化

"""This is a test program."""

import numpy as np

def softmax(aaa):
    """ソフトマックス関数"""
    exp_a = np.exp(aaa)
    sum_exp_a = np.sum(exp_a)
    return exp_a / sum_exp_a

print(softmax(np.array([0.3, 2.9, 4.0])))

オーバーフロー対策の実装 †

ソフトマックス関数は指数関数を使用するため、オーバーフローし易い。
従って、ここでは、オーバーフロー対策について考える。

以下のように変形できる。

            exp(Ak)
Yk = ───────────
            n
           Σexp(Ai)
           i=1

          C exp(Ak)
   = ───────────
            n
         C Σexp(Ai)
           i=1

            exp(Ak + logeC)
   = ───────────
            n
           Σexp(Ai + logeC)
           i=1

            exp(Ak + C')
   = ───────────
            n
           Σexp(Ai + C')
           i=1

例えば、
- 10の3乗は、10の1乗*10の2乗 = 1,000
- 10の4乗は、10の2乗*10の2乗 = 10,000
- なので、下のようになる。
```
 (a+b)    a    b
X      = X  * X  
```
Xb=Cのとき、b=logxCになるから、下のようになる。
```
 a    logxC     (a+logxC)
X  * X       = X
```

Cは、入力信号中の最大値を使用する。
これによって、オーバーフローが発生し難くなる。以下に実装を示す。

"""This is a test program."""

import numpy as np

def softmax(aaa):
    """ソフトマックス関数"""
    exp_a = np.exp(aaa - np.max(aaa))
    sum_exp_a = np.sum(exp_a)
    return exp_a / sum_exp_a

# print(softmax(np.array([0.3, 2.9, 4.0])))
print(softmax(np.array([1010, 1000, 990])))

参考 †

ニューラルネットワーク - Wikipedia
https://ja.wikipedia.org/wiki/%E3%83%8B%E3%83%A5%E3%83%BC%E3%83%A9%E3%83%AB%E3%83%8D%E3%83%83%E3%83%88%E3%83%AF%E3%83%BC%E3%82%AF