sigma-se

概要

ステップ関数、シグモイド関数、ReLU関数、恒等関数、ソフトマックス関数をPythonで実装し、それぞれの使いどころを整理する。

活性化関数はすべて同じ役割ではなく、中間層で使いやすいもの、回帰の出力層で使うもの、分類の出力層で使うものがある。

ここでは、関数ごとの特徴とNumPy実装をまとめて確認する。

この記事で扱うこと

代表的な活性化関数の特徴。
中間層と出力層で使われる関数の違い。
NumPyで各関数を実装する方法。
ソフトマックス関数で確率のような出力を作る考え方。

作業前に確認すること

確認項目	内容
NumPy	配列演算、np.exp、np.maximumの基本を確認しておく。
前提知識	活性化関数の役割を前の記事で確認しておく。
数値の扱い	指数関数では値が大きくなりやすい点を意識する。

概念の説明と実装サンプル

ステップ関数

前の記事 > ニューラルネットワークの活性化関数と実装サンプルで触れたステップ関数で、線形の活性化関数であり階段関数とも呼ばれる。

定義
\(x\) が \(0\) より大きければ、\(1\) を出力し、\(0\) 以下であれば \(0\) を出力する。

\[ {\normalsize h(x) = \begin{cases} 0 \hspace{5pt}\text{if}\hspace{5pt}x \leqq 0 \\ 1 \hspace{5pt}\text{if}\hspace{5pt}x > 0 \end{cases} } \]

実装

$ python
 >>> import numpy as np
 >>> import matplotlib.pylab as plt
 >>> def step_func(x):    # ステップ関数の定義
 ...    return np.array(x > 0, dtype=np.int)
 ...

グラフ出力

$ python
 >>> x = np.arange(-5.0, 5.0, 0.1)    # 区間を-5～5 まで、描画制度を 0.1 刻みに設定
 >>> y = step_func(x)    # ステップ関数をコール
 >>> plt.title("step_func\n# arange:-5.0, 5.0, 0.1, xlabel:x, ylabel:y")    # グラフタイトルを設定
 Text(0.5, 1.0, 'step_func\n# arange:-5.0, 5.0, 0.1, xlabel:x, ylabel:y')
 >>> plt.ylim(-0.1, 1.1)    # y軸の範囲を設定
 (-0.1, 1.1)
 >>> plt.xlabel("x")    # x軸のラベルを設定
 Text(0.5, 0, 'x')
 >>> plt.ylabel("y")    # y軸のラベルを設定
 Text(0, 0.5, 'y')
 >>> plt.plot(x, y)    # グラフの描画
 [&lt;matplotlib.lines.Line2D object at 0x7fc13041e278&gt;]
 >>> plt.savefig('/var/www/vops/ops/macuos/static/macuos/img/pid18_1.png'))    # グラフの出力

pid18_1

シグモイド関数

前の記事 > ニューラルネットワークの活性化関数と実装サンプルで触れたシグモイド関数で、非線形のの活性化関数に分類される。

定義
出力値は、\(x\) が小さいほど \(0\) になく近づき、\(x\) が大きいほど \(1\) に限りなく近づく。

\[ h(x) = \frac{1}{1+e^{-x}} \]

実装

$ python
 >>> import numpy as np
 >>> import matplotlib.pylab as plt
 >>> def sigmoid_func(x):    # シグモイド関数の定義
 ...     return 1 / (1 + np.exp(-x))    # 自然対数の低 (e) の -x 乗
 ...

グラフ出力

$ python
 >>> x = np.arange(-5.0, 5.0, 0.1)    # 区間を-5～5 まで、描画制度を 0.1 刻みに設定
 >>> y = sigmoid_func(x)    # シグモイド関数をコール
 >>> plt.title("sigmoid_func\n# arange:-5.0, 5.0, 0.1, xlabel:x, ylabel:y")    # グラフタイトルを設定
 Text(0.5, 1.0, 'sigmoid_func\n# arange:-5.0, 5.0, 0.1, xlabel:x, ylabel:y')
 >>> plt.ylim(-0.1, 1.1)    # y軸の範囲を設定
 (-0.1, 1.1)
 >>> plt.xlabel("x")    # x軸のラベルを設定
 Text(0.5, 0, 'x')
 >>> plt.ylabel("y")    # y軸のラベルを設定
 Text(0, 0.5, 'y')
 >>> plt.plot(x, y)
 [&lt;matplotlib.lines.Line2D object at 0x7f727fbc1be0&gt;]
 >>> plt.savefig('/var/www/vops/ops/macuos/static/macuos/img/pid18_2.png')    # グラフの出力

pid18_2

ReLU関数

ReLU（Rectified Linear Unit：ランプ関数、正規化線形関数）と呼ばれ、非線形の活性化関数に分類される。
※ 最近では、ニューラルネットワークにおいて、シグモイド関数より、ReLU関数が多く用いられるようになった。

定義
\(x\) が \(0\) より大きい場合、\(x\) を出力し、\(0\) 以下である場合、\(0\) を出力する。

\[ {\normalsize h(x) = \begin{cases} x \hspace{5pt}\text{if}\hspace{5pt}x > 0 \\ 0 \hspace{5pt}\text{if}\hspace{5pt}x \leqq 0 \end{cases} } \]

実装

$ python
 >>> import numpy as np
 >>> import matplotlib.pylab as plt
 >>> def relu_func(x):    # ReLU関数の定義
 ...     return np.maximum(0, x)
 ...

グラフ出力

$ python
 >>> x = np.arange(-5.0, 5.0, 0.1)    # 区間を-5～5 まで、描画制度を 0.1 刻みに設定
 >>> y = relu_func(x)    # ReLU関数をコール
 >>> plt.title("relu_func\n# arange:-5.0, 5.0, 0.1, xlabel:x, ylabel:y")    # グラフタイトルを設定
 Text(0.5, 1.0, 'relu_func\n# arange:-5.0, 5.0, 0.1, xlabel:x, ylabel:y')
 >>> plt.xlabel("x")    # x軸のラベルを設定
 Text(0.5, 0, 'x')
 >>> plt.ylabel("y")    # y軸のラベルを設定
 Text(0, 0.5, 'y')
 >>> plt.plot(x, y)
 [&lt;matplotlib.lines.Line2D object at 0x7fbf1cfeecc0&gt;]
 >>> plt.savefig('/var/www/vops/ops/macuos/static/macuos/img/pid18_3.png')
 >>>

pid18_3

恒等関数

出力層で使われる線形の活性化関数に分類される。

定義
\(x\) をそのまま出力する。

\[ {\normalsize h(x) = x } \]

実装

$ python
 >>> import numpy as np
 >>> import matplotlib.pylab as plt
 >>> def koutou_func(x):    # 恒等関数の定義
 ...     return x
 ...

グラフ出力

$ python
 >>> x = np.arange(-5.0, 5.0, 0.1)    # 区間を-5～5 まで、描画制度を 0.1 刻みに設定
 >>> y = koutou_func(x)    # 恒等関数をコール
 >>> plt.title("koutou_func\n# arange:-5.0, 5.0, 0.1, xlabel:x, ylabel:y")    # グラフタイトルを設定
 Text(0.5, 1.0, 'koutou_func\n# arange:-5.0, 5.0, 0.1, xlabel:x, ylabel:y')
 >>> plt.xlabel("x")    # x軸のラベルを設定
 Text(0.5, 0, 'x')
 >>> plt.ylabel("y")    # y軸のラベルを設定
 Text(0, 0.5, 'y')
 >>> plt.plot(x, y)
 [&lt;matplotlib.lines.Line2D object at 0x7fba4d928f60&gt;]
 >>> plt.savefig('/var/www/vops/ops/macuos/static/macuos/img/pid18_4.png')
 >>>

pid18_4

ソフトマックス関数

分類問題で使われる非線形の活性化関数に分類される。

定義
\(n \leqq k\) の時、\(k\) 番目の出力 \(h(x_{k})\) を表す。

\[ {\normalsize h(x_{k}) = \frac{e^{x_{k}}}{\sum_{i=1}^{n} e^{x_{i}}} } \]

実装

$ python
 >>> def softmax_func(x):    # ソフトマックス関数の定義
 ...     exp_x = np.exp(x)
 ...     sum_exp_x = np.sum(exp_x)
 ...     y = exp_x / sum_exp_x
 ...     return y
 ...

グラフ出力

$ python
 >>> x = np.arange(-5.0, 5.0, 0.1)    # 区間を-5～5 まで、描画制度を 0.1 刻みに設定
 >>> y = koutou_func(x)    # ソフトマックス関数をコール
 >>> plt.title("softmax_func\n# arange:-5.0, 5.0, 0.1, xlabel:x, ylabel:y")    # グラフタイトルを設定
 Text(0.5, 1.0, 'softmax_func\n# arange:-5.0, 5.0, 0.1, xlabel:x, ylabel:y')
 >>> plt.xlabel("x")    # x軸のラベルを設定
 Text(0.5, 0, 'x')
 >>> plt.ylabel("y")    # y軸のラベルを設定
 Text(0, 0.5, 'y')
 >>> plt.plot(x, y)
 [&lt;matplotlib.lines.Line2D object at 0x7ff04a9c4d68&gt;]
 >>> plt.savefig('/var/www/vops/ops/macuos/static/macuos/img/pid18_5.png')
 >>>

pid18_5

違いを整理する

比較する項目	整理するポイント
ReLUとステップ関数	どちらも0を境にするが、ReLUは正の値をそのまま通す。
恒等関数の使いどころ	主に回帰問題の出力層で、値をそのまま出したい場合に使う。
ソフトマックスのオーバーフロー	指数計算では入力値が大きいと桁あふれしやすいため、安定化の工夫が必要。

実務とのつながり

分類と回帰の設計
出力層の活性化関数は、解きたい問題が分類か回帰かで変わる。
学習の安定性
ReLUやソフトマックスの性質を知っておくと、学習が進まない原因を切り分けやすい。

まとめ

活性化関数は、用途に応じて使い分ける。
ReLUは中間層、恒等関数は回帰の出力層、ソフトマックスは多クラス分類の出力層でよく使われる。
実装では、配列演算と数値安定性に注意する。

参考文献

斎藤康毅（\(2018\)）『ゼロから作るDeep Learning - Pythonで学ぶディープラーニングの理論と実装』株式会社オライリー・ジャパン

SIGMA-SE Tech Blog