エンジニアの本棚第5回

ブック・インサイド『Python機械学習プログラミング』―パーセプトロンを読み解く

前回は、書籍『Python機械学習プログラミング』を読むために必要な知識、読み方等について説明しました。今回は、2章の内容についてより分かりやすく理解するためのヒントを解説していきます。

2016年8月8日 10:43

原著の『Python Machine Learning』は2015年9月に米国などで発売。「機械学習の考え方」と「Pythonプログラミングによる実践」をバランスよく解説していると評価され、米国Amazon.comでベストセラー。その日本語訳はコラムや脚注、付録が追加され、2016年6月に発売されました。ここでは、本書のより効果的な活用法について監訳者が解説します。

第2章の内容

『Python機械学習プログラミング』の第2章では、パーセプトロン、ADALINE という2 つのアルゴリズムについて説明されます。本章の内容を理解することにより、機械学習の分類タスクの考え方、Python による機械学習アルゴリズム実装への習熟、最適化の考え方等について理解を深めることができます。

各節で扱われる内容を「数式を用いた説明」「Pythonによる実装」「分析結果の解釈」の3つによって大まかに分類すると、表1のようになります。

表1：各節で扱われる内容について特性で分類

「Pythonによる実装」は、第3章以降でscikit-learnを用いて機械学習のアルゴリズムを実行するときの基礎になります。「数式による説明」は、第3章でロジスティック回帰やサポートベクトルマシンなどのアルゴリズム、また第12章でニューラルネットワークを理解するのに重要な事項です。

以上のように、第2章は本書を読み進めていく上で重要な位置付けになっています。一方で、前回記述したように、数式が最初から登場したり、クラスを用いてパーセプトロンやADALINEのアルゴリズムを実装したりと、少し取っ付きづらい面もあるかもしれません。本記事では、そうした点を補っていければと思います。

パーセプトロンの定式化

2.1節「人工ニューロン--機械学習の前史」から2.3節「Irisデータセットでのパーセプトロンモデルのトレーニング」では、数式を交えたパーセプトロンの概要、Pythonによる実装、そしてその分析結果が説明されます。

p.18の図において、入力信号がm個あるとします。以下のように図の左側には5個の矢印が描かれていますが、この1つ1つが入力信号だと考えてください。

図1：神経細胞の模式図

入力信号1の信号値がx₁、入力信号2の信号値がx₂、・・・、入力信号mの信号値がx_mであるとします。これらの入力信号は重みをw₁、・・・、w_mとして、それぞれを足し合わせたものが細胞核に取り込まれます。これを総入力(net input)と呼んでいます。

総入力z = (入力信号1 の重み付きの信号値) + (入力信号2 の重み付きの信号値) + … + (入力信号m の重み付きの信号値)
　　　  = w₁x₁ + w₂x₂ + … + w_mx_m

例えば、3 つの入力信号があるとして、1 番目の入力信号の信号値をx₁ = 1、2 番目の入力信号の信号値をx₂ = 2、3 番目の入力信号の信号値をx₃ = 3 とします。これらの入力信号の重みをw₁ = 0.2、w₂ = 0.4、w₃ = 0.5 とします。このとき、

総入力z = (入力信号1 の重み付きの信号値) + (入力信号2 の重み付きの信号値) + … + (入力信号m の重み付きの信号値)
　　　  = w₁x₁ + w₂x₂ + w₃x₃
　　　  = 0.2 × 1 + 0.4 × 2 + 0.5 × 3 = 0.2 + 0.8 + 1.5 = 2.5

となります。例えば、すべての入力信号の重みが1 のときの総入力は、

z = 1・x₁ + 1・x₂ +・・・+ 1・x_m
  = x₁ + x₂ +・・・+ x_m

となり、単純にすべての入力信号の信号値を足し合わせたもの(和) になります。さて、本書内でも説明されているように、Rosenblatt によるパーセプトロンは以上の神経細胞を模したアルゴリズムで、入力信号から出力信号を判定するものです。そのアイディアは、

入力信号の重み付きの和が一定値(しきい値) 以上であれば出力信号が生成される

というものです。これは、総入力z がしきい値θ を超えているかどうかを判定することにより行います。数式で表すと、次の判定条件になります。

総入力z ≥ しきい値θ

総入力z の式を具体的に代入すると、以下のようになります。

z = w₁x₁ + w₂x₂ + … + w_mx_m ≥ θ

先ほどの具体例では、以下のようになります。

w₁x₁ + w₂x₂ + w₃x₃ = 2.5  ≥ θ

例えば、θ = 2 とすると左辺はθ より大きくなります。θ = 3 とすると左辺はθ よりも小さくなります。

上記の総入力z がしきい値θ を超えるかどうかを判定する式において、右辺のθ を左辺に移行すると、以下の式を得ます。

-θ + w₁x₁ + w₂x₂ + ・・・ + w_mx_m ≥ 0

この式で、

-θ = w₀x₀

とおくと、

w₀x₀ + w₁x₁ + w₂x₂ + w₃x₃ + ・・・ + w_mx_m ≥ 0

となり、統一的な形で表すことができます。w₀とx₀の決め方は様々なものが考えられます。例えば、w₀ = -1、x₀ = θ としても良いですし、w₀ = θ、x₀ = -1 としても良さそうです。本書では、重みをw₀ = -θ、x₀ = 1 としています。このとき、総入力z は次式

z = w₀x₀ + w₁x₁ + ・・・ + w_mx_m

で表せます。総入力z が0 以上ならば出力信号が生成され、0 未満ならば出力信号が生成されません。このように、総入力z の値から出力の値を判断する活性化関数φ = φ(z) は次式で定義されます。

例えば、入力信号の重みをw₀ = 0.2、w₁ = 0.4、w₂ = 0.5 とすると、総入力が0 以上となるのは、

z = w₀x₀ + w₁x₁ + w₂x₂
  = 0.2・1 + 0.4・x₁ + 0.5・x₂ ≥ 0

となります。この式を整理すると、

x₂ ≥ -0.4/0.5x₁ - 0.2/0.5

となります。分数を簡潔にすると、

x₂ ≥ -0.8x₁ - 0.4

となります。

行列による総入力の表現

なお、総入力z の式は、行列を用いて書き表すことができます。

ここでは、以下のようにしています。

なお、p.19の式2.1.1 ではベクトルwとxは以下のように定義されています。

同じページの式 2.1.3 以降ではw、x にそれぞれw₀、x₀が追加されていることに注意してください。

重みを推定するための計算方法

さて、以上では入力信号の重みw₀、・・・、w_m は与えられるものとして扱ってきました。しかし、これらの重みは、出力信号が生成される場合と生成されない場合をうまく説明できるように調整する必要があります。Rosenblatt によるパーセプトロンは、次の手順で重みを調整していきます。

1. 重みを0 または値の小さい乱数で初期化する。
2. トレーニングサンプルx_0(i) ごとに以下の手順を実行する。
（a）出力値ŷを計算する。
（b）重みを更新する。

この記事のキーワード：

この記事をシェアしてください

人気記事ランキング

人気コーナーランキング

タイプ

連載

特集

ブック・インサイド『Python機械学習プログラミング』―パーセプトロンを読み解く

目次

Python機械学習プログラミング
達人データサイエンティストによる理論と実践

第2章の内容

パーセプトロンの定式化

行列による総入力の表現

重みを推定するための計算方法

バックナンバー

ブック・インサイド『Python機械学習プログラミング』―単純な例でADALINEのイメージをつかむ