[Think IT] 第3回：パルスニューロンモデルとは？ (3/3)

聴覚神経回路モデルと音時間差検出モデル

耳介（じかい）から入った音（空気振動）は、外耳を通って鼓膜で機械振動に変換され、この振動は中耳にあるツチ骨、キヌタ骨、アブミ骨に伝えられて増幅され、内耳にある「かたつむり状」の蝸牛（かぎゅう）に到達する。

この蝸牛ではリンパ液中の液体振動に変換され、ここで周波数分析が行われる。蝸牛内にある基底膜では音の周波数によって振動する部位が異なり、それぞれの周波数成分の強さに比例して特定部位の基底膜の振動の振幅が変化する。そして、基底膜上の有毛細胞が基底膜の振動に応じて興奮して神経インパルスを発生し、その神経インパルスが最終的に蝸牛神経に伝達され、この神経インパルスが脳へ送られていく。

筆者らはこの聴覚神経機構を参考に、蝸牛基底膜に相当するバンドパスフィルター群、有毛細胞に相当する非線形変換とローパスフィルタ群、そして、蝸牛神経に相当するパルス変換器群によって、聴覚神経回路モデルを構成している。

脳においては、音源定位に関与する上オリーブ核（Superior Olivary Complex）に音情報が神経インパルスとして伝達される。ここでの2つの部位、内側上オリーブ核（MSO：Medial Superior Olive）が音の時間差の処理に、外側上オリーブ核（LSO：Lateral Superior Olive）が音圧差の処理に関与していると考えられている。

筆者らは、内側上オリーブ核での音時間差検出モデルとしてJeffressの一致モデルを用いている。人間は両耳に入ってくる音信号の時間差を使って、音源の方向を知ることができる。例えば音源が正面よりも右にある場合には、右耳に入る音が左耳に入る音よりもわずかに早く入ってくるはずである。

このJeffressの一致モデルを聴覚神経回路モデルとパルスニューロンモデルを使って実現する。

音時間差検出モデルの仕組み

まず、左右それぞれの音信号を聴覚神経回路モデルによりパルス列に変換する。変換されたパルス列を図3で示すパルスニューロンモデル群に入力する。

図3において、それぞれのパルスニューロンモデルは2つのシナプスを持ち、それぞれのシナプスに対する結合係数を1.0に設定する。そして発火のしきい値を2.0よりも若干小さい値に設定し、左右からほぼ同時にパルスが入力された場合に発火をするように設定する。入力信号は遅れ素子を用いることで、1クロックずつ順に反対方向へと進行するようにする。

今、両側から全く同時にパルスが入力されたとすると、これらのパルスはちょうど真ん中のニューロンで出会うため、真ん中のニューロンが発火することになる。もし、右側のパルスが早く入力されたとすると、2つのパルスはやや左よりの位置で出会うため、中央よりも左側のニューロンが発火する。もし、左側のパルスが早く入力されたとすると、2つのパルスはやや右よりの位置で出会うため、中央よりも右側のニューロンが発火する。このように、Jeffressのモデルでは両耳間の音時間差を発火するニューロンの位置として検出することが可能である。

このモデルをそれぞれの周波数帯域ごとに用意し、パルスニューロンモデルを2次元マトリックス状に配置したネットワークモデルを構築する。このモデルを用いることで、2つのマイクに入った音の時間差を検出することが可能となる。

次週には、この音時間差検出を行うパルスニューロンモデルと、さらに音源の種類を識別するパルスニューラルネットワークを加えて、音源定位と音源種類識別をリアルタイムで行うハードウェアに関して紹介する。

最後に、パルスニューラルネットワークモデル原著論文は「Susumu Kuroyanagi and Akira Iwata："Auditory Pulse Neural Network Model to Extract the Inter-Aural Time and Level Difference for Sound Localization"、 IEICE Transactions on Information and Systems、E77-D、No.4、pp.466--474、1994」「黒柳奨、岩田彰："音源方向定位聴覚神経系モデルによるITD、ILDの脳内マッピング"、電子情報通信学会論文誌（D-II）、Vol.J79-D-II、No.2、pp.267--276、1996」となる。タイトルへ戻る