Subject   : 畳み込みニューラルネットワーク (Convolutional Neural Networks: CNN)

カテゴリー  : 情報産業・技術  


 畳み込みニューラルネットワーク (Convolutional Neural Networks: CNN)
 畳み込みニューラルネットワーク (Convolutional Neural Networks: CNN) とは、全結合していない順伝播型ニューラルネットワークの一種。特に2次元の畳込みニューラルネットワークは人間の視覚野のニューロンの結合と似たニューラルネットワークであり、人間の認知とよく似た学習が行われることが期待される。結合がスパース(疎)であるため、全結合しているニューラルネットワークに比べて学習が高速である。

1979年に福島邦彦が発表したネオコグニトロンから発展し、1988年にHomma Toshiteruらが音素の認識に、1989年にYann LeCunらが文字画像の認識に使用し、1998年にLeCunらが発表したLeNet-5へと続き、2012年にILSVRCでの物体カテゴリ認識で優勝したアルゴリズムも深層畳み込みニューラルネットワークである。ネオコグニトロンの時から深層であったが、近年は深層であることを強調するため、深層が頭につき、深層畳み込みニューラルネットワークと呼ばれることもある。自然言語処理に対する応用もなされはじめた。

何段もの深い層を持つニューラルネットワークで、特に画像認識の分野で優れた性能を発揮しているネットワークです。このネットワークは「畳み込み層」や「プーリング層」などの幾つかの特徴的な機能を持った層を積み上げることで構成され、現在幅広い分野で活用されています。

この畳み込みニューラルネットワークは、主に一般物体認識と呼ばれる画像認識のタスクで優れた性能を持つアルゴリズムとして使われているものですが、この圧倒的な性能の他に、転移学習による効率的なネットワークの学習方法が確立されたことなどもこの技術が普及した大きなきっかけになったと言えるでしょう。

● 畳み込み層
 一般的なニューラルネットワークでは層状にニューロンを配置し、前後の層に含まれるニューロン同士は網羅的に結線するのが普通ですが、この畳み込みニューラルネットワークではこのニューロン同士の結合をうまく制限し、なおかつウェイト共有という手法を使うことで、画像の畳み込みに相当するような処理をニューラルネットワークの枠組みの中で表現することに成功しています。この層は「畳み込み層」と呼ばれ、この畳み込みニューラルネットワークでは特に重要な意味を持っています。

● プーリング層
 「プーリング層」は、畳み込みニューラルネットワークにおいて、「畳み込み層」が画像からのエッジ抽出等の特徴抽出の役割を果たしているとすると、「プーリング層」はそうした抽出された特徴が、平行移動などでも影響を受けないようにロバスト性を与える役割を果たします。畳み込みニューラルネットワークは、特に画像のカテゴリ分類(一般物体認識)で優れた性能を発揮するネットワークとして知られていますが、例えば写真に写った動物が犬か猫かをカテゴリ分類したい場合、犬と猫が正しく識別できることが重要であり、犬が左端に映っているか、右端に映っているかはあまり重要ではありません。つまり、そうした画像のカテゴリ分類というタスクにはあまり重要でない位置に関する情報を巧妙に削ぎ落としてやっているのが、この「プーリング層」と呼ばれる層の役割になります。

● 正規化線形ユニット(Rectified Linear Unit)
 この畳み込みニューラルネットワークには、従来のニューラルネットワークではあまり使われることのなかった区分線形な関数、正規化線形ユニット(Rectified Linear Unit)と呼ばれる関数が活性化関数として使われています。従来のニューラルネットワークでは、ステップ関数を鈍したようなロジスティックシグモイド(Logistic Sigmoid)関数などが使われることが多かったのですが、この正規化線形ユニット(Rectified Linear Unit)を使うことで、畳み込みニューラルネットワークの学習速度が6倍程度まで高速化したとの記録もあります。

 ⇒ AI(Artificial Intelligence)

[メニューへ戻る]  [カテゴリー一覧]  [HOMEへ戻る]  [前のページに戻る]