ディープラーニング(深層学習)ライブラリ
入力画像xがNNに渡された際に、そのまま識別結果yを出力
ディープラーニングの主な手法
CNN (Convolutional Neural Network)=畳み込みニューラルネットワーク、ConvNet、主力のディープニューラルネットワーク
画像認識におけるディープラーニングで一般的に使用される
畳み込み層とプーリング層と全結合層から構成されるニューラルネットワーク
左から右へと入力層から出力層へ一方向のみ伝播する
入力xが一旦、zへ変換される→NNに渡され最終的にyが出力(通常のニューラルネットワーク(フィードフォワード)に渡される。)
zは画像から抽出された重要な特徴
畳み込み演算は、入力データに対してカーネル(フィルターとも)を適応
入力データにフィルターをかけることで、特徴マップを作成
1. カーネル
畳み込みに使用するカーネル(フィルター)に関して設定しなければならないパラメーターが4つ
1.使用するフィルタの数(K)
2.フィルタの大きさ(F)
3.フィルタの移動幅(S)
4.画像の端の領域をどれくらい埋めるのか。(パディングの設定)(P)
2. ストライド
カーネルをずらす際の間隔
ストライドを大きくすると、出力サイズは小さくなる
3. パディング
入力の幅を広げるためのパディング
パディングを大きくすると、出力サイズは大きくなる
畳み込み演算を何度も繰り返すと、いつかは出力サイズが1に
CNNの層がカーネルと入力のサイズに依存
入力にゼロパディングすることでカーネル幅と出力のサイズを独立に制御できる
プーリング層=畳み込み層で得た特徴マップを縮小する層
基本的に活性関数にはReLU関数を利用
RNN (Recurrent Neural Network)=再帰型ニューラルネットワーク
アルゴリズム:可変長のデータを扱うため隠れ層に再帰的な構造をもたせたニューラルネットワークを利用
自然言語処理の分野
例)株価予測やチャットボット、音声認識