ざっくりした、畳み込み層と全結合層との違い
畳み込み層:入力画像に対して、フィルタを逐次ずらしながら、かけることで特徴を抽出する。(局所部分を学習する)⇔ 全体を一度に畳み込むことは通常ない
全結合層:広い領域を学習
本編
畳み込み層の特徴:
height, width channelの3D tensorsを扱う。(=特徴マップと呼ばれる)
深い層になるにつれて、複雑な情報を扱う(第一層がエッジを扱うなら、二層目はその組み合わせを扱うようなイメージ)
エッジ:切れ端など
⇔ 全結合層;畳み込み層と対照的に、新しい位置にあれば、新しいパターンとして学ぶ
画像の特徴抽出のポイント
・ 移動不変性をパターンとして学ぶ。(畳み込み層は画像上の特徴をどこでも同様に認識できる)
畳み込みを行ったときの変化
・ 入力と出力後のdepth(channel)の値が異なる Ex. 入力前(28,28,1) → 出力後(26,26,32)
➡ この"32"はフィルタの数を示し、26×26のフィルタを32回かけたことを意味する。
流れ: 26 = (28 - 3) /1+ 1 (3×3フィルタ使用)
入力時のwidth, heightと出力時のwidth,heightは別のモノ!
理由:
・Inputした特徴図がPaddingされているから
・ストライドの使用