畳み込み層について・個人メモ

ざっくりした、畳み込み層と全結合層との違い

畳み込み層:入力画像に対して、フィルタを逐次ずらしながら、かけることで特徴を抽出する。(局所部分を学習する)⇔ 全体を一度に畳み込むことは通常ない


全結合層:広い領域を学習

 

 本編

畳み込み層の特徴:
height, width channelの3D tensorsを扱う。(=特徴マップと呼ばれる)


 深い層になるにつれて、複雑な情報を扱う(第一層がエッジを扱うなら、二層目はその組み合わせを扱うようなイメージ)

エッジ:切れ端など

⇔ 全結合層;畳み込み層と対照的に、新しい位置にあれば、新しいパターンとして学ぶ

 

 

画像の特徴抽出のポイント
・ 移動不変性をパターンとして学ぶ。(畳み込み層は画像上の特徴をどこでも同様に認識できる)

 

 


畳み込みを行ったときの変化
・ 入力と出力後のdepth(channel)の値が異なる Ex. 入力前(28,28,1) → 出力後(26,26,32)
 ➡ この"32"はフィルタの数を示し、26×26のフィルタを32回かけたことを意味する。
流れ: 26 = (28 - 3) /1+ 1 (3×3フィルタ使用)

 入力時のwidth, heightと出力時のwidth,heightは別のモノ!
理由:
・Inputした特徴図がPaddingされているから
ストライドの使用