CNN
CNN์ conv layer์ pooling layer๋ฅผ ๋ฒ๊ฐ์ ๋ฐฐ์นํ๋ ๊ตฌ์กฐ๋ก ํ์ฑ๋์ด์๋ค. ์ด๋ฅผ ํตํด์ ์ ๋ ฅ๋๋ ์ด๋ฏธ์ง์ ํน์ง์ ์ถ์ถํ๊ณ , ์ดํ์ FC layer๋ฅผ ํตํด์ ๋ถ๋ฅ์์ ์ ์ํํ๋ค.
ํ์ง๋ง ์ด๋ฐ CNN ์๋ ๋ช๊ฐ์ง ํ๊ณ๊ฐ ์๋ค.
๋น์ ํ์ฑ์ ์ ํ
- Convolution filter๋ฅผ ์ฌ์ฉํ๋ฏ๋ก ์ ๋ ฅ ๋ฐ์ดํฐ์ ๋ํด์ ๋ก์ปฌํ ์ ํ ์ฐ์ฐ์ ์ํํ๊ฒ ๋๋ค. ๋ฐ๋ผ์ ์ด ๋ถ๋ถ์์๋ ๋น์ ํ์ฑ์ด ๋จ์ด์ง๋ค๋ ๋ฌธ์ ๊ฐ ์๋ค. ์ฆ, ์ด๋ก ์ธํด์ ๋ณต์ํ ๋ฐ์ดํฐ์ ๋ํ ํจํด์ ์บก์ณํ๋๊ฒ์ ํ๊ณ๊ฐ ์๋ค.
์์ ์ฐ๊ฒฐ ๋ ์ด์ด ์ค๋ฒํผํ
- FC layer๋ ๋ง์ ํ๋ผ๋ฏธํฐ๊ฐ ํ์ํ layer์ด๋ค. ๋ฐ๋ผ์ ์ด๋ฅผ ํตํด์ ์ค๋ฒํผํ ์ด ๋ฐ์ํ๊ฒ ๋๋ค๋ ํ๊ณ๊ฐ ์๋ค.
๊ณต๊ฐ์ ์ ๋ณด์ ์์ค
- ๋ํ FC layer์์ vectorํํ๋ ์ด๋ฏธ์ง์ ๊ณต๊ฐ์ ์ธ ์ ๋ณด๋ฅผ ๋ฌด์ํ๊ฒ ๋๋ค๋ ํ๊ณ๊ฐ ์๋ค.
Idea
Network in Netwok ๋ ผ๋ฌธ์ 2๊ฐ์ง์ ์ฃผ์ ์์ด๋์ด๋ฅผ ํตํด ์๋ก์ด ๊ตฌ์กฐ์ ๋คํธ์ํฌ๋ฅผ ์๊ฐํ๋ค.
๋ ผ๋ฌธ์์ ๋งํ๋ ์ฃผ์ ์์ด๋์ด๋ ๋ค์๊ณผ ๊ฐ๋ค.
MLPConv layer
Universal Function Approximators
- ์ข ๋ general ํ ๋ฌธ์ ๋ฅผ ์ ์ฉํ ์ ์๊ฒ ํ๊ธฐ ์ํด์ feature์ distribution๊ณผ ๊ด๊ณ์์ด feature extractionํ ์ ์๋Universal Function Approximators์ ์ฌ์ฉํด์ผ ํ๋ค.
- 2๊ฐ์ง์ ์ ์๋ ค์ง universal function approximatior๋ Radial Basis Function Network(RBFN)์ Multilayer Perceptron(MLP)๊ฐ ์๋ค.
- NIN์์๋ ๋ approximator ์ค์์ MLP๋ฅผ ์ ํํ๋ค. ์ ํ์ ์ด์ ๋ MLP๊ฐ CNN๊ตฌ์กฐ์ ํธํ์ด ๋๋ค๋ ์ฅ์ ์ด ์๊ณ (back propagation), MLP๋ก deep model์ ๋ง๋ค ์ ์๊ธฐ ๋๋ฌธ์ด๋ค.
MLPConv Layer
- mlpconv layer๋ ๊ธฐ์กด์ GLM(conv์ filter๋ฅผ ๋งํจ)์ ๋์ฒดํ์ฌ ์ฌ์ฉํ๋ค.
- ๊ธฐ์กด์ GLM์ ๊ฒฝ์ฐ ์ ํ ํํฐ+๋น์ ํ์ ํ์ฑํ ํจ์, mlpconv์ธต์ ๊ฒฝ์ฐ mlp๋ก ์ธํด ๋ ๋ณต์กํ ํน์ง ์ถ์ถ ๊ฐ๋ฅ
Mathmatical Representation

- feature map/chnnel ๊ฐ์ ํ๋ง์์ ์์ ๋ฐฉ์ ์์ Cascaded Cross Channel Parametric Pooling์ ํ๋๊ฒ๊ณผ ๊ฐ๋ค.(์ฆ, 1x1 conv filter๊ณผ ๊ฐ์ ์๋ฆฌ๋ก ๋์ํ๋ค.)


Global Average Pooliong
์ผ๋ฐ์ ์ผ๋ก conv layer๋ฅผ ํตํด feature map์ ์ป๊ณ , ๋ถ๋ฅ๋ฅผ ์ํด์ Full Connected layer์ softmax layer๋ฅผ ์ฌ์ฉํ๊ฒ ๋๋ค.
๊ทธ๋ฐ๋ฐ, FC Layer์ ๊ฒฝ์ฐ ํ๋ผ๋ฏธํฐ์ ์๊ฐ ๋ง๊ธฐ ๋๋ฌธ์ ์ค๋ฒํผํ ์ ์ ๋ฐํ์ฌ generalization์ ๋ฐฉํดํ๋ค.
์ด๋ฅผ ๋ง๊ธฐ ์ํด์ ์ด์ ์ Dropout ์ ๊ทํ ๊ธฐ๋ฒ์ด ๊ณ ์๋์๋ค.(dropout : activation์ dropoutrate๋งํผ ๋ฌด์์๋ก 0์ผ๋ก ์ค์ )
NIN์์๋ feature extractor๋ก ์ฌ์ฉ๋๋ FC layer๋ฅผ ์ถ๊ฐํ์ง ์๊ณ , Global Average Pooling์ ์ฌ์ฉํ๋ค.๋ง์ง๋ง mlpconv์ธต์์ ๊ฐ label๋ง๋ค ํ๊ฐ์ feature map์ ๋ง๋ค๋๋ก ํ๊ณ , ๊ฐ feature map์ avg๊ฐ์ ๊ณ์ฐํ์ฌ ๋ฒกํฐ๋ฅผ ์ป๋๋ค.
Global avg pooling์ ์ฅ์
- conv structure์ ์ ํฉํจ.
- parameter๊ฐ ํ์์์!
- spatial information์ robustํจ
NIN์ ๊ตฌ์กฐ
3๊ฐ์ mlp conv layers์ ๋ง๋จ์ ํ๊ฐ์ global avg pooling layer๋ก ๊ตฌ์ฑ๋๋ค.

'๐ฆAI > Paper' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift (0) | 2024.08.06 |
---|