๋จ์ธต ์ ๊ฒฝ๋ง Single-Layer Perceptron
- input layer์ outoput layer ๋ก๋ง ๊ตฌ์ฑ
- ์ ํ์ผ๋ก ์ด๋ฃจ์ด์ง
๋จ์ธต ์ ๊ฒฝ๋ง์ ํ๊ณ
- ์ ํ ๋ถ๋ฆฌ ๋ถ๊ฐ๋ฅ(linearly inseparable) ๋ฌธ์
- ์ง์ ์ผ๋ก ์์ญ์ ๋ถ๋ฆฌํ ์ ์๋ ๊ฒฝ์ฐ๊ฐ ์์
- ์ด๋ฌํ ๊ฒฝ์ฐ ์๋ ๊ทธ๋ฆผ๊ณผ ๊ฐ์ด ๋ณต์กํ ๊ณก์ ์ผ๋ก๋ง ์์ญ ๋ถ๋ฆฌ ๊ฐ๋ฅํจ
- ์ ํ๋ถ๋ฅ๊ธฐ์์ ๋น์ ํ ๋ถ๋ฅ๊ธฐ๋ก ๋น๊ฟ์ผํ๋ ํ์์ฑ ์์
- ์ด๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด ๋์จ ๊ฐ๋ ์ด hidden layer
์ฌ์ธต์ ๊ฒฝ๋ง ํน์ง
- hidden layer๊ฐ 2๊ฐ ์ด์ ๋ถํฐ๋ ์ฌ์ธต์ ๊ฒฝ๋ง
- ๋น์ ํ์ ํ์ฑํจ์
- hidden layer๋ ๋ฌด์์ ์๊ธฐ๋ง ํ๋ค๊ณ ํด์ ํผ์ ํธ๋ก ์ ์ ํ๋ถ๋ฅ๊ธฐ์์ ๋น์ ํ๋ถ๋ฅ๊ธฐ๋ก ๋ฐ๊ฟ ์ ์๋ ๊ฒ์ ์๋
- 2๊ฐ์ Layer๋ฅผ ์์๋ดค์ง๋ง X์ ๊ณฑํด์ง๋ ํญ๋ค์ W๋ก ์นํ๊ฐ๋ฅํ๊ณ , ์ ๋ ฅ๊ณผ ๋ฌด๊ดํ ์์๋ค์ ์ ์ฒด๋ฅผ B๋ก ์นํ ๊ฐ๋ฅํ๊ธฐ ๋๋ฌธ์ WX+B๋ผ๋ Single layer perceptron๊ณผ ๋์ผํ ๊ฒฐ๊ณผ
- Deep ํ๊ฒ ์๋ ์๋ฏธ๊ฐ ์์ด์ง
ํ์ฑํ ํจ์activation function
ํ์ฑํ ํจ์์ ์ข ๋ฅ
ํ๊ณ
- non-linear ๋ฌธ์ ๋ค์ ํด๊ฒฐํ ์ ์์์ง๋ง layer๊ฐ ๊น์ด์ง์๋ก ํ๋ผ๋ฏธํฐ์ ๊ฐ์๊ฐ ๊ธ๋ฑํ๊ฒ ๋๊ณ ์ด ํ๋ผ๋ฏธํฐ๋ค์ ์ ์ ํ๊ฒ ํ์ต์ํค๋ ๊ฒ์ด ๋งค์ฐ ์ด๋ ค์
- ์ด๋ ์ญ์ ํ ์๊ณ ๋ฆฌ์ฆ์ด ๋ฑ์ฅํ๊ฒ ๋๋ฉด์ ํด๊ฒฐ๋์๊ณ ๊ฒฐ๋ก ์ ์ผ๋ก ์ฌ๋ฌ layer๋ฅผ ์์ ์ ๊ฒฝ๋ง ๋ชจ๋ธ ํ์ต์ด ๊ฐ๋ฅ
์ญ์ ํ Backpropagation
- ์ญ์ ํ ์๊ณ ๋ฆฌ์ฆ์ ์ถ๋ ฅ๊ฐ์ ๋ํ ์ ๋ ฅ๊ฐ์ ๊ธฐ์ธ๊ธฐ(๋ฏธ๋ถ๊ฐ)์ ์ถ๋ ฅ์ธต layer์์๋ถํฐ ๊ณ์ฐํ์ฌ ๊ฑฐ๊พธ๋ก ์ ํ์ํค๋ ๊ฒ
- ์ถ๋ ฅ์ธต ๋ฐ๋ก ์ layer์์๋ถํฐ ๊ธฐ์ธ๊ธฐ(๋ฏธ๋ถ๊ฐ)์ ๊ณ์ฐํ๊ณ ์ด๋ฅผ ์ ์ ๊ฑฐ๊พธ๋ก ์ ํ์ํค๋ฉด์ ์ layer๋ค์์์ ๊ธฐ์ธ๊ธฐ์ ์๋ก ๊ณฑํ๋ ํ์์ผ๋ก ๋์๊ฐ๋ฉด ์ต์ข ์ ์ผ๋ก ์ถ๋ ฅ์ธต์ output์ ๋ํ ์ ๋ ฅ์ธต์์์ input์ ๊ธฐ์ธ๊ธฐ(๋ฏธ๋ถ๊ฐ)์ ๊ตฌํ ์๊ฐ ์์
๋ฐฐ์น Batch
- Iteration 1ํ๋น ์ฌ์ฉ๋๋ training data set ์ ๋ฌถ์
๋ฏธ๋๋ฐฐ์นsub>Mini-Batch
- training data set ์ชผ๊ฐ์ด ๋์ ๋ฌถ์
Batch gradient descent(BGD)
- ์ ์ฒด ๋ฐ์ดํฐ ์ ์ ๋ํ ์๋ฌ๋ฅผ ๊ตฌํ ๋ค ๊ธฐ์ธ๊ธฐ๋ฅผ ํ๋ฒ๋ง ๊ณ์ฐํ์ฌ ๋ชจ๋ธ์ parameter ๋ฅผ ์ ๋ฐ์ดํธ ํ๋ ๋ฐฉ๋ฒ
ํ๋ฅ ์ ๊ฒฝ์ฌ ํ๊ฐ๋ฒ Stochastic gradient descent(SGD)
- ์ถ์ถ๋ ๋ฐ์ดํฐ ํ ๊ฐ์ ๋ํด์ error gradient ๋ฅผ ๊ณ์ฐํ๊ณ , Gradient descent ์๊ณ ๋ฆฌ์ฆ์ ์ ์ฉํ๋ ๋ฐฉ๋ฒ
- ์ ์ฒด ๋ฐ์ดํฐ๋ฅผ ์ฌ์ฉํ๋ ๊ฒ์ด ์๋๋ผ, ๋๋คํ๊ฒ ์ถ์ถํ ์ผ๋ถ ๋ฐ์ดํฐ๋ฅผ ์ฌ์ฉ
- ๋ฐ๋ผ์ ํ์ต ์ค๊ฐ ๊ณผ์ ์์ ๊ฒฐ๊ณผ์ ์งํญ์ด ํฌ๊ณ ๋ถ์์ ํ๋ฉฐ, ์๋๊ฐ ๋งค์ฐ ๋น ๋ฅด๋ค.