์ƒ๋ฌผํ•™์ ์ธ ๋‰ด๋Ÿฐ

  • ์ธ๊ฐ„์˜ ๋‡Œ๋Š” 1000์–ต ๊ฐœ๊ฐ€ ๋„˜๋Š” ์‹ ๊ฒฝ์„ธํฌ(๋‰ด๋Ÿฐ)๊ฐ€ 100์กฐ ๊ฐœ ์ด์ƒ์˜ ์‹œ๋ƒ…์Šค๋ฅผ ํ†ตํ•ด ๋ณ‘๋ ฌ์ ์œผ๋กœ ์—ฐ๊ฒฐ
  • ๊ฐ๊ฐ์˜ ๋‰ด๋Ÿฐ์€ ์ˆ˜์ƒ๋Œ๊ธฐ(Dendrite)๋ฅผ ํ†ตํ•ด ๋‹ค๋ฅธ ๋‰ด๋Ÿฐ์—์„œ ์ž…๋ ฅ์‹ ํ˜ธ๋ฅผ ๋ฐ›์•„์„œ ์ถ•์ƒ‰๋Œ๊ธฐ(Axon)๋ฅผ ํ†ตํ•ด ๋‹ค๋ฅธ ๋‰ด๋Ÿฐ์œผ๋กœ ์‹ ํ˜ธ๋ฅผ ๋‚ด๋ณด๋‚ธ๋‹ค.
  • ์ถœ๋ ฅ์‹ ํ˜ธ๋Š” ์ž…๋ ฅ๋œ ์‹ ํ˜ธ๊ฐ€ ๋ชจ์—ฌ์„œ ์ผ์ •ํ•œ ์šฉ๋Ÿ‰์„ ๋„˜์–ด์„ค ๋•Œ ์ผ์–ด๋‚œ๋‹ค.

์ธ๊ณต์‹ ๊ฒฝ๋ง ๋‰ด๋Ÿฐ [ํผ์…‰ํŠธ๋ก  (Perceptron)]

  • ์ธ๊ณต์‹ ๊ฒฝ๋ง ๋‰ด๋Ÿฐ ๋ชจ๋ธ์€ ์ƒ๋ฌผํ•™์ ์ธ ๋‰ด๋Ÿฐ์„ ์ˆ˜ํ•™์ ์œผ๋กœ ๋ชจ๋ธ๋ง ํ•˜์˜€๋‹ค. (1๊ฐœ์˜ ๋‰ด๋Ÿฐ =Perceptrone)
  • ํผ์…‰ํŠธ๋ก (perceptron)์€ ์ดˆ๊ธฐ ํ˜•ํƒœ ์ธ๊ณต์‹ ๊ฒฝ๋ง์˜ ํ•œ ์ข…๋ฅ˜๋กœ์„œ, 1957๋…„์— ์ฝ”๋„ฌ ํ•ญ๊ณต ์—ฐ๊ตฌ์†Œ(Cornell Aeronautical Lab)์˜ ํ”„๋ž‘ํฌ ๋กœ์  ๋ธ”๋ผํŠธ (Frank Rosenblatt)์— ์˜ํ•ด ๊ณ ์•ˆ
  • ๊ฐ ๋…ธ๋“œ์˜ ๊ฐ€์ค‘์น˜์™€ ์ž…๋ ฅ์น˜๋ฅผ ๊ณฑํ•œ ๊ฒƒ์„ ๋ชจ๋‘ ํ•ฉํ•œ ๊ฐ’์ด ํ™œ์„ฑํ•จ์ˆ˜์— ์˜ํ•ด ํŒ๋‹จ๋˜๋Š”๋ฐ, ๊ทธ ๊ฐ’์ด ์ž„๊ณ„์น˜(๋ณดํ†ต 0)๋ณด๋‹ค ํฌ๋ฉด ๋‰ด๋Ÿฐ์ด ํ™œ์„ฑํ™”๋˜๊ณ  ๊ฒฐ๊ณผ๊ฐ’์œผ๋กœ 1์„ ์ถœ๋ ฅํ•œ๋‹ค.
  • ๋‰ด๋Ÿฐ์ด ํ™œ์„ฑํ™”๋˜์ง€ ์•Š์œผ๋ฉด ๊ฒฐ๊ณผ๊ฐ’์œผ๋กœ 0์„ ์ถœ๋ ฅ ํ•œ๋‹ค.

์ƒ๋ฌผํ•™์  ์‹ ๊ฒฝ์„ธํฌ ๊ตฌ์„ฑ๊ณผ ์ด๋ฅผ ๋ชจ๋ฐฉํ•œ ์ธ๊ณต์‹ ๊ฒฝ๋ง์˜ ์›๋ฆฌ

png

์ธ๊ณต์‹ ๊ฒฝ๋ง (Artificial Neural Nework, ANN)์˜ ์›๋ฆฌ

  • ์ธ๊ณต์‹ ๊ฒฝ๋ง(ANN)์€ ์ƒ๋ฌผํ•™์˜ ๋‡Œ ๊ตฌ์กฐ(์‹ ๊ฒฝ๋ง)๋ฅผ ๋ชจ๋ฐฉํ•˜์—ฌ ๋ชจ๋ธ๋งํ•œ ์ˆ˜ํ•™์  ๋ชจ๋ธ. ์ฆ‰, ์ธ๊ณต์‹ ๊ฒฝ๋ง์€ ์ด๋Ÿฌํ•œ ์ƒ๋ฌผํ•™์  ์‹ ๊ฒฝ์„ธํฌ์˜ ์ •๋ณด์ฒ˜๋ฆฌ ๋ฐ ์ „๋‹ฌ ๊ณผ์ •์„ ๋ชจ๋ฐฉํ•˜์—ฌ ๊ตฌํ˜„ ํ•œ๊ฒƒ
  • ์—ฌ๋Ÿฌ ๋‰ด๋Ÿฐ์ด ์„œ๋กœ ์—ฐ๊ฒฐ๋˜์–ด ์žˆ๋Š” ๊ตฌ์กฐ์˜ ๋„คํŠธ์›Œํฌ
  • ๊ฐ ๋…ธ๋“œ๋“ค์€ ๊ฐ€์ค‘์น˜๊ฐ€ ์žˆ๋Š” ๋งํฌ๋“ค๋กœ ์—ฐ๊ฒฐ๋˜์–ด ์žˆ๊ณ , ์ „์ฒด ๋ชจ๋ธ์€ ๊ฐ€์ค‘์น˜๋ฅผ ๋ฐ˜๋ณต์ ์œผ๋กœ ์กฐ์ •ํ•˜๋ฉด์„œ ํ•™์Šต
  • ์ž…๋ ฅ์ธต , ์€๋‹‰์ธต ,์ถœ๋ ฅ์ธต์œผ๋กœ ์ด๋ฃจ์–ด ์ง„๋‹ค.

png

INPUT LAYER (์ž…๋ ฅ์ธต) - ์™ธ๋ถ€ ๋ฐ์ดํ„ฐ๋ฅผ ์ž…๋ ฅํ•˜๋Š” ์ž…๊ตฌ๋…ธ๋“œ
HIDDEN LAYER (์€๋‹‰์ธต) - ๋…ธ๋“œ ์‚ฌ์ด๋ฅผ ์—ฐ๊ฒฐํ•˜๊ณ  ๊ฒฐ๊ณผ๋ฅผ ๋…ธ๋“œ๋กœ ์ „๋‹ฌ
OUTPUT LAYER (์ถœ๋ ฅ์ธต) - ์ตœ์ข… ๊ฒฐ๊ณผ๋ฅผ ๋‚ด๋ณด๋‚ด๋Š” ์ถœ๊ตฌ ๋…ธ๋“œ

** ํ™œ์„ฑํ™” ํ•จ์ˆ˜(Activation Function) : ์ž…๋ ฅ๋œ ๋ฐ์ดํ„ฐ์˜ ๊ฐ€์ค‘ ํ•ฉ์„ ์ถœ๋ ฅ์‹ ํ˜ธ๋กœ ๋ณ€ํ™˜ํ•˜๋Š” ํ•จ์ˆ˜ ex ์‹œ๊ทธ๋ชจ์ด๋“œ ํ•จ์ˆ˜(sigmoid), ReLU(Rectified Linear Unit),Softmax

  • ์ธ๊ณต์‹ ๊ฒฝ๋ง์˜ ํ•œ๊ณ„
    • 1969๋…„ ๋งˆ๋นˆ ๋ฏผ์Šคํ‚ค๋Š” ํผ์…‰ํŠธ๋ก ์˜ ํ•œ๊ณ„๋ฅผ ์ˆ˜ํ•™์ ์œผ๋กœ ์ฆ๋ช…
    • ํผ์…‰ํŠธ๋ก ์€ ๋‹จ์ˆœํ•œ ์„ ํ˜• ๋ถ„๋ฅ˜๊ธฐ์— ๋ถˆ๊ณผํ•˜์—ฌ OR ์™€ AND ์™€ ๊ฐ™์€ ๋ถ„๋ฅ˜๋Š” ํ• ์ˆ˜ ์žˆ์œผ๋‚˜, XOR ๋ถ„๋ฅ˜(๋น„์„ ํ˜• ๋ถ„๋ฅ˜)๋ฅผ ์ˆ˜ํ–‰ํ•  ์ˆ˜ ์—†๋‹ค.

png

png

  • ํ•˜๋‚˜์˜ ์ธต์„ ์ถ”๊ฐ€ํ•˜์—ฌ NAND , OR ๊ฒŒ์ดํŠธ๋กœ ๋ณด๋‚ธ ๋‹ค์Œ ๊ทธ ๊ฒฐ๊ณผ๊ฐ’์„ AND ๊ฒŒ์ดํŠธ๋กœ ๋ณด๋‚ด๋ฉด XOR ๊ฒŒ์ดํŠธ๋ฅผ ๊ตฌํ˜„ ๊ฐ€๋Šฅ

==> ์‹ฌ์ธต์‹ ๊ฒฝ๋ง๊ณผ ์—ญ์ „ํŒŒ ๋„์ž…์œผ๋กœ ํ•ด๊ฒฐ


ํ•ฉ์„ฑ๊ณฑ ์‹ ๊ฒฝ๋ง์˜ ๊ตฌ์„ฑ์š”์†Œ(Component of convolutional neural network)

  • ์‹œ๊ฐ์  ์ด๋ฏธ์ง€๋ถ„์„์— ๊ฐ€์žฅ ์ผ๋ฐ˜์ ์œผ๋กœ ์‚ฌ์šฉ๋˜๋Š” ์ธ๊ณต์‹ ๊ฒฝ๋ง์˜ ํ•œ์ข…๋ฅ˜๋กœ, ์ž…๋ ฅ ์ด๋ฏธ์ง€๋กœ๋ถ€ํ„ฐ ํŠน์ง•์„ ์ถ”์ถœํ•˜์—ฌ ์ž…๋ ฅ์ด๋ฏธ์ง€๊ฐ€ ์–ด๋–ค ์ด๋ฏธ์ง€์ธ์ง€ ํด๋ž˜์Šค๋ฅผ ๋ถ„๋ฅ˜ํ•จ
  • ์™„์ „์—ฐ๊ฒฐ(fully-connected)๊ณ„์ธต๊ณผ๋Š” ๋‹ฌ๋ฆฌ ํ•ฉ์„ฑ๊ณฑ ์‹ ๊ฒฝ๋ง์€ ํฌ๊ฒŒ ํ•ฉ์„ฑ๊ณฑ์ธต๊ณผ(Convolution layer)์™€ ํ’€๋ง์ธต(Pooling layer)์œผ๋กœ ๊ตฌ์„ฑ

png

ํ•ฉ์„ฑ๊ณฑ ๊ณ„์ธต (CONV)

  • ์•„๋ž˜์˜ ๊ทธ๋ฆผ์ฒ˜๋Ÿผ ํฌํ† ์ƒต ๋“ฑ์—์„œ ๋‹ค์–‘ํ•œ ํ•„ํ„ฐ๋ฅผ ์ ์šฉํ•ด์„œ ์ด๋ฏธ์ง€๋ฅผ ๋ณ€ํ˜•ํ•˜๋Š” ๊ฒƒ์ฒ˜๋Ÿผ, CNN์—์„œ๋„ ์ด๋ฏธ์ง€ ์ธ์‹์„ ๋ณด๋‹ค ์ž˜ ํ•  ์ˆ˜ ์žˆ๋„๋ก ํ•„ํ„ฐ๋ฅผ ์‚ฌ์šฉ
  • ํ•„ํ„ฐ(filter)๋Š” ์ด๋ฏธ์ง€์˜ ๋ถ€๋ถ„ ๋ถ€๋ถ„์„ ์ด๋™ํ•˜๋Š”๋ฐ, ํ•œ๋ฒˆ ์›€์ง์ผ ๋•Œ ์ด๋™ํ•  ๊ฑฐ๋ฆฌ๋ฅผ ์ŠคํŠธ๋ผ์ด๋“œ(stride)๋ผ๊ณ  ํ•œ๋‹ค.
  • ์ถœ๋ ฅ ๊ฒฐ๊ณผ๋Š” ํ”ผ์ณ๋งต(feature map) ๋˜๋Š” ํ™œ์„ฑํ™”๋งต(activation map)์ด๋ผ๊ณ  ํ•œ๋‹ค. png

  • ํ•ฉ์„ฑ๊ณฑ์„ ์ง„ํ–‰ํ• ์ˆ˜๋ก ์ด๋ฏธ์ง€ ํฌ๊ธฐ๊ฐ€ ์ค„์–ด๋“ ๋‹ค. -> ์ด๋Ÿฌํ•œ ํ˜„์ƒ์„ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด Padding ๊ธฐ๋ฒ• ์‚ฌ์šฉ

Padding ์ฒ˜๋ฆฌ

  • ์ž…๋ ฅ๋ฐ์ดํ„ฐ์™€ ์ถœ๋ ฅ๋ฐ์ดํ„ฐ์˜ ํฌ๊ธฐ๋ฅผ ๋งž์ถ”๊ธฐ ์œ„ํ•ด ์‚ฌ์šฉ

ex) 4x4 ์ด๋ฏธ์ง€๊ฐ€ ํ•ฉ์„ฑ๊ณฑ์„ ์ˆ˜ํ–‰ํ•˜์—ฌ 2x2 ์ถœ๋ ฅ์ด๋ฏธ์ง€์˜ ํฌ๊ธฐ๋ฅผ ๊ฐ–๋Š”๋‹ค.

  • ์ด๋ฏธ์ง€์˜ ๊ฐ€์žฅ์ž๋ฆฌ์— 0์˜ ๊ฐ’์„ ๊ฐ–๋Š” ํ”ฝ์…€์„ ์ถ”๊ฐ€ํ•˜๋Š” ๊ฒƒ์„ zero-padding ์ด๋ผ๊ณ  ํ•œ๋‹ค.

png

ํ’€๋ง(Pooling)

  • ์„ธ๋กœ, ๊ฐ€๋กœ ๋ฐฉํ–ฅ์˜ ๊ณต๊ฐ„์„ ์ค„์ด๋Š” ์—ฐ์‚ฐ์œผ๋กœ, sub-sampling ์ด๋ผ๊ณ ๋„ ๋ถˆ๋ฆผ
  • ํ’€๋ง์˜ ์ข…๋ฅ˜๋Š” ์ตœ๋Œ€ํ’€๋ง, ํ‰๊ท ํ’€๋ง, ์ตœ์†Œํ’€๋ง์ด ์žˆ๋‹ค. png

์™„์ „์—ฐ๊ฒฐ์ธต(Fully-connected layer)์˜ ์—ญํ• 

  • ์ถ”์ถœ๋œ ํŠน์ง•๊ฐ’์„ ๊ธฐ์กด neural network์— ๋„ฃ์–ด์„œ ์ด๋ฏธ์ง€๋ฅผ ๋ถ„๋ฅ˜ํ•จ
  • 2๊ฐ€์ง€ ์ข…๋ฅ˜์˜ Layer๊ฐ€ ์กด์žฌ
    • Flatten Layer : ๋ฐ์ดํ„ฐ ํƒ€์ž…์„ fully-connected ๋„คํŠธ์›Œํฌ ํ˜•ํƒœ๋กœ ๋ณ€๊ฒฝ. ์ž…๋ ฅ๋ฐ์ดํ„ฐ์˜ shape ๋ณ€๊ฒฝ๋งŒ ์ˆ˜ํ–‰
    • Softmax Layer : Classification ์ˆ˜ํ–‰

Source

ANN

  • https://dbrang.tistory.com/1537
  • https://bioinformaticsandme.tistory.com/231
  • https://edumon.tistory.com/160
  • https://brunch.co.kr/@gdhan/6
  • https://m.blog.naver.com/PostView.naver?isHttpsRedirect=true&blogId=stelch&logNo=221611099784
  • https://trendy00develope.tistory.com/35 CNN
  • https://stanford.edu/~shervine/l/ko/teaching/cs-230/cheatsheet-convolutional-neural-networks