๐ง Gradient Descent Learning ์ด๋?
Input์ ๋ฃ์์ ๋ ์ฐ๋ฆฌ๊ฐ ์ํ๋ Output์ ์ป๊ธฐ ์ํด์๋ ๊ทธ์ ๋ง๋ ํจ์๋ฅผ ์ฐพ์์ผ ํ๋ค.
์๋ง์ Output์ด ๋์ค๋๋ก ํ๋ F(x)๋ฅผ ์ฐพ๊ธฐ ์ํด์ ์ฐ๋ฆฌ๋ ์ปดํจํฐ์ ํ์ต(Learning)์ ์์ผ์ค๋ค.
( Perceptrone์์๋ F(x)๋ฅผ ์ฐพ๋๋ค๋ ๊ฒ์ Weight๋ค์ ์ฐพ๋ ๊ฒ์ ์๋ฏธํ๋ค. )
์์ ๊ฐ์ด ์๊ณ ๋ฆฌ์ฆ์ Training Data๋ฅผ ๋ฃ์ ๊ฒฐ๊ณผ์ ์์๋๋ Target Answer๋ฅผ ๋น๊ตํ๋ค.
๋น๊ตํ ๊ฒฐ๊ณผ์ ๋ฐ๋ผ ํ์ต์ ์์ผ์ฃผ๋ฉฐ ๋ชจ๋ ๊ฐ์ด Target Answer์ ๋์ผํ๋๋ก ๋ฐ๋ณตํ๋ฉฐ ํ์ต์ํจ๋ค.
์ด๋ฐ ๊ณผ์ ์์ ํ๋ฆฐ ๊ฐ, ์ฆ Error๋ค์ด ๋์ฌ ์ ์๋๋ฐ
์ด๋ป๊ฒ ํ๋ฉด ์ด Error๋ฅผ ์ต์ํ์ํฌ ์ ์์๊น?
์ผ๋จ Error๋ฅผ ๊ตฌํด๋ณด์.
Error๋ฅผ ๊ตฌํ๊ธฐ ์ํด์๋ ์ ์ฒด ํ ์คํธ ํด์ผํ ์ ๋ต์ ์์์ ๋ง์ ์ ๋ต์ ์๋ฅผ ๋นผ์ฃผ๋ฉด ๋๋ค.
๋ฐฉ์ ์์ ๊ทน์์ ์ ๊ตฌํด์ฃผ๊ธฐ ์ํด์๋ ๋ฏธ๋ถ์ ํ ํ 0์ด ๋๋ ๊ฐ์ ์ฐพ์์ฃผ๋ฉด ๋๋ค.
ํ์ง๋ง ์๋ฌ ๊ฐ์ ์์๊ฐ ๋์ฌ ์ ์๊ณ ์์๋ ๋์ฌ ์ ์๋ค.
์์๊ฐ ๋์ ๊ณ์ฐ์ ๋ฒ๊ฑฐ๋ก์์ ์์ ์ฃผ๊ธฐ ์ํด Error์ ์์ ๋ณ๊ฒฝํด์ค์ผ ํ๋ค.
์ฐ๋ฆฌ๋ ๋ณดํต ์์์์ ์์๋ฅผ ๋ง๋ค์ด์ฃผ๊ธฐ ์ํด ์ ๋๊ฐ์ ๋ถ์ฌ ํด๊ฒฐํ๊ณค ํ์ง๋ง,
๊ทธ๋ฌ๋ ์ ๋๊ฐ์ ๋ณต์กํ ์์ผ ๋ ๋ฏธ๋ถํจ์ ์์ด์ ์ด๋ ค์์ ์ค ์ ์๋ค.
๋ฐ๋ผ์ ์ ๋๊ฐ์ ์์ด์ฃผ๋ ๋์ ์๋์ ๊ฐ์ด ์์ ๋ณ๊ฒฝ์ ํด์ผ ํ๋ค.
์ฐ๋ฆฌ๋ ์์์ weight ๊ฐ์ ๋ฃ์ด์ฃผ๊ณ ํ์ต์ ์์ผ ์๋ฌ์จ์ ์ต์ํ์์ผ์ผ ํ๋ค.
Error๊ฐ ์ต์๋ก ๋์ค๊ฒ ํ๊ธฐ ์ํด weight ๊ฐ๋ค์ ์์ง์ด๋ฉฐ ๊ทน์์ ์ ์ฐพ์์ค์ผ ํ๋๋ฐ,
์ด๋ Gradient descent ( ๊ฒฝ์ฌ ํ๊ฐ๋ฒ )์ ํตํด ๊ทน์์ ์ด ๋์ค๊ธฐ ์ํ weight ๊ฐ๋ค์ ์ ์ถํ ์ ์๋ค.
Gradient descent๋ ๋ง ๊ทธ๋๋ก ๊ฒฝ์ฌ๊ฐ ํ๊ฐํ๋ ๊ณณ์ผ๋ก ๊ฐ์ ๋ณ๊ฒฝํด์ฃผ๋ ๋ฐฉ๋ฒ์ด๋ค.
- ๊ธฐ์ธ๊ธฐ๊ฐ ์์๋ผ๋ฉด weight๊ฐ์ ๋์ฌ์ค์ผ ํ๊ณ , ( Gradient < 0 -> direction of weight : + )
- ๊ธฐ์ธ๊ธฐ๊ฐ ์์๋ผ๋ฉด weight๊ฐ์ ๋ฎํ์ผํ๋ค. ( Gradient > 0 -> direction of weight : - )
์ด๊ฒ์ ์ฌ์ฉํ๋ฉด ๊ฒฝ์ฌ๊ฐ ํ๊ฐํ๊ณ ๊ฒฝ์ฌ๊ฐ ์์นํ๋ ๋ถ๋ถ์ ์ต์๊ฐ์ด ๋์ค๋ ๊ฒ์ ์ ์ ์๋ค.
์ ๊ทธ๋ฆผ๊ณผ ๊ฐ์ด ์์ฝ๊ฒ Error๊ฐ ์ต์๊ฐ์ด ๋์ฌ ์ ์๋๋ก ํ๊ธฐ ์ํ weight๊ฐ๋ค์ ์ ์ถํ ์ ์๋ค.
๐ ์ ๋ฆฌ
ํผ์ ํธ๋ก (Perceptron)์์ Error๋ฅผ ์ต์๊ฐ์ผ๋ก ๋ง๋ค์ด์ฃผ๊ธฐ ์ํด ๊ฐ w๊ฐ๋ค์ ๋ํด ํธ๋ฏธ๋ถ์ ํ๋ฉฐ ๊ฐ์ ๊ตฌํด์ค์ผ ํ๋ค.
( โป ๋ค์ธต ํผ์ ํธ๋ก ์ด๋ผ๋ฉด ํธ๋ฏธ๋ถ์ BackPropagation Algorithm์ ํตํด ์ฝ๊ฒ์ฝ๊ฒ ํด๊ฒฐํ์)
์ฆ, ์๋์ ๊ฐ์ ํผ์ ํธ๋ก ์ผ ๋ ์ต์ Error ๊ฐ์ ๊ตฌํด์ฃผ๊ธฐ ์ํด,
๊ฐ ๊ฐ์ค์น(w1, w2, w3.... wm)๋ง๋ค ํธ๋ฏธ๋ถ์ ์ํํด ๊ฐ ๊ฐ์ค์น์ ์ต์๊ฐ์ ์ฐพ๋ ๋ฐฉ๋ฒ์ ๋ฐ๋ณตํ๋ฉฐ ํ์ต์ํค์!
๊ถ๊ธํ์ ๊ฒ์ด ์์ผ์๋ฉด ์ธ์ ๋ ์ง ๋๊ธ ๋ฌ์์ฃผ์ธ์!
'Artificial Intelligence' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[A.I] Learning ( ํ์ต ) (0) | 2020.10.06 |
---|---|
[A.I] Non-linear Problem์ Linear Problem์ผ๋ก ๋ฐ๊ฟ์ฃผ๊ธฐ (0) | 2020.09.14 |