[Machine Learning] Hyperparameter Tuning
โ Hyperparameter Tuning
- ๋ชฉ์ : ํ๋ จ ํ๊ฐ / ๊ฒ์ฆ ํ๊ฐ ์ฌ์ด์ ์ฐจ์ด๊ฐ ์ต์๊ฐ ๋๋๋ก ๋ง๋๋ ๊ฒ (Overfitting ๋ฐฉ์ง)
๐ Hyperparameter ์ ์๊ฐ ๋๋ฌด ๋ง๊ธฐ ๋๋ฌธ์, ์ต์ ์ parameter ๋ฅผ ์ฐพ์์ฃผ๋ ๋๊ตฌ๋ค์ ์จ์ ์ฐพ์๋ธ๋ค
โ 1) Grid Search
: ๋์ฒด ๋ชจ๋ธ ๊ตฌ์ฑ(alternative model configrations) ์ ํ์ํ๋ ์ผ๋ฐ์ ์ธ ์ ๊ทผ ๋ฐฉ์์ ๊ทธ๋ฆฌ๋ ๊ฒ์ ๋ฐฉ๋ฒ์ ์ฌ์ฉ
๐ ๋ชจ๋ธ ํ์ดํผ ํ๋ผ๋ฏธํฐ์ ๋ฃ์ ์ ์๋ ๊ฐ๋ค์ ์์ฐจ์ ์ผ๋ก ์ ๋ ฅํ ๋ค์,
๊ฐ์ฅ ๋์ ์ฑ๋ฅ์ ๋ณด์ด๋ ํ์ดํผ ํ๋ผ๋ฏธํฐ ๊ฐ์ ์ฐพ๋ ํ์ ๋ฐฉ๋ฒ
๐ ๊ด์ฌ์๋ ๋งค๊ฐ๋ณ์๋ค์ ๋์์ผ๋ก ๊ฐ๋ฅํ ๋ชจ๋ ์กฐํฉ์ ์๋ํ์ฌ ์ต์ ์ ๋งค๊ฐ๋ณ์๋ฅผ ์ฐพ๋ ๋ฐฉ๋ฒ์ผ๋ก
๋งค๊ฐ๋ณ์๋ฅผ ํ๋ํ์ฌ ์ผ๋ฐํ ์ฑ๋ฅ์ ๊ฐ์
โ 2) Random Search
: ํ์ดํผ ํ๋ผ๋ฏธํฐ ๊ฐ์ ๋๋คํ๊ฒ ๋ฃ์ด๋ณด๊ณ ๊ทธ ์ค ์ฐ์ํ ๊ฐ์ ๋ณด์ด๋ ํ์ดํผ ํ๋ผ๋ฏธํฐ๋ฅผ ํ์ฉํด ๋ชจ๋ธ์ ์์ฑ
๐ ๊ทธ๋ฆฌ๋ ๊ฒ์ ๋ฐฉ๋ฒ์ ๋ชจ๋ ๊ฐ์ ํ์ํด์ผํ๋ฉฐ, ์ด๋ค ๊ฐ์ด ํจ๊ณผ์ ์ธ์ง ์ ์ ์์
But, ๋๋ค ๊ฒ์ ๋ฐฉ๋ฒ์ ๋๋คํ๊ฒ ์ซ์๋ฅผ ๋ฃ์ ๋ค ์ ํด์ง ๊ฐ๊ฒฉ(grid) ์ฌ์ด์ ์์นํ ๊ฐ๋ค์ ๋ํด์๋
ํ๋ฅ ์ ์ผ๋ก ํ์์ด ๊ฐ๋ฅํ์ฌ ์ต์ ์ hyper parameter ๊ฐ์ ๋ ๋นจ๋ฆฌ ์ฐพ์ ์ ์์
โ 3) Latin HyperCube
: ๋ฐ์ดํฐ๊ฐ ๊ณ ๋ฅด๊ฒ ๋ถํฌ๋์ด ์๋ ํน์ง์ด ์์
๐ 1. ๊ฐ ์ ์๋ ๋ถํฌ์์ ๋ฌด์์๋ก ๊ฐ์ ์ ํํ๊ณ ๊ท ์ผํ๊ฒ ๋ถ์ฐ
2. ๊ฐ ๊ฐ์ ์ ํ๋ฅ ๋ถํฌ๋ฅผ ๊ฐ๊ฐ ๊ฐ์ ํ๋ฅ ์ ๊ฒน์น์ง ์์ ์ธ๊ทธ๋จผํธ๋ก ๋๋
3. ์๋ฎฌ๋ ์ด์ ์ด ์คํ๋๋ ๋์ ์ธ๊ทธ๋จผํธ์ ํ๋ฅ ๋ถํฌ์ ๋ฐ๋ผ ๊ฐ ์ธ๊ทธ๋จผํธ์ ๋ฌด์์ ๊ฐ์ ๊ฐ์ ์ ํ
โท ๊ฐ ์ธ๊ทธ๋จผํธ๋ฅผ ์ ํํ ํ ๋ฒ ์ํ๋งํ ํ์๋ ์๋ฎฌ๋ ์ด์ ์ด ์ค์ง๋ ๋๊น์ง ํ๋ก์ธ์ค๊ฐ ๋ฐ๋ณต
์ ์ฒด ๋ฒ์์ ๋ถํฌ๊ฐ ๋ณด๋ค ๊ท ์ผํ๊ณ ์ผ๊ด๋๊ฒ ์ํ๋ง ๋จ
์๋ฎฌ๋ ์ด์ ํต๊ณ๋ฅผ ๊ณ์ฐํ๋ ๊ฒฝ์ฐ๋ณด๋ค ์ ํํ ๊ฒฐ๊ณผ๊ฐ์ ๋์ถ
โ 4) Optimization
: ๋จธ์ ๋ฌ๋๊ณผ scoring ์๊ณ ๋ฆฌ์ฆ์ ๋ณต์กํ ๋ธ๋๋ฐ์ค์ด๊ธฐ ๋๋ฌธ์ ์ด๋ ค์ด ์ต์ ํ ๋ฌธ์ ๋ฅผ ๋ง๋ค์ด๋
๐ข ๋จธ์ ๋ฌ๋ ์๊ณ ๋ฆฌ์ฆ์ ์ผ๋ฐ์ ์ผ๋ก ์ฐ์ํ / ๋ฒ์ฃผํ / ์ ์ํ ๋ณ์๋ฅผ ๋ชจ๋ ํฌํจ
์ด๋ฌํ ๋ณ์๋ค์ ๋ชฉํ์์ ๋งค์ฐ ๋ถ์ฐ์์ ์ธ ๋ณ๊ฒฝ(=discrete change)์ ์ด๋
๐ข Noisy or nondeterministic (= ๊ฒฐ์ ์ ์ด์ง ๋ชปํ) : ๋งค๊ฐ ๋ณ์ ๊ณต๊ฐ์ด ๋ถ์ฐ์์ ์ด๊ณ ์ปดํจํ ๋ ธ๋๊ฐ ์คํจํ์ฌ ๊ฒ์ ์ ๋ต์
๋ฌด์ฐ์ํฌ ์ ์๊ธฐ ๋๋ฌธ์ ๊ฐ๊ด์ ์ธ ํ๊ฐ๊ฐ ์คํจ
๐ข Flat regions : ๊ณต๊ฐ์๋ ๋ง์ ๊ตฌ์ฑ์ด ๋งค์ฐ ์ ์ฌํ ๋ชจ๋ธ์ ์์ฑํ๋ ๋ง์ ํํํ ์์ญ์ด ํฌํจ
๐ข ์๋ก ๋ค๋ฅธ ํ์ดํผ ๋งค๊ฐ ๋ณ์ ๊ฐ์ ์ฌ์ฉํ์ฌ ์์ธก ๋ชจ๋ธ์ train / validataion ํ๋ ์์ธก ๋ถ๊ฐ๋ฅํ ๊ณ์ฐ ๋น์ฉ
๐ก ๋ฐ๋ผ์, Hyper Parameter ๊ฐ ์ค์ ์ ๋ํ ์ ์ฐํ๊ณ ํจ๊ณผ์ ์ธ ์ ๋ต์ด ํ์!!