๋ฒ ์คํธ
10๊ฐ์ง ์ต๊ณ ์ ๊ธฐ๊ณ ํ์ต ์๊ณ ๋ฆฌ์ฆ
์ฐ๋ฆฌ๋ GPU ๊ฐ์ ๋จธ์ ๋ฌ๋ ๋ถ์ผ์์ ์์ฒญ๋ ํ์ ์ ๊ฒช๊ณ ์์ง๋ง, ์ต์ ์ฐ๊ตฌ ๋ ผ๋ฌธ์์๋ ์ข ์ข (๊ทธ๋ฆฌ๊ณ ๋๋๋ฌ์ง๊ฒ) ์์ญ ๋ ์ , ์ด๋ค ๊ฒฝ์ฐ์๋ 70๋ ์ด๋ ๋ ์๊ณ ๋ฆฌ์ฆ์ ๋ค๋ฃจ๊ณ ์์ต๋๋ค.
์ผ๋ถ ์ฌ๋๋ค์ ์ด๋ฌํ ์ค๋๋ ๋ฐฉ๋ฒ ์ค ๋ค์๊ฐ ๊ธฐ๊ณ ํ์ต๋ณด๋ค๋ 'ํต๊ณ ๋ถ์' ๋ฒ์ฃผ์ ์ํ๋ค๊ณ ์ฃผ์ฅํ ์ ์์ผ๋ฉฐ, ์ด ๋ถ์ผ์ ์ถํ์ 1957๋ ๊น์ง๋ง ๊ฑฐ์ฌ๋ฌ ์ฌ๋ผ๊ฐ๋ ๊ฒ์ ์ ํธํฉ๋๋ค. ํผ์ ํธ๋ก ์ ๋ฐ๋ช .
์ด๋ฌํ ๊ธฐ์กด ์๊ณ ๋ฆฌ์ฆ์ด ๋จธ์ ๋ฌ๋์ ์ต์ ํธ๋ ๋์ ์ฃผ์ ๊ธฐ์ ๋ฐ์ ์ ์ผ๋ง๋ ์ง์ํ๊ณ ์ฝํ ์๋์ง๋ฅผ ๊ณ ๋ คํ๋ฉด, ์ด๋ ๋ ผ์์ ์ฌ์ง๊ฐ ์๋ ์ฃผ์ฅ์ ๋๋ค. ๋ฐ๋ผ์ ์ต์ ํ์ ์ ๋ท๋ฐ์นจํ๋ '๊ณ ์ ์ ์ธ' ๊ตฌ์ฑ ์์์ AI ๋ช ์์ ์ ๋น์ ์กฐ๊ธฐ ์ ์ฑํ๋ ค๋ ์๋ก์ด ์๊ณ ๋ฆฌ์ฆ๋ค์ ์ดํด๋ณด๊ฒ ์ต๋๋ค.
1: ํธ๋์คํฌ๋จธ
2017๋ Google Research๋ ์ฐ๊ตฌ ํ๋ ฅ์ ์ฃผ๋ํ์ฌ ์ข ์ด ์ฃผ์ ๋ง ์์ผ๋ฉด๋ฉ๋๋ค. ์ด ์์ ์ ๋ค์์ ์ด์งํ๋ ์๋ก์ด ์ํคํ ์ฒ๋ฅผ ์ค๋ช ํ์ต๋๋ค. ์ฃผ์ ๋ฉ์ปค๋์ฆ ์ธ์ฝ๋/๋์ฝ๋์ ์ํ ๋คํธ์ํฌ ๋ชจ๋ธ์ 'ํ์ดํ'์์๋ถํฐ ๊ทธ ์์ฒด๋ก ์ค์ ๋ณํ ๊ธฐ์ ์ ์ด๋ฅด๊ธฐ๊น์ง.
์ ๊ทผ ๋ฐฉ์์ ๋๋น๋์์ต๋๋ค ๋ณ์ ๋ก๋ด, ์ดํ ์์ฐ์ด ์ฒ๋ฆฌ(NLP)์ ํ์ ์ ์ธ ๋ฐฉ๋ฒ๋ก ์ด ๋์์ผ๋ฉฐ, ํนํ ์๋ ํ๊ท ์ธ์ด ๋ชจ๋ธ๊ณผ AI ํฌ์คํฐ ํ์ GPT-3์ ์ง์ํฉ๋๋ค.

๋ณ์๊ธฐ๋ ๋ฌธ์ ๋ฅผ ์ฐ์ํ๊ฒ ํด๊ฒฐํ์ต๋๋ค. ์ํ์ค ๋ณํ'๋ณํ'์ด๋ผ๊ณ ๋ ๋ถ๋ฆฌ๋ ์ด ๊ธฐ๋ฅ์ ์ ๋ ฅ ์ํ์ค๋ฅผ ์ถ๋ ฅ ์ํ์ค๋ก ์ฒ๋ฆฌํ๋ ๋ฐ ์ฌ์ฉ๋ฉ๋๋ค. ๋ณํ๊ธฐ๋ ์์ฐจ์ ์ธ ๋ฐฐ์น๊ฐ ์๋ ์ฐ์์ ์ธ ๋ฐฉ์์ผ๋ก ๋ฐ์ดํฐ๋ฅผ ์์ ํ๊ณ ๊ด๋ฆฌํ์ฌ RNN ์ํคํ ์ฒ๊ฐ ์ ๊ณตํ์ง ๋ชปํ๋ '๋ฉ๋ชจ๋ฆฌ ์ง์์ฑ'์ ์ ๊ณตํฉ๋๋ค. ๋ณํ๊ธฐ์ ๋ํ ์์ธํ ๋ด์ฉ์ ๋ค์์ ์ฐธ์กฐํ์ธ์. ์ฐ๋ฆฌ์ ์ฐธ์กฐ ๊ธฐ์ฌ.
CUDA ์๋์ ML ์ฐ๊ตฌ๋ฅผ ์ง๋ฐฐํ๊ธฐ ์์ํ ์ํ ์ ๊ฒฝ๋ง(RNN)๊ณผ ๋ฌ๋ฆฌ Transformer ์ํคํ ์ฒ๋ ์ฝ๊ฒ ๋ณ๋ ฌํ, RNN๋ณด๋ค ํจ์ฌ ๋ ํฐ ๋ฐ์ดํฐ ๋ชจ์์ ์์ฐ์ ์ผ๋ก ์ฒ๋ฆฌํ ์ ์๋ ๊ธธ์ ์ด์ด์ค๋๋ค.
์ธ๊ธฐ์๋ ์ฌ์ฉ๋ฒ
ํธ๋์คํฌ๋จธ๋ 2020๋ ๋น์ ๊ธฐ๋ก์ ๊ฒฝ์ ํ OpenAI์ GPT-3 ์ถ์๋ก ๋์ค์ ์์๋ ฅ์ ์ฌ๋ก์ก์์ต๋๋ค. 175 ์ต ๋งค๊ฐ ๋ณ์. ์ด ๋๋ผ์ด ์ฑ๊ณผ๋ ๊ฒฐ๊ตญ 2021๋ ๊ณผ ๊ฐ์ ์ดํ ํ๋ก์ ํธ์ ์ํด ๊ฐ๋ ค์ก์ต๋๋ค. ๊ณต๊ฐ Microsoft์ Megatron-Turing NLG 530B๋ (์ด๋ฆ์์ ์ ์ ์๋ฏ์ด) 530์ต ๊ฐ ์ด์์ ๋งค๊ฐ๋ณ์๋ฅผ ๊ฐ์ถ๊ณ ์์ต๋๋ค.

ํ์ดํผ์ค์ผ์ผ Transformer NLP ํ๋ก์ ํธ์ ํ์๋ผ์ธ. ์ถ์ฒ: Microsoft
Transformer ์ํคํ ์ฒ๋ ๋ํ NLP์์ ์ปดํจํฐ ๋น์ ์ผ๋ก ๋์ด๊ฐ์ต๋๋ค. ์๋ก์ด ์ธ๋ OpenAI์ ๊ฐ์ ์ด๋ฏธ์ง ํฉ์ฑ ํ๋ ์์ํฌ ์ฅ๋ค ๋ฐ DALL-E, ์ ์ ๋ ๋ง์ ๊ด๋ จ ์์ฉ ํ๋ก๊ทธ๋จ ์ค์์ ํ ์คํธ> ์ด๋ฏธ์ง ๋๋ฉ์ธ ๋งคํ์ ์ฌ์ฉํ์ฌ ๋ถ์์ ํ ์ด๋ฏธ์ง๋ฅผ ์์ฑํ๊ณ ํ๋ จ๋ ๋๋ฉ์ธ์์ ์๋ก์ด ์ด๋ฏธ์ง๋ฅผ ํฉ์ฑํฉ๋๋ค.

DALL-E๋ ํ๋ผํค์ ํ์์ ๋ถ๋ถ์ ์ด๋ฏธ์ง๋ฅผ ์์ฑํ๋ ค๊ณ ์๋ํ๋ค. ์ถ์ฒ : https://openai.com/blog/dall-e/
2: ์์ฑ์ ์ ๋ ์ ๊ฒฝ๋ง(GAN)
ํธ๋์คํฌ๋จธ๋ GPT-3์ ์ถ์ ๋ฐ ์ฑํ์ ํตํด ๋๋ผ์ด ์ธ๋ก ๋ณด๋๋ฅผ ์ป์์ง๋ง, ์์ ์ ๋์ ๋คํธ์ํฌ (GAN)์ ๊ทธ ์์ฒด๋ก ์ธ์ํ ์ ์๋ ๋ธ๋๋๊ฐ ๋์์ผ๋ฉฐ ๊ถ๊ทน์ ์ผ๋ก ๋ฅ ํ์ดํฌ ๋์ฌ๋ก.
์ฒ์ ์ ์ ์ฌํ์ฉ๋ฅ ์ด๋ฏธ์ง ํฉ์ฑ์ ์ฃผ๋ก ์ฌ์ฉ๋๋ Generative Adversarial Network ์ํคํ ์ฒ ๊ตฌ์ฑ๋์ด ์์ต๋๋ค ๋ฐ์ ๊ธฐ ๋ฐ ํ๋ณ ์์์ฑ์๋ ๋ฐ์ดํฐ์ธํธ์ ์๋ ์์ฒ ๊ฐ์ ์ด๋ฏธ์ง๋ฅผ ์ํํ๋ฉฐ ๋ฐ๋ณต์ ์ผ๋ก ์ฌ๊ตฌ์ฑ์ ์๋ํฉ๋๋ค. ๊ฐ ์๋๋ง๋ค ํ๋ณ์๋ ์์ฑ์์ ์์ ์ ํ๊ฐํ๊ณ , ์์ฑ์๋ฅผ ๋ ๋์ ๊ฒฐ๊ณผ๋ฅผ ๋ด๋๋ก ๋๋๋ ค ๋ณด๋ด์ง๋ง, ์ด์ ์ฌ๊ตฌ์ฑ์ ์ค๋ฅ ๋ฐฉ์์ ๋ํ ํต์ฐฐ๋ ฅ์ ์ ๊ณตํ์ง ์์ต๋๋ค.

์ถ์ฒ: https://developers.google.com/machine-learning/gan/gan_structure
์ด๋ ๊ฒ ํ๋ฉด Discriminator๊ฐ ์ด๋์์ ์๋ชป๋์๋์ง ์๋ ค์คฌ์ ๋ ๋ฐ์ํ ์ ์๋ ์ ์ฌ์ ์ธ ๋ง๋ค๋ฅธ ๊ณจ๋ชฉ์ ๋ฐ๋ผ๊ฐ๋ ๋์ Generator๊ฐ ๋ค์ํ ๋ฐฉ๋ฒ์ ํ์ํด์ผ ํฉ๋๋ค(์๋ #8 ์ฐธ์กฐ). ๊ต์ก์ด ๋๋ ๋์ฏค Generator๋ ๋ฐ์ดํฐ ์ธํธ์ ํฌ์ธํธ ๊ฐ์ ๊ด๊ณ์ ๋ํ ์์ธํ๊ณ ํฌ๊ด์ ์ธ ๋งต์ ๊ฐ๊ฒ ๋ฉ๋๋ค.

์ข ์ด์์ ๊ณต๊ฐ ์ธ์์ ๋์ฌ GAN ํํ ๊ฐ์ : ์๋ก์ด ํ๋ ์์ํฌ๋ GAN์ ๋๋๋ก ์ ๋นํ ์ ์ฌ ๊ณต๊ฐ์ ์ํํ์ฌ ์ด๋ฏธ์ง ํฉ์ฑ ์ํคํ ์ฒ์ ๋ฐ์ํ๋ ์๋จ์ ์ ๊ณตํฉ๋๋ค. ์ถ์ฒ: https://genforce.github.io/eqgan/
๋น์ ํ์๋ฉด, ์ด๊ฒ์ ๋ฐ๋ ์ค์ฌ๋ถ๋ก ๋จ์กฐ๋ก์ด ์ถํด๊ทผ๊ธธ์ ๋ฐฐ์ฐ๋ ๊ฒ๊ณผ ํ๋ค๊ฒ ์ต๋ํ๋ ๊ฒ์ ์ฐจ์ด์ ๋๋ค. ์ง์.
๊ทธ ๊ฒฐ๊ณผ, ํ๋ จ๋ ๋ชจ๋ธ์ ์ ์ฌ ๊ณต๊ฐ์ ์์ ์์ค์ ํน์ง๋ค์ด ๋ชจ์ ๋๋ค. ์์ ์์ค์ ํน์ง์ ๋ํ ์๋ฏธ์ ์งํ๋ '์ฌ๋'์ผ ์ ์์ผ๋ฉฐ, ํด๋น ํน์ง๊ณผ ๊ด๋ จ๋ ํน์ด์ฑ์ ์ดํด๋ณด๋ฉด '๋จ์ฑ'๊ณผ '์ฌ์ฑ'๊ณผ ๊ฐ์ ๋ค๋ฅธ ํ์ต๋ ํน์ง๋ค์ ๋ฐ๊ฒฌํ ์ ์์ต๋๋ค. ํ์ ์์ค์์๋ ํ์ ํน์ง๋ค์ด '๊ธ๋ฐ', '๋ฐฑ์ธ' ๋ฑ์ผ๋ก ์ธ๋ถํ๋ ์ ์์ต๋๋ค.
์ฝํ์ ์ฃผ๋ชฉํ ๋งํ ๋ฌธ์ GAN๊ณผ ์ธ์ฝ๋/๋์ฝ๋ ํ๋ ์์ํฌ์ ์ ์ฌ ๊ณต๊ฐ์์: GAN์์ ์์ฑ๋ ์ฌ์ฑ ์ผ๊ตด์ ๋ฏธ์๋ ์ ์ฌ ๊ณต๊ฐ์์ ๊ทธ๋ ์ '์ ์ฒด์ฑ'์ ์ฝํ ํน์ง์ธ๊ฐ, ์๋๋ฉด ํํํ ๊ฐ์ง์ธ๊ฐ?

์ด ์ฌ๋์ GAN ์์ฑ ์ผ๊ตด์ ์กด์ฌํ์ง ์์ต๋๋ค. ์ถ์ฒ: https://this-person-does-not-exist.com/en
์ง๋ ๋ช ๋ ๋์ ์ด์ ๊ด๋ จํ์ฌ ์ ์ ๋ ๋ง์ ์๋ก์ด ์ฐ๊ตฌ ํ๋ก์ ํธ๊ฐ ์งํ๋์ด ์์ผ๋ฉฐ, ์ด๋ GAN์ ์ ์ฌ ๊ณต๊ฐ์ ๋ํ ๊ธฐ๋ฅ ์์ค์ ํฌํ ์ต ์คํ์ผ ํธ์ง์ ์ํ ๊ธธ์ ๋ฆ์์์ง๋ ๋ชจ๋ฆ ๋๋ค. ํ์ง๋ง ํ์ฌ ๋ง์ ๋ณํ์ ์ฌ์ค์ '์ ๋ถ ์๋๋ฉด ์ ๋ฌด' ํจํค์ง์ ๋ถ๊ณผํฉ๋๋ค. ํนํ, NVIDIA์ 2021๋ ๋ง EditGAN ๋ฆด๋ฆฌ์ค๋ ๋์ ์์ค์ ํด์ ๊ฐ๋ฅ์ฑ ์๋งจํฑ ๋ถํ ๋ง์คํฌ๋ฅผ ์ฌ์ฉํ์ฌ ์ ์ฌ ๊ณต๊ฐ์์
์ธ๊ธฐ์๋ ์ฌ์ฉ๋ฒ
์ธ๊ธฐ ์๋ ๋ฅํ์ดํฌ ๋น๋์ค์ ๋ํ ์ฐธ์ฌ(์ค์ ๋ก ์๋นํ ์ ํ์ ์) ์ธ์๋ ์ด๋ฏธ์ง/๋น๋์ค ์ค์ฌ GAN์ ์ง๋ XNUMX๋ ๋์ ๊ธ์ฆํ์ฌ ์ฐ๊ตฌ์๊ณผ ๋์ค ๋ชจ๋๋ฅผ ๋งค๋ฃ์์ผฐ์ต๋๋ค. ์ ๋ฆด๋ฆฌ์ค์ ์ด์ง๋ฌ์ด ์๋์ ๋น๋๋ฅผ ๋ฐ๋ผ์ก๋ ๊ฒ์ ์ด๋ ค์ด ์ผ์ด์ง๋ง GitHub ๋ฆฌํฌ์งํ ๋ฆฌ๋ ๋ฉ์ง GAN ์ ํ๋ฆฌ์ผ์ด์ ํฌ๊ด์ ์ธ ๋ชฉ๋ก์ ์ ๊ณตํ๋ ๊ฒ์ ๋ชฉํ๋ก ํฉ๋๋ค.
Generative Adversarial Networks๋ ์ด๋ก ์ ์ผ๋ก ์ ๊ตฌ์ฑ๋ ๋๋ฉ์ธ์์ ๊ธฐ๋ฅ์ ํ์ํ ์ ์์ต๋๋ค. ํ ์คํธ ํฌํจ.
3: SVM
์ ๋ ์ฌํ์ฉ๋ฅ , ๋ฒกํฐ ๋จธ์ ์ง์ (SVM)์ ์๋ก์ด ์ฐ๊ตฌ์์ ์์ฃผ ๋ฑ์ฅํ๋ ํต์ฌ ์๊ณ ๋ฆฌ์ฆ์ ๋๋ค. SVM์์ ๋ฒกํฐ๋ ๋ฐ์ดํฐ ์ธํธ์์ ๋ฐ์ดํฐ ํฌ์ธํธ์ ์๋์ ๋ฐฐ์น๋ฅผ ๋งคํํ๋ ๋ฐ๋ฉด SUPPORT ๋ฒกํฐ๋ ์๋ก ๋ค๋ฅธ ๊ทธ๋ฃน, ๊ธฐ๋ฅ ๋๋ ํน์ฑ ๊ฐ์ ๊ฒฝ๊ณ๋ฅผ ๋ํ๋ ๋๋ค.

์ง์ ๋ฒกํฐ๋ ๊ทธ๋ฃน ๊ฐ์ ๊ฒฝ๊ณ๋ฅผ ์ ์ํฉ๋๋ค. ์ถ์ฒ: https://www.kdnuggets.com/2016/07/support-vector-machines-simple-explanation.html
๋์ถ๋ ๊ฒฝ๊ณ๋ฅผ ์ดํ๋ฉด.
๋ฎ์ ๊ธฐ๋ฅ ์์ค์์ SVM์ XNUMX ์ฐจ์ (์ ์ด๋ฏธ์ง) ๊ทธ๋ฌ๋ ์ธ์๋๋ ๊ทธ๋ฃน์ด๋ ์ ํ์ ์๊ฐ ๋ ๋ง์ ๊ฒฝ์ฐ์๋ ๋ค์๊ณผ ๊ฐ์ต๋๋ค. ์ผ์ฐจ์์.

์ ๊ณผ ๊ทธ๋ฃน์ ๋ ๊น์ ๋ฐฐ์ด์๋ XNUMX์ฐจ์ SVM์ด ํ์ํฉ๋๋ค. ์ถ์ฒ: https://cml.rhul.ac.uk/svm.html
์ธ๊ธฐ์๋ ์ฌ์ฉ๋ฒ
์ง์ ๋ฒกํฐ ๋จธ์ ์ ๋ค์ํ ์ข ๋ฅ์ ๊ณ ์ฐจ์ ๋ฐ์ดํฐ๋ฅผ ํจ๊ณผ์ ์ด๊ณ ๋ถ๊ฐ์ง๋ก ์ ์ผ๋ก ์ฒ๋ฆฌํ ์ ์๊ธฐ ๋๋ฌธ์ ๋ค์์ ํฌํจํ ๋ค์ํ ๋จธ์ ๋ฌ๋ ๋ถ์ผ์์ ๋๋ฆฌ ์ฌ์ฉ๋ฉ๋๋ค. ๋ฅ ํ์ดํฌ ๊ฐ์ง, ์ด๋ฏธ์ง ๋ถ๋ฅ, ์ฆ์ค์ฌ ํํ ๋ถ๋ฅ, DNA ๋ถ์ ๋ฐ ์ธ๊ตฌ ๊ตฌ์กฐ ์์ธก๋ง์ ๋ค๋ฅธ ์ฌ๋์ ์ฌ์ด์์.
4: K-ํ๊ท ํด๋ฌ์คํฐ๋ง
์ผ๋ฐ์ ์ผ๋ก ํด๋ฌ์คํฐ๋ง์ ๋น์ง๋ ํ์ต ๋ฅผ ํตํด ๋ฐ์ดํฐ ํฌ์ธํธ๋ฅผ ๋ถ๋ฅํ๋ ค๋ ์ ๊ทผ ๋ฐฉ์ ๋ฐ๋ ์ถ์ , ์ฐ๊ตฌ ์ค์ธ ๋ฐ์ดํฐ์ ๋ถํฌ ๋งต์ ์์ฑํฉ๋๋ค.

K-Means๋ ๋ฐ์ดํฐ์ ์ ์ฑํ ์ธ๊ทธ๋จผํธ, ๊ทธ๋ฃน ๋ฐ ์ปค๋ฎค๋ํฐ๋ฅผ ํด๋ฌ์คํฐ๋งํฉ๋๋ค. ์ถ์ฒ: https://aws.amazon.com/blogs/machine-learning/k-means-clustering-with-amazon-sagemaker/
K- ํ๊ท ๊ตฐ์งํ ์ด ์ ๊ทผ ๋ฐฉ์์ ๊ฐ์ฅ ์ธ๊ธฐ ์๋ ๊ตฌํ ๋ฐฉ์์ ๋ฐ์ดํฐ ํฌ์ธํธ๋ฅผ ๊ณ ์ ํ 'K ๊ทธ๋ฃน'์ผ๋ก ๋ถ๋ฅํ๋ ๊ฒ์ ๋๋ค. ์ด๋ ์์ ํต๊ณ ๋ฐ์ดํฐ์์ ๋ฐ๊ฒฌ๋๊ธฐ๋ฅผ ๊ธฐ๋ค๋ฆฌ๋ ์ธ๊ตฌ ํต๊ณ์ ๋ถ๋ฌธ, ์จ๋ผ์ธ ์ปค๋ฎค๋ํฐ ๋๋ ๊ธฐํ ๊ฐ๋ฅํ ๋น๋ฐ ์ง๊ณ๋ฅผ ๋ํ๋ผ ์ ์์ต๋๋ค.

ํด๋ฌ์คํฐ๋ K-Means ๋ถ์์์ ํ์ฑ๋ฉ๋๋ค. ์ถ์ฒ: https://www.geeksforgeeks.org/ml-determine-the-optimal-value-of-k-in-k-means-clustering/
K ๊ฐ ์์ฒด๋ ํ๋ก์ธ์ค์ ์ ์ฉ์ฑ๊ณผ ํด๋ฌ์คํฐ์ ๋ํ ์ต์ ์ ๊ฐ์ ์ค์ ํ๋ ๊ฒฐ์ ์์ธ์ ๋๋ค. ์ฒ์์๋ K ๊ฐ์ด ๋ฌด์์๋ก ํ ๋น๋๊ณ ๊ทธ ํน์ง๊ณผ ๋ฒกํฐ ํน์ฑ์ด ์ด์๊ณผ ๋น๊ต๋ฉ๋๋ค. ๋ฐ์ดํฐ๊ฐ ํ๋ก์ธ์ค์์ ํ์ฉํ๋ ๋ชจ๋ ๊ทธ๋ฃนํ๋ฅผ ์์ฑํ ๋๊น์ง ์์๋ก ํ ๋น๋ ๊ฐ์ด ์๋ ๋ฐ์ดํฐ ํฌ์ธํธ์ ๊ฐ์ฅ ์ ์ฌํ ์ด์์ด ํด๋ฌ์คํฐ์ ๋ฐ๋ณต์ ์ผ๋ก ํ ๋น๋ฉ๋๋ค.
ํด๋ฌ์คํฐ ๊ฐ ๊ฐ ์ฐจ์ด์ ์ ๊ณฑ ์ค์ฐจ ๋๋ '๋น์ฉ'์ ๋ํ ํ๋กฏ์ ๋ค์์ ๋ณด์ฌ์ค๋๋ค. ํ๊ฟ์น ํฌ์ธํธ ๋ฐ์ดํฐ:

ํด๋ฌ์คํฐ ๊ทธ๋ํ์ 'ํ๊ฟ์น ์ง์ '. ์ถ์ฒ: https://www.scikit-yb.org/en/latest/api/cluster/elbow.html
ํ๊ฟ์น ํฌ์ธํธ๋ ๋ฐ์ดํฐ ์ธํธ์ ๋ํ ๊ต์ก ์ธ์ ์ด ๋๋ ๋ ์์ค์ด ๊ฐ์ํ๋ ๋ฐฉ์์ผ๋ก ๊ฐ๋ ์ ์ ์ฌํฉ๋๋ค. ๊ทธ๋ฃน ๊ฐ์ ๋ ์ด์์ ๊ตฌ๋ถ์ด ๋ช ํํด์ง์ง ์๋ ์ง์ ์ ๋ํ๋ด๋ฉฐ ๋ฐ์ดํฐ ํ์ดํ๋ผ์ธ์ ํ์ ๋จ๊ณ๋ก ์ด๋ํ๊ฑฐ๋ ๊ฒฐ๊ณผ๋ฅผ ๋ณด๊ณ ํด์ผ ํ๋ ์๊ฐ์ ๋ํ๋ ๋๋ค.
์ธ๊ธฐ์๋ ์ฌ์ฉ๋ฒ
K-ํ๊ท ํด๋ฌ์คํฐ๋ง์ ๊ณ ๊ฐ ๋ถ์์์ ๊ธฐ๋ณธ์ ์ธ ๊ธฐ์ ๋ก, ๋ฐฉ๋ํ ์์ ๊ธฐ๋ก์ ์ธ๊ตฌ ํต๊ณ์ ํต์ฐฐ๋ ฅ๊ณผ '๋ฆฌ๋'๋ก ๋ณํํ๋ ๋ช ํํ๊ณ ์ค๋ช ๊ฐ๋ฅํ ๋ฐฉ๋ฒ๋ก ์ ์ ๊ณตํฉ๋๋ค.
์ด ์์ฉ ํ๋ก๊ทธ๋จ ์ธ์๋ K-Means Clustering์ ๋ค์์ ์ํด ์ฌ์ฉ๋ฉ๋๋ค. ์ฐ์ฌํ ์์ธก, ์๋ฃ ์์ ๋ถํ , GAN์ ์ฌ์ฉํ ์ด๋ฏธ์ง ํฉ์ฑ, ๋ฌธ์ ๋ถ๋ฅ๋ฐ ๋์ ๊ณํ, ๋ค๋ฅธ ๋ง์ ์ ์ฌ์ ๋ฐ ์ค์ ์ฉ๋ ์ค์์.
5: ๋๋ค ํฌ๋ ์คํธ
๋๋ค ํฌ๋ ์คํธ๋ ์์๋ธ ํ์ต ๋ฐฐ์ด์ ๊ฒฐ๊ณผ๋ฅผ ํ๊ท ํํ๋ ๋ฐฉ๋ฒ ๊ฒฐ์ ํธ๋ฆฌ ๊ฒฐ๊ณผ์ ๋ํ ์ ๋ฐ์ ์ธ ์์ธก์ ์ค์ ํฉ๋๋ค.

์ถ์ฒ: https://www.tutorialandexample.com/wp-content/uploads/2019/10/Decision-Trees-Root-Node.png
๋น์ ์ด ๊ทธ๊ฒ์ ์กฐ๊ธ์ด๋ผ๋ ์กฐ์ฌํ๋ค๋ฉด, ๋ฏธ๋๋ก ๊ทํ 3๋ถ์์ธ ์์ฌ๊ฒฐ์ ํธ๋ฆฌ ์์ฒด๋ ๊ฐ๋ ํํ๊ธฐ๊ฐ ๋งค์ฐ ์ฝ์ต๋๋ค. ์ฌ๋ฌ ๊ฒฝ๋ก๊ฐ ์ฌ๋ฌ๋ถ ์์ ๋์ฌ ์๊ณ , ๊ฐ ๊ฒฝ๋ก๋ ๋ ๋ง์ ๊ฐ๋ฅํ ๊ฒฝ๋ก๋ฅผ ํฌํจํ๋ ์๋ก์ด ๊ฒฐ๊ณผ๋ก ๋ถ๊ธฐ๋ฉ๋๋ค.
In ๊ฐํ ํ์ต, ๊ฒฝ๋ก์์ ํํดํ๊ณ ์ด์ ์ ์ฅ์์ ๋ค์ ์์ํ ์ ์์ง๋ง ์์ฌ ๊ฒฐ์ ํธ๋ฆฌ๋ ์ฌ์ ์ ์ ๋ ํฉ๋๋ค.
๋ฐ๋ผ์ ๋๋ค ํฌ๋ ์คํธ ์๊ณ ๋ฆฌ์ฆ์ ๋ณธ์ง์ ์ผ๋ก ์์ฌ๊ฒฐ์ ์ ์คํ๋ ๋ ๋ฒ ํ ์ ์ ์ฉํฉ๋๋ค. ์ด ์๊ณ ๋ฆฌ์ฆ์ด '๋ฌด์์'๋ผ๊ณ ๋ถ๋ฆฌ๋ ์ด์ ๋ ์์ ๋ณํต์ ์ดํดํ๊ธฐ ์ํ ์ ํ๊ณผ ๊ด์ฐฐ ์ค์ ๋ถ๋ฆฌ๋ ์์ฌ ๊ฒฐ์ ํธ๋ฆฌ ๋ฐฐ์ด์ ๊ฒฐ๊ณผ ํฉ๊ณ์ ๋๋ค.
๋ค์ํ ์์๋ฅผ ๊ณ ๋ คํ๊ธฐ ๋๋ฌธ์ Random Forest ์ ๊ทผ ๋ฐฉ์์ ์์ฌ ๊ฒฐ์ ํธ๋ฆฌ๋ณด๋ค ์๋ฏธ ์๋ ๊ทธ๋ํ๋ก ๋ณํํ๊ธฐ๊ฐ ๋ ์ด๋ ค์ธ ์ ์์ง๋ง ํจ์ฌ ๋ ์์ฐ์ ์ผ ์ ์์ต๋๋ค.
์์ฌ ๊ฒฐ์ ํธ๋ฆฌ๋ ๊ณผ์ ํฉ(overfitting)์ ์ํฅ์ ๋ฐ๋๋ฐ, ์ด๋ ์ป์ ๊ฒฐ๊ณผ๊ฐ ํน์ ๋ฐ์ดํฐ์๋ง ๊ตญํ๋์ด ์ผ๋ฐํํ๊ธฐ ์ด๋ ต๊ธฐ ๋๋ฌธ์ ๋๋ค. ๋๋ค ํฌ๋ ์คํธ๋ ๋ฐ์ดํฐ ํฌ์ธํธ๋ฅผ ์์๋ก ์ ํํ์ฌ ๋ฐ์ดํฐ์์ ์๋ฏธ ์๊ณ ์ ์ฉํ ๋ํ์ ์ถ์ธ๋ฅผ ์ฐพ์๋ด๋ ๋ฐฉ์์ผ๋ก ์ด๋ฌํ ๊ฒฝํฅ์ ๊ทน๋ณตํฉ๋๋ค.

์์ฌ ๊ฒฐ์ ํธ๋ฆฌ ํ๊ท. ์ถ์ฒ: https://scikit-learn.org/stable/auto_examples/tree/plot_tree_regression.html
์ธ๊ธฐ์๋ ์ฌ์ฉ๋ฒ
์ด ๋ชฉ๋ก์ ์๋ ๋ง์ ์๊ณ ๋ฆฌ์ฆ๊ณผ ๋ง์ฐฌ๊ฐ์ง๋ก, ๋๋ค ํฌ๋ ์คํธ๋ ์ผ๋ฐ์ ์ผ๋ก ๋ฐ์ดํฐ์ '์ด๊ธฐ' ์ ๋ ฌ ๋ฐ ํํฐ๋ง ์ญํ ์ ํ๋ฉฐ, ์ด๋ฌํ ํน์ฑ์ผ๋ก ์ธํด ์๋ก์ด ์ฐ๊ตฌ ๋ ผ๋ฌธ์ ๊พธ์คํ ๋ฑ์ฅํฉ๋๋ค. ๋๋ค ํฌ๋ ์คํธ ํ์ฉ ์ฌ๋ก๋ ๋ค์๊ณผ ๊ฐ์ต๋๋ค. ์๊ธฐ๊ณต๋ช ์์ํฉ์ฑ, Bitcoin ๊ฐ๊ฒฉ ์์ธก, ์ธ๊ตฌ ์กฐ์ฌ ์ธ๋ถํ, ํ ์คํธ ๋ถ๋ฅ ๋ฐ ์ ์ฉ ์นด๋ ์ฌ๊ธฐ ํ์ง.
Random Forest๋ ๋จธ์ ๋ฌ๋ ์ํคํ ์ฒ์ ํ์ ์์ค ์๊ณ ๋ฆฌ์ฆ์ด๋ฏ๋ก ๋ค์๊ณผ ๊ฐ์ ์๊ฐํ ์๊ณ ๋ฆฌ์ฆ๋ฟ๋ง ์๋๋ผ ๋ค๋ฅธ ํ์ ์์ค ๋ฐฉ๋ฒ์ ์ฑ๋ฅ์๋ ๊ธฐ์ฌํ ์ ์์ต๋๋ค. ์ ๋ ํด๋ฌ์คํฐ๋ง, ๊ธฐ๋ฅ ๋ณํ, ํ ์คํธ ๋ฌธ์์ ๋ถ๋ฅ ํฌ์ ๊ธฐ๋ฅ ์ฌ์ฉ๋ฐ ํ์ดํ๋ผ์ธ ํ์.
6: ๋์ด๋ธ ๋ฒ ์ด์ฆ
๋ฐ๋ ์ถ์ ๊ณผ ๊ฒฐํฉ(์ฐธ์กฐ 4, ์), ๋์ด๋ธ ๋ฒ ์ด์ฆ ๋ถ๋ฅ๊ธฐ๋ ๋ฐ์ดํฐ์ ๊ณ์ฐ๋ ํน์ง์ ๊ธฐ๋ฐ์ผ๋ก ํ๋ฅ ์ ์ถ์ ํ ์ ์๋ ๊ฐ๋ ฅํ์ง๋ง ์๋์ ์ผ๋ก ๊ฐ๋ฒผ์ด ์๊ณ ๋ฆฌ์ฆ์ ๋๋ค.

๋์ด๋ธ ๋ฒ ์ด์ฆ ๋ถ๋ฅ๊ธฐ์ ๊ธฐ๋ฅ ๊ด๊ณ. ์ถ์ฒ: https://www.sciencedirect.com/topics/computer-science/naive-bayes-model
'์์งํ'์ด๋ผ๋ ์ฉ์ด๋ ๊ฐ์ ์ ์๋ฏธํฉ๋๋ค. ๋ฒ ์ด์ฆ์ ์ ๋ฆฌ ํด๋น ๊ธฐ๋ฅ์ ๊ด๋ จ์ด ์์ผ๋ฉฐ ์กฐ๊ฑด๋ถ ๋ ๋ฆฝ์ด๋ฌํ ๊ด์ ์ ์ทจํ๋ค๋ฉด, ์ค๋ฆฌ์ฒ๋ผ ๊ฑท๊ณ ๋งํ๋ ๊ฒ๋ง์ผ๋ก๋ ์ฐ๋ฆฌ๊ฐ ์ค๋ฆฌ๋ฅผ ์๋ํ๊ณ ์๋ค๋ ๊ฒ์ ์ ์ฆํ๊ธฐ์ ์ถฉ๋ถํ์ง ์์ผ๋ฉฐ, ์ด๋ ํ '๋ช ๋ฐฑํ' ๊ฐ์ ๋ ์ฑ๊ธํ๊ฒ ์ฑํ๋์ง ์์ต๋๋ค.
'์์'์ผ๋ก ์ ๊ทผํ ์ ์๋ ๋ถ์ผ์์ ์ด ์ ๋ ์์ค์ ํ๋ฌธ์ , ์กฐ์ฌ์ ์๊ฒฉ์ฑ์ ์ง๋์น๊ฒ ์ง๋ง, ๋จธ์ ๋ฌ๋ ๋ฐ์ดํฐ ์ธํธ์ ์กด์ฌํ ์ ์๋ ๋ง์ ๋ชจํธ์ฑ๊ณผ ์ ์ฌ์ ์ผ๋ก ๊ด๋ จ์ฑ์ด ์๋ ์๊ด๊ด๊ณ๋ฅผ ํ์ํ ๋๋ ๊ท์คํ ๊ธฐ์ค์ด ๋ฉ๋๋ค.
์๋ ๋ฒ ์ด์ง์ ๋คํธ์ํฌ์์ ๊ธฐ๋ฅ์ ๋ค์์ ๋ฐ๋ฆ ๋๋ค. ์ฑ์ ๊ธฐ๋ฅ, ์ต์ ์ค๋ช ๊ธธ์ด ํฌํจ ๋ฒ ์ด์ง์ ์ฑ์ , ๋ฐ์ดํฐ ํฌ์ธํธ ๊ฐ์ ๋ฐ๊ฒฌ๋ ์์ ์ฐ๊ฒฐ๊ณผ ์ด๋ฌํ ์ฐ๊ฒฐ์ด ํ๋ฅด๋ ๋ฐฉํฅ ์ธก๋ฉด์์ ๋ฐ์ดํฐ์ ์ ํ์ ๊ฐํ ์ ์์ต๋๋ค.
๋ฐ๋๋ก, ๋์ด๋ธ ๋ฒ ์ด์ฆ ๋ถ๋ฅ๊ธฐ๋ ์ฃผ์ด์ง ๊ฐ์ฒด์ ํน์ง์ด ๋ ๋ฆฝ์ ์ด๋ผ๊ณ ๊ฐ์ ํ ํ, ๋ฒ ์ด์ฆ ์ ๋ฆฌ๋ฅผ ์ฌ์ฉํ์ฌ ์ฃผ์ด์ง ๊ฐ์ฒด์ ํน์ง์ ๊ธฐ๋ฐ์ผ๋ก ํด๋น ๊ฐ์ฒด์ ํ๋ฅ ์ ๊ณ์ฐํฉ๋๋ค.
์ธ๊ธฐ์๋ ์ฌ์ฉ๋ฒ
Naive Bayes ํํฐ๋ ์ง๋ณ ์์ธก ๋ฐ ๋ฌธ์ ๋ถ๋ฅ, ์คํธ ํํฐ๋ง, ๊ฐ์ ๋ถ๋ฅ, ์ถ์ฒ ์์คํ ๋ฐ ์ฌ๊ธฐ ํ์ง, ๋ค๋ฅธ ์์ฉ ํ๋ก๊ทธ๋จ ์ค์์.
7: K- ์ต๊ทผ์ ์ด์(KNN)
๋ฏธ ๊ณต๊ตฐ ํญ๊ณต ์ํ ํ๊ต์์ ์ฒ์ ์ ์ ์ฌํ์ฉ๋ฅ 20์ธ๊ธฐ ์ค๋ฐ ์ต์ฒจ๋จ ์ปดํจํ ํ๋์จ์ด์ ์ ์ํด์ผ ํ๋ K- ์ต๊ทผ ์ ์ด์ (KNN)์ ํ์ ๋ ผ๋ฌธ ๋ฐ ๋ฏผ๊ฐ ๋ถ๋ฌธ ๊ธฐ๊ณ ํ์ต ์ฐ๊ตฌ ์ด๋์ ํฐ๋ธ์์ ์ฌ์ ํ ๋๋๋ฌ์ง๊ฒ ๋ํ๋๋ ๋ฆฐ ์๊ณ ๋ฆฌ์ฆ์ ๋๋ค.
KNN์ ์์ ํ ๋จธ์ ๋ฌ๋ ๋ชจ๋ธ์ ํ์ต์ํค๋ ๋์ , ๋ฐ์ดํฐ ํฌ์ธํธ ๊ฐ์ ๊ด๊ณ๋ฅผ ํ๊ฐํ๊ธฐ ์ํด ๋ฐ์ดํฐ ์ธํธ๋ฅผ ์ฒ ์ ํ ๊ฒํ ํ๊ธฐ ๋๋ฌธ์ '๊ฒ์ผ๋ฅธ ํ์ต์'๋ผ๊ณ ๋ถ๋ฆฝ๋๋ค.

KNN ๊ทธ๋ฃนํ. ์์ฒ: https://scikit-learn.org/stable/modules/neighbors.html
KNN์ ๊ตฌ์กฐ์ ์ผ๋ก ๊ฐ๋ํ์ง๋ง ์ฒด๊ณ์ ์ธ ์ ๊ทผ ๋ฐฉ์์ ์ฝ๊ธฐ/์ฐ๊ธฐ ์์ ์ ์๋นํ ์์๊ฐ ์์ผ๋ฉฐ ๋งค์ฐ ํฐ ๋ฐ์ดํฐ ์ธํธ์์ KNN์ ์ฌ์ฉํ๋ ๊ฒ์ ๋ณต์กํ๊ณ ๋์ฉ๋ ๋ฐ์ดํฐ ์ธํธ๋ฅผ ๋ณํํ ์ ์๋ ์ฃผ์ฑ๋ถ ๋ถ์(PCA)๊ณผ ๊ฐ์ ๋ณด์กฐ ๊ธฐ์ ์์ด๋ ๋ฌธ์ ๊ฐ ๋ ์ ์์ต๋๋ค. ~ ์์ผ๋ก ๋ํ ๊ทธ๋ฃน KNN์ด ๋ ์ ์ ๋ ธ๋ ฅ์ผ๋ก ์ํํ ์ ์์ต๋๋ค.
A ์ต๊ทผ์ ์ฐ๊ตฌ ์ง์์ด ํ์ฌ๋ฅผ ๋ ๋ ์ง ์ฌ๋ถ๋ฅผ ์์ธกํ๋ ์ฌ๋ฌ ์๊ณ ๋ฆฌ์ฆ์ ํจ์จ์ฑ๊ณผ ๊ฒฝ์ ์ฑ์ ํ๊ฐํ์ฌ XNUMX๋ KNN์ด ์ ํ์ฑ๊ณผ ์์ธก ํจ์จ์ฑ ์ธก๋ฉด์์ ๋ ํ๋์ ์ธ ๊ฒฝ์์๋ณด๋ค ์ฐ์ํ๋ค๋ ์ฌ์ค์ ๋ฐ๊ฒฌํ์ต๋๋ค.
์ธ๊ธฐ์๋ ์ฌ์ฉ๋ฒ
KNN์ ๊ฐ๋ ๊ณผ ์คํ์ ๋์ค์ ๋จ์์ฑ์๋ ๋ถ๊ตฌํ๊ณ 1950๋ ๋์ ๋จธ๋ฌผ๋ฌ ์์ง ์์ต๋๋ค. ๋ณด๋ค DNN ์ค์ฌ์ ์ธ ์ ๊ทผ ๋ฐฉ์ 2018๋ Pennsylvania State University์ ์ ์์์ ํจ์ฌ ๋ ๋ณต์กํ ๋ง์ ๊ธฐ๊ณ ํ์ต ํ๋ ์์ํฌ์์ ์ค์ ์ด๊ธฐ ๋จ๊ณ ํ๋ก์ธ์ค(๋๋ ์ฌํ ์ฒ๋ฆฌ ๋ถ์ ๋๊ตฌ)๋ก ๋จ์ ์์ต๋๋ค.
๋ค์ํ ๊ตฌ์ฑ์์ KNN์ด ์ฌ์ฉ๋์์ต๋๋ค. ์จ๋ผ์ธ ์๋ช ํ์ธ, ์ด๋ฏธ์ง ๋ถ๋ฅ, ํ ์คํธ ๋ง์ด๋, ์๋ฌผ ์์ธก๋ฐ ์ผ๊ตด ์ธ์, ๋ค๋ฅธ ์์ฉ ํ๋ก๊ทธ๋จ ๋ฐ ํตํฉ ์ธ์.

ํ๋ จ ์ค์ธ KNN ๊ธฐ๋ฐ ์๋ฉด ์ธ์ ์์คํ . Source: https://pdfs.semanticscholar.org/6f3d/d4c5ffeb3ce74bf57342861686944490f513.pdf
8: ๋ง๋ฅด์ฝํ ๊ฒฐ์ ํ๋ก์ธ์ค(MDP)
๋ฏธ๊ตญ์ ์ํ์ ๋ฆฌ์ฐจ๋ ๋ฒจ๋ง์ด ์๊ฐํ ์ํ์ ํ ์ฌํ์ฉ๋ฅ , MDP(Markov Decision Process)๋ ๊ฐ์ฅ ๊ธฐ๋ณธ์ ์ธ ๋ธ๋ก ์ค ํ๋์ ๋๋ค. ๊ฐํ ํ์ต ์ํคํ ์ฒ. ๊ทธ ์์ฒด๋ก ๊ฐ๋ ์ ์๊ณ ๋ฆฌ์ฆ์ด๋ฉฐ ์๋ง์ ๋ค๋ฅธ ์๊ณ ๋ฆฌ์ฆ์ ์ ์ฉ๋์์ผ๋ฉฐ ํ์ฌ AI/ML ์ฐ๊ตฌ์์ ์์ฃผ ๋ฐ๋ณต๋ฉ๋๋ค.
MDP๋ ํ์ฌ ์ํ(์ฆ, ๋ฐ์ดํฐ์์ '์ด๋์' ์๋์ง)๋ฅผ ํ๊ฐํ์ฌ ๋ฐ์ดํฐ ํ๊ฒฝ์ ํ์ํ๊ณ , ๋ค์์ ํ์ํ ๋ฐ์ดํฐ ๋ ธ๋๋ฅผ ๊ฒฐ์ ํฉ๋๋ค.

์ถ์ฒ: https://www.sciencedirect.com/science/article/abs/pii/S0888613X18304420
๊ธฐ๋ณธ์ ์ธ Markov ๊ฒฐ์ ํ๋ก์ธ์ค๋ ๋ณด๋ค ๋ฐ๋์งํ ์ฅ๊ธฐ ๋ชฉํ๋ณด๋ค ๋จ๊ธฐ์ ์ด์ ์ ์ฐ์ ์ํฉ๋๋ค. ์ด๋ฌํ ์ด์ ๋ก ์ด๋ ์ผ๋ฐ์ ์ผ๋ก ๊ฐํ ํ์ต์ ๋ณด๋ค ํฌ๊ด์ ์ธ ์ ์ฑ ์ํคํ ์ฒ์ ๋งฅ๋ฝ์ ํฌํจ๋๋ฉฐ ํ ์ธ๋ ๋ณด์๊ณผ ๊ฐ์ ์ ํ ์์ ๋ฐ ๊ณ ๋ ค ์์ด ์ฆ๊ฐ์ ์ธ ๋ชฉํ๋ก ๋์งํ๋ ๊ฒ์ ๋ฐฉ์งํ๋ ๊ธฐํ ์์ ํ๊ฒฝ ๋ณ์์ ์ ์ฉ์ ๋ฐ๋ ๊ฒฝ์ฐ๊ฐ ๋ง์ต๋๋ค. ๋ ํญ๋์ ์ํ๋ ๊ฒฐ๊ณผ๋ฅผ ์ป์ ์ ์์ต๋๋ค.
์ธ๊ธฐ์๋ ์ฌ์ฉ๋ฒ
MDP์ ์ ์์ค ๊ฐ๋ ์ ๋จธ์ ๋ฌ๋ ์ฐ๊ตฌ ๋ฐ ์ค์ ์ ์ฉ ๋ถ์ผ์์ ๋๋ฆฌ ์ฌ์ฉ๋๊ณ ์์ต๋๋ค. IoT ๋ณด์ ๋ฐฉ์ด ์์คํ , ๋ฌผ๊ณ ๊ธฐ ์ํ๋ฐ ์์ฅ ์์ธก.
๊ทธ ์ธ์ ๋ช ๋ฐฑํ ์ ์ฉ ๊ฐ๋ฅ์ฑ ์ฒด์ค ๋ฐ ๊ธฐํ ์๊ฒฉํ๊ฒ ์์ฐจ์ ์ธ ๊ฒ์์ ๋ํด MDP๋ ๋ํ ๋ก๋ด ์์คํ ์ ์ ์ฐจ์ ํ๋ จ, ์๋ ๋น๋์ค์์ ๋ณผ ์ ์๋ฏ์ด.
9: ์ฉ์ด ๋น๋-์ญ ๋ฌธ์ ๋น๋
๊ธฐ๊ฐ ๋น๋(TF) ๋ฌธ์์ ๋จ์ด๊ฐ ๋ํ๋๋ ํ์๋ฅผ ํด๋น ๋ฌธ์์ ์ด ๋จ์ด ์๋ก ๋๋๋๋ค. ๋ฐ๋ผ์ ๋จ์ด ๋ดํ๋ค ์ฒ ๋จ์ด ๊ธฐ์ฌ์ ํ ๋ฒ ๋ฑ์ฅํ๋ ์ฉ์ด ๋น๋๋ 0.001์ ๋๋ค. TF ์์ฒด๋ ์๋ฏธ ์๋ ๊ธฐ์ฌ(์: a, ๋ฐ , ์ ์,๋ฐ it) ์ฐ์ธํ๋ค.
์ฉ์ด์ ๋ํ ์๋ฏธ ์๋ ๊ฐ์ ์ป๊ธฐ ์ํด IDF(์ญ ๋ฌธ์ ๋น๋)๋ ๋ฐ์ดํฐ ์ธํธ์ ์ฌ๋ฌ ๋ฌธ์์์ ๋จ์ด์ TF๋ฅผ ๊ณ์ฐํ์ฌ ๋ฎ์ ๋ฑ๊ธ์ ๋งค์ฐ ๋์ ๋น๋์ ํ ๋นํฉ๋๋ค. ์คํฑ ์๋, ๊ธฐ์ฌ์ ๊ฐ์. ๊ฒฐ๊ณผ ํน์ง ๋ฒกํฐ๋ ์ ์ฒด ๊ฐ์ผ๋ก ์ ๊ทํ๋๋ฉฐ ๊ฐ ๋จ์ด์๋ ์ ์ ํ ๊ฐ์ค์น๊ฐ ํ ๋น๋ฉ๋๋ค.

TF-IDF๋ ์ฌ๋ฌ ๋ฌธ์์์ ๋น๋๋ฅผ ๊ธฐ์ค์ผ๋ก ์ฉ์ด์ ๊ด๋ จ์ฑ์ ๊ฐ์ค์น๋ฅผ ๋ถ์ฌํ๋ฉฐ ๋๋ฌผ๊ฒ ๋ฐ์ํ๋ ๊ฒฝ์ฐ ํ์ ์ฑ์ ๋ํ๋ ๋๋ค. ์ถ์ฒ: https://moz.com/blog/inverse-document-frequency-and-the-importance-of-uniqueness
์ด ์ ๊ทผ ๋ฐฉ์์ ์๋ฏธ์ ์ค์ํ ๋จ์ด๊ฐ ๋ค์๊ณผ ๊ฐ์ด ์์ค๋๋ ๊ฒ์ ๋ฐฉ์งํ์ง๋ง ์ด์์น, ๋น๋ ๊ฐ์ค์น๋ฅผ ๋ฐ์ ํ๋ค๊ณ ํด์ ์๋์ผ๋ก ์ ์ฃผํ ์ฉ์ด๊ฐ ์ง์ ์ผ๋ถ๋ ๋๋ฌผ๊ธฐ ๋๋ฌธ์ ์ด์์น ๋ฐ ๊ฐ์น ์๋. ๋ฐ๋ผ์ ๋น๋๊ฐ ๋ฎ์ ์ฉ์ด๋ ๋ฐ์ดํฐ ์ธํธ์ ์ฌ๋ฌ ๋ฌธ์์์ (๋ฌธ์๋น ๋น๋๊ฐ ๋ฎ์ ๊ฒฝ์ฐ์๋) ๊ธฐ๋ฅ์ ํตํด ๋ ๋์ ์ํคํ ์ฒ ์ปจํ ์คํธ์์ ๊ทธ ๊ฐ์น๋ฅผ ์ ์ฆํด์ผ ํฉ๋๋ค.
๊ทธ๋ผ์๋ ๋ถ๊ตฌํ๊ณ ๋์ด, TF-IDF๋ ์์ฐ์ด ์ฒ๋ฆฌ ํ๋ ์์ํฌ์์ ์ด๊ธฐ ํํฐ๋ง ํต๊ณผ๋ฅผ ์ํ ๊ฐ๋ ฅํ๊ณ ๋๋ฆฌ ์ฌ์ฉ๋๋ ๋ฐฉ๋ฒ์ ๋๋ค.
์ธ๊ธฐ์๋ ์ฌ์ฉ๋ฒ
TF-IDF๋ ์ง๋ 20๋ ๋์ Google์ ๋๋ถ๋ถ ์จ๊ฒจ์ง PageRank ์๊ณ ๋ฆฌ์ฆ ๊ฐ๋ฐ์ ์ต์ํ ์ด๋ ์ ๋ ์ญํ ์ ํ๊ธฐ ๋๋ฌธ์ ๋งค์ฐ ๋๋ฆฌ ์ฑํ John Mueller์ 2019๋ ์กฐ์ฌ์๋ ๋ถ๊ตฌํ๊ณ ์กฐ์์ ์ธ SEO ์ ๋ต์ผ๋ก ๊ฑฐ๋ถ ๊ฒ์ ๊ฒฐ๊ณผ์ ๋ํ ์ค์์ฑ์ ๋๋ค.
PageRank ์ฃผ๋ณ์ ๋น๋ฐ๋ก ์ธํด TF-IDF๊ฐ ์ง์ ํ์ฌ ๊ตฌ๊ธ ์์๋ฅผ ๋์ด๋ ํจ๊ณผ์ ์ธ ์ ๋ต์ ๋๋ค. ์ ๋์ ํ ๋ก ์ต๊ทผ IT ์ ๋ฌธ๊ฐ๋ค ์ฌ์ด์์ ์ฉ์ด ๋จ์ฉ์ด ์ฌ์ ํ SEO ๋ฐฐ์น๋ฅผ ๊ฐ์ ํ ์ ์๋ค๋ ๋์ค์ ์ธ ์ดํด๋ฅผ ๋ํ๋ ๋๋ค. ๋ ์ ๋จ์ฉ ํ์ ๋ฐ ๊ณผ๋ํ ๊ด๊ณ ์ด ์ด๋ก ์ ํ๊ณ๋ฅผ ํ๋ฆฌ๊ฒ ํจ).
10: ํ๋ฅ ์ ๊ฒฝ์ฌํ๊ฐ๋ฒ
ํ๋ฅ ์ ๊ฒฝ์ฌํ๊ฐ๋ฒ (SGD)๋ ๊ธฐ๊ณ ํ์ต ๋ชจ๋ธ์ ๊ต์ก์ ์ต์ ํํ๋ ๋ฐ ์ ์ ๋ ๋ง์ด ์ฌ์ฉ๋๋ ๋ฐฉ๋ฒ์ ๋๋ค.
๊ฒฝ์ฌ ํ๊ฐ๋ฒ ์์ฒด๋ ํ๋ จ ์ค์ ๋ชจ๋ธ์ด ๋ง๋๋ ๊ฐ์ ์ ์ต์ ํํ๊ณ ์ดํ์ ์ ๋ํํ๋ ๋ฐฉ๋ฒ์ ๋๋ค.
์ด๋ฐ ์๋ฏธ์์ '๊ธฐ์ธ๊ธฐ'๋ (์๋ ์ด๋ฏธ์ง ์ฐธ์กฐ, ์์ ๊ธฐ๋ฐ ๊ทธ๋ผ๋ฐ์ด์ ์ด ์๋) ์๋๋ก ๊ธฐ์ธ์ด์ง ๋ชจ์์ ๋ํ๋ ๋๋ค. ์ผ์ชฝ '์ธ๋'์ ๊ฐ์ฅ ๋์ ์ง์ ์ ํ์ต ๊ณผ์ ์ ์์์ ๋ํ๋ ๋๋ค. ์ด ๋จ๊ณ์์ ๋ชจ๋ธ์ ์์ง ์ ์ฒด ๋ฐ์ดํฐ๋ฅผ ํ ๋ฒ๋ ์ ํ์ง ์์์ผ๋ฉฐ, ํจ๊ณผ์ ์ธ ๋ณํ์ ์์ฑํ ๋งํผ ๋ฐ์ดํฐ ๊ฐ์ ๊ด๊ณ์ ๋ํด ์ถฉ๋ถํ ํ์ตํ์ง ๋ชปํ์ต๋๋ค.

FaceSwap ๊ต์ก ์ธ์ ์ ๊ฒฝ์ฌ ํ๊ฐ๋ฒ. ์ฐ๋ฆฌ๋ ๊ต์ก์ด ํ๋ฐ๋ถ์ ์ผ๋ง ๋์ ์ ์ฒด๋์์ง๋ง ๊ฒฐ๊ตญ ์์ฉ ๊ฐ๋ฅํ ์๋ ด์ ํฅํ ๊ธฐ์ธ๊ธฐ ์๋๋ก ํ๋ณต๋์์์ ๋ณผ ์ ์์ต๋๋ค.
์ค๋ฅธ์ชฝ์ ๊ฐ์ฅ ๋ฎ์ ์ง์ ์ ์๋ ด์ ๋ํ๋ ๋๋ค(๋ชจ๋ธ์ด ๋ถ๊ณผ๋ ์ ์ฝ ์กฐ๊ฑด ๋ฐ ์ค์ ํ์์ ์ป์ ์ ์๋ ๋งํผ ํจ๊ณผ์ ์ธ ์ง์ ).
๊ทธ๋๋์ธํธ๋ ์ค๋ฅ์จ(๋ชจ๋ธ์ด ํ์ฌ ๋ฐ์ดํฐ ๊ด๊ณ๋ฅผ ์ผ๋ง๋ ์ ํํ๊ฒ ๋งคํํ๋์ง)๊ณผ ๊ฐ์ค์น(๋ชจ๋ธ์ด ํ์ตํ๋ ๋ฐฉ์์ ์ํฅ์ ๋ฏธ์น๋ ์ค์ ) ์ฌ์ด์ ์ฐจ์ด์ ๋ํ ๊ธฐ๋ก ๋ฐ ์์ธก์ ์ญํ ์ ํฉ๋๋ค.
์ด ์งํ ๊ธฐ๋ก์ ๋ค์์ ์๋ฆฌ๋ ๋ฐ ์ฌ์ฉํ ์ ์์ต๋๋ค. ํ์ต๋ฅ ์ผ์ , ์ด๊ธฐ ๋ชจํธํ ์ธ๋ถ ์ฌํญ์ด ๋ช ํํ ๊ด๊ณ ๋ฐ ๋งคํ์ผ๋ก ๋ณํ๋จ์ ๋ฐ๋ผ ์ํคํ ์ฒ๊ฐ ๋ณด๋ค ์ธ๋ถํ๋๊ณ ์ ํํด์ง๋๋ก ์ง์ํ๋ ์๋ ํ๋ก์ธ์ค์ ๋๋ค. ์ค์ ๋ก ๊ทธ๋๋์ธํธ ์์ค์ ๊ต์ก์ด ๋ค์์ ์งํ๋์ด์ผ ํ๋ ์์น์ ์งํ ๋ฐฉ๋ฒ์ ๋ํ ์ ์ ๋งต์ ์ ๊ณตํฉ๋๋ค.
ํ๋ฅ ์ ๊ฒฝ์ฌ ํ๊ฐ๋ฒ์ ํ์ ์ ๊ฐ ๋ฐ๋ณต๋ง๋ค ๊ฐ ํ์ต ์์ ์ ๋ชจ๋ธ ๋งค๊ฐ๋ณ์๋ฅผ ์ ๋ฐ์ดํธํ์ฌ ์ผ๋ฐ์ ์ผ๋ก ์๋ ด ์๋๋ฅผ ๋์ธ๋ค๋ ์ ์ ๋๋ค. ์ต๊ทผ ๋ช ๋ ๋์ ํ์ดํผ์ค์ผ์ผ ๋ฐ์ดํฐ ์ธํธ๊ฐ ๋ฑ์ฅํ๋ฉด์, SGD๋ ์ด๋ก ์ธํ ๋ก์ง์คํฑ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ ์ ์๋ ํ ๊ฐ์ง ๋ฐฉ๋ฒ์ผ๋ก ์ต๊ทผ ์ธ๊ธฐ๋ฅผ ์ป๊ณ ์์ต๋๋ค.
๋ฐ๋ฉด SGD๋ ๋ถ์ ์ ์ธ ์๋ฏธ ๊ธฐ๋ฅ ํฌ๊ธฐ ์กฐ์ ์ ์ํด ๋์ผํ ๊ฒฐ๊ณผ๋ฅผ ์ป๊ธฐ ์ํด ๋ ๋ง์ ๋ฐ๋ณต์ด ํ์ํ ์ ์์ผ๋ฏ๋ก ์ผ๋ฐ ๊ฒฝ์ฌ ํ๊ฐ๋ฒ์ ๋นํด ์ถ๊ฐ ๊ณํ ๋ฐ ์ถ๊ฐ ๋งค๊ฐ๋ณ์๊ฐ ํ์ํฉ๋๋ค.
์ธ๊ธฐ์๋ ์ฌ์ฉ๋ฒ
๊ตฌ์ฑ ๊ฐ๋ฅ์ฑ๊ณผ ๋จ์ ์๋ ๋ถ๊ตฌํ๊ณ SGD๋ ์ ๊ฒฝ๋ง ํผํ ์ ์ํ ๊ฐ์ฅ ์ธ๊ธฐ ์๋ ์ต์ ํ ์๊ณ ๋ฆฌ์ฆ์ด ๋์์ต๋๋ค. ์๋ก์ด AI/ML ์ฐ๊ตฌ ๋ ผ๋ฌธ์์ ์ง๋ฐฐ์ ์ธ SGD ๊ตฌ์ฑ ์ค ํ๋๋ ADAM(Adaptive Moment Estimation)์ ์ ํ์ ๋๋ค. ์ฌํ์ฉ๋ฅ ) ์ตํฐ๋ง์ด์ .
ADAM์ ๊ฐ ๋งค๊ฐ๋ณ์์ ํ์ต๋ฅ ์ ๋์ ์ผ๋ก ์กฐ์ ('์ ์์ ํ์ต๋ฅ ')ํ๊ณ , ์ด์ ์ ๋ฐ์ดํธ ๊ฒฐ๊ณผ๋ฅผ ํ์ ๊ตฌ์ฑ์ ํตํฉ('๋ชจ๋ฉํ ')ํฉ๋๋ค. ๋ํ, ๋ค์๊ณผ ๊ฐ์ ์ต์ ํ์ ๊ธฐ์ ์ ์ฌ์ฉํ๋๋ก ๊ตฌ์ฑํ ์ ์์ต๋๋ค. ๋ค์คํ ๋กํ ๋ชจ๋ฉํ .
๊ทธ๋ฌ๋ ์ผ๋ถ์์๋ ๋ชจ๋ฉํ ์ ์ฌ์ฉํ๋ฉด ADAM(๋ฐ ์ ์ฌํ ์๊ณ ๋ฆฌ์ฆ)์ ์ต์ ์ด ์๋ ๊ฒฐ๋ก . ๊ธฐ๊ณ ํ์ต ์ฐ๊ตฌ ๋ถ์ผ์ ์ต์ฒจ๋จ ๋ถ์ผ์ ๋ง์ฐฌ๊ฐ์ง๋ก SGD๋ ์งํ ์ค์ธ ์์ ์ ๋๋ค.
10๋
2022์ 10์ผ์ ์ฒ์ ๊ฒ์๋์์ต๋๋ค. EET 20.05๋
XNUMX์ XNUMX์ผ์ ์์ ๋์์ต๋๋ค.










