Refresh

This website www.unite.ai/ko/%EC%9E%90%EC%97%B0%EC%96%B4-%EC%B2%98%EB%A6%AC%EB%A5%BC-%EC%9C%84%ED%95%9C-%EC%B5%9C%EA%B3%A0%EC%9D%98-Python-%EB%9D%BC%EC%9D%B4%EB%B8%8C%EB%9F%AC%EB%A6%AC-10%EA%B0%9C/ is currently offline. Cloudflare's Always Online™ shows a snapshot of this web page from the Internet Archive's Wayback Machine. To check for the live version, click Refresh.

Rescale ๋ฏธํŒ… ์˜ˆ์•ฝ

์ž์—ฐ์–ด ์ฒ˜๋ฆฌ๋ฅผ ์œ„ํ•œ ์ตœ๊ณ ์˜ Python ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ 10๊ฐœ

ํŒŒ์ด์ฌ ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ

์ž์—ฐ์–ด ์ฒ˜๋ฆฌ๋ฅผ ์œ„ํ•œ ์ตœ๊ณ ์˜ Python ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ 10๊ฐœ

์—…๋ฐ์ดํŠธ on

Python์€ ์ตœ๊ณ ์˜ ํ”„๋กœ๊ทธ๋ž˜๋ฐ ์–ธ์–ด๋กœ ๋„๋ฆฌ ์•Œ๋ ค์ ธ ์žˆ์œผ๋ฉฐ ์ธ๊ณต ์ง€๋Šฅ(AI) ๋ฐ ๊ธฐ๊ณ„ ํ•™์Šต ์ž‘์—…์— ๋งค์šฐ ์ค‘์š”ํ•ฉ๋‹ˆ๋‹ค. Python์€ ๋‹ค๋ฅธ ์ฃผ๋ฅ˜ ์–ธ์–ด์™€ ๋น„๊ตํ•  ๋•Œ ๋งค์šฐ ํšจ์œจ์ ์ธ ํ”„๋กœ๊ทธ๋ž˜๋ฐ ์–ธ์–ด์ด๋ฉฐ, ์˜์–ด์™€ ์œ ์‚ฌํ•œ ๋ช…๋ น ๋ฐ ๊ตฌ๋ฌธ ๋•๋ถ„์— ์ดˆ๋ณด์ž์—๊ฒŒ ํƒ์›”ํ•œ ์„ ํƒ์ž…๋‹ˆ๋‹ค. Python ํ”„๋กœ๊ทธ๋ž˜๋ฐ ์–ธ์–ด์˜ ๋˜ ๋‹ค๋ฅธ ๊ฐ€์žฅ ์ข‹์€ ์ธก๋ฉด ์ค‘ ํ•˜๋‚˜๋Š” Python์ด ์—„์ฒญ๋‚œ ์–‘์˜ ์˜คํ”ˆ ์†Œ์Šค ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ๋กœ ๊ตฌ์„ฑ๋˜์–ด ์žˆ์–ด ๊ด‘๋ฒ”์œ„ํ•œ ์ž‘์—…์— ์œ ์šฉํ•˜๋‹ค๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. 

ํŒŒ์ด์ฌ๊ณผ NLP

์ž์—ฐ์–ด ์ฒ˜๋ฆฌ(NLP)๋Š” ์ธ๊ฐ„์˜ ์ž์—ฐ ์–ธ์–ด์˜ ์˜๋ฏธ์™€ ์˜๋ฏธ๋ฅผ ์ดํ•ดํ•˜๋Š” ๊ฒƒ์„ ๋ชฉํ‘œ๋กœ ํ•˜๋Š” AI ๋ถ„์•ผ์ž…๋‹ˆ๋‹ค. ํ•™์ œ๊ฐ„ ๋ถ„์•ผ๋Š” ์–ธ์–ดํ•™ ๋ฐ ์ปดํ“จํ„ฐ ๊ณผํ•™ ๋ถ„์•ผ์˜ ๊ธฐ์ˆ ์„ ๊ฒฐํ•ฉํ•˜์—ฌ ์ฑ—๋ด‡ ๋ฐ ๋””์ง€ํ„ธ ๋ณด์กฐ ์žฅ์น˜์™€ ๊ฐ™์€ ๊ธฐ์ˆ ์„ ๋งŒ๋“œ๋Š” ๋ฐ ์‚ฌ์šฉ๋ฉ๋‹ˆ๋‹ค. 

๊ฐ„๋‹จํ•œ ๊ตฌ๋ฌธ๊ณผ ํˆฌ๋ช…ํ•œ ์˜๋ฏธ ์ฒด๊ณ„๋ฅผ ํฌํ•จํ•˜์—ฌ Python์„ NLP ํ”„๋กœ์ ํŠธ๋ฅผ ์œ„ํ•œ ํ›Œ๋ฅญํ•œ ํ”„๋กœ๊ทธ๋ž˜๋ฐ ์–ธ์–ด๋กœ ๋งŒ๋“œ๋Š” ๋งŽ์€ ์ธก๋ฉด์ด ์žˆ์Šต๋‹ˆ๋‹ค. ๊ฐœ๋ฐœ์ž๋Š” ๋˜ํ•œ ๋‹ค๋ฅธ ์–ธ์–ด ๋ฐ ๋„๊ตฌ์™€์˜ ํ†ตํ•ฉ์„ ์œ„ํ•œ ์šฐ์ˆ˜ํ•œ ์ง€์› ์ฑ„๋„์— ์•ก์„ธ์Šคํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. 

์•„๋งˆ๋„ NLP์šฉ Python์˜ ๊ฐ€์žฅ ์ข‹์€ ์ ์€ ๊ฐœ๋ฐœ์ž์—๊ฒŒ ์ฃผ์ œ ๋ชจ๋ธ๋ง, ๋ฌธ์„œ ๋ถ„๋ฅ˜, ํ’ˆ์‚ฌ(POS) ํƒœ๊น…, ๋‹จ์–ด ๋ฒกํ„ฐ, ๊ฐ์ • ๋ถ„์„ ๋“ฑ. 

์ž์—ฐ์–ด ์ฒ˜๋ฆฌ๋ฅผ ์œ„ํ•œ ์ตœ๊ณ ์˜ Python ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ 10๊ฐœ๋ฅผ ์‚ดํŽด๋ณด๊ฒ ์Šต๋‹ˆ๋‹ค. 

1. ์ž์—ฐ์–ด ํˆดํ‚ท (NLTK) 

์šฐ๋ฆฌ ๋ชฉ๋ก์˜ XNUMX์œ„๋Š” NLP๋ฅผ ์œ„ํ•œ ์ตœ๊ณ ์˜ Python ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ๋กœ ๋„๋ฆฌ ์•Œ๋ ค์ง„ NLTK(Natural Language Toolkit)์ž…๋‹ˆ๋‹ค. NLTK๋Š” ๋ถ„๋ฅ˜, ํƒœ๊น…, ์Šคํ…Œ๋ฐ, ๊ตฌ๋ฌธ ๋ถ„์„ ๋ฐ ์˜๋ฏธ๋ก ์  ์ถ”๋ก ๊ณผ ๊ฐ™์€ ์ž‘์—…์„ ์ง€์›ํ•˜๋Š” ํ•„์ˆ˜ ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ์ž…๋‹ˆ๋‹ค. NLP ๋ฐ ๊ธฐ๊ณ„ ํ•™์Šต ๋ถ„์•ผ์— ์ฐธ์—ฌํ•˜๋ ค๋Š” ์ดˆ๋ณด์ž๊ฐ€ ์ž์ฃผ ์„ ํƒํ•ฉ๋‹ˆ๋‹ค. 

NLTK๋Š” ๋‹ค๋ชฉ์  ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ์ด๋ฉฐ ๋ณต์žกํ•œ NLP ๊ธฐ๋Šฅ์„ ๋งŒ๋“œ๋Š” ๋ฐ ๋„์›€์ด ๋ฉ๋‹ˆ๋‹ค. ํŠน์ • ๋ฌธ์ œ์— ๋Œ€ํ•ด ์„ ํƒํ•  ์ˆ˜ ์žˆ๋Š” ๋งŽ์€ ์•Œ๊ณ ๋ฆฌ์ฆ˜ ์„ธํŠธ๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค. NLTK๋Š” ๋‹ค์–‘ํ•œ ์–ธ์–ด์™€ ๋‹ค์ค‘ ์–ธ์–ด๋ฅผ ์œ„ํ•œ ๋ช…๋ช…๋œ ์—”ํ„ฐํ‹ฐ๋ฅผ ์ง€์›ํ•ฉ๋‹ˆ๋‹ค. 

NLTK๋Š” ๋ฌธ์ž์—ด ์ฒ˜๋ฆฌ ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ์ด๋ฏ€๋กœ ๋ฌธ์ž์—ด์„ ์ž…๋ ฅ์œผ๋กœ ์‚ฌ์šฉํ•˜๊ณ  ๋ฌธ์ž์—ด ๋˜๋Š” ๋ฌธ์ž์—ด ๋ชฉ๋ก์„ ์ถœ๋ ฅ์œผ๋กœ ๋ฐ˜ํ™˜ํ•ฉ๋‹ˆ๋‹ค. 

NLP์— NLTK๋ฅผ ์‚ฌ์šฉํ•  ๋•Œ์˜ ์žฅ๋‹จ์ : 

  • ์žฅ์  :
    • ๊ฐ€์žฅ ์ž˜ ์•Œ๋ ค์ง„ NLP ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ
    • ํƒ€์‚ฌ ํ™•์žฅ
  • ๋‹จ์  : 
    • ํ•™์Šต ๊ณก์„ 
    • ๋•Œ๋•Œ๋กœ ์ฒœ์ฒœํžˆ
    • ์‹ ๊ฒฝ๋ง ๋ชจ๋ธ ์—†์Œ
    • ํ…์ŠคํŠธ๋งŒ ๋ฌธ์žฅ์œผ๋กœ ๋‚˜๋ˆ•๋‹ˆ๋‹ค.

2. ์ŠคํŒŒ

SpaCy๋Š” ํ”„๋กœ๋•์…˜ ์šฉ๋„๋กœ ๋ช…์‹œ์ ์œผ๋กœ ์„ค๊ณ„๋œ ์˜คํ”ˆ ์†Œ์Šค NLP ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ์ž…๋‹ˆ๋‹ค. SpaCy๋ฅผ ์‚ฌ์šฉํ•˜๋ฉด ๊ฐœ๋ฐœ์ž๋Š” ์—„์ฒญ๋‚œ ์–‘์˜ ํ…์ŠคํŠธ๋ฅผ ์ฒ˜๋ฆฌํ•˜๊ณ  ์ดํ•ดํ•  ์ˆ˜ ์žˆ๋Š” ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜์„ ๋งŒ๋“ค ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. Python ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ๋Š” ์ž์—ฐ์–ด ์ดํ•ด ์‹œ์Šคํ…œ ๋ฐ ์ •๋ณด ์ถ”์ถœ ์‹œ์Šคํ…œ์„ ๊ตฌ์ถ•ํ•˜๋Š” ๋ฐ ์ž์ฃผ ์‚ฌ์šฉ๋ฉ๋‹ˆ๋‹ค. 

spaCy์˜ ๋‹ค๋ฅธ ์ฃผ์š” ์ด์  ์ค‘ ํ•˜๋‚˜๋Š” ์‚ฌ์ „ ํ›ˆ๋ จ๋œ ํ†ต๊ณ„ ๋ชจ๋ธ ๋ฐ ๋‹จ์–ด ๋ฒกํ„ฐ๊ฐ€ ๋กœ๋“œ๋˜์–ด 49๊ฐœ ์ด์ƒ์˜ ์–ธ์–ด์— ๋Œ€ํ•œ ํ† ํฐํ™”๋ฅผ ์ง€์›ํ•œ๋‹ค๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. spaCy์˜ ์ฃผ์š” ์‚ฌ์šฉ ์‚ฌ๋ก€์—๋Š” ๊ฒ€์ƒ‰ ์ž๋™ ์™„์„ฑ, ์ž๋™ ์ˆ˜์ •, ์˜จ๋ผ์ธ ๋ฆฌ๋ทฐ ๋ถ„์„, ์ฃผ์š” ์ฃผ์ œ ์ถ”์ถœ ๋“ฑ์ด ํฌํ•จ๋ฉ๋‹ˆ๋‹ค.

NLP์— spaCy๋ฅผ ์‚ฌ์šฉํ•  ๋•Œ์˜ ์žฅ๋‹จ์ : 

  • ์žฅ์  :
    • ๋น ๋ฅธ
    • ์‰ฌ์šด ์‚ฌ์šฉ
    • ์ดˆ๋ณด ๊ฐœ๋ฐœ์ž์—๊ฒŒ ์ ํ•ฉ
    • ๋ชจ๋ธ ํ•™์Šต์„ ์œ„ํ•ด ์‹ ๊ฒฝ๋ง์— ์˜์กด
  • ๋‹จ์  : 
    • NLTK์™€ ๊ฐ™์€ ๋‹ค๋ฅธ ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ๋งŒํผ ์œ ์—ฐํ•˜์ง€ ์•Š์Œ

3. ๊ฒ์‹ฌ

NLP๋ฅผ ์œ„ํ•œ ๋˜ ๋‹ค๋ฅธ ์ตœ๊ณ ์˜ Python ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ๋Š” Gensim์ž…๋‹ˆ๋‹ค. ์›๋ž˜ ์ฃผ์ œ ๋ชจ๋ธ๋ง์šฉ์œผ๋กœ ๊ฐœ๋ฐœ๋œ ์ด ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ๋Š” ํ˜„์žฌ ๋ฌธ์„œ ์ธ๋ฑ์‹ฑ๊ณผ ๊ฐ™์€ ๋‹ค์–‘ํ•œ NLP ์ž‘์—…์— ์‚ฌ์šฉ๋ฉ๋‹ˆ๋‹ค. Gensim์€ ์•Œ๊ณ ๋ฆฌ์ฆ˜์— ์˜์กดํ•˜์—ฌ RAM๋ณด๋‹ค ํฐ ์ž…๋ ฅ์„ ์ฒ˜๋ฆฌํ•ฉ๋‹ˆ๋‹ค. 

์ง๊ด€์ ์ธ ์ธํ„ฐํŽ˜์ด์Šค๋ฅผ ํ†ตํ•ด Gensim์€ LSA(Latent Semantic Analysis) ๋ฐ LDA(Latent Dirichlet Allocation)์™€ ๊ฐ™์€ ์•Œ๊ณ ๋ฆฌ์ฆ˜์˜ ํšจ์œจ์ ์ธ ๋ฉ€ํ‹ฐ์ฝ”์–ด ๊ตฌํ˜„์„ ๋‹ฌ์„ฑํ•ฉ๋‹ˆ๋‹ค. ๋„์„œ๊ด€์˜ ๋‹ค๋ฅธ ์ฃผ์š” ์‚ฌ์šฉ ์‚ฌ๋ก€ ์ค‘ ์ผ๋ถ€๋Š” ํ…์ŠคํŠธ ์œ ์‚ฌ์„ฑ์„ ์ฐพ๊ณ  ๋‹จ์–ด์™€ ๋ฌธ์„œ๋ฅผ ๋ฒกํ„ฐ๋กœ ๋ณ€ํ™˜ํ•˜๋Š” ๊ฒƒ์„ ํฌํ•จํ•ฉ๋‹ˆ๋‹ค. 

NLP์šฉ Gensim ์‚ฌ์šฉ์˜ ์žฅ๋‹จ์ : 

  • ์žฅ์  :
    • ์ง๊ด€์  ์ธ ์ธํ„ฐํŽ˜์ด์Šค
    • ํ™•์žฅ
    • LSA ๋ฐ LDA์™€ ๊ฐ™์€ ๋„๋ฆฌ ์‚ฌ์šฉ๋˜๋Š” ์•Œ๊ณ ๋ฆฌ์ฆ˜์˜ ํšจ์œจ์ ์ธ ๊ตฌํ˜„
  • ๋‹จ์  : 
    • ๊ฐ๋…๋˜์ง€ ์•Š์€ ํ…์ŠคํŠธ ๋ชจ๋ธ๋ง์„ ์œ„ํ•ด ์„ค๊ณ„๋จ
    • ์ข…์ข… NLTK์™€ ๊ฐ™์€ ๋‹ค๋ฅธ ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ์™€ ํ•จ๊ป˜ ์‚ฌ์šฉํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค.

5. ์ฝ”์–ดNLP 

Stanford CoreNLP๋Š” ์–ธ์–ด ๋ถ„์„ ๋„๊ตฌ๋ฅผ ํ…์ŠคํŠธ์— ์ ์šฉํ•˜๋Š” ๋ฐ ๋„์›€์ด ๋˜๋Š” ๋‹ค์–‘ํ•œ ์ธ๊ฐ„ ์–ธ์–ด ๊ธฐ์ˆ  ๋„๊ตฌ๋กœ ๊ตฌ์„ฑ๋œ ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ์ž…๋‹ˆ๋‹ค. CoreNLP๋ฅผ ์‚ฌ์šฉํ•˜๋ฉด ๋‹จ ๋ช‡ ์ค„์˜ ์ฝ”๋“œ๋กœ ๋ช…๋ช…๋œ ์—”ํ„ฐํ‹ฐ ์ธ์‹, ํ’ˆ์‚ฌ ํƒœ๊น… ๋“ฑ๊ณผ ๊ฐ™์€ ๊ด‘๋ฒ”์œ„ํ•œ ํ…์ŠคํŠธ ์†์„ฑ์„ ์ถ”์ถœํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. 

CoreNLP์˜ ๊ณ ์œ ํ•œ ์ธก๋ฉด ์ค‘ ํ•˜๋‚˜๋Š” ํŒŒ์„œ, ๊ฐ์ • ๋ถ„์„, ํ’ˆ์‚ฌ(POS) ํƒœ๊ฑฐ ๋ฐ ๋ช…๋ช…๋œ ์—”ํ„ฐํ‹ฐ ์ธ์‹๊ธฐ(NER)์™€ ๊ฐ™์€ ์Šคํƒ ํฌ๋“œ NLP ๋„๊ตฌ๋ฅผ ํ†ตํ•ฉํ•œ๋‹ค๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. ์˜์–ด, ์•„๋ž์–ด, ์ค‘๊ตญ์–ด, ๋…์ผ์–ด, ํ”„๋ž‘์Šค์–ด, ์ŠคํŽ˜์ธ์–ด ์ด XNUMX๊ฐœ ์–ธ์–ด๋ฅผ ์ง€์›ํ•ฉ๋‹ˆ๋‹ค. 

NLP์— CoreNLP ์‚ฌ์šฉ์˜ ์žฅ๋‹จ์ : 

  • ์žฅ์  :
    • ์‰ฌ์šด ์‚ฌ์šฉ
    • ๋‹ค์–‘ํ•œ ์ ‘๊ทผ๋ฒ• ๊ฒฐํ•ฉ 
    • ์˜คํ”ˆ ์†Œ์Šค ๋ผ์ด์„ ์Šค
  • ๋‹จ์  : 
    • ์˜ค๋ž˜๋œ ์ธํ„ฐํŽ˜์ด์Šค
    • spaCy์™€ ๊ฐ™์€ ๋‹ค๋ฅธ ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ๋งŒํผ ๊ฐ•๋ ฅํ•˜์ง€ ์•Š์Œ

5. ๋ฌด๋Šฌ

ํŒจํ„ด์€ NLP์šฉ ์˜ฌ์ธ์› Python ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ๋ฅผ ์ฐพ๋Š” ๋ชจ๋“  ์‚ฌ๋žŒ์—๊ฒŒ ํ›Œ๋ฅญํ•œ ์˜ต์…˜์ž…๋‹ˆ๋‹ค. NLP, ๋ฐ์ดํ„ฐ ๋งˆ์ด๋‹, ๋„คํŠธ์›Œํฌ ๋ถ„์„, ๊ธฐ๊ณ„ ํ•™์Šต ๋ฐ ์‹œ๊ฐํ™”๋ฅผ ์ฒ˜๋ฆฌํ•  ์ˆ˜ ์žˆ๋Š” ๋‹ค๋ชฉ์  ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ์ž…๋‹ˆ๋‹ค. ์—ฌ๊ธฐ์—๋Š” ๊ฒ€์ƒ‰ ์—”์ง€๋‹ˆ์–ด, Wikipedia ๋ฐ ์†Œ์…œ ๋„คํŠธ์›Œํฌ์˜ ๋ฐ์ดํ„ฐ ๋งˆ์ด๋‹์„ ์œ„ํ•œ ๋ชจ๋“ˆ์ด ํฌํ•จ๋ฉ๋‹ˆ๋‹ค. 

ํŒจํ„ด์€ NLP ์ž‘์—…์— ๊ฐ€์žฅ ์œ ์šฉํ•œ ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ ์ค‘ ํ•˜๋‚˜๋กœ ๊ฐ„์ฃผ๋˜๋ฉฐ ์ตœ์ƒ๊ธ‰ ๋ฐ ๋น„๊ต๊ธ‰ ์ฐพ๊ธฐ, ์‚ฌ์‹ค ๋ฐ ์˜๊ฒฌ ๊ฐ์ง€์™€ ๊ฐ™์€ ๊ธฐ๋Šฅ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ๊ธฐ๋Šฅ์€ ๋‹ค๋ฅธ ์ƒ์œ„ ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ ์ค‘์—์„œ ๋ˆˆ์— ๋„๋Š” ๋ฐ ๋„์›€์ด ๋ฉ๋‹ˆ๋‹ค. 

NLP์šฉ ํŒจํ„ด ์‚ฌ์šฉ์˜ ์žฅ๋‹จ์ : 

  • ์žฅ์  :
    • ๋ฐ์ดํ„ฐ ๋งˆ์ด๋‹ ์›น ์„œ๋น„์Šค
    • ๋„คํŠธ์›Œํฌ ๋ถ„์„ ๋ฐ ์‹œ๊ฐํ™”
  • ๋‹จ์  : 
    • ์ผ๋ถ€ NLP ์ž‘์—…์— ๋Œ€ํ•œ ์ตœ์ ํ™” ๋ถ€์กฑ

6. ํ…์ŠคํŠธ๋ธ”๋กญ

Python์—์„œ NLP๋ฅผ ์‹œ์ž‘ํ•˜๋ ค๋Š” ๊ฐœ๋ฐœ์ž๋ฅผ ์œ„ํ•œ ํ›Œ๋ฅญํ•œ ์˜ต์…˜์ธ TextBlob์€ NLTK๋ฅผ ์œ„ํ•œ ์ข‹์€ ์ค€๋น„๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค. ์ดˆ๋ณด์ž๊ฐ€ ๊ฐ์ • ๋ถ„์„ ๋ฐ ๋ช…์‚ฌ๊ตฌ ์ถ”์ถœ๊ณผ ๊ฐ™์€ ๊ธฐ๋ณธ NLP ์‘์šฉ ํ”„๋กœ๊ทธ๋žจ์„ ๋น ๋ฅด๊ฒŒ ๋ฐฐ์šธ ์ˆ˜ ์žˆ๋Š” ์‚ฌ์šฉํ•˜๊ธฐ ์‰ฌ์šด ์ธํ„ฐํŽ˜์ด์Šค๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค. 

TextBlob์˜ ๋˜ ๋‹ค๋ฅธ ์ตœ๊ณ  ์‘์šฉ ํ”„๋กœ๊ทธ๋žจ์€ ๋ณต์žกํ•œ ํŠน์„ฑ์„ ๊ฐ์•ˆํ•  ๋•Œ ์ธ์ƒ์ ์ธ ๋ฒˆ์—ญ์ž…๋‹ˆ๋‹ค. ์ฆ‰, TextBlob์€ ๋‚ฎ์€ ์„ฑ๋Šฅ์˜ NLTK๋ฅผ ์ƒ์†ํ•˜๋ฏ€๋กœ ๋Œ€๊ทœ๋ชจ ์ƒ์‚ฐ์— ์‚ฌ์šฉํ•ด์„œ๋Š” ์•ˆ ๋ฉ๋‹ˆ๋‹ค. 

NLP์šฉ TextBlob ์‚ฌ์šฉ์˜ ์žฅ๋‹จ์ : 

  • ์žฅ์  :
    • ์ดˆ๋ณด์ž์—๊ฒŒ ์ข‹์Šต๋‹ˆ๋‹ค
    • NLTK๋ฅผ ์œ„ํ•œ ํ† ๋Œ€ ์ œ๊ณต
    • ์‚ฌ์šฉํ•˜๊ธฐ ์‰ฌ์šด ์ธํ„ฐํŽ˜์ด์Šค
  • ๋‹จ์  : 
    • NLTK์—์„œ ๋ฌผ๋ ค๋ฐ›์€ ๋‚ฎ์€ ์„ฑ๋Šฅ
    • ๋Œ€๊ทœ๋ชจ ์ƒ์‚ฐ ์šฉ๋„๋กœ๋Š” ์ ํ•ฉํ•˜์ง€ ์•Š์Œ

7. PyNLPI 

'ํŒŒ์ธ์• ํ”Œ'๋กœ ๋ฐœ์Œ๋˜๋Š” PyNLPI๋Š” NLP์šฉ Python ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ ์ค‘ ํ•˜๋‚˜์ž…๋‹ˆ๋‹ค. ์—ฌ๊ธฐ์—๋Š” NLP ์ž‘์—…์„ ์œ„ํ•œ ๋‹ค์–‘ํ•œ ๋งž์ถคํ˜• Python ๋ชจ๋“ˆ์ด ํฌํ•จ๋˜์–ด ์žˆ์œผ๋ฉฐ ์ฃผ์š” ๊ธฐ๋Šฅ ์ค‘ ํ•˜๋‚˜๋Š” FoLiA XML(์–ธ์–ด ์ฃผ์„ ํ˜•์‹) ์ž‘์—…์„ ์œ„ํ•œ ๊ด‘๋ฒ”์œ„ํ•œ ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ์ž…๋‹ˆ๋‹ค. 

๋ถ„๋ฆฌ๋œ ๊ฐ ๋ชจ๋“ˆ๊ณผ ํŒจํ‚ค์ง€๋Š” ํ‘œ์ค€ ๋ฐ ๊ณ ๊ธ‰ NLP ์ž‘์—…์— ์œ ์šฉํ•ฉ๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ์ž‘์—… ์ค‘ ์ผ๋ถ€์—๋Š” n-gram ์ถ”์ถœ, ๋นˆ๋„ ๋ชฉ๋ก ๋ฐ ๋‹จ์ˆœํ•˜๊ฑฐ๋‚˜ ๋ณต์žกํ•œ ์–ธ์–ด ๋ชจ๋ธ ๊ตฌ์ถ•์ด ํฌํ•จ๋ฉ๋‹ˆ๋‹ค.

NLP์— PyNLPI ์‚ฌ์šฉ์˜ ์žฅ๋‹จ์ : 

  • ์žฅ์  :
    • n-gram ์ถ”์ถœ ๋ฐ ๊ธฐํƒ€ ๊ธฐ๋ณธ ์ž‘์—…
    • ๋ชจ๋“ˆ๋Ÿฌ ๊ตฌ์กฐ
  • ๋‹จ์  : 
    • ์ œํ•œ๋œ ๋ฌธ์„œ 

8. ์‚ฌ์ด ํ‚ท ํ•™์Šต

์›๋ž˜ SciPy ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ์— ๋Œ€ํ•œ ํƒ€์‚ฌ ํ™•์žฅ์ธ scikit-learn์€ ์ด์ œ Github์˜ ๋…๋ฆฝ ์‹คํ–‰ํ˜• Python ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ์ž…๋‹ˆ๋‹ค. Spotify์™€ ๊ฐ™์€ ๋Œ€๊ธฐ์—…์—์„œ ํ™œ์šฉํ•˜๊ณ  ์žˆ์œผ๋ฉฐ ์‚ฌ์šฉํ•˜๋ฉด ๋งŽ์€ ์ด์ ์ด ์žˆ์Šต๋‹ˆ๋‹ค. ํ•˜๋‚˜๋Š” ์ŠคํŒธ ํƒ์ง€, ์ด๋ฏธ์ง€ ์ธ์‹, ์˜ˆ์ธก, ๊ณ ๊ฐ ๋ถ„๋ฅ˜์™€ ๊ฐ™์€ ๊ณ ์ „์ ์ธ ๊ธฐ๊ณ„ ํ•™์Šต ์•Œ๊ณ ๋ฆฌ์ฆ˜์— ๋งค์šฐ ์œ ์šฉํ•ฉ๋‹ˆ๋‹ค. 

์ฆ‰, scikit-learn์€ ์ง€๋„ ๋จธ์‹  ๋Ÿฌ๋‹์—์„œ ๊ฐ€์žฅ ์ค‘์š”ํ•œ ์ž‘์—… ์ค‘ ํ•˜๋‚˜์ธ ํ…์ŠคํŠธ ๋ถ„๋ฅ˜์™€ ๊ฐ™์€ NLP ์ž‘์—…์—๋„ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋˜ ๋‹ค๋ฅธ ์ฃผ์š” ์‚ฌ์šฉ ์‚ฌ๋ก€๋Š” ๊ฐ์ • ๋ถ„์„์œผ๋กœ, scikit-learn์€ ๋ฐ์ดํ„ฐ๋ฅผ ํ†ตํ•ด ์˜๊ฒฌ์ด๋‚˜ ๊ฐ์ •์„ ๋ถ„์„ํ•˜๋Š” ๋ฐ ๋„์›€์„ ์ค„ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

NLP์— PyNLPI ์‚ฌ์šฉ์˜ ์žฅ๋‹จ์ : 

  • ์žฅ์  :
    • ๋‹ค์–‘ํ•œ ๋ชจ๋ธ๊ณผ ์•Œ๊ณ ๋ฆฌ์ฆ˜์œผ๋กœ ๋‹ค์žฌ๋‹ค๋Šฅํ•จ
    • SciPy ๋ฐ NumPy ๊ธฐ๋ฐ˜
    • ์‹ค์ œ ์‘์šฉ ํ”„๋กœ๊ทธ๋žจ์˜ ์ž…์ฆ๋œ ๊ธฐ๋ก
  • ๋‹จ์  : 
    • ๋”ฅ ๋Ÿฌ๋‹์— ๋Œ€ํ•œ ์ œํ•œ๋œ ์ง€์›

9. ํด๋ฆฌ ๊ธ€๋กฏ

์šฐ๋ฆฌ ๋ชฉ๋ก์˜ ๊ฑฐ์˜ ๋งˆ์ง€๋ง‰์—๋Š” ๋‹ค์–‘ํ•œ NLP ์ž‘์—…์„ ์ˆ˜ํ–‰ํ•˜๋Š” ๋ฐ ์‚ฌ์šฉ๋˜๋Š” ์˜คํ”ˆ ์†Œ์Šค Python ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ์ธ Polyglot์ด ์žˆ์Šต๋‹ˆ๋‹ค. Numpy๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ํ•˜๋ฉฐ ๋งค์šฐ ๋‹ค์–‘ํ•œ ์ „์šฉ ๋ช…๋ น์„ ์ œ๊ณตํ•˜๋Š” ๋งค์šฐ ๋น ๋ฅธ ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ์ž…๋‹ˆ๋‹ค. 

Polyglot์ด NLP์— ๋งค์šฐ ์œ ์šฉํ•œ ์ด์œ  ์ค‘ ํ•˜๋‚˜๋Š” ๊ด‘๋ฒ”์œ„ํ•œ ๋‹ค๊ตญ์–ด ์‘์šฉ ํ”„๋กœ๊ทธ๋žจ์„ ์ง€์›ํ•˜๊ธฐ ๋•Œ๋ฌธ์ž…๋‹ˆ๋‹ค. ์„ค๋ช…์„œ์—๋Š” 165๊ฐœ ์–ธ์–ด์— ๋Œ€ํ•œ ํ† ํฐํ™”, 196๊ฐœ ์–ธ์–ด์— ๋Œ€ํ•œ ์–ธ์–ด ๊ฐ์ง€ ๋ฐ 16๊ฐœ ์–ธ์–ด์— ๋Œ€ํ•œ ํ’ˆ์‚ฌ ํƒœ๊น…์„ ์ง€์›ํ•˜๋Š” ๊ฒƒ์œผ๋กœ ๋‚˜์™€ ์žˆ์Šต๋‹ˆ๋‹ค. 

NLP์— Polyglot ์‚ฌ์šฉ์˜ ์žฅ๋‹จ์ : 

  • ์žฅ์  :
    • ์ผ๋ถ€ ์ž‘์—…์—์„œ 200๊ฐœ์— ๊ฐ€๊นŒ์šด ์ธ๊ฐ„ ์–ธ์–ด๋ฅผ ์‚ฌ์šฉํ•˜๋Š” ๋‹ค๊ตญ์–ด
    • NumPy ์œ„์— ๊ตฌ์ถ•
  • ๋‹จ์  : 
    • NLTK ๋ฐ spaCy์™€ ๊ฐ™์€ ๋‹ค๋ฅธ ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ์™€ ๋น„๊ตํ•  ๋•Œ ๋” ์ž‘์€ ์ปค๋ฎค๋‹ˆํ‹ฐ

10. ํŒŒ์ด ํ† ์น˜

NLP๋ฅผ ์œ„ํ•œ ์ตœ๊ณ ์˜ Python ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ 10๊ฐœ ๋ชฉ๋ก์„ ๋งˆ๋ฌด๋ฆฌํ•˜๋Š” ๊ฒƒ์€ 2016๋…„ Facebook์˜ AI ์—ฐ๊ตฌํŒ€์ด ๋งŒ๋“  ์˜คํ”ˆ ์†Œ์Šค ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ์ธ PyTorch์ž…๋‹ˆ๋‹ค. ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ ์ด๋ฆ„์€ Lua ํ”„๋กœ๊ทธ๋ž˜๋ฐ ์–ธ์–ด๋กœ ์ž‘์„ฑ๋œ ๋”ฅ ๋Ÿฌ๋‹ ํ”„๋ ˆ์ž„์›Œํฌ์ธ Torch์—์„œ ํŒŒ์ƒ๋˜์—ˆ์Šต๋‹ˆ๋‹ค. . 

PyTorch๋ฅผ ์‚ฌ์šฉํ•˜๋ฉด ๋งŽ์€ ์ž‘์—…์„ ์ˆ˜ํ–‰ํ•  ์ˆ˜ ์žˆ์œผ๋ฉฐ ํŠนํžˆ NLP ๋ฐ ์ปดํ“จํ„ฐ ๋น„์ „๊ณผ ๊ฐ™์€ ๋”ฅ ๋Ÿฌ๋‹ ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜์— ์œ ์šฉํ•ฉ๋‹ˆ๋‹ค. 

PyTorch์˜ ๊ฐ€์žฅ ์ข‹์€ ์  ์ค‘ ์ผ๋ถ€๋Š” ๋น ๋ฅธ ์‹คํ–‰ ์†๋„๋ฅผ ํฌํ•จํ•˜๋ฉฐ, ์ด๋Š” ๋ฌด๊ฑฐ์šด ๊ทธ๋ž˜ํ”„๋ฅผ ์ฒ˜๋ฆฌํ•  ๋•Œ๋„ ๋‹ฌ์„ฑํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋˜ํ•œ ๋‹จ์ˆœํ™”๋œ ํ”„๋กœ์„ธ์„œ ๋˜๋Š” CPU ๋ฐ GPU์—์„œ ์ž‘๋™ํ•  ์ˆ˜ ์žˆ๋Š” ์œ ์—ฐํ•œ ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ์ž…๋‹ˆ๋‹ค. PyTorch์—๋Š” ์ž์—ฐ์–ด ํˆดํ‚ท๋ฟ๋งŒ ์•„๋‹ˆ๋ผ ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ์—์„œ ํ™•์žฅํ•  ์ˆ˜ ์žˆ๋Š” ๊ฐ•๋ ฅํ•œ API๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค. 

NLP์— Pytorch๋ฅผ ์‚ฌ์šฉํ•  ๋•Œ์˜ ์žฅ๋‹จ์ : 

  • ์žฅ์  :
    • ๊ฐ•๋ ฅํ•œ ํ”„๋ ˆ์ž„์›Œํฌ
    • ํด๋ผ์šฐ๋“œ ํ”Œ๋žซํผ ๋ฐ ์ƒํƒœ๊ณ„
  • ๋‹จ์  : 
    • ์ผ๋ฐ˜ ๊ธฐ๊ณ„ ํ•™์Šต ํˆดํ‚ท
    • ํ•ต์‹ฌ NLP ์•Œ๊ณ ๋ฆฌ์ฆ˜์— ๋Œ€ํ•œ ์‹ฌ์ธต ์ง€์‹ ํ•„์š” 

Alex McFarland๋Š” ์ธ๊ณต ์ง€๋Šฅ์˜ ์ตœ์‹  ๊ฐœ๋ฐœ์„ ํƒ๊ตฌํ•˜๋Š” AI ์ €๋„๋ฆฌ์ŠคํŠธ์ด์ž ์ž‘๊ฐ€์ž…๋‹ˆ๋‹ค. ๊ทธ๋Š” ์ „ ์„ธ๊ณ„ ์ˆ˜๋งŽ์€ AI ์Šคํƒ€ํŠธ์—… ๋ฐ ์ถœํŒ๋ฌผ๊ณผ ํ˜‘๋ ฅํ•ด ์™”์Šต๋‹ˆ๋‹ค.