Rescale λ―ΈνŒ… μ˜ˆμ•½

HITL(Human-in-the-Loop)μ΄λž€ λ¬΄μ—‡μž…λ‹ˆκΉŒ?

인곡지λŠ₯

HITL(Human-in-the-Loop)μ΄λž€ λ¬΄μ—‡μž…λ‹ˆκΉŒ?

Unsplash의 Drew Dizzy Graham 사진

인곡지λŠ₯(AI)κ³Ό λ¨Έμ‹ λŸ¬λ‹(ML)을 λ‹€λ£° λ•Œ μ ‘ν•  수 μžˆλŠ” μš©μ–΄ 쀑 ν•˜λ‚˜κ°€ HITL(Human-In-The-Loop)μž…λ‹ˆλ‹€. 그것은 마치 μ†Œλ¦¬μ™€ κ°™μŠ΅λ‹ˆλ‹€. HITL은 기계 ν•™μŠ΅ λͺ¨λΈμ„ 생성할 λ•Œ 인간과 기계 μ§€λŠ₯을 λͺ¨λ‘ μ‚¬μš©ν•˜λŠ” AI의 ν•œ λΆ„μ•Όμž…λ‹ˆλ‹€.

휴먼 인 더 루프(Human-in-the-Loop) μ ‘κ·Ό 방식은 ꡐ윑, μ‘°μ • 및 ν…ŒμŠ€νŠΈμ˜ μ•Œκ³ λ¦¬μ¦˜ 주기에 μ‚¬λžŒλ“€μ΄ 참여함을 μ˜λ―Έν•©λ‹ˆλ‹€.

λͺ¨λΈμ΄ κ³ ν’ˆμ§ˆ 및 λŒ€λŸ‰ ꡐ윑 데이터λ₯Ό λ‹¬μ„±ν•˜λŠ” 데 도움이 λ˜λŠ” Humans first λ ˆμ΄λΈ” λ°μ΄ν„°μž…λ‹ˆλ‹€. 그런 λ‹€μŒ 기계 ν•™μŠ΅ μ•Œκ³ λ¦¬μ¦˜μ€ μ‚¬λžŒμ΄ λͺ¨λΈμ„ λ―Έμ„Έ μ‘°μ •ν•˜κΈ° 전에 데이터λ₯Ό 기반으둜 결정을 λ‚΄λ¦¬λŠ” 방법을 λ°°μ›λ‹ˆλ‹€.

그런 λ‹€μŒ 좜λ ₯ 점수λ₯Ό 맀겨 인간이 λͺ¨λΈμ„ ν…ŒμŠ€νŠΈν•˜κ³  검증할 수 μžˆμŠ΅λ‹ˆλ‹€. 이 ν”„λ‘œμ„ΈμŠ€λŠ” μ•Œκ³ λ¦¬μ¦˜μ΄ νŒλ‹¨μ— λŒ€ν•΄ μžμ‹ μ΄ μ—†κ±°λ‚˜ 잘λͺ»λœ 결정에 λŒ€ν•΄ λ„ˆλ¬΄ μžμ‹ μ΄ μžˆλŠ” κ²½μš°μ— 특히 μœ μš©ν•©λ‹ˆλ‹€.

HITL ν”„λ‘œμ„ΈμŠ€λŠ” 지속적인 ν”Όλ“œλ°± λ£¨ν”„μž…λ‹ˆλ‹€. 즉, 각각의 ꡐ윑, μ‘°μ • 및 ν…ŒμŠ€νŠΈ μž‘μ—…μ΄ μ•Œκ³ λ¦¬μ¦˜μ— ν”Όλ“œλ°±λ©λ‹ˆλ‹€. 이 ν”„λ‘œμ„ΈμŠ€λ₯Ό 톡해 μ•Œκ³ λ¦¬μ¦˜μ€ μ‹œκ°„μ΄ 지남에 따라 λ”μš± 효과적이고 μ •ν™•ν•΄μ§€λ©° νŠΉμ • μ‚¬μš© 사둀에 λŒ€ν•œ 맀우 μ •ν™•ν•˜κ³  λ§Žμ€ μ–‘μ˜ ν›ˆλ ¨ 데이터λ₯Ό μƒμ„±ν•˜λŠ” 데 특히 μœ μš©ν•©λ‹ˆλ‹€. μΈκ°„μ˜ 톡찰λ ₯은 쑰직이 κ°€μž₯ μ •ν™•ν•˜κ³  μ‹€ν–‰ κ°€λŠ₯ν•œ 결정을 내릴 수 μžˆλ„λ‘ λͺ¨λΈμ„ μ‘°μ •ν•˜κ³  ν…ŒμŠ€νŠΈν•˜λŠ” 데 도움이 λ©λ‹ˆλ‹€.

이미지: μŠ€νƒ ν¬λ“œ λŒ€ν•™κ΅

HITL 기계 ν•™μŠ΅μ˜ μ€‘μš”μ„±

HITL은 κΈ°μ‘΄ 기계 ν•™μŠ΅ λͺ¨λΈμ΄ μ •ν™•ν•œ μ˜ˆμΈ‘μ„ λ‹¬μ„±ν•˜κΈ° μœ„ν•΄ λ§Žμ€ 수의 λ ˆμ΄λΈ”μ΄ μ§€μ •λœ 데이터 포인트λ₯Ό ν•„μš”λ‘œ ν•˜κΈ° λ•Œλ¬Έμ— AI의 맀우 μ€‘μš”ν•œ μ§€μ μž…λ‹ˆλ‹€. 데이터가 λΆ€μ‘±ν•˜λ©΄ 기계 ν•™μŠ΅ λͺ¨λΈμ΄ μœ μš©ν•˜μ§€ μ•ŠμŠ΅λ‹ˆλ‹€.

μ–Έμ–΄ ν•™μŠ΅μ„ 예둜 λ“€μ–΄ λ³΄κ² μŠ΅λ‹ˆλ‹€. 수천 λͺ…μ˜ μ‚¬λžŒλ“€λ§Œ μ‚¬μš©ν•˜λŠ” μ–Έμ–΄κ°€ 있고 기계 ν•™μŠ΅μ„ 톡해 ν•΄λ‹Ή 언어에 λŒ€ν•œ 톡찰λ ₯을 μ–»μœΌλ €λŠ” 경우 λͺ¨λΈμ΄ ν•™μŠ΅ν•  μΆ©λΆ„ν•œ 예λ₯Ό μ°ΎκΈ° μ–΄λ €μšΈ 수 μžˆμŠ΅λ‹ˆλ‹€. HITL μ ‘κ·Ό 방식을 μ‚¬μš©ν•˜λ©΄ μ΄λŸ¬ν•œ 데이터 μ„ΈνŠΈμ˜ 정확성을 보μž₯ν•  수 μžˆμŠ΅λ‹ˆλ‹€.

의료 산업은 λ˜ν•œ HITL μ‹œμŠ€ν…œμ— κ°€μž₯ μ€‘μš”ν•œ μ‚°μ—… 쀑 ν•˜λ‚˜μž…λ‹ˆλ‹€. Stanford의 2018λ…„ 연ꡬ에 λ”°λ₯΄λ©΄ HITL λͺ¨λΈμ€ AIλ‚˜ 인간보닀 더 잘 μž‘λ™ν•©λ‹ˆλ‹€.

HITL μ‹œμŠ€ν…œμ€ μ „ 세계 λ§Žμ€ μ‚°μ—…μ—μ„œ μ€‘μš”ν•œ 인간 μˆ˜μ€€μ˜ ν‘œμ€€μ„ μœ μ§€ν•˜λ©΄μ„œ 정확도λ₯Ό ν–₯μƒμ‹œν‚΅λ‹ˆλ‹€.

HITL μ‹œμŠ€ν…œμ„ μ‚¬μš©ν•΄μ•Ό ν•˜λŠ” 경우

인간 μ°Έμ—¬ν˜•(Human-in-the-Loop) 기계 ν•™μŠ΅μ„ μ‚¬μš©ν•΄μ•Ό ν•˜λŠ” AI 수λͺ… μ£ΌκΈ°μ—λŠ” λ‹€μŒκ³Ό 같은 λͺ‡ κ°€μ§€ νŠΉμ • μ‹œκ°„μ΄ μžˆμŠ΅λ‹ˆλ‹€.

HITL μ ‘κ·Ό 방식이 λͺ¨λ“  기계 ν•™μŠ΅ ν”„λ‘œμ νŠΈμ— μ ν•©ν•˜μ§€ μ•Šλ‹€λŠ” 점에 μœ μ˜ν•˜λŠ” 것이 μ€‘μš”ν•©λ‹ˆλ‹€. μ‚¬μš© κ°€λŠ₯ν•œ 데이터가 λ§Žμ§€ μ•Šμ„ λ•Œ 주둜 μ‚¬μš©λ©λ‹ˆλ‹€.

Human-in-the-Loop λ”₯ λŸ¬λ‹μ€ 인간과 기계 ν•™μŠ΅ ν”„λ‘œμ„ΈμŠ€κ°€ λ‹€μŒκ³Ό 같은 νŠΉμ • μ‹œλ‚˜λ¦¬μ˜€μ—μ„œ μƒν˜Έ μž‘μš©ν•  λ•Œ μ‚¬μš©λ©λ‹ˆλ‹€. μ•Œκ³ λ¦¬μ¦˜μ΄ μž…λ ₯을 μ΄ν•΄ν•˜μ§€ λͺ»ν•©λ‹ˆλ‹€. 데이터 μž…λ ₯이 잘λͺ» ν•΄μ„λ©λ‹ˆλ‹€. μ•Œκ³ λ¦¬μ¦˜μ€ νŠΉμ • μž‘μ—…μ„ μˆ˜ν–‰ν•˜λŠ” 방법을 λͺ¨λ¦…λ‹ˆλ‹€. 기계 ν•™μŠ΅ λͺ¨λΈμ€ 더 μ •ν™•ν•΄μ•Ό ν•©λ‹ˆλ‹€. 인간 ꡬ성 μš”μ†ŒλŠ” 보닀 효율적이고 μ •ν™•ν•΄μ•Ό ν•©λ‹ˆλ‹€. ML κ°œλ°œμ—μ„œ 였λ₯˜ λΉ„μš©μ΄ λ„ˆλ¬΄ λ†’μŠ΅λ‹ˆλ‹€. μ›ν•˜λŠ” 데이터λ₯Ό μ‚¬μš©ν•  수 μ—†μŠ΅λ‹ˆλ‹€.

HITL용 데이터 라벨링 μœ ν˜•

HITL μ ‘κ·Ό 방식은 ν•„μš”ν•œ 데이터 μ„ΈνŠΈμ˜ μ’…λ₯˜μ— 따라 λ‹€μ–‘ν•œ μœ ν˜•μ˜ 데이터 라벨링에 μ‚¬μš©ν•  수 μžˆμŠ΅λ‹ˆλ‹€. 예λ₯Ό λ“€μ–΄ 기계가 νŠΉμ • λͺ¨μ–‘을 μΈμ‹ν•˜λŠ” 방법을 ν•™μŠ΅ν•΄μ•Ό ν•˜λŠ” 경우 경계 μƒμžκ°€ μ‚¬μš©λ©λ‹ˆλ‹€. κ·ΈλŸ¬λ‚˜ λͺ¨λΈμ΄ μ΄λ―Έμ§€μ˜ 각 뢀뢄을 λΆ„λ₯˜ν•΄μ•Ό ν•˜λŠ” 경우 μ„ΈλΆ„ν™”κ°€ μ„ ν˜Έλ©λ‹ˆλ‹€. μ–Όκ΅΄ 인식 데이터 μ„ΈνŠΈμ˜ 경우 μ–Όκ΅΄ λ§ˆν‚Ήμ΄ 자주 μ‚¬μš©λ©λ‹ˆλ‹€.

또 λ‹€λ₯Έ μ£Όμš” μ‘μš© λΆ„μ•ΌλŠ” 기계가 μ‚¬λžŒμ΄ λ§ν•˜κ±°λ‚˜ μ“΄ λ‚΄μš©μ„ 이해할 수 있게 ν•΄μ£ΌλŠ” ν…μŠ€νŠΈ λΆ„μ„μž…λ‹ˆλ‹€. μ‚¬λžŒλ“€μ€ λ™μΌν•œ 의미λ₯Ό ν‘œν˜„ν•˜κΈ° μœ„ν•΄ λ‹€λ₯Έ 단어λ₯Ό μ‚¬μš©ν•˜κΈ° λ•Œλ¬Έμ— AI μ‹œμŠ€ν…œμ€ λ‹€μ–‘ν•œ λ³€ν˜•μ„ μ•Œμ•„μ•Ό ν•©λ‹ˆλ‹€. 더 λ‚˜μ•„κ°€ 감정 뢄석은 νŠΉμ • λ‹¨μ–΄λ‚˜ ꡬ의 μ–΄μ‘°λ₯Ό 인식할 수 μžˆμŠ΅λ‹ˆλ‹€. μ΄λŸ¬ν•œ μ˜ˆλŠ” 인간 μ°Έμ—¬ν˜• μ ‘κ·Ό 방식을 μ‚¬μš©ν•˜λŠ” 것이 μ™œ κ·Έλ ‡κ²Œ μ€‘μš”ν•œμ§€ μž…μ¦ν•©λ‹ˆλ‹€.

νšŒμ‚¬μ—μ„œ HITL을 κ΅¬ν˜„ν•΄μ•Ό ν•˜λŠ” 이유

κ·€ν•˜μ˜ λΉ„μ¦ˆλ‹ˆμŠ€μ—μ„œ HITL μ‹œμŠ€ν…œμ„ μ„€μΉ˜ν•˜λ €λŠ” 경우 이λ₯Ό μˆ˜ν–‰ν•˜λŠ” κ°€μž₯ 일반적인 방법 쀑 ν•˜λ‚˜λŠ” μžλ™ν™” μ†Œν”„νŠΈμ›¨μ–΄λ₯Ό μ‚¬μš©ν•˜λŠ” κ²ƒμž…λ‹ˆλ‹€. 이미 HITL μ ‘κ·Ό 방식을 μ€‘μ‹¬μœΌλ‘œ κ΅¬μΆ•λœ λ§Žμ€ μžλ™ν™” μ†Œν”„νŠΈμ›¨μ–΄κ°€ μžˆμŠ΅λ‹ˆλ‹€. 즉, 이미 ν”„λ‘œμ„ΈμŠ€κ°€ κ³ λ €λ˜μ—ˆμŠ΅λ‹ˆλ‹€.

이와 같은 μ‹œμŠ€ν…œμ„ 톡해 νšŒμ‚¬λŠ” μ¦‰μ‹œ 높은 μˆ˜μ€€μ˜ μ„±κ³Όλ₯Ό λ‹¬μ„±ν•˜κ³  톡찰λ ₯을 얻을 수 μžˆμŠ΅λ‹ˆλ‹€. λ¨Έμ‹  λŸ¬λ‹ μ‹œμŠ€ν…œμ€ 이미 거의 λͺ¨λ“  μ‚°μ—… λΆ„μ•Όμ—μ„œ κ΅¬ν˜„λ˜κ³  μžˆμŠ΅λ‹ˆλ‹€. 즉, κ°œλ°œμžλŠ” μ‹œμŠ€ν…œμ΄ λ³€ν™”ν•˜λŠ” 데이터와 잘 μž‘λ™ν•˜λŠ”μ§€ 확인해야 ν•©λ‹ˆλ‹€.

νšŒμ‚¬μ— HITL μ‹œμŠ€ν…œμ„ κ΅¬ν˜„ν•˜λ©΄ λ§Žμ€ 이점이 μžˆμŠ΅λ‹ˆλ‹€.

HITL μ‹œμŠ€ν…œμ˜ 과제

Human-in-the-Loop μ‹œμŠ€ν…œμ€ λ˜ν•œ ν•΄κ²°ν•΄μ•Ό ν•  λͺ‡ κ°€μ§€ νŠΉμ • 문제λ₯Ό μ œμ‹œν•©λ‹ˆλ‹€. 첫째, 인간은 μ‹€μˆ˜λ₯Ό ν•˜κΈ° λ•Œλ¬Έμ— 인간이 μžˆλŠ” λͺ¨λ“  μ‹œμŠ€ν…œμ€ 잘λͺ»λ  μœ„ν—˜μ΄ μžˆμŠ΅λ‹ˆλ‹€. 이것은 μ‹œμŠ€ν…œμ˜ νš¨μœ¨μ„±μ— 큰 영ν–₯을 λ―ΈμΉ  수 μžˆμŠ΅λ‹ˆλ‹€. 예λ₯Ό λ“€μ–΄ 데이터에 λ ˆμ΄λΈ”μ„ μ§€μ •ν•  λ•Œ μ‚¬λžŒμ΄ μ‹€μˆ˜ν•˜λ©΄ λ™μΌν•œ μ‹€μˆ˜κ°€ 전체 μ‹œμŠ€ν…œμ— 퍼져 ν–₯ν›„ 문제λ₯Ό μΌμœΌν‚¬ 수 μžˆμŠ΅λ‹ˆλ‹€.

인간이 μ˜μ‚¬ κ²°μ • ν”„λ‘œμ„ΈμŠ€μ— κ΄€μ—¬ν•˜κΈ° λ•Œλ¬Έμ— HITL μ‹œμŠ€ν…œλ„ 느릴 수 μžˆμŠ΅λ‹ˆλ‹€. AI와 ML의 μ„±μž₯ 이면에 μžˆλŠ” κ°€μž₯ 큰 이유 쀑 ν•˜λ‚˜λŠ” 기계가 인간보닀 μ—„μ²­λ‚˜κ²Œ λΉ λ₯΄κΈ° λ•Œλ¬Έμž…λ‹ˆλ‹€. ν•˜μ§€λ§Œ κΈ°μ‘΄ ML μ‹œμŠ€ν…œμ—μ„œ 자주 λ³Ό 수 μžˆλŠ” 이 속도가 항상 HITL μ‹œμŠ€ν…œμœΌλ‘œ λ³€ν™˜λ˜λŠ” 것은 μ•„λ‹™λ‹ˆλ‹€.

HITL μ‹œμŠ€ν…œμ˜ 또 λ‹€λ₯Έ λ¬Έμ œλŠ” ꡬ좕 및 μœ μ§€ 관리 λΉ„μš©μ΄ 많이 λ“€ 수 μžˆλ‹€λŠ” κ²ƒμž…λ‹ˆλ‹€. 기계와 κ΄€λ ¨λœ λΉ„μš© 외에도 기업은 인λ ₯에 λŒ€ν•œ μ˜ˆμ‚°λ„ μ±…μ •ν•΄μ•Ό ν•©λ‹ˆλ‹€.

Alex McFarlandλŠ” 인곡 μ§€λŠ₯의 μ΅œμ‹  κ°œλ°œμ„ νƒκ΅¬ν•˜λŠ” AI μ €λ„λ¦¬μŠ€νŠΈμ΄μž μž‘κ°€μž…λ‹ˆλ‹€. κ·ΈλŠ” μ „ 세계 μˆ˜λ§Žμ€ AI μŠ€νƒ€νŠΈμ—… 및 좜판물과 ν˜‘λ ₯ν•΄ μ™”μŠ΅λ‹ˆλ‹€.