Rescale λ―ΈνŒ… μ˜ˆμ•½

μ—”μ§€λ‹ˆμ–΄λ“€μ€ 심측 신경망을 κ΅μœ‘ν•˜κΈ° μœ„ν•΄ μ—λ„ˆμ§€ 효율적인 "Early Bird" 방법을 κ°œλ°œν•©λ‹ˆλ‹€.

인곡지λŠ₯

μ—”μ§€λ‹ˆμ–΄λ“€μ€ 심측 신경망을 κ΅μœ‘ν•˜κΈ° μœ„ν•΄ μ—λ„ˆμ§€ 효율적인 "Early Bird" 방법을 κ°œλ°œν•©λ‹ˆλ‹€.

mm

Rice University의 μ—”μ§€λ‹ˆμ–΄λ“€μ€ 일반적으둜 ν•„μš”ν•œ μ—λ„ˆμ§€μ˜ μΌλΆ€λ‘œ DNN(심측 신경망)을 κ΅μœ‘ν•˜λŠ” μƒˆλ‘œμš΄ 방법을 κ°œλ°œν–ˆμŠ΅λ‹ˆλ‹€. DNN은 자율 μ£Όν–‰ μžλ™μ°¨, μ§€λŠ₯ν˜• λΉ„μ„œ, μ•ˆλ©΄ 인식 및 기타 μ‘μš© ν”„λ‘œκ·Έλž¨κ³Ό 같은 기술 κ°œλ°œμ—μ„œ 핡심 역할을 ν•˜λŠ” 인곡 μ§€λŠ₯(AI)의 ν•œ ν˜•νƒœμž…λ‹ˆλ‹€.

μ–Όλ¦¬λ²„λ“œμ— λŒ€ν•œ μžμ„Έν•œ λ‚΄μš©μ€ 쒅이 Rice와 Texas A&M University의 연ꡬ원듀이 29μ›” XNUMX일에. κ·Έκ²ƒμ€μ—μ„œ 일어났닀 ν•™μŠ΅ ν‘œν˜„μ— κ΄€ν•œ ꡭ제 회의, λ˜λŠ” ICLR 2020. 

이 μ—°κ΅¬μ˜ μ£Ό μ €μžλŠ” Rice의 EIC(Efficient and Intelligent Computing) μ—°κ΅¬μ†Œμ˜ Haoran You와 Chaojian Liμ˜€μŠ΅λ‹ˆλ‹€. ν•œ μ—°κ΅¬μ—μ„œ 그듀은 이 방법이 μ˜€λŠ˜λ‚ μ˜ 방법과 λ™μΌν•œ μˆ˜μ€€κ³Ό μ •ν™•λ„λ‘œ DNN을 ν›ˆλ ¨ν•  수 μžˆλŠ” 방법을 보여 μ£Όμ—ˆμ§€λ§Œ 10.7λ°° 적은 μ—λ„ˆμ§€λ₯Ό μ‚¬μš©ν–ˆμŠ΅λ‹ˆλ‹€. 

이 μ—°κ΅¬λŠ” EIC Lab 이사인 Yingyan Lin, Rice의 Richard Baraniuk, Texas A&M의 Zhangyang Wang이 μ£Όλ„ν–ˆμŠ΅λ‹ˆλ‹€. λ‹€λ₯Έ 곡동 μ €μžλ‘œλŠ” Pengfei Xu, Yonggan Fu, Yue Wang 및 Xiaohan Chen이 μžˆμŠ΅λ‹ˆλ‹€. 

린은 "졜근 AI ν˜μ‹ μ˜ μ£Όμš” 원동λ ₯은 더 크고 더 λΉ„μ‹Ό DNN의 λ„μž…μž…λ‹ˆλ‹€."라고 λ§ν–ˆμŠ΅λ‹ˆλ‹€. "ν•˜μ§€λ§Œ μ΄λŸ¬ν•œ DNN을 ν›ˆλ ¨ν•˜λ €λ©΄ μƒλ‹Ήν•œ μ—λ„ˆμ§€κ°€ ν•„μš”ν•©λ‹ˆλ‹€. 더 λ§Žμ€ ν˜μ‹ μ΄ 곡개되렀면 ν™˜κ²½ 문제λ₯Ό ν•΄κ²°ν•˜κ³  AI μ—°κ΅¬μ˜ μž¬μ •μ  μž₯벽을 μ€„μ΄λŠ” '녹색' ν›ˆλ ¨ 방법을 μ°ΎλŠ” 것이 ν•„μˆ˜μ μž…λ‹ˆλ‹€."

DNN κ΅μœ‘μ— λΉ„μš©μ΄ 많이 λ“­λ‹ˆλ‹€.

세계 졜고의 DNN을 κ΅μœ‘ν•˜λŠ” λ°λŠ” λΉ„μš©μ΄ 많이 λ“€ 수 있으며 κ°€κ²©ν‘œλŠ” κ³„μ†ν•΄μ„œ μ¦κ°€ν•˜κ³  μžˆμŠ΅λ‹ˆλ‹€. 2019λ…„ μ‹œμ• ν‹€μ˜ Allen Institute for AIκ°€ μ£Όλ„ν•œ 연ꡬ에 λ”°λ₯΄λ©΄ 졜고 μˆ˜μ€€μ˜ 심측 신경망을 ν›ˆλ ¨μ‹œν‚€κΈ° μœ„ν•΄μ„œλŠ” 300,000~2012년에 λΉ„ν•΄ 2018λ°° 더 λ§Žμ€ 계산이 ν•„μš”ν•©λ‹ˆλ‹€. μ΄λ²ˆμ— 맀사좔세츠 λŒ€ν•™κ΅ μ• λ¨ΈμŠ€νŠΈ(University of Massachusetts Amherst)의 연ꡬ원이 μ£Όλ„ν•œ 또 λ‹€λ₯Έ 2019λ…„ μ—°κ΅¬μ—μ„œλŠ” 단일 μ—˜λ¦¬νŠΈ DNN을 κ΅μœ‘ν•˜λ©΄ λ―Έκ΅­ μžλ™μ°¨ XNUMXλŒ€μ™€ 거의 λ™μΌν•œ μ–‘μ˜ μ΄μ‚°ν™”νƒ„μ†Œ λ°°μΆœλŸ‰μ΄ λ°°μΆœλœλ‹€λŠ” 사싀을 λ°œκ²¬ν–ˆμŠ΅λ‹ˆλ‹€. 

DNN이 κ³ λ„λ‘œ μ „λ¬Έν™”λœ μž‘μ—…μ„ μˆ˜ν–‰ν•˜κΈ° μœ„ν•΄ μ΅œμ†Œ 수백만 개의 인곡 λ‰΄λŸ°μœΌλ‘œ κ΅¬μ„±λ©λ‹ˆλ‹€. 그듀은 λ§Žμ€ 수의 예λ₯Ό κ΄€μ°°ν•¨μœΌλ‘œμ¨ 결정을 λ‚΄λ¦¬λŠ” 방법을 배울 수 있으며 λ•Œλ‘œλŠ” 인간을 λŠ₯κ°€ν•©λ‹ˆλ‹€. λͺ…μ‹œμ μΈ ν”„λ‘œκ·Έλž˜λ° 없이도 이 μž‘μ—…μ„ μˆ˜ν–‰ν•  수 μžˆμŠ΅λ‹ˆλ‹€. 

μžλ‘μ™€ ν›ˆλ ¨

Lin은 Rice의 Brown School of Engineering의 μ „κΈ° 및 컴퓨터 곡학 μ‘°κ΅μˆ˜μž…λ‹ˆλ‹€. 

"DNN ν•™μŠ΅μ„ μˆ˜ν–‰ν•˜λŠ” μ΅œμ²¨λ‹¨ 방법은 점진적 κ°€μ§€μΉ˜κΈ°μ™€ ν•™μŠ΅μž…λ‹ˆλ‹€."라고 린은 λ§ν–ˆμŠ΅λ‹ˆλ‹€. "λ¨Όμ €, 밀도가 λ†’κ³  κ±°λŒ€ν•œ λ„€νŠΈμ›Œν¬λ₯Ό ν•™μŠ΅μ‹œν‚¨ ν›„, λ‚˜λ¬΄ κ°€μ§€μΉ˜κΈ°μ²˜λŸΌ μ€‘μš”ν•˜μ§€ μ•Šμ•„ λ³΄μ΄λŠ” 뢀뢄을 μ œκ±°ν•©λ‹ˆλ‹€. 그런 λ‹€μŒ κ°€μ§€μΉ˜κΈ° ν›„ μ„±λŠ₯이 μ €ν•˜λ˜λ―€λ‘œ, κ°€μ§€μΉ˜κΈ°λœ λ„€νŠΈμ›Œν¬λ₯Ό λ‹€μ‹œ ν•™μŠ΅μ‹œμΌœ μ„±λŠ₯을 νšŒλ³΅ν•©λ‹ˆλ‹€. μ‹€μ œλ‘œ 쒋은 μ„±λŠ₯을 μ–»μœΌλ €λ©΄ κ°€μ§€μΉ˜κΈ°μ™€ ν•™μŠ΅μ„ μ—¬λŸ¬ 번 λ°˜λ³΅ν•΄μ•Ό ν•©λ‹ˆλ‹€."

이 방법은 특수 μž‘μ—…μ„ μ™„λ£Œν•˜λŠ” 데 λͺ¨λ“  인곡 λ‰΄λŸ°μ΄ ν•„μš”ν•œ 것은 μ•„λ‹ˆκΈ° λ•Œλ¬Έμ— μ‚¬μš©λ©λ‹ˆλ‹€. ν›ˆλ ¨μœΌλ‘œ 인해 λ‰΄λŸ° κ°„μ˜ 연결이 κ°•ν™”λ˜κ³  λ‚˜λ¨Έμ§€λŠ” 버릴 수 μžˆμŠ΅λ‹ˆλ‹€. 이 κ°€μ§€μΉ˜κΈ° 방법은 계산 λΉ„μš©μ„ μ ˆκ°ν•˜κ³  λͺ¨λΈ 크기λ₯Ό 쀄여 μ™„μ „νžˆ ν›ˆλ ¨λœ DNN을 보닀 μ €λ ΄ν•˜κ²Œ λ§Œλ“­λ‹ˆλ‹€. 

"첫 번째 단계인 λ°€μ§‘λœ κ±°λŒ€ν•œ λ„€νŠΈμ›Œν¬λ₯Ό ν›ˆλ ¨ν•˜λŠ” 것이 κ°€μž₯ λΉ„μŒ‰λ‹ˆλ‹€." 린이 λ§ν–ˆλ‹€. "이 μž‘μ—…μ—μ„œ 우리의 μ•„μ΄λ””μ–΄λŠ” 이 λΉ„μš©μ΄ 많이 λ“œλŠ” 첫 번째 λ‹¨κ³„μ˜ μ‹œμž‘ λ‹¨κ³„μ—μ„œ 'μ–Όλ¦¬λ²„λ“œ ν‹°μΌ“'이라고 λΆ€λ₯΄λŠ” μ΅œμ’…μ μ΄κ³  μ™„μ „νžˆ κΈ°λŠ₯ν•˜λŠ” κ°€μ§€μΉ˜κΈ°λœ λ„€νŠΈμ›Œν¬λ₯Ό μ‹λ³„ν•˜λŠ” κ²ƒμž…λ‹ˆλ‹€."

연ꡬ원듀은 μ£Όμš” λ„€νŠΈμ›Œν¬ μ—°κ²° νŒ¨ν„΄μ„ μ°Ύμ•„ 이λ₯Ό μˆ˜ν–‰ν–ˆμœΌλ©° μ΄λŸ¬ν•œ μ‘°κΈ° 티켓을 λ°œκ²¬ν•  수 μžˆμ—ˆμŠ΅λ‹ˆλ‹€. 이λ₯Ό 톡해 DNN κ΅μœ‘μ„ λΉ λ₯΄κ²Œ μ§„ν–‰ν•  수 μžˆμ—ˆμŠ΅λ‹ˆλ‹€. 

ꡐ윑 μ‹œμž‘ λ‹¨κ³„μ˜ μ–Όλ¦¬λ²„λ“œ

Linκ³Ό λ‹€λ₯Έ 연ꡬ원듀은 Early Birdκ°€ ν›ˆλ ¨μ˜ μ‹œμž‘ λ‹¨κ³„μ—μ„œ XNUMXλΆ„μ˜ XNUMX μ΄ν•˜λ‘œ λ‚˜νƒ€λ‚  수 μžˆμŒμ„ λ°œκ²¬ν–ˆμŠ΅λ‹ˆλ‹€. 

Linμ€β€œμš°λ¦¬μ˜ 방법은 μ‘°λ°€ν•˜κ³  κ±°λŒ€ν•œ λ„€νŠΈμ›Œν¬ ν›ˆλ ¨μ˜ 처음 10 % μ΄λ‚΄μ—μ„œ μ‘°κΈ° 등둝 티켓을 μžλ™μœΌλ‘œ 식별 ν•  수 μžˆμŠ΅λ‹ˆλ‹€. "즉, κΈ°μ‘΄ κ΅μœ‘μ— ν•„μš”ν•œ μ‹œκ°„μ˜ μ•½ 10 % μ΄ν•˜λ‘œ μ£Όμ–΄μ§„ μž‘μ—…μ— λŒ€ν•΄ λ™μΌν•˜κ±°λ‚˜ 더 λ‚˜μ€ 정확도λ₯Ό λ‹¬μ„±ν•˜λ„λ‘ DNN을 ꡐ윑 ν•  수 있으며, μ΄λŠ” 계산과 μ—λ„ˆμ§€ λͺ¨λ‘μ—μ„œ λ‘˜ μ΄μƒμ˜ μ£Όλ¬Έ 절감으둜 μ΄μ–΄μ§ˆ 수 μžˆμŠ΅λ‹ˆλ‹€."

더 λΉ λ₯΄κ³  μ—λ„ˆμ§€ 효율적인 것 외에도 연ꡬ원듀은 ν™˜κ²½ 영ν–₯에 쀑점을 λ‘‘λ‹ˆλ‹€. 

β€œμš°λ¦¬μ˜ λͺ©ν‘œλŠ” AIλ₯Όλ³΄λ‹€ ν™˜κ²½ μΉœν™”μ μ΄κ³  ν¬κ΄„μ μœΌλ‘œ λ§Œλ“œλŠ” κ²ƒμž…λ‹ˆλ‹€.”라고 κ·Έλ…€λŠ” λ§ν–ˆμŠ΅λ‹ˆλ‹€. β€œλ³΅μž‘ν•œ AI 문제의 μ—„μ²­λ‚œ ν¬κΈ°λŠ” μ†Œκ·œλͺ¨ ν”Œλ ˆμ΄μ–΄λ₯Ό 막아 λƒˆμŠ΅λ‹ˆλ‹€. Green AIλŠ” μ—°κ΅¬μžλ“€μ΄ λ…ΈνŠΈλΆμ΄λ‚˜ μ œν•œλœ μ»΄ν“¨νŒ… λ¦¬μ†ŒμŠ€λ₯Ό κ°€μ§€κ³  AI ν˜μ‹ μ„ 탐ꡬ ν•  μˆ˜μžˆλŠ” 문을 μ—΄ 수 μžˆμŠ΅λ‹ˆλ‹€.”

이 μ—°κ΅¬λŠ” ꡭ립 κ³Όν•™ μž¬λ‹¨μ˜ 지원을 λ°›μ•˜μŠ΅λ‹ˆλ‹€.