์ธ๊ณต์ง€๋Šฅ

์†Œํ˜• AI: ๋†’์€ ๋น„์šฉ๊ณผ ์—๋„ˆ์ง€้œ€ๆฑ‚์— ๋Œ€ํ•œ ์ง€์† ๊ฐ€๋Šฅํ•œ ์†”๋ฃจ์…˜

mm

최근 몇 년 동안, 기술 산업은 점점 더 큰 AI 모델을 개발하는 경쟁에 매료되었습니다. 이 모델들은 수십억 개의 매개변수를 가지고 있으며, 자연어 처리부터 이미지 인식까지 다양한 분야에서 획기적인 발전을 약속합니다. 그러나 이ような 크기 추구는 높은 비용과 상당한 환경적 영향을 가진다는 단점이 있습니다. 소형 AI는 효율성과 에너지 사용량을 낮추는 대안을 제공합니다. 그러나 현재 소형 AI를 구축하는 접근 방식은 여전히 상당한 자원을 필요로 합니다. 더 작은 및 더 지속 가능한 AI를 추구할 때, 이러한 제한을 효과적으로 해결하는 새로운 전략을 탐색하는 것이 중요합니다.

소형 AI: 높은 비용과 에너지需求에 대한 지속 가능한 솔루션

대형 AI 모델을 개발하고 유지하는 것은 비싼 일이입니다. 추정에 따르면, GPT-3를 훈련시키는 비용은 400만 달러 이상이며, 더 발전된 모델은 높은 단일 자릿수 백만 달러에 이를 수 있습니다. 이러한 비용, 필요한 하드웨어, 저장소, 계산 능력 및 인력 비용은 많은 조직, 특히 작은 기업과 연구 기관에게 금지적인 것입니다. 이러한 금전적 장벽은 불균형한 경쟁을 만들며, 접근하기 어려운 최첨단 AI 기술과 혁신을 방해합니다.

또한, 대형 AI 모델을 훈련시키는 에너지需求은 엄청납니다. 예를 들어, 대형 언어 모델인 GPT-3를 훈련시키는 것은 추정에 따르면 약 1,300 메가와트시(MWh)의 전기를 소비합니다. 이는 미국의 130개 가정의 연간 전기 소비량과 같습니다. 이러한 훈련 비용에도 불구하고, 각 ChatGPT 요청은 추정에 따르면 2.9 와트시의 전기를 소비합니다. IEA는 AI, 데이터 센터 및 가상화폐의 집합 에너지需求이 거의 2%의 글로벌 에너지需求을 차지한다고 추정합니다. 이러한需求은 2026년까지 두 배로 증가할 것으로 예상되며, 일본의 총 전기 소비량에 가까워질 것입니다. 높은 에너지 소비는 운영 비용을 증가시키며, 또한 환경 위기를 악화시키는 탄소 발자국을 증가시킵니다. 이를 명확히 하기 위해, 연구자들은 단일 대형 AI 모델을 훈련시키는 것이 626,000 파운드의 이산화탄소를 방출할 수 있다고 추정합니다. 이는 5대의 자동차가 수명 동안 방출하는 양과 같습니다.

이러한 도전 과제 중에서, 소형 AI는 실용적인 솔루션을 제공합니다. 효율성과 확장성을 위해 설계되었으며, 훨씬 적은 데이터와 계산 능력을 필요로 합니다. 이는 전체 비용을 줄이고, 발전된 AI 기술을 작은 조직과 연구 팀에게 더 접근하기 쉽게 만듭니다. 또한, 소형 AI 모델은 에너지需求이 낮아, 운영 비용을 절감하고 환경에 미치는 영향을 줄입니다. 최적화된 알고리즘과 전이 학습과 같은 방법을 사용하여, 소형 AI는 적은 자원으로 높은 성능을 달성할 수 있습니다. 이러한 접근 방식은 AI를 더 저렴하게 만들뿐만 아니라, 에너지 소비와 탄소 배출을 최소화하여 지속 가능성을 지원합니다.

현재 소형 AI 모델은 어떻게 구축되는가

소형 AI의 이점을 인식하고, 주요 기술 회사인 Google, OpenAI 및 Meta는 컴팩트 모델 개발에 점점 더 초점을 맞추고 있습니다. 이러한 전환은 Gemini Flash, GPT-4o Mini 및 Llama 7B와 같은 모델의 발전으로 이어졌습니다. 이러한 소형 모델은 주로 지식 증류라는 기술을 사용하여 개발됩니다.

지식 증류의 핵심은 대형 모델의 지식을 더 작은, 효율적인 버전으로 전달하는 것입니다. 이 과정에서 “교사” 모델(대형 AI 모델)은 광범위한 데이터셋에서 훈련되어 복잡한 패턴과 뉴앙스를 학습합니다. 이 모델은 예측 또는 “소프트 레이블”을 생성하여 깊은 이해를 포함합니다.

“학생” 모델(소형 AI 모델)은 이러한 소프트 레이블을 복제하도록 훈련됩니다. 교사 모델의 행동을 모방함으로써, 학생 모델은 많은 지식과 성능을 캡처하지만, 훨씬 적은 매개변수로 작동합니다.

왜 우리는 대형 AI를 증류하는 것을 넘어야 하는가

대형 AI를 더 작은, 관리하기 쉬운 버전으로 증류하는 것은 소형 AI를 구축하는 인기 있는 접근 방식이 되었습니다. 그러나 이 접근 방식이 모든 대형 AI 개발 도전 과제에 대한 솔루션이 아닐 수 있는 몇 가지 강력한 이유가 있습니다.

  • 대형 모델에 대한 지속적인 의존: 증류는 더 작은, 효율적인 AI 모델을 생성하며, 추론 시간에 계산 및 에너지 효율성을 개선합니다. 그러나 초기에 대형 AI 모델을 훈련시키는 데 여전히 크게 의존합니다. 이는 소형 AI 모델을 구축하는 데에도 상당한 계산 자원과 에너지가 필요하다는 것을 의미합니다. 증류는 자원 부담을 제거하는 것이 아니라, 단지 자원 부담을 이동시킵니다. 대형 “교사” 모델을 훈련시키는 초기 비용은 특히 작은 조직과 연구 그룹에게 도전 과제가 될 수 있습니다. 또한, 이러한 대형 모델을 훈련시키는 환경적 영향은 소형 모델의 이점을 일부 상쇄할 수 있습니다.
  • 제한된 혁신 범위: 증류에 의존하는 것은 기존 대형 모델을 복제하는 것에 초점을 맞추기 때문에, 새로운 접근 방식의 탐색을 제한할 수 있습니다. 이는 특정 문제에 대한 더 나은 솔루션을 제공할 수 있는 새로운 AI 아키텍처 또는 방법의 개발을 느리게 할 수 있습니다. 대형 AI에 대한 의존은 소형 AI 개발을 자원 풍부한 몇몇 회사에 제한시킵니다. 결과적으로, 소형 AI의 이점은 기술 발전을 방해하고, 혁신의 기회를 제한할 수 있습니다.
  • 일반화 및 적응 도전: 증류를 통해 생성된 소형 AI 모델은 새로운, 보지 못한 데이터에 어려움을 겪을 수 있습니다. 이는 증류 과정에서 더 큰 모델의 일반화 능력을 완전히 캡처하지 못할 수 있기 때문입니다. 결과적으로, 이러한 작은 모델은 익숙한 작업에서 잘 수행할 수 있지만, 새로운 상황에 직면하면 어려움을 겪을 수 있습니다. 또한, 증류된 모델을 새로운 모달리티 또는 데이터셋에 적응시키는 것은 종종 더 큰 모델을 다시 훈련시키거나 미세 조정하는 것을 포함합니다. 이 반복적인 과정은 복잡하고 자원 집중적일 수 있습니다. 이는 소형 AI 모델을 빠르게 발전하는 기술적需求이나 새로운 응용 프로그램에 신속하게 적응시키는 것을 어렵게 만듭니다.

결론

대형 AI 모델을 더 작은 모델로 증류하는 것이 실용적인 솔루션으로 보일 수 있지만, 여전히 대형 모델을 훈련시키는 높은 비용에 의존합니다. 진정한 소형 AI 발전을 위해, 우리는 더 혁신적이고 지속 가능한 관행을 탐색해야 합니다. 이는 특정 응용 프로그램을 위한 모델을 설계하고, 훈련 방법을 더 비용 효율적이고 에너지 효율적으로 만드는 것을 포함합니다. 또한, 환경 지속 가능성을 중점으로 해야 합니다. 이러한 전략을 추구함으로써, 우리는 산업과 지구 모두에게 책임감 있고 유익한 방식으로 AI 개발을 발전시킬 수 있습니다.

Dr. Tehseen Zia๋Š” COMSATS University Islamabad์˜ ์ •๊ต์ˆ˜์ด๋ฉฐ, ์˜ค์ŠคํŠธ๋ฆฌ์•„ ๋น„์—”๋‚˜ ๊ธฐ์ˆ ๋Œ€ํ•™๊ต์—์„œ ์ธ๊ณต์ง€๋Šฅ ๋ฐ•์‚ฌํ•™์œ„๋ฅผ ์ทจ๋“ํ–ˆ์Šต๋‹ˆ๋‹ค. ์ธ๊ณต์ง€๋Šฅ, ๊ธฐ๊ณ„ํ•™์Šต, ๋ฐ์ดํ„ฐ ๊ณผํ•™, ์ปดํ“จํ„ฐ ๋น„์ „์„ ์ „๋ฌธ์œผ๋กœ ํ•˜๋ฉฐ, ์œ ๋ช…ํ•œ ๊ณผํ•™ ์ €๋„์— ๋ฐœํ‘œ๋œ ๋…ผ๋ฌธ์œผ๋กœ ะทะฝะฐั‡์ ์ธ ๊ธฐ์—ฌ๋ฅผ ํ–ˆ์Šต๋‹ˆ๋‹ค. Dr. Tehseen์€ ์ฃผ์š” ์—ฐ๊ตฌ์ž๋กœ์„œ ๋‹ค์–‘ํ•œ ์‚ฐ์—… ํ”„๋กœ์ ํŠธ๋ฅผ ์ด๋Œ์—ˆ์œผ๋ฉฐ, ์ธ๊ณต์ง€๋Šฅ ์ปจ์„คํ„ดํŠธ๋กœ๋„ ํ™œ๋™ํ–ˆ์Šต๋‹ˆ๋‹ค.