인공 지능
Microsoft, Phi-3 공개: 작은 크기로 최고의 성능을 제공하는 강력한 개방형 AI 모델
마이크로소프트가 새로운 제품군인 Phi-3를 출시했습니다. 소규모 언어 모델(SLM) AI 애플리케이션에서 높은 성능과 비용 효율성을 제공하는 것을 목표로 합니다. 이러한 모델은 유사하거나 더 큰 규모의 모델과 비교할 때 언어 이해, 추론, 코딩 및 수학의 벤치마크 전반에서 강력한 결과를 보여주었습니다. Phi-3의 출시로 효율성과 비용의 균형을 유지하면서 AI를 활용하려는 개발자와 기업이 사용할 수 있는 옵션이 확장되었습니다.
Phi-3 모델 제품군 및 가용성
Phi-3 라인업의 첫 번째 모델은 현재 3B 매개변수 모델인 Phi-3.8-mini입니다. 애저 AI 스튜디오, 포옹하는 얼굴및 올라마. Phi-3-mini는 지침에 따라 조정되어 제공되므로 광범위한 미세 조정 없이 "즉시" 사용할 수 있습니다. 해당 크기 클래스에서 가장 긴 최대 128K 토큰의 컨텍스트 창을 갖추고 있어 성능 저하 없이 더 큰 텍스트 입력을 처리할 수 있습니다.
하드웨어 설정 전반에서 성능을 최적화하기 위해 Phi-3-mini는 ONNX Runtime 및 NVIDIA GPU에 맞게 미세 조정되었습니다. Microsoft는 Phi-3-소형(3B 매개변수) 및 Phi-7-medium(3B 매개변수) 출시를 통해 곧 Phi-14 제품군을 확장할 계획입니다. 이러한 추가 모델은 다양한 요구와 예산을 충족할 수 있는 더 넓은 범위의 옵션을 제공합니다.
Phi-3 성능 및 개발
Microsoft는 Phi-3 모델이 다양한 벤치마크에서 동일한 크기의 모델은 물론 더 큰 모델에 비해 상당한 성능 향상을 보여주었다고 보고합니다. 회사에 따르면 Phi-3-mini는 언어 이해 및 생성 작업에서 크기가 3배인 모델을 능가했으며, Phi-3-small과 Phi-3.5-medium은 GPT-XNUMXT와 같은 훨씬 큰 모델을 능가했습니다. 평가.
Microsoft는 Phi-3 모델의 개발이 회사의 계획을 따랐다고 밝혔습니다. 책임 있는 AI 원칙 책임성, 투명성, 공정성, 신뢰성, 안전, 개인 정보 보호, 보안 및 포용성을 강조하는 표준. 해당 모델은 책임 있는 AI 배포 관행을 준수하기 위해 안전 교육, 평가 및 레드팀 구성을 거친 것으로 알려졌습니다.
Phi-3의 잠재적 응용 및 기능
Phi-3 제품군은 리소스가 제한되어 있거나 짧은 대기 시간이 필수적이거나 비용 효율성이 우선인 시나리오에서 탁월한 성능을 발휘하도록 설계되었습니다. 이러한 모델은 온디바이스 추론을 가능하게 하여 AI 기반 애플리케이션이 컴퓨팅 성능이 제한된 장치를 포함하여 다양한 장치에서 효율적으로 실행되도록 할 수 있는 잠재력을 가지고 있습니다. Phi-3 모델의 크기가 작을수록 기업은 미세 조정 및 사용자 정의를 보다 저렴하게 수행할 수 있으므로 높은 비용을 들이지 않고도 특정 사용 사례에 모델을 적용할 수 있습니다.
빠른 응답 시간이 중요한 응용 분야에서 Phi-3 모델은 유망한 솔루션을 제공합니다. 최적화된 아키텍처와 효율적인 처리를 통해 결과를 빠르게 생성하고 사용자 경험을 향상하며 실시간 AI 상호 작용의 가능성을 열어줄 수 있습니다. 또한 Phi-3-mini의 강력한 추론 및 논리 기능은 데이터 분석 및 통찰력 생성과 같은 분석 작업에 매우 적합합니다.