Trí tuệ nhân tạo
Microsoft tiết lộ Phi-3: Các mô hình AI mở mạnh mẽ mang lại hiệu suất cao nhất ở quy mô nhỏ
Microsoft đã giới thiệu Phi-3, một dòng sản phẩm mới mô hình ngôn ngữ nhỏ (SLM) nhằm mục đích mang lại hiệu suất cao và tiết kiệm chi phí trong các ứng dụng AI. Những mô hình này đã cho thấy kết quả tốt qua các điểm chuẩn về khả năng hiểu ngôn ngữ, lý luận, mã hóa và toán học khi so sánh với các mô hình có quy mô tương tự và lớn hơn. Việc phát hành Phi-3 mở rộng các tùy chọn có sẵn cho các nhà phát triển và doanh nghiệp đang tìm cách tận dụng AI đồng thời cân bằng giữa hiệu quả và chi phí.
Dòng mẫu Phi-3 và tính khả dụng
Mẫu đầu tiên trong dòng Phi-3 là Phi-3-mini, mẫu tham số 3.8B hiện đã có mặt trên Xưởng AI Azure, Ôm mặtvà Ollama. Phi-3-mini được điều chỉnh theo hướng dẫn, cho phép sử dụng ngay mà không cần tinh chỉnh rộng rãi. Nó có cửa sổ ngữ cảnh lên tới 128K mã thông báo, dài nhất trong loại kích thước của nó, cho phép xử lý các đầu vào văn bản lớn hơn mà không làm giảm hiệu suất.
Để tối ưu hóa hiệu suất trên các thiết lập phần cứng, Phi-3-mini đã được tinh chỉnh cho ONNX Runtime và GPU NVIDIA. Microsoft có kế hoạch sớm mở rộng dòng Phi-3 với việc phát hành Phi-3-small (thông số 7B) và Phi-3-medium (thông số 14B). Những mô hình bổ sung này sẽ cung cấp nhiều tùy chọn hơn để đáp ứng nhu cầu và ngân sách đa dạng.
Hiệu suất và phát triển Phi-3
Microsoft báo cáo rằng các mẫu Phi-3 đã cho thấy những cải tiến hiệu suất đáng kể so với các mẫu có cùng kích thước và thậm chí cả các mẫu lớn hơn trên nhiều tiêu chuẩn khác nhau. Theo công ty, Phi-3-mini đã vượt trội hơn các mô hình có quy mô gấp đôi về nhiệm vụ hiểu và tạo ngôn ngữ, trong khi Phi-3-small và Phi-3-medium đã vượt qua các mô hình lớn hơn nhiều, chẳng hạn như GPT-3.5T, ở một số điểm nhất định. đánh giá.
Microsoft tuyên bố rằng việc phát triển các mẫu Phi-3 đã tuân theo kế hoạch của công ty. Nguyên tắc AI có trách nhiệm và các tiêu chuẩn, trong đó nhấn mạnh trách nhiệm giải trình, tính minh bạch, công bằng, độ tin cậy, an toàn, quyền riêng tư, bảo mật và tính toàn diện. Các mô hình này được cho là đã trải qua quá trình đào tạo, đánh giá và lập đội đỏ về an toàn để đảm bảo tuân thủ các phương pháp triển khai AI có trách nhiệm.
Các ứng dụng và khả năng tiềm năng của Phi-3
Dòng Phi-3 được thiết kế để vượt trội trong các tình huống mà tài nguyên bị hạn chế, độ trễ thấp là điều cần thiết hoặc hiệu quả chi phí là ưu tiên hàng đầu. Những mô hình này có khả năng kích hoạt khả năng suy luận trên thiết bị, cho phép các ứng dụng hỗ trợ AI chạy hiệu quả trên nhiều loại thiết bị, bao gồm cả những thiết bị có khả năng tính toán hạn chế. Kích thước nhỏ hơn của các mẫu Phi-3 cũng có thể giúp các doanh nghiệp có thể tinh chỉnh và tùy chỉnh hợp lý hơn, cho phép họ điều chỉnh các mô hình cho phù hợp với các trường hợp sử dụng cụ thể mà không phải chịu chi phí cao.
Trong các ứng dụng đòi hỏi thời gian phản hồi nhanh, các mẫu Phi-3 mang lại giải pháp đầy hứa hẹn. Kiến trúc được tối ưu hóa và khả năng xử lý hiệu quả của chúng có thể cho phép tạo ra kết quả nhanh chóng, nâng cao trải nghiệm người dùng và mở ra khả năng tương tác AI trong thời gian thực. Ngoài ra, khả năng suy luận và logic mạnh mẽ của Phi-3-mini khiến thiết bị này rất phù hợp cho các nhiệm vụ phân tích, chẳng hạn như phân tích dữ liệu và tạo thông tin chuyên sâu.