Connect with us

人工智能

微软推出Phi-3:强大的开放AI模型在小尺寸下实现顶级性能

mm

微软推出Phi-3,一系列新的小型语言模型(SLMs),旨在为AI应用提供高性能和成本效益。这些模型在语言理解、推理、编码和数学等方面的基准测试中表现出色,相比同等大小和更大的模型。Phi-3的发布为开发人员和企业提供了更多选择,以平衡效率和成本的同时利用AI。

Phi-3模型家族和可用性

Phi-3家族的第一个模型是Phi-3-mini,一个3.8B参数的模型,现已在Azure AI StudioHugging FaceOllama上提供。Phi-3-mini预先进行了指令微调,可以“开箱即用”,无需进行大量的微调。它具有最长的上下文窗口(高达128K令牌),使其能够处理更大的文本输入而不牺牲性能。

为了优化性能,Phi-3-mini已针对ONNX Runtime和NVIDIA GPU进行了微调。微软计划在不久的将来发布Phi-3-small(7B参数)和Phi-3-medium(14B参数),以提供更多选择以满足不同需求和预算。

图片:微软

Phi-3性能和开发

微软报告称,Phi-3模型在各项基准测试中表现出色,相比同等大小和更大的模型。根据公司的说法,Phi-3-mini在语言理解和生成任务中超越了两倍大小的模型,而Phi-3-small和Phi-3-medium在某些评估中超越了更大的模型,如GPT-3.5T。

微软表示,Phi-3模型的开发遵循了公司的负责任AI原则和标准,强调了问责、透明、公平、可靠、安全、隐私、安全和包容性。这些模型已接受了安全训练、评估和红队测试,以确保遵循负责任的AI部署实践。

图片:微软

Phi-3的潜在应用和能力

Phi-3家族旨在在资源受限、低延迟至关重要或成本效益是优先考虑的情况下表现出色。这些模型有可能实现设备上的推理,使AI驱动的应用程序能够在包括计算能力有限的设备在内的广泛设备上高效运行。Phi-3模型的较小尺寸还可能使微调和定制更加经济实惠,使企业能够将模型适应其特定的用例而无需承担高昂的成本。

在需要快速响应时间的应用程序中,Phi-3模型提供了一个有前途的解决方案。它们的优化架构和高效处理可以实现快速生成结果,增强用户体验并开启实时AI交互的可能性。此外,Phi-3-mini的强大推理和逻辑能力使其非常适合分析任务,例如数据分析和洞察生成。

随着Phi-3模型在现实世界中的应用出现,这些模型推动创新和使AI更加普及的潜力变得越来越明显。Phi-3家族代表了AI民主化的一个里程碑,使企业和开发人员能够在保持效率和成本效益的同时利用高级语言模型的力量。

随着Phi-3的发布,微软推动了小型语言模型的可能性边界,为一个未来铺平了道路,在这个未来,AI可以无缝地集成到广泛的应用程序和设备中。

Alex McFarland 是一名人工智能记者和作家,探索最新的人工智能发展。他曾与世界各地的众多人工智能初创公司和出版物合作。