人工智能
Grok:埃隆·马斯克的xAI人工智能聊天机器人

埃隆·马斯克,这位特斯拉和SpaceX背后的企业家,最近因其人工智能初创公司xAI而备受关注,特别是其新产品Grok的发布。这一模型是在Twitter重新估值仅一周后推出的,Twitter是他一年前收购的,现在估值为$19亿,而最初的估值为$44亿。
https://twitter.com/xai/status/1721027348970238035
访问Grok LLM:https://grok.x.ai/
Grok的一个显著特点是其能够实时获取信息,这使其与其同时代的产品区别开来。如最近的截图所示,Grok不仅能够提供带有幽默的当前事件更新,还能在其交互中展示出锋利的讽刺语气。这一方法标志着人工智能响应从传统的中立和事实性转向更具人性化的、引人入胜的对话风格。
当人工智能响应当前新闻或调皮的请求时,它能够保持一种幽默而富有信息的语气,确保用户的参与,同时微妙地强调了合法性和道德的重要性,如其在讨论非法活动时的坚定立场所示。
Grok LLM从Grok-0开始,Grok-0是一个具有33亿参数的原型LLM。从Grok-0到Grok-1的演变中,推理和编码能力得到了显著的增强,Grok-1在HumanEval编码任务中获得了63.2%的成绩,在MMLU中获得了73%的成绩,超越了其前身。
Grok-1是Grok的核心力量,它是一个基于自回归Transformer的模型,经过精心的预训练,以实现下一个标记的预测——一个基于前面的标记预测序列中下一个单词或标记的过程。在预训练之后,Grok-1经过了微调,受益于来自人类评估者的丰富反馈和来自其前身早期Grok-0模型的见解。这种微调提高了其能力,为其在2023年11月的正式发布做好了准备。
Grok-1的训练计划是广泛和多样的,涵盖了截至2023年第三季度的互联网数据和来自人工智能导师的宝贵输入。
Grok-1在处理初中数学词问题、多学科多选题、Python代码完成任务和数学问题方面的能力,展示了其强大的推理能力。特别值得注意的是,其在标准机器学习基准测试中的出色表现,超越了ChatGPT-3.5和Inflection-1等同时代的模型,只有在训练数据集明显更大的模型(如GPT-4)中才略逊一筹。
基于Kubernetes、Rust和JAX的自定义训练和推理栈构成了Grok的基础设施。对Rust的强调是由于其高性能、可靠性和防错能力,这是xAI致力于质量和创新的一种证明。
Grok被设想为不仅仅是一个问题回答人工智能;它被视为一种工具,帮助进行可扩展的监督、增强安全性和可靠性的形式验证、长上下文理解、对抗鲁棒性和多模态能力。最终目标是为Grok配备多种感官,实现更广泛的实时交互和帮助。
相比之下,ChatGPT是一个值得注意的人工智能工具,它最初缺乏实时互联网访问,需要提示来产生机智的回应。虽然后来的版本改进了这一点,但Grok将幽默与实时信息检索相结合的能力设定了一个新的标准。
在其早期测试阶段结束后,Grok将可供X Premium订阅者使用,订阅价格为每月$16,提供无广告的体验。这一可访问性表明了向更广泛的受众提供先进人工智能对话代理的步骤。
以下帖子展示了Grok的UI功能,由xAI的创始成员之一发布。
https://twitter.com/TobyPhln/status/1721053802235621734
xAI于七月推出,是一个由Google的DeepMind和Microsoft等著名人工智能研究实体的成员组成的团队。虽然xAI独立运营,但它与X保持着共生关系,并与特斯拉和其他公司保持着联系,汇集了多样化的专业知识来推动人工智能驱动的通信的前沿。













