埃隆·马斯克旗下人工智能公司xAI于近日正式发布Grok-1.5大语言模型。
此次升级版本在推理能力、代码生成和上下文理解等方面实现显著提升,尤其引人注目的是新增的多模态处理功能。据xAI官方技术博客披露,Grok-1.5能够同时解析文本、图像、音频和视频数据。
在基准测试中,Grok-1.5在MMLU、GSM8K等权威评估体系中的表现较前代提升超过30%。其上下文窗口扩展至128k tokens,大幅增强了对长文档和复杂对话的理解能力。
值得注意的是,该模型特别强化了数学与编程能力。在HumanEval代码生成测试中达到74.1%的准确率,已接近当前顶尖水平。xAI团队表示,这一进步得益于新型神经网络架构的优化。
作为马斯克"TruthGPT"愿景的最新实践,Grok-1.5延续了对抗幻觉机制的设计理念。模型内置的事实核查模块可实时验证生成内容的准确性,这项特性在新闻摘要等场景中表现突出。
目前Grok-1.5已开始向X平台Premium+订阅用户开放测试。xAI同时宣布,计划在未来季度实现API接口的商业化部署,这将为开发者提供更强大的AI工具支持。