马斯克刚刚发布Grok 4.1,直接霸榜大模型竞技场第一和第二。Grok 4.1思考模式以1483分稳居榜首,领先非xAI模型中的最高分整整31分。非思考模式拿下1465分,排名第二,超越了排行榜上所有其他模型的完整推理模式。更夸张的是速度。之前的Grok 4在排行榜上还只排第33位,不到半年时间,xAI就实现了巨大飞跃。在大模型竞技场新推出的专家榜和职业榜上,Grok 4.1思考模式同样霸榜。专家榜中的题目预计只有各自领域的顶尖专家才会提出,职业榜分为八个细分领域:软件和IT服务,写作、文学和语言,生命科学、物理科学和社会科学,娱乐、体育和媒体,商业、管理和财务运营,数学,法律与政府,医疗保健。Grok 4.1目前只在文学榜上输给Gemini 2.5,数学榜输给Claude 4.5和o3,其他六个榜单均拿下第一。在非用户投票的EQ-Bench情商测试中,Grok 4.1的表现同样出色,超过刚发布不久的Kimi K2(非Thinking版本)。这个测试评估的是主动情商能力、理解力、洞察力、同理心和人际交往技能。目前,Grok 4.1已经在grok.com、X平台以及iOS和Android应用上向所有用户开放,默认以自动模式推出,用户也可以在模型选择器中明确选择Grok 4.1。



