最新的Grok 4.1刚刚发布,带来了一些非常令人印象深刻的升级。如果你一直关注这个领域的AI发展,这个版本值得关注。
这些改进是真实的。创意写作现在感觉更自然——对话更加流畅,情感智力水平提高了,协作互动实际上感觉更具协作性。它能够捕捉到早期版本完全会忽略的微妙上下文。
性能方面?幻觉降低了大约 3 倍。这在依赖准确性的情况下是巨大的。响应速度也明显更快,这使得实时应用程序更加可行。
也许最具说明性的是:它在LMSYS Arena排行榜上以1483的Elo评分在思考模式中刚刚夺得第一。这不是市场宣传的虚假信息——这是用户偏好的直接数据。
对于任何构建工具或只是关注人工智能能力发展方向的人来说,此次发布设定了一个新基准。
查看原文