上周还在骂Grok"听不懂人话"的开发者,这周突然发现同一串提示词居然能跑了。没人收到通知,但API返回的结果确实变了——有人用代码检测工具比对,发现模型权重在72小时内被热更新过两次。
这种"静默迭代"在AI圈不算新鲜事,OpenAI也干过。但xAI的特别之处在于连版本号都懒得改,开发者只能靠输出结果的随机性来猜:今天抽风,明天可能就好了。一位在Reddit吐槽的用户被官方账号亲自回复:「Grok is constantly being updated, so there is a good chance that what didn't work for you even a few days ago might work now」——翻译成人话就是:你骂早了,再试试。
这种策略的副作用很明显。有团队上周刚把Grok接进客服系统,这周回答风格突变,用户以为换了个人工。更麻烦的是调试:昨天能复现的bug今天消失了,工程师连日志都不知道该抓哪份。一位产品经理在Hacker News抱怨,他们现在给Grok的提示词必须加时间戳,"就像跟金鱼谈恋爱,每次都得重新自我介绍"。
马斯克此前放话要让Grok"每周都有大更新",现在看来是把敏捷开发玩到了极致。没有发布会,没有changelog,连API文档里的示例代码都滞后于实际模型。有开发者调侃,xAI的更新频率和马斯克的推文密度成正比——后者凌晨三点发个表情包,前者四点就可能上线新特性。
目前xAI仍未回应是否会引入版本锁定机制。一位连续追踪了14天模型输出的研究员发现,Grok在数学推理上的准确率波动幅度高达23%,"比加密货币还难预测"。他最后把测试脚本改成了每小时跑一遍,"至少能知道自己活在哪个版本的时间线上"。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.