GLM-5V-Turbo这个名字听起来像显卡超频,其实是智谱憋了半年的多模态大模型。昨天突然上线,没开发布会,没找KOL预热,官网更新完公告才补发——这种"先斩后奏"的打法,在国内AI厂商里算少见的。
参数上对标GPT-4o,但价格砍到0.3元/千tokens,差不多是OpenAI的三分之一。智谱内部的人私下吐槽过,之前GLM-4V定价"参考竞品"定高了,客户跑了一批,这次算是「把利润压到地板,先把人圈进来」。
多模态赛道现在有点尴尬。GPT-4o视觉能力确实强,但国内厂商用起来贵、审查严;开源的Qwen-VL便宜,但企业客户嫌支持弱。智谱选了个中间路线:闭源模型+国产合规+骨折价,专打那些"既要又要"的B端客户。
有个细节挺有意思。GLM-5V-Turbo的API文档里埋了个彩蛋:视频理解默认只处理前10秒,超过要额外计费。有开发者测完发现,这10秒刚好覆盖80%的短视频场景——产品经理显然研究过抖音的完播率数据。
智谱没公布训练成本,但业内估算这种规模的视觉模型,单次推理成本比纯文本高5-8倍。0.3元的定价大概率是赔本赚吆喝,跟去年字节豆包的价格战一个路数。区别是字节有钱烧,智谱上一轮估值200亿人民币,账上子弹没那么多。
目前GLM-5V-Turbo的排队时长在2秒左右,比GLM-4刚发布时稳定多了。有用户反馈说识别手写公式准确率还行,但碰到艺术字会抽风——这毛病GPT-4o也有,算是视觉模型的通病。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.