大模型横评传送门: 网页链接好消息:o1-mini 和 o1-preview 最新分数出炉~坏消息:还是比 chatgpt-4o-latest 低。这两个前段时间讨论热度极高的模型从用户端实际体验上比较一般,可能因为思维链的模式导致stream 模式速度太慢了。Cohere 和 llama 分别是更新到了 command-r-plus-08-2024 版本和 llama3.2 版本。这俩难兄难弟的提升几乎一样,一起从倒数第四和倒数第三提升到了中游水平。吊车尾的 Mixtral 是真不想更新啊。此外零一万物的 yi-lightning 也进入竞技场匹配池啦,期待下外网“力压” gpt-4o-2024-05-13 的新模型在国内中文语料下表现如何,过两天一起看分数!
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.