2 月 9 日,在 HuggingFace 的 GitHub 开源项目页面中,Qwen3.5 并入 Transformers 的新 PR(提交代码合并申请)于昨天首次公布。
先前外媒 The Information 曾爆料称,Qwen3.5 将在春节期间开源。而在本月早些时候,智谱首席科学家唐杰也在微博上透露,近期将有包括 DeepSeek v4、Qwen3.5、GLM-5 在内的众多新模型登场。
据IT之家了解,2025 年 4 月 29 日,阿里巴巴发布了新一代 Qwen3 模型,一举登顶全球最强开源模型。这是国内首个“混合推理模型”,将“快思考”与“慢思考”集成进同一个模型,大大节省算力消耗。
本文源自:IT之家
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.