【TechWeb】4月3日消息,有消息称阿里即将在2025年4月第二周发布新模型Qwen3,这将是阿里在2025年上半年最重要的模型产品。消息还称,DeepSeek-R1发布后,阿里云基础模型团队把策略中心进一步向模型的推理能力倾斜。
去年9月19日,阿里云CTO周靖人在2024云栖大会上发布通义千问新一代开源模型Qwen2.5,强化多轮对话与复杂任务处理能力,显著提升生成质量与逻辑连贯性。其中Qwen2.5-72B-Instruct版本在Chatbot Arena盲测中位列全球前十,成为首个进入该榜单的中国模型。
公开信息显示,自2023年8月起,阿里云相继开源Qwen、Qwen1.5、Qwen2、Qwen2.5等4代模型,囊括了0.5B、1.5B、3B、7B、14B、32B、72B、110B等全尺寸,大语言、多模态、数学和代码等全模态。(宜月)
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.