阿里通义千问发布了新一代推理模型Qwen3-30B-A3B-Thinking-2507。该模型在数学、代码、通用能力(写作、Agent能力、多轮对话、多语言指令遵循)以及知识水平方面相较于上一版本(Qwen3-30-A3B)均有显著提升,并在多项评测中超越了Gemini2.5-Flash(thinking)和Qwen3-235B-A22B(thinking)。Qwen3-30B-A3B-Thinking-2507原生支持256K tokens的上下文长度,并可扩展至1M tokens。该模型已在魔搭社区和HuggingFace上开源。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.