1月26日,阿里发布千问旗舰推理模型Qwen3-Max-Thinking。阿里称,Qwen3-Max-Thinking在多个关键维度上实现了显著提升,包括事实知识、复杂推理、指令遵循、人类偏好对齐以及智能体能力。在19项权威基准测试中,其性能可媲美GPT-5.2-Thinking、Claude-Opus-4.5和Gemini 3 Pro等顶尖模型。Qwen3-Max-Thinking引入两项核心创新:1.自适应工具调用能力,可按需调用搜索引擎和代码解释器,现已上线Qwen Chat;2.测试时扩展技术(Test-Time Scaling),显著提升推理性能。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.