![]()
3月30日,AI圈的两条公告相隔几小时发布,却像两条分叉的铁轨——一条指向"堆料协作",一条押注"单兵全能"。
微软的Copilot Cowork正式上线Frontier项目。核心功能Critique让OpenAI的GPT起草研究回复,再由Anthropic的Claude审核准确性、完整性和引用质量。两家竞争对手的旗舰模型,被塞进同一个产品里串行工作。微软把这叫做"多模型时代",DRACO基准得分57.4,比GPT单打独斗提升13.8%。
阿里没给对手留面子
同一天,阿里Qwen团队放出Qwen3.5-Omni。一个模型,能看、能听、能说、能写代码,覆盖113种语言。没有调用链,没有模型间握手,没有"你写我审"的接力赛。
微软的路线像精密手术室:GPT主刀,Claude当麻醉+器械护士,分工明确但流程冗长。阿里的路线像全科医生坐诊,一个人问诊、检查、开方、做手术——效率取决于个体能力上限,而非团队协作损耗。
两条路线的成本结构完全不同。 Cowork每轮对话要跑两次推理,Token消耗翻倍,延迟叠加。Omni的单次推理架构,理论上能把边际成本压到前者的几分之一。这对企业采购决策的影响,比任何技术白皮书都直接。
语言覆盖是道隐形门槛
113种语言不是炫技数字。全球前五大AI消费市场中,印度、印尼、巴西的非英语用户占比超过60%,但多数模型对这些语言的推理质量断崖式下跌。Omni的覆盖清单里包含斯瓦希里语、泰卢固语、爪哇语——这些在GPT-4的训练数据里属于"长尾中的长尾"。
微软的选择有历史包袱。它同时投资了OpenAI和Anthropic,两家模型必须雨露均沾,"多模型"是政治正确的技术叙事。阿里没有这种股东结构,可以押注单一架构的极限压缩。
但单模型路线有个致命赌点:故障排查。 Cowork出问题,工程师能定位是GPT的幻觉还是Claude的过度谨慎。Omni黑箱化后,错误归因变成考古学——你得从113种语言的混合表征里挖线索。
行业正在被迫站队
创业公司现在面临残酷选择:接Cowork的API要付双份模型费,接Omni要赌阿里生态的稳定性。没有中间路线。某东南亚电商SaaS创始人告诉我,他们测试了两套方案处理印尼客户的语音工单,Omni的端到端延迟比Cowork低40%,但遇到爪哇语方言时直接输出乱码——Cowork虽然慢,GPT会先翻译成英语再给Claude审核,反而绕过了方言陷阱。
这个案例暴露了两种哲学的适用边界:任务越标准化,单模型越香;场景越边缘,多模型的冗余设计越值钱。
微软和阿里都没公布定价。但Omni的开源协议已经挂在Hugging Face上,开发者可以本地部署。Cowork目前仅限Frontier订阅用户,企业版报价单据说正在各CIO的邮箱里躺着。
如果明年此时,Omni的方言覆盖率从113涨到200,而Cowork的DRACO分数没突破65,这场分叉的胜负还有悬念吗?
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.