1、全球大模型技术进展与趋势
海外模型迭代与特点: 海外大模型近期高频迭代。GPT 5.1参数约2万亿 - 3万亿,激活比例300B - 400B,在数学、HL1等复杂测评维度得50多分;上下文工程版400K,专属版达百万级别,涵盖图像、视频、3D实时分析生成,对话延时300毫秒内,有多种个性化对话风格。谷歌的Gemini、Claude等全能模型,在代码生成等十几个维度测评分数达85 - 94分;Claude是编程领域开发者和企业首选,Grok被称为最接近AGI的模型,用于科研复杂推理和数据分析。Meta此前因团队内斗及Llama 4‘高分低能’沉寂,现秘密训练4.5模型,预计2025年第四季度末或2026年第一季度发布,届时海外赛道将有Meta、Grok、谷歌、OpenAI等五家竞争。
国内模型追赶与突破: 2025年11月,国内发布K2、MiniMax M2、阿里千问Max等模型,调整了全球大模型座次。K2在逻辑、数学、代码维度与海外模型接近,推理性能等匹配;采用万亿参数与超低稀疏路径,支持200万超长上下文,可动态进行200 - 300步深度推理,集成多种调用能力,是海外编程等场景首选。MiniMax M2等进入海外前六甚至前四,国内头部模型近期追赶进展显著。
大模型技术新趋势: 当前大模型技术呈现多维度趋势。一是全模态竞争加剧,头部模型向多模态扩展;二是智能体能力(含外部工具调用)成核心竞争力;三是开源模型加速追赶,Meta、阿里等重返赛道;四是音频模型进入第三代,单模型实现闭环任务;五是视频生成进入端到端合成阶段,音视频合成技术落地;六是世界模型化成新赛道,用于机器人训练等,海外由李飞飞团队等推进,国内阿里通过通义万相2.5参与,预计2026年形成语言模型与视觉AI(世界模型)两条主线。
2、千问APP出海竞争力分析
海外市场表现与优势: 千问等国内模型在海外市场表现突出。从API调用数据看,K2、M2等模型调用次数已进入海外前五,千问Max等头部模型也受到海外欢迎。其竞争力主要体现在三方面:一是技术性能领先,海外测评排名较为靠前;二是成本优势显著,模型调用成本相比OpenAI等海外平台具有较大优势;三是开源特性突出,采用MIT(如Deepseek)、Apache 2.0(如阿里模型)等开源模式,开源程度比海外闭源模型更透彻,便于开发者在满足本地合规要求时灵活定制。在本地化适配方面,东南亚的穆斯林国家(如印度、印尼、马来西亚)企业可基于开源模型输入本地化价值观体系和政策,使模型生成内容符合当地合规要求;日韩地区企业则利用开源模型进行日文、韩文定制,并针对行业需求深度开发本土化模型;中东地区企业因阿拉伯语等小语种及本地价值观体系需求,也倾向选择中国本土模型。
对阿里云增长的驱动: 海外业务通过多维度策略驱动阿里云增长。在业务模式上,海外与国内类似,国内早期以模型调用为主,2025年转向模型使用与本土化产品解决方案结合(如教育、交通、能源、政企等领域的解决方案),用户更多使用底层为模型的产品化Agent服务,并为产品溢价买单。利润方面,海外AI化Agent服务利润率高于国内。团队层面,通过在新加坡建立国际团队,将国内成熟方案转化为国际化版本并在海外推广,与谷歌、微软、AWS等大厂的标准品形成差异化竞争,聚焦其较少涉及的行业定制领域。合作模式上,绑定SAP、Salesforce等国际大厂,为其提供底层算力和AI支持,推动这些大厂的AI产品上云并部署在阿里云海外平台,从而拉动高质量用户增长,促进阿里云海外业务发展。
3、千问APP TO C战略与定位调整
改版与功能聚焦: 千问APP(原通义)过去一年功能堆砌、定位模糊,此前定位为‘全能AI助手’,有教育、娱乐等多频道及多种功能,但用户心智不清晰。经实践与复盘,团队认为AI时代用户需场景闭环的专属AI助手。11月中旬改版,砍掉教育等非核心功能,保留Chatbot、AI创意、智能体三大核心频道,聚焦‘搜索加电商’或‘搜索加智能体’定位。为统一开源社区用户心智,品牌从‘通义’改为‘千问’,降低用户理解成本。
用户画像与生态打通: 千问APP打通阿里系生态数据构建多维度用户画像。若用户注册账号为淘宝或支付宝账号,其淘系的购买、搜索、年度购物数据,以及阿里系其他APP(如地图、飞猪)的使用数据将被整合。用户在千问Chatbot的对话数据也会通过长记忆存储,与阿里系原有数据结合形成更饱满画像,精准理解用户背景和意图。推动交互从‘人找服务’向‘服务找人’升级,让智能体更懂用户需求。
服务集成与增长路径: 千问APP服务集成分两步:先接入非电商类服务(如地图、办公、阿里健康),使产品能对话且完成服务操作;再接入电商类服务(包括飞猪、淘宝购物、海外电商等)。国内服务打通后,将推进国际化,先推国内版,再推国际版服务全球用户和开发者。用户增长上,通过阿里系APP开屏广告引流,绑定88VIP联合会员账号(同步为千问会员账号),打通淘系VIP会员服务。目前千问日活百万级别,月活400万级别,团队预期流量将快速提升,从百万级日活到千万级日活仅需几个月。
4、千问与夸克APP差异化定位
夸克APP定位: 夸克APP自2018年起已运营多年,核心用户群体为15 - 26岁的学生及职场新人(涵盖高中、大学、研究生及刚上班人群)。产品功能围绕教育赛道,有拍题、题库(国内较强)、高考填报志愿等。近半年新增AI超级框功能,八、九月迭代为AI助手,支持多轮对话式搜索,定位为“搜索 + AI效率工具”。
千问APP定位: 过去千问与夸克功能有重叠,如通义曾涉及翻译、AI PPT、教育工具、办公功能等,致用户感觉重复建设。当前千问定位调整为“AI超级助理 + 智能体”服务,类比“ChatGPT + 亚马逊”组合。其与开源社区深度绑定,开发者累计下载6亿开源模型,衍生模型超10万个,这些开发者是千问的天然用户。通过模型与APP同名,利用开源社区力量,由开发者下载传播APP影响更多用户。
团队与资源调整: 为明确千问与夸克定位,团队资源从夸克向千问倾斜。此前夸克占用大预算和人力,现抽调部分人员,从其他团队引入有经验的C端产品及运营人员,加强千问团队C端产品力和运营能力。
5、阿里系产品AI重构成效
高德地图智能体: 高德地图已内嵌“小高”智能体,自2025年7月起启动灰度测试。目前,小高智能体日活超8000万,用户使用频率高。其优化了交互体验,用户可语音与智能体交互,如说“小高小高,我要到哪里”,智能体自动搜索并选路径;还能提出“到昆山玩”等需求,让其搜索附近酒店并完成位置规划。
电商场景AI应用: 电商板块,AI已覆盖搜索、导购、客服和广告场景。搜索与导购上,双十一可体验“AI One搜索”,传统搜索右下角新增“AI导购”,用户可询问商品评论、价格、质地等,缩短购买决策时间。客服方面,“店小秘”全面升级,支持全时段沟通,可解决85%的售前、售中、售后问题。广告采用“AI小万”投放架构,效果显著提升,ROI官宣提升12%,点击量提升10%,复杂语义相关性搜索准确率提升20%。AI在电商的搜索、推荐、广告维度已显成效。
AI赋能目标: 阿里系产品AI重构核心目标有三:提升流量匹配效率、为商家增效降本、缩短用户购买决策链路。目前已初见成效,仍在打磨。未来,AI对阿里电商的赋能将从局部向全量全链路渗透。
Q&A
Q:截至11月,全球大模型领域国内外代表性模型的进展情况如何?
A:海外方面,近期大模型高频迭代,接近GPT 5.1版本推出,谷歌酝酿下一代模型,头部模型长期占据前三、前四位置。GPT 5.1参数约2万亿至3万亿,激活比例300B~400B,采用极致稀疏超大参数路径,数学HL1测评得分50多分,工程版上下文长度400K、专属版达百万级别,模态涵盖图像、视频、3D实时分析生成,对话延时300毫秒内,支持科学家、律师等个性化对话风格。海外头部模型各有优势:谷歌多模态领域领先,Claude为编程领域首选,GPT 5.1均衡通用,Grok接近AGI、适用于科研行业;Meta内部团队调整,秘密训练下一代4.5模型,预计2023年第四季度末或2024年第一季度重返市场。此外,海外视觉生成模型发展迅速,音视频合成技术出现;音频技术进入第三代,单模型可实现SR、NLP、TTS功能。国内方面,11月推出叶子、2M的K2、MINI MAX M2及阿里千万山Max后,模型排名调整,K2在逻辑、数学、代码方面接近海外模型。国内头部模型持续追赶,第四季度与海外头部模型状态接近。K2在超长上下文、多智能体、推理数学方面领先,M2进入海外前六甚至前四;K2具备万亿参数、超低稀疏、超长上下文特性,集成记忆压缩、深度思考、动态推理、工具调用能力。2023年第三季度起,世界模型化成为国内外大厂新赛道,预计2024年大模型将分语言模型和视觉AI两条线,落地机身智能、机器人行业。
Q:当前全球大模型领域有哪些主要趋势?
A:全球大模型领域主要呈现四大趋势:全模态竞争加剧,头部语言模型向多模态模型加速迭代;模型智能体能力成为竞争焦点;Meta、阿里、Kimi、MiniMax等机构推动开源模型加速竞争;音频模型进入第三代,视频生成模型中,音视频合成与图像编辑成为新主流技术。
Q:未来千问模型出海的展望如何?在东南亚、日韩等地区的竞争力如何?能否与谷歌等模型竞争?从性价比与竞争力角度如何评估?
A:千问模型在海外开发者平台OPPO Roto的API调用次数中,头部模型如KK 2M2已进入前五,表现突出。其竞争力主要体现在三方面:一是海外测评排名领先;二是调用成本显著低于OpenAI等海外模型;三是开源程度更透彻,采用MIT、Apache 2.0等开源模式,支持免商用授权,为开发者提供更高灵活性。在东南亚,模型可通过输入本地化价值观与政策满足穆斯林国家、印度、印尼、马来西亚等地区的合规需求;在日韩,本土企业基于千问开源模型开发日文、韩文版本,针对行业深度定制;在中东,阿拉伯语小语种支持及价值观适配能力也推动中国本土模型更受客户青睐。综合成本、开源灵活性、可定制性及技术性能参数,千问模型在东亚、中东等区域具备较强竞争力。
Q:未来阿里云的海外业务如何体现在收入上?海外地区利润率是否高于国内?出海业务如何驱动阿里云整体增长?
A:未来阿里云海外收入主要通过两方面体现:一是提供模型服务及定制化服务,2025年客户需求将从直接调用模型转向使用本土化产品解决方案,用户更多使用产品化的智能代理及服务,此类产品化服务可获得溢价,海外AI化Agent服务整体利润率高于国内;二是通过新加坡国际团队将国内成熟方案本土化后推广至海外,与谷歌、微软、AWS等提供标准产品的大厂形成差异化竞争,同时绑定海外SAP、Salesforce等大厂,为其供应底层算力及AI支持,推动其AI上云并部署于阿里云海外平台,从而带来新增高质量用户,拉动海外业务增长。
Q:阿里当前改版推出千问APP的原因是什么?未来千问APP的核心功能、用户画像、端定位及战略布局如何?
A:阿里改版推出千问APP的主要原因在于,其前身通义APP原属阿里云ToB业务,用于展示模型能力,2024年12月划归专注C端产品的智能信息事业群后,用户规模显著落后于同部门的夸克,且原定位模糊,功能堆砌,不符合AI时代用户对场景闭环专属AI助手的需求。未来千问APP核心功能聚焦聪明到可以替用户做事的AI智能体,改版后保留主频道Chatbot、AI创意、智能体三大频道。用户画像通过打通阿里系生态数据与千问Chatbot对话数据,形成多维度长记忆用户画像。端定位区别于夸克,定位为中文版ChatGPT+亚马逊,强调主动服务用户。战略布局分阶段推进:第一步打通阿里系用户数据与画像融合;第二步集成服务;国内版先行,后续推出国际版;通过阿里系APP开屏广告引流、绑定VIP联合会员账号等方式快速提升流量。
Q:千问未来在用户DAU方面的短期目标是什么?
A:千问短期DAU目标为冲刺5000万级别,计划在明年上半年实现大几千万级别,并将5000万日活作为首要突破目标。
Q:夸克APP与同一系列其他APP在定位和功能上的核心差异是什么?
A:夸克自2018年起主要聚焦15-26岁学生及刚工作人群,核心功能围绕教育赛道,包括拍题、网盘、高考志愿填报等,近期迭代AI助手支持多轮对话搜索,当前定位为搜索+AI效率工具。千万则从AI工具箱升级为AI超级助理/智能体,类比ChatGPT+亚马逊,定位与电商及超级助理服务相关,由千万三、千万等模型赋能,绑定开源社区开发者,开发者为其天然用户,通过模型与APP同名强化社区传播。此前二者因功能重叠定位模糊,目前已明确区分:教育相关需求指向夸克,超级助理及电商相关需求指向千万。此外,夸克原占较大预算和人力,现抽调人员并引入经验丰富的C端产品及运营团队,加强千万的产品力与运营能力。
Q:未来在投入方面是否有预期的资金营销规模?全球化推广的计划及节奏如何?
A:全球化推广将分阶段推进:2023年11月聚焦核心功能,砍掉非核心功能,重点发展AI Chatbot、AI创作和智能体三大模块;第四季度末启动用户数据打通及更长记忆体构建,实现内容服务主动触达用户;2024年第一季度优先接入非电商板块;电商类中飞猪先接入,淘系先推出比价助手、种草、商品搜索等轻量级智能体,后续逐步覆盖搜索、比价、种草、下单、售后全流程;国内布局完成后,国际化推广将先推出对标ChatGPT的轻量级版本,与海外电商打通需等到2024年下半年。
Q:营销资金投入规模及量级有哪些参考依据?
A:营销资金规模可参考夸克的年营销投入水平,夸克年营销投入为10亿级别,覆盖数字媒体及线下户外媒体。2027财年营销投入预计与夸克相当,当前Q4及明年Q1将临时追加部分投入。营销方式包括生态内引流与生态外投流:阿里系20多个APP总用户达10亿级别,通过开屏广告引导下载实现生态内引流;生态外则通过广告投流获取新用户。核心仍依赖产品本身,通过大力改版优化产品定位与用户心智,以自然流量沉淀用户并稳定客户。
Q:淘天流量导流及后端数据对接涉及的跨部门合作由谁主导,使用淘天流量的费用承担是否有初步安排?
A:此前通用产品团队因跨事业部问题难以推动该合作,当前集团领导在评审新产品时发现通用流量主要被夸克占据,因此需加大夸克与通义的投入,合作由集团层面从上往下推动。目前淘系数据已打通,下一步需将现有管道迁移至目标产品。关于利益分配,当前首要任务是同步用户画像,流量分配、引流及结算等具体安排需后续规划明确,产品侧现阶段以规划为主。
Q:与ChatGPT、豆包、元宝等产品竞争时,阿里系APP的差异化打法是什么?如何更好利用国内国际流量资源?
A:豆包等产品的用户心智集中于Chatbot,其优势在于字节系数据支撑的高质量文本生成及抖音视频资源整合能力,阿里系因缺乏社交媒体流量及视频数据难以直接竞争。阿里的差异化打法核心包括:一是打通会员体系,将八八VIP等账号权限拓展至产品,通过VIP用户渗透提升使用粘性;二是依托阿里生态服务优势,结合全套用户体系与用户画像技术,实现从客户找内容到内容找客户的精准推荐;三是多端协同服务,凭借大、中、小尺寸模型布局,向手机、PC、AI硬件、汽车等端侧渗透,通过账号体系打通实现跨端服务同步,构建高壁垒体验;四是模型与智能体优势,模型开源全球排名靠前,智能体可扩展支持外部优质服务集成,通过自研与第三方服务结合提升覆盖能力。所有服务均基于多维用户画像构建的长记忆个性化库,实现实时精准推荐,形成核心竞争内核。
Q:未来千万APP的产品规划节奏如何?
A:千万APP产品规划分多阶段推进。第一阶段为改版,聚焦AI Chatbot、AI创作、智能体三大核心功能,砍掉非核心功能以建立用户心智。其中,AI Chatbot用于信息对话及上下文长记忆服务;AI创作旨在弥补电商内容短板,用户可分享AI生成的图片、视频及购买产品视频,未来内容可用于排名或搜索;智能体频道初期上线优质政体,后续引入生态系非电商服务。第二阶段为数据同步,完成长记忆数据、内部业务数据打通及用户画像同步,启动灰度测试。第三阶段为场景拓展,内置办公、无影、地图、健康等非电商场景;后续推进电商产品,先上线轻量级Agent,待账号、支付系统打通后形成购买及售后闭环。最终,明年第三季度国内商业闭环将逐步形成。
Q:信息智能事业群中,除夸克和通义外,当前孵化的AI原生应用有哪些?
A:信息智能事业群主要聚焦C端AI延伸应用,除夸克和通义外,孵化中的AI原生应用包括虚拟社交、VR淘宝版本、教育场景应用等,但均处于试验预演阶段,尚未形成流量规模。此外,UC浏览器、小说类应用等AI属性较弱的传统产品仍在迭代中。硬件方面,已上线AI眼镜未来将作为主打产品,当前售价3000余元,后续计划推出低配版;硬件迭代节奏为一年一代,软件则保持季度大版本更新。事业部同步推进软件APP与AI硬件两条产品线,持续推出新产品。
Q:除了夸克和通义之外,主站AI搜索及与高德AI线路规划融合等AI功能,目前是否已有表现突出的数据或未来可能成为爆款的案例?
A:部分产品已通过AI重构取得显著进展。高德地图内嵌的小高智能体自7月灰度测试以来,日活达8000余万,用户高频使用,支持语音交互完成目的地搜索及酒店规划等操作,优化用户体验。AI电商方面,AI One搜索及新增的AI导购功能计划于双十一推出,用户可通过AI导购查询商品评论、价格、质地等信息,缩短购买决策链路;客服系统升级为店小秘,可解决85%的售前、售中、售后问题,支持全时段服务。广告系统采用AI小万投放架构,ROI提升12%,推荐精度及点击量提升10%,复杂语义搜索准确率提升20%。当前AI在阿里电商板块的搜索、推荐、广告等维度已初步显现成效,后续将围绕提升流量匹配效率、商家增效降本、缩短用户决策链路三大核心目标,从局部向全链路渗透赋能。
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.