网易首页 > 网易号 > 正文 申请入驻

大语言模型2025这一年

0
分享至

中经记者 李昆昆 李正豪 北京报道

回望2025年,大语言模型行业取得了一些发展,但同时也面临着一定的挑战。DeepSeek凭借开源策略和推理功能成为黑马,用户增长很快。国内外头部厂商如OpenAI、谷歌、腾讯、阿里巴巴、字节跳动,以及智谱、月之暗面这些专业大模型公司,在技术、应用和生态上持续竞争。

财经专栏作者马继鹏接受《中国经营报》记者采访时表示,目前来看,整个行业还处于朝气蓬勃发展的一种状态,很明显的就是,这些互联网巨头研发的这些大语言模型,后劲还是比较足的,比如字节跳动的豆包、阿里巴巴的千问、百度的文心一言、腾讯的元宝。目前来看,各家的水平可能都差不多,但是互联网巨头在大模型应用方面,和专门做大模型的公司如Kimi、DeepSeek相比,有一些天然的优势,其更懂得怎么大规模地获取用户,怎么解决用户的实际问题。

2025这一年

综合2025年多个关键时间点的公开信息,腾讯混元大模型在这一年的发展可以概括为年初的技术攻坚与能力突破,到年中生态与应用的全面铺开,再到年底在“世界模型”上的战略卡位,体现了从技术追赶到场景落地的清晰路径。

比如,混元在模型能力升级方面,快慢思考结合,推出TurboS(快思考)与T1(慢思考)组合,增强推理与响应能力。

DeepSeek这一年的发展确实亮眼,从模型架构到应用场景都有不少突破。DeepSeek-V3‌(2024年12月发布)是当前的开源标杆,采用‌MLA(多头潜在注意力)‌和DeepSeek MoE架构‌,总参数达6710亿‌,每个token可激活370亿参数‌。它在数学推理(如MATH-500测试)和代码生成(如LiveCodeBench竞赛)中表现突出,甚至能与GPT-4o、Claude-3.5-Sonnet等闭源模型竞争。

DeepSeek-R1‌(2025年1月发布)则聚焦推理能力,性能与OpenAI o1正式版相当,支持上网搜索和PDF阅读,还开放了数据蒸馏和商业化使用。

如今,DeepSeek又推出了DeepSeek-V3.2和DeepSeek-V3.2-Speciale,DeepSeek-V3.2 的目标是平衡推理能力与输出长度,适合日常使用,例如问答场景和通用Agent任务场景。DeepSeek-V3.2-Speciale 的目标是将开源模型的推理能力推向极致,探索模型能力的边界。

而豆包大模型在技术、应用和生态上都实现了显著突破,已成为国内AI领域的头部玩家,日均token使用量突破50万亿,稳居中国第一、全球第三。

比如,在技术架构方面,推出混合专家模型(MoE)架构‌,通过动态稀疏激活技术,将万亿参数模型的推理成本降至行业平均水平的60%,性能杠杆提升至7倍。多模态交互,推出“视觉—语言—控制”三模态融合方案,在汽车工厂实践中实现缺陷检测响应时间从分钟级缩短至秒级。实时语音模型‌,采用Speech2Speech端到端框架,实现语音对话中真正意义上的语音理解生成端到端,具备高表现力与高情绪承接能力。

统一架构方面‌,Qwen2.5-VL-32B-Instruct采用统一的Transformer架构和共享向量空间,实现“万物皆可token化”;跨模态对齐‌,通过共享“语义中间层”统一表征,跨模态生成准确性提升40%以上;基准测试‌方面,在MMMU(多模态理解)测试中得分超过70分,MathVista(数学视觉推理)和DocVQA(文档视觉问答)测试中达到业界领先水平。

目前,“大模型四小龙”智谱AI、月之暗面、百川智能和MiniMax这四家公司都推出了各自特色的大模型产品。比如智谱AI在技术能力上‌,实现了参数规模从5万亿到10万亿级的翻倍增长,推理精度也提升到98.5%,接近国际领先水平。新发布的GLM-4.7在编程能力上表现突出,在Vals Index榜单中拿下开源模型第一,Design Arena胜率和Elo评分也紧追谷歌Gemini。

记者采访腾讯、小米等方面关于其大语言模型的发展,截至发稿前,对方尚未回复。

在马继鹏看来,他还是更看重有实际应用场景的,就是它在大模型基础上,开发了很多智能体应用,应用在不同行业,比如医疗行业、图文生成等,可能以后其市场前景会更好。

展望未来

大语言模型(LLM)的未来发展,可以用“更聪明、更垂直、更贴近生活”来概括。它正从技术突破走向深度应用,在多个领域带来实实在在的改变。

在业内看来,在技术突破方面,从“模仿”到“自主思考”。可验证奖励强化学习(RLVR)‌成为核心,让AI能拆解复杂问题、生成推理轨迹,自主探索解决方案。比如OpenAI的o3模型,在数学、代码等可验证任务中表现突出。多模态能力‌持续增强,像GPT-4o已能处理文本、图像和音频,成本更低、响应更快。

在应用升级方面,垂直领域专业化。整合编排‌成为新趋势,比如Cursor这类应用通过优化提示词、编排模型调用,将通用模型改造成垂直领域的“专业团队”。个性化体验‌和‌对话式AI‌会大幅提升,企业能用LLM提供定制化服务,增强用户黏性。

智能体方面,本地化智能体‌如Anthropic的Claude Code(CC)直接部署在用户设备中,可访问本地数据,实现低延迟交互,实用价值远超云端集群。编程方面,门槛降低。氛围编程‌兴起,普通人用自然语言就能构建复杂程序,专业开发者也能突破技术限制,实现轻量化开发;语言翻译‌和‌本地化‌将显著进步,LLM能提供更自然、符合语境的翻译,助力跨语言沟通。交互革新,告别纯文本。业内人士指出,可视化交互‌成为新趋势,LLM将告别纯文本,进入更直观、更丰富的交互时代。隐私保护技术方面,‌将建立用户信任,确保LLM应用符合伦理标准。

展望未来,挑战与机遇并存。业内人士认为,数据多样性与质量‌是主要瓶颈,需提升数据来源和标注质量。模型可解释性‌和‌透明度‌不足,需加强监管和防范措施。技术标准与规范‌缺乏,需制定统一标准,提升开发效率。

马继鹏认为,大模型企业未来的发展方向,无非就是两个:第一,就是像DeepSeek这类,在基础能力、技术能力方面,其会走得越来越强,代表中国和OpenAI在技术方面竞争。第二,就是在应用方面可能会更厉害。在应用方面,可能有两个重要的方向:一是比较虚拟的,比如图文生成、视频生成,它本质上是结合目前互联网上的大数据给用户提供一些比较可靠的答案;还有一个应用方向,就是在具身智能领域的应用,具身智能其实是一个物理的人工智能,但是其大脑还是需要大模型的,这是一个非常好的应用方向,而且具身智能也是未来几年国家鼓励发展的一个方向。

(编辑:吴清 审核:李正豪 校对:张国刚)

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
宜家的问题已经挺严重了

宜家的问题已经挺严重了

蔚然未来消费
2026-01-08 08:34:50
闫学晶风波不断升级!网友扒出其儿子考中戏新疆班,分数要低30分

闫学晶风波不断升级!网友扒出其儿子考中戏新疆班,分数要低30分

小徐讲八卦
2026-01-07 16:31:06
2026年春节,要暖到离谱?大年初一撞上七九,老辈人:60年头回见

2026年春节,要暖到离谱?大年初一撞上七九,老辈人:60年头回见

叮当当科技
2026-01-07 13:58:49
0比3惨案!张本智和遭薛飞横扫,多哈奥运备战拉响警报

0比3惨案!张本智和遭薛飞横扫,多哈奥运备战拉响警报

阿晞体育
2026-01-08 12:44:16
谢婷婷携男友回香港探亲,抱半岁儿子与亲友聚餐,一家住豪华酒店

谢婷婷携男友回香港探亲,抱半岁儿子与亲友聚餐,一家住豪华酒店

小小李娱
2026-01-08 10:01:25
雷军的道歉,打了多少友军的脸

雷军的道歉,打了多少友军的脸

此地无言
2026-01-06 23:39:23
天助阿森纳:1-1,英超第2遭英超第10逼平,28岁日本球星破门救主

天助阿森纳:1-1,英超第2遭英超第10逼平,28岁日本球星破门救主

侧身凌空斩
2026-01-08 05:25:59
体检报告中,若这3个指标都正常,基本可排除很多疾病

体检报告中,若这3个指标都正常,基本可排除很多疾病

财经早餐
2025-08-05 06:38:02
美媒:克林根曾被视为杨瀚森过渡替身 如今已成开拓者建队基石

美媒:克林根曾被视为杨瀚森过渡替身 如今已成开拓者建队基石

罗说NBA
2026-01-08 06:52:21
女首相被吓哭了!

女首相被吓哭了!

钧言堂
2026-01-07 12:36:38
老家河南:一家五个孩子,其中四个离婚了,离婚理由都令人无法反驳

老家河南:一家五个孩子,其中四个离婚了,离婚理由都令人无法反驳

救赎之旅
2026-01-07 07:06:32
“刚买的新车,就要拆发动机大修!”知名大牌汽车,引发沪上消费者“集体维权”

“刚买的新车,就要拆发动机大修!”知名大牌汽车,引发沪上消费者“集体维权”

新民晚报
2026-01-07 20:30:39
14周连跌,俄罗斯油价暴跌至36美元/桶

14周连跌,俄罗斯油价暴跌至36美元/桶

桂系007
2026-01-07 23:47:14
武汉大学女教授献血300次事件,违背常识是最大的恶

武汉大学女教授献血300次事件,违背常识是最大的恶

清书先生
2026-01-07 16:26:41
拒20分逆转!雷霆加时险胜爵士 亚历山大46+6+6献绝平球

拒20分逆转!雷霆加时险胜爵士 亚历山大46+6+6献绝平球

醉卧浮生
2026-01-08 11:49:07
26年央视春晚嘉宾名单曝光,牛鬼蛇神混子引争议

26年央视春晚嘉宾名单曝光,牛鬼蛇神混子引争议

杜鱂手工制作
2026-01-06 18:48:05
郑爽近照越来越像妈妈!首曝居住环境消费严重降级,衣服只要200

郑爽近照越来越像妈妈!首曝居住环境消费严重降级,衣服只要200

古希腊掌管月桂的神
2026-01-07 22:24:06
杨瀚森打火箭效果明显!防守+卡位明显提升,策应亮眼给正向带动

杨瀚森打火箭效果明显!防守+卡位明显提升,策应亮眼给正向带动

篮球资讯达人
2026-01-08 13:49:41
唐嫣在国外很豪放!穿连体衣下面不系扣,难道不好好穿衣就时髦?

唐嫣在国外很豪放!穿连体衣下面不系扣,难道不好好穿衣就时髦?

章眽八卦
2026-01-05 12:27:07
罗晋携任素汐去祈福后,唐嫣连发三文表态,婚变传闻终于真相大白

罗晋携任素汐去祈福后,唐嫣连发三文表态,婚变传闻终于真相大白

瓜汁橘长Dr
2025-12-29 11:29:56
2026-01-08 16:44:49
中国经营报 incentive-icons
中国经营报
中国经营报微博由《中国经营报》社有限公司运营,与中国企业同步成长
20032文章数 30123关注度
往期回顾 全部

科技要闻

智谱拿下“全球大模型第一股”,凭什么

头条要闻

9岁女孩课堂写试卷昏倒去世 家属不忍尸检称"她怕疼"

头条要闻

9岁女孩课堂写试卷昏倒去世 家属不忍尸检称"她怕疼"

体育要闻

约基奇倒下后,一位故人邪魅一笑

娱乐要闻

2026春节档将有六部电影强势上映

财经要闻

微软CTO韦青:未来人类会花钱"戒手机"

汽车要闻

从量变到"智"变 吉利在CES打出了五张牌

态度原创

本地
游戏
房产
艺术
公开课

本地新闻

1986-2026,一通电话的时空旅程

这款画风清奇的新游,竟成了外媒最期待的海盗游戏?

房产要闻

三亚新房,又全国第一了!

艺术要闻

颐和园金光穿洞

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版