网易首页 > 网易号 > 正文 申请入驻

国泰海通:DeepSeek~V3.1加强智能体支持 与国产AI芯片协同创新

0
分享至

智通财经APP获悉,国泰海通发布研报称,DeepSeek V3.1在多项指标上性能大幅领先R1-0528,加强了智能体支持,独创性使用UE8M0 FP8 Scale精度,与国产AI芯片协同创新。DeepSeek-V3.1加强了智能体支持,并且针对下一代国产AI芯片设计;该行维持计算机板块“增持”评级。

国泰海通主要观点如下:

DeepSeek-V3.1发布包含三大升级

①混合推理架构,一个模型同时支持思考模式和非思考模式,官方App与网页端模型已同步升级为DeepSeek-V3.1,用户可以通过“深度思考”按钮,实现思考模式和非思考模式自由切换;②更高的思考效率,相比DeepSeek-R1-0528,DeepSeek-V3.1-Think能在更短时间内给出答案;③更强的Agent能力,通过Post-Training优化,新模型在工具使用与智能体任务中的表现有较大提升。

工具调用/智能体支持进一步增强

①编程智能体,在代码修复测评SWE与命令行终端环境下的复杂任务(Terminal-Bench)测试中,DeepSeek-V3.1相比之前的DeepSeek系列模型有明显提高。②搜索智能体,DeepSeek-V3.1在多项搜索评测指标上取得了较大提升。在需要多步推理的复杂搜索测试(browsecomp)与多学科专家级难题测试(HLE)上,DeepSeek-V3.1性能已大幅领先R1-0528。③思考效率提升,测试结果显示,经过思维链压缩训练后,V3.1-Think在输出token数减少20%-50%的情况下,各项任务的平均表现与R1-0528持平。同时,V3.1在非思考模式下的输出长度也得到了有效控制,相比于DeepSeek-V3-0324,能够在输出长度明显减少的情况下保持相同的模型性能。

API&模型开源,使用UE8M0 FP8 Scale精度

①V3.1的Base模型在V3的基础上重新做了外扩训练,一共增加训练了840Btokens。Base模型与后训练模型均已在Hugging face与魔搭开源。②需要注意的是,DeepSeek-V3.1使用了UE8M0 FP8 Scale的参数精度,UE8M0 FP8是针对即将发布的下一代国产芯片设计。③另外,V3.1对分词器及chat template进行了较大调整,与DeepSeek-V3存在明显差异。

风险提示:大模型技术发展不及预期;下游应用拓展不及预期;与AI算力硬件协同不及预期。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
谁也拦不住贾国龙埋葬西贝

谁也拦不住贾国龙埋葬西贝

不惑猪的频道
2026-01-17 19:26:43
大溃败!中国网贷公司,在印度全军覆没

大溃败!中国网贷公司,在印度全军覆没

首席品牌评论
2026-01-07 18:20:00
周最佳球员:西部亚历山大 东部阿德巴约

周最佳球员:西部亚历山大 东部阿德巴约

北青网-北京青年报
2026-01-20 07:30:05
安徽画家关玉梅被判处死刑,死前拒吃断头饭,临行前一句话众人泪目

安徽画家关玉梅被判处死刑,死前拒吃断头饭,临行前一句话众人泪目

红豆讲堂
2024-11-15 11:25:33
2026年新成语:恶意寻子!该警惕了,细节越挖越心寒!

2026年新成语:恶意寻子!该警惕了,细节越挖越心寒!

你食不食油饼
2026-01-11 06:41:42
西安代驾圈,挤满了失业的经理人 | 人间

西安代驾圈,挤满了失业的经理人 | 人间

网易人间
2026-01-19 14:04:31
联盟第一!哈登爆砍36分,快船惊险战胜奇才

联盟第一!哈登爆砍36分,快船惊险战胜奇才

阿衃体育
2026-01-20 08:02:28
新京报批评牛娜对丈夫“公开处刑”!评论区却遭到网友怒怼!

新京报批评牛娜对丈夫“公开处刑”!评论区却遭到网友怒怼!

阿燕姐说育儿
2026-01-19 12:46:12
一个残忍的现象:当你接触的人越多,就会发现,越是嘴甜、会来事、情商高的人,往往背后最会算计人

一个残忍的现象:当你接触的人越多,就会发现,越是嘴甜、会来事、情商高的人,往往背后最会算计人

品读时刻
2026-01-19 09:08:21
谁也没想到,被传“风流成性,绯闻不断”的左小青,如今成了这样

谁也没想到,被传“风流成性,绯闻不断”的左小青,如今成了这样

小熊侃史
2026-01-20 07:50:03
恩爱29年遭遇背叛,陈凯歌的“喜新厌旧”终成悲剧

恩爱29年遭遇背叛,陈凯歌的“喜新厌旧”终成悲剧

阿废冷眼观察所
2026-01-17 10:37:27
美国签证太离谱!晒了一条朋友圈,签证被撤了!

美国签证太离谱!晒了一条朋友圈,签证被撤了!

易签visa
2026-01-19 11:23:01
中国向全世界披露:美国4400颗卫星,包围中国空间站,这是要做啥

中国向全世界披露:美国4400颗卫星,包围中国空间站,这是要做啥

素衣读史
2026-01-17 18:35:57
WTT公布新加坡大满贯双打名单,莎头组合不在其中,原因让人心疼

WTT公布新加坡大满贯双打名单,莎头组合不在其中,原因让人心疼

球盲百小易
2026-01-20 00:56:22
他是史书上贪图好色的享乐者,也是明朝中兴的关键角色

他是史书上贪图好色的享乐者,也是明朝中兴的关键角色

新京报
2026-01-18 16:36:10
养老金发放时间定了!2026年2月遇春节,14日前多数地区到账

养老金发放时间定了!2026年2月遇春节,14日前多数地区到账

复转这些年
2026-01-19 23:53:23
寒潮、冰冻、大风多预警发布 南方局地降温10℃以上

寒潮、冰冻、大风多预警发布 南方局地降温10℃以上

极目新闻
2026-01-20 07:02:53
31岁中国女留学生刚到英国三天,时差还没倒过来,就和人发生关系

31岁中国女留学生刚到英国三天,时差还没倒过来,就和人发生关系

百态人间
2026-01-18 05:30:04
媒体称武打明星梁小龙去世,其个人社交媒体10小时前发文“此事古难全”

媒体称武打明星梁小龙去世,其个人社交媒体10小时前发文“此事古难全”

红星新闻
2026-01-18 16:54:14
李亚鹏没想到,儿童医院陷租金纠纷不到两天,前妻王菲口碑暴跌

李亚鹏没想到,儿童医院陷租金纠纷不到两天,前妻王菲口碑暴跌

秋风悲画芯
2026-01-20 01:27:48
2026-01-20 08:51:00
智通财经 incentive-icons
智通财经
全球资本市场财经资讯提供者
1084998文章数 101242关注度
往期回顾 全部

科技要闻

去年预亏60亿后再投百亿 两大车企紧抱华为

头条要闻

女子订3间双床房被告知是3张单人床 退订扣80%违约金

头条要闻

女子订3间双床房被告知是3张单人床 退订扣80%违约金

体育要闻

错失英超冠军奖牌,他却在德甲成为传奇

娱乐要闻

吴磊起诉白珊珊诽谤,白珊珊称被盗号

财经要闻

2026股市猜想

汽车要闻

徐军:冲击百万销量,零跑一直很清醒

态度原创

本地
旅游
房产
艺术
手机

本地新闻

云游内蒙|黄沙与碧波撞色,乌海天生会“混搭”

旅游要闻

重庆黔江:峡谷梅香引客来

房产要闻

中旅・三亚蓝湾发布会揭秘自贸港好房子高阶形态

艺术要闻

瑞典艺术大师,佐恩人物作品精选19幅

手机要闻

苹果iPhone 18系列售价曝光:起步维持原价,大容量版本起飞

无障碍浏览 进入关怀版