网易首页 > 网易号 > 正文 申请入驻

DeepSeek-V3.1发布,字节开源大型语言模型 | 蓝媒GPT

0
分享至


DeepSeek-V3.1正式发布

8月21日,据DeepSeek官方公众号消息,DeepSeek-V3.1正式发布。本次升级包含以下主要变化:混合推理架构:一个模型同时支持思考模式与非思考模式;更高的思考效率:相比DeepSeek-R1-0528,DeepSeek-V3.1-Think能在更短时间内给出答案;更强的Agent能力:通过Post-Training优化,新模型在工具使用与智能体任务中的表现有较大提升。官方App与网页端模型已同步升级为DeepSeek-V3.1。用户可以通过“深度思考”按钮,实现思考模式与非思考模式的自由切换。

DeepSeek官微留言:UE8M0 FP8是针对即将发布的下一代国产芯片设计

8月21日,DeepSeek在其官宣“正式发布DeepSeek-V3.1”的文章里面提到,DeepSeek-V3.1使用了UE8M0 FP8 Scale的参数精度。另外,V3.1对分词器及chat template进行了较大调整,与 DeepSeek-V3 存在明显差异。DeepSeek官微在置顶留言里说,UE8M0 FP8是针对即将发布的下一代国产芯片设计。

2025年《财富》中国科技50强榜单发布,DeepSeek、宇树等上榜

8月21日,《财富》(FORTUNE)正式发布“2025年中国科技50强”榜单,其中,DeepSeek、阿里巴巴、腾讯、字节跳动、宇树科技、珞石机器人、创新奇智、中关村科金等多家大模型、具身智能公司上榜。

国内多数AI模型训练使用的中文数据占比已超60%

8月21日,中文数据在国内AI大模型的训练性能提升方面发挥着重要作用。国家数据局近日发布的数据显示,目前国内多数AI模型训练使用的中文数据占比已经超过60%,有的模型达到80%。中文高质量数据的开发和供给能力持续增强,推动我国人工智能模型性能快速提升。国家数据局局长刘烈宏表示,我国人工智能的快速发展,与我国高度重视数据工作是密不可分的。作为人工智能发展的核心要素之一,数据在推动“人工智能+”过程中发挥着关键作用,高质量数据集的建设至关重要。

智元灵犀X2即将完成量产,将于8月底开始陆续供应

在8月21日的智元机器人首届合作伙伴大会上,智元机器人联合创始人兼CTO彭志辉透露,智元灵犀X2即将完成量产,将于8月底开始陆续供应,第四季度起不限量发货。

智元机器人预计明年出货量将达数万台

8月21日,智元机器人首届合作伙伴大会8月21日在沪召开。从会上获悉,智元机器人今年会有数千台的出货量,明年预计会有数万台的出货,智元机器人希望在未来几年,每年出货量可达到数十万台。

字节开源大型语言模型 Seed-OSS-36B

8月21日,字节跳动旗下的 Seed 团队在 AI 代码分享平台 Hugging Face 上发布了最新的开源大型语言模型 Seed-OSS-36B。Seed-OSS-36B 的架构结合了多种常见的设计选择,包括因果语言建模、分组查询注意力(Grouped Query Attention)、SwiGLU 激活函数、RMSNorm 和 RoPE 位置编码。每个模型包含 360 亿参数,分布在 64 层网络中,并支持 15.5 万词表。这一新模型最大上下文长度可达 512k tokens,能够在不损失性能的情况下处理超长文档和推理链。

Lanmeih/今日话题

你怎么评价DeepSeek最新的模型?

咱们评论区聊聊~

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
李谷一不再沉默,揭晓宋祖英“消失”的真相,观众:原来是这样

李谷一不再沉默,揭晓宋祖英“消失”的真相,观众:原来是这样

查尔菲的笔记
2025-09-02 16:01:14
日本发现李白书法,经鉴定为唐代真迹无疑,这字也就他能写得出来

日本发现李白书法,经鉴定为唐代真迹无疑,这字也就他能写得出来

书法网
2025-09-13 17:57:00
英国最大代表团来访,对华提出一个条件,中国要求英方对等回应

英国最大代表团来访,对华提出一个条件,中国要求英方对等回应

通文知史
2025-09-15 01:40:03
赖清德向岛民承诺“开打后,决不向大陆投降”,转头就被美国卖了

赖清德向岛民承诺“开打后,决不向大陆投降”,转头就被美国卖了

古事寻踪记
2025-09-16 07:50:28
炫富翻车,华裔真豪门锤爆假千金,400万人围观上流社会鄙视链!

炫富翻车,华裔真豪门锤爆假千金,400万人围观上流社会鄙视链!

BenSir本色说
2025-09-11 22:47:22
9.16股市早8点丨都是大消息好消息,尘埃落定,看涨!

9.16股市早8点丨都是大消息好消息,尘埃落定,看涨!

沙黾农
2025-09-16 06:30:44
从世锦赛惨败看东京失利:因利益地方和排协插手,郎导已无选人权

从世锦赛惨败看东京失利:因利益地方和排协插手,郎导已无选人权

金毛爱女排
2025-09-14 00:00:08
为了永留美国,在联合国大楼举牌抹黑中国的张晓宁,终于“圆梦”

为了永留美国,在联合国大楼举牌抹黑中国的张晓宁,终于“圆梦”

壹知眠羊
2025-09-14 19:11:45
除了篮球啥都玩!西蒙斯晒近期动态:出游+钓鱼+玩橄榄球

除了篮球啥都玩!西蒙斯晒近期动态:出游+钓鱼+玩橄榄球

直播吧
2025-09-15 09:59:11
快船紧急交易伦纳德!鲍尔默放话:肖华别玩火自焚

快船紧急交易伦纳德!鲍尔默放话:肖华别玩火自焚

逗逗睡不醒
2025-09-15 16:51:32
今天有望领涨的三条主线

今天有望领涨的三条主线

趋势巡航
2025-09-16 06:34:24
央视曝光后,电白区成立联合调查组,连夜行动

央视曝光后,电白区成立联合调查组,连夜行动

新京报政事儿
2025-09-15 19:46:14
外籍童模公然辱华后续!父母拒绝道歉再次挑衅,品牌终止一切合作

外籍童模公然辱华后续!父母拒绝道歉再次挑衅,品牌终止一切合作

不写散文诗
2025-09-15 12:11:12
苹果 iOS 26 正式版推送:全新液态玻璃设计、AI 功能改进

苹果 iOS 26 正式版推送:全新液态玻璃设计、AI 功能改进

IT之家
2025-09-16 01:18:26
澳洲杨兰兰是谁?五层“身份套娃”揭秘:她或许根本就不存在

澳洲杨兰兰是谁?五层“身份套娃”揭秘:她或许根本就不存在

麦大人
2025-08-18 18:02:38
1941年李讷贴身保姆被奸杀,保卫部:排队去洗澡,巧妙找出真凶

1941年李讷贴身保姆被奸杀,保卫部:排队去洗澡,巧妙找出真凶

纪实文录
2025-07-03 18:00:55
让北宋头痛不已的“契丹”,是如今的哪个民族?说出来你可能不信

让北宋头痛不已的“契丹”,是如今的哪个民族?说出来你可能不信

混沌录
2025-09-12 21:51:22
钱再多有什么用?从主持人到“精神病”,48岁李维嘉现状令人唏嘘

钱再多有什么用?从主持人到“精神病”,48岁李维嘉现状令人唏嘘

小娱乐悠悠
2025-09-16 06:59:58
赵长鹏香港大会发言全文:迟早会有市场寒冬,我们都要经历周期

赵长鹏香港大会发言全文:迟早会有市场寒冬,我们都要经历周期

吴说
2025-09-15 20:18:08
95年女友考清华和我分手,我入伍21年升任师长,退役后与她再度重逢

95年女友考清华和我分手,我入伍21年升任师长,退役后与她再度重逢

晓悦流年
2025-09-11 16:39:33
2025-09-16 08:52:49
蓝媒汇财经plus incentive-icons
蓝媒汇财经plus
聚焦财经热点解读行业动态
458文章数 247关注度
往期回顾 全部

科技要闻

中国将依法依规开展TikTok技术出口审批

头条要闻

牛弹琴:特朗普又夸中国了 羡慕中又透出一些焦虑不服

头条要闻

牛弹琴:特朗普又夸中国了 羡慕中又透出一些焦虑不服

体育要闻

诺维茨基退役十年后,德国篮球走向巅峰

娱乐要闻

60岁张曼玉定居法国:瘦成皮包骨?

财经要闻

华与华秒怂 罗永浩称已接到对方道歉

汽车要闻

后轮转向和5C 2026款梦想家把想到的都给了

态度原创

亲子
数码
教育
房产
公开课

亲子要闻

我该怎么办呢?

数码要闻

苹果 AirPods 4 / Pro 2 耳机推送 8A356 固件

教育要闻

决胜中层——学校中层管理干部实操进阶高级研修班

房产要闻

当海口书包房卷向「未来」,这里的孩子和房价,都在高速超车!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版