网易首页 > 网易号 > 正文 申请入驻

刚刚!DeepSeek发布

0
分享至

【导读】DeepSeek发布NSA技术论文

中国基金报记者 泰勒

今天,马斯克发布Grok-3,随后,DeepSeek就推出NSA。

DeepSeek推出NSA

2月18日,DeepSeek在社交平台X上发布了一篇关于NSA的纯技术论文报告。

DeepSeek称,NSA是一种与硬件高度适配并可原生训练的稀疏注意力机制,实现超高速长上下文训练与推理!

NSA的核心组件包括:动态分层稀疏策略、粗粒度的Token压缩、细粒度的Token选择。

DeepSeek称,通过针对现代硬件的优化设计,NSA在提升推理速度的同时降低预训练成本且不牺牲性能。在通用基准测试、长上下文任务以及基于指令的推理中,NSA的表现可媲美甚至超越全注意力模型。

马斯克今日宣布Grok-3发布

埃隆·马斯克旗下的人工智能公司xAI于2月18日正式发布了最新的大模型Grok-3。

马斯克称其为“地球上最聪明的人工智能”,Grok-3在多项技术和性能上实现了重大突破。

马斯克在直播中称,在数学、科学和编程等基准测试中,Grok-3超越了Alphabet旗下Google Gemini、DeepSeek的V3模型、Anthropic的Claude和OpenAI的GPT-4o,Grok-3的计算能力比前代版本提升了10倍以上,并已于今年1月初完成预训练。

根据马斯克的介绍,Grok-3采用了“思维链”(Chain of Thought)技术,能够模拟人类逐步推理的过程,显著提升了模型在处理复杂任务时的逻辑连贯性和推理能力。

在现场演示中,Grok-3被要求解决一个复杂的物理问题,即计算从地球到火星的转移轨迹,并绘制3D动画。xAI提到,这一任务完全没有预设脚本,Grok-3仅通过简短的指令“生成地球发射、火星着陆以及下一次发射窗口返回地球的动画3D图”进行操作。Grok-3能够理解复杂的物理计算并生成可视化图形,证明其在科学计算方面的能力。

在训练Grok-3的过程中,xAI搭建了由20万张英伟达H100 GPU组成的超大规模计算集群。这一庞大算力使得Grok-3的训练效率和模型性能大幅提升。

另外,xAI推出了名为DeepSearch的智能搜索引擎,集成于Grok-3中。 该引擎能够扫描互联网和X平台上的信息,并以摘要形式回应用户查询,提供更高效、精准的信息检索服务。

xAI称,Grok-3具备自我纠正机制,能够通过反复检查数据,实现逻辑一致性,从而减少错误并提高准确性。

此外,xAI引入了人类反馈循环和情境训练,以确保Grok-3的响应更加自然和准确。人类反馈循环通过人类审阅者的直接反馈,帮助模型改进答案的准确性、相关性和实用性。而情境训练则教导AI根据对话上下文调整回应,考虑之前的互动、用户意图和相关信息,生成更符合情境的答案。

编辑:杜妍

校对:王玥

审核:木鱼

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
当“观察者网”说出底线二字的时候,我还是笑了

当“观察者网”说出底线二字的时候,我还是笑了

林中木白
2026-03-26 14:23:04
演员王传君发文宣布退出

演员王传君发文宣布退出

美芽
2026-03-26 12:05:06
突发心梗,吃丹参滴丸有用吗?医生:这2种药才是心梗急救药!

突发心梗,吃丹参滴丸有用吗?医生:这2种药才是心梗急救药!

健康科普365
2026-03-26 09:57:24
伊朗称正在搜捕逃亡美军

伊朗称正在搜捕逃亡美军

界面新闻
2026-03-25 23:21:14
利空突袭,全线杀跌!

利空突袭,全线杀跌!

中国基金报
2026-03-26 13:16:51
倒计时开始!特朗普将迎来终极翻车时刻!

倒计时开始!特朗普将迎来终极翻车时刻!

一个坏土豆
2026-03-25 20:56:19
特朗普,开始甩锅

特朗普,开始甩锅

中国基金报
2026-03-26 07:57:39
我就不信张一山没有后悔过吗?这么美的前任拱手让出去了

我就不信张一山没有后悔过吗?这么美的前任拱手让出去了

喜欢历史的阿繁
2026-03-26 09:20:58
人民日报对张雪峰的评价——

人民日报对张雪峰的评价——

叶初七
2026-03-26 10:03:04
“中园石化”被立案调查

“中园石化”被立案调查

每日经济新闻
2026-03-25 11:13:18
伊朗或开辟新战线!伊朗外长:霍尔木兹海峡只对敌人关闭,中国、俄罗斯、巴基斯坦、伊拉克、印度、孟加拉国等国船只都安全通过了

伊朗或开辟新战线!伊朗外长:霍尔木兹海峡只对敌人关闭,中国、俄罗斯、巴基斯坦、伊拉克、印度、孟加拉国等国船只都安全通过了

每日经济新闻
2026-03-26 09:53:07
15战14胜,加时掀翻东部第一!新鹰王27+8+12证明贱卖特雷杨有理

15战14胜,加时掀翻东部第一!新鹰王27+8+12证明贱卖特雷杨有理

锅子篮球
2026-03-26 11:25:55
收评:三大指数均跌超1% 两市成交额跌破2万亿

收评:三大指数均跌超1% 两市成交额跌破2万亿

财联社
2026-03-26 15:02:09
周杰伦继续割韭菜!网友一针见血:他唯一和华流关系最大的是割大陆韭菜

周杰伦继续割韭菜!网友一针见血:他唯一和华流关系最大的是割大陆韭菜

爆角追踪
2026-03-26 08:56:24
A股:低开低走跳水大跌,发生了什么?刚刚,新华社传来重磅消息

A股:低开低走跳水大跌,发生了什么?刚刚,新华社传来重磅消息

虎哥闲聊
2026-03-26 12:06:24
震惊!聊天框打出“飞机”,华为是民航客机,苹果是螺旋桨小飞机

震惊!聊天框打出“飞机”,华为是民航客机,苹果是螺旋桨小飞机

火山詩话
2026-03-26 09:43:22
中方驳斥“闯馆事件”日方荒谬说法:你见过未经允许持刀进入使馆同大使交谈的先例吗?

中方驳斥“闯馆事件”日方荒谬说法:你见过未经允许持刀进入使馆同大使交谈的先例吗?

环球网资讯
2026-03-26 07:09:09
继张雪峰之后,中医大师黄贵华被曝心梗去世,社交账号已变黑白

继张雪峰之后,中医大师黄贵华被曝心梗去世,社交账号已变黑白

180视角
2026-03-26 11:52:12
张雪峰员工:办公室已拆掉红色锦旗,员工彻夜难眠,家长电话打爆

张雪峰员工:办公室已拆掉红色锦旗,员工彻夜难眠,家长电话打爆

每日人物
2026-03-26 13:34:51
日本网民真怕了,呼吁严惩闯入中国使馆的暴徒,防止226事件再现

日本网民真怕了,呼吁严惩闯入中国使馆的暴徒,防止226事件再现

知法而形
2026-03-25 18:38:56
2026-03-26 15:52:49
中国基金报 incentive-icons
中国基金报
洞察金融市场,传播中国价值——《中国基金报》社官方账号(《中国基金报》社有限公司运营管理)
60692文章数 517363关注度
往期回顾 全部

科技要闻

Meta高管狂分百亿期权,700名员工却下岗

头条要闻

上海妈妈寻亲27年悬赏市区一套房:不用尽孝 要个拥抱

头条要闻

上海妈妈寻亲27年悬赏市区一套房:不用尽孝 要个拥抱

体育要闻

35岁替补门将,凭什么入选英格兰队?

娱乐要闻

张雪峰家人首发声 不设追思会丧事从简

财经要闻

黄仁勋:芯片公司的时代已经结束了

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

健康
教育
艺术
家居
时尚

转头就晕的耳石症,能开车上班吗?

教育要闻

教育部部署开展2026年全国中小学生安全教育周活动

艺术要闻

哪一座桥不是风景?

家居要闻

傍海而居 静观蝴蝶海

皮衣+裙,高级到炸

无障碍浏览 进入关怀版