网易首页 > 网易号 > 正文 申请入驻

DeepSeek促动成都AI创业者,利好国产硬件和AI端侧应用

0
分享至

近些年,人工智能呈现突破发展,以DeepSeek为代表的LLM为整个行业带来了新的变化。

2月15日,由智慧途灵科技(成都)有限公司主办,AIGCxChengdu、四川省影视联合会沉浸式专委会协办的技术沙龙上,行业专家围绕DeepSeek技术优点、行业机遇及创新等话题展开了讨论。

DeepSeek的4个创新点

智慧途灵科技联合创始人&CTO吕磊从技术角度分析了DeepSeek的优势,他对比OpenAI O1与DeepSeek在运行效率上的差异,并认为DeepSeek在GPU上运行时,能够最大限度地利用GPU资源,将空白区域减少到最小,从而提高GPU性能。

“技术方面DeepSeek主要在MLA(Multi-Head Latent Attention)、MoE、多Token预测、FP8训练这四点比较创新。”

MLA(多层注意力)机制:通过优化注意力层的缓存过程,显著降低了缓存占用。例如,在处理大规模数据时,MLA机制能将原本需要存储的中间结果进行压缩,大大减少内存消耗,提高计算效率。

MoE(混合专家)架构:将多个专家网络组合,根据输入数据动态选择特定专家网络处理。就好比为不同领域的知识配备了专门的 “专家”,在处理某一特定问题时,能够精准调动相关专家网络,避免了整体激活带来的巨大计算开销,提升了模型的灵活性和效率。

多TOKEN预测技术:采用主模型和旁支模型协同工作,一次性预测多个Token,提高了生成速度。举例来说,在生成一段文本时,传统方法可能逐字推理,而多TOKEN预测技术可以同时预测后面多个字,就像多人接力跑步,同时启动多个选手,大大缩短了整体时间。

FP8训练方法:在保证训练基本精度的前提下,大幅降低了模型训练的内存占用和计算资源需求。通过8位浮点数运算代替传统的32位运算,减少了数据存储和传输量,降低了硬件成本,但提高了系统工程复杂性,获得了大规模模型的训练的高效和低成本。

国产GPU、端侧AI等迎来机遇

DeepSeek在AI赛道的高效低本特性,在全球开启了价格战,同时也推动了AI技术的广泛应用,也使智慧途灵科技看到了更多的市场机遇和挑战。

智慧途灵科技(成都)有限公司创始人徐梦曦认为DeepSeek为整个行业带来的变化,从Center for AI Safety(人工智能安全中心)最新发起的“Humanity’s Last Exam”测试中,虽然不如OpenAI最新的O3但也位于前列。“Humanity’s Last Exam”测试表明,在专业领域推理方面目前大模型依旧还有很长的路要走,这同时也是敢于挑战和创新的AI科研团队和年轻探索者的机会。

徐梦曦说:DeepSeek模型的爆红,不仅对OpenAI产生了影响,还对其他AI巨头如Anthropic、Meta、Mistral等带来了挑战,也是对现有硅谷为首的AI模型生态的重新定义。Anthropic公司虽然在多模态和语言能力上表现出色,但在推理模型上一直未有突破,DeepSeek的出现使其在to B 和to D领域的护城河面临崩塌风险。Meta作为开源模型的引领者,其地位也受到威胁,DeepSeek的开源策略和技术创新,使得Meta的开源生态护城河受到冲击。Mistral公司虽然推出了免费且高效的AI超级助手Le Chat,但在DeepSeek的竞争下,也面临着不小的压力。

另外在算力方面,DeepSeek采用的FP8工程优化和采用PTX,大幅降低了算力需求。这一改变不仅降低了训练成本,还为其他芯片厂商如Groq、LPU架构等芯片带来了新的机会。

“AI赛道的门槛将会越来越低,端侧AI的发展将越来越清晰,to C领域的应用场景将迎来突飞猛进的发展,如娱乐、生活、辅助等方面。但在to B领域,数据安全、多模态和推理能力依然是竞争的关键。DeepSeek模型的出现,不仅在技术上改变了范式,也在商业模式上引发创新和变革。”

专注AGI填补行业空白

作为专注于AGI道路探索的科技公司,智慧途灵科技通过提供高效、智能的AI私域模型和智能体解决方案,帮助企业实现数字化转型和智能化升级,目前已经在某985高校物理所原子与分子科研模型、电力生产安全分析模型、金融数据分析模型、Agent知识思维链工具、科技馆AI一键成片、文旅Copilot旅行助手等场景进行落地。

近两年智慧途灵针对更具效率的(SLM)小规模NLP模型积累了丰厚的研究心得和实际场景案例经验,使得SLM小规模模型和LLM大模型一样具备文本生成、问答和推理等多任务、多模态中展现了突现能力。此外,LLM通用大模型在专属知识领域、比如自然科学:物理科学、环境科学、生物科学、材料科学等。专属知识行业:航天航空、金融、医疗、半导体等专业领域的表现往往不足,原因在于缺乏足够的领域特定知识语料来强化学习,而私有化部署的专业数据标注模型和多重MOE模型正在填补这一类空白。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
崩了,知名光伏公司大规模停产,大面积待岗!

崩了,知名光伏公司大规模停产,大面积待岗!

黯泉
2026-03-25 21:36:39
“中园石化”被立案调查

“中园石化”被立案调查

每日经济新闻
2026-03-25 11:13:18
2026QS世界大学学科排名正式发布!

2026QS世界大学学科排名正式发布!

双一流高校
2026-03-26 00:11:50
最近全网都在夸陈若琳长得好看,我真的想说:别光看脸啊

最近全网都在夸陈若琳长得好看,我真的想说:别光看脸啊

小光侃娱乐
2026-03-26 06:55:03
多名大学校长炮轰机器人跳舞是哗众取宠

多名大学校长炮轰机器人跳舞是哗众取宠

上峰视点
2026-03-25 19:07:57
中国最“尴尬”的5个地级市:它们根本不该在本省,应该“改嫁”

中国最“尴尬”的5个地级市:它们根本不该在本省,应该“改嫁”

好笑娱乐君每一天
2026-03-26 01:22:35
怀孕传闻真相大白后,翁帆突传“喜讯”,杨振宁终于可以放心了!

怀孕传闻真相大白后,翁帆突传“喜讯”,杨振宁终于可以放心了!

丁丁鲤史纪
2026-03-25 16:35:13
白宫:美国总统特朗普将于5月访华

白宫:美国总统特朗普将于5月访华

辇毂
2026-03-26 05:18:40
清纯得不像动作片女一号!

清纯得不像动作片女一号!

贵圈真乱
2026-03-26 11:33:33
张雪峰追悼会周六将在苏州殡仪馆举行

张雪峰追悼会周六将在苏州殡仪馆举行

界面新闻
2026-03-26 07:04:27
你见过哪些闷声发大财的人?网友:干这个买三套房子,两个门面

你见过哪些闷声发大财的人?网友:干这个买三套房子,两个门面

夜深爱杂谈
2026-02-01 18:57:04
奴颜媚骨具象化,高市早苗三十年前照片被扒出,原来她从未变过!

奴颜媚骨具象化,高市早苗三十年前照片被扒出,原来她从未变过!

社会酱
2026-03-23 17:34:19
狂赚18亿!比爱马仕还狠的运动奢侈品,正在掏空中产的钱包

狂赚18亿!比爱马仕还狠的运动奢侈品,正在掏空中产的钱包

青眼财经
2026-03-17 16:03:09
哈萨克斯坦也没想到,跟着中国混来混去,结果自己也混成了个霸主

哈萨克斯坦也没想到,跟着中国混来混去,结果自己也混成了个霸主

小樾说历史
2026-03-25 12:16:16
东契奇43分7助攻湖人战胜步行者,勒布朗23分9板9助里夫斯25分

东契奇43分7助攻湖人战胜步行者,勒布朗23分9板9助里夫斯25分

湖人崛起
2026-03-26 09:32:48
张雪峰:如果你不好好学习,一旦掉入社会底层,和一群没有素质的人混在一起.....

张雪峰:如果你不好好学习,一旦掉入社会底层,和一群没有素质的人混在一起.....

山东教育
2026-01-27 11:38:18
炸锅!利物浦 1.25 亿标王主动申请离队,首选下家完全出乎意料

炸锅!利物浦 1.25 亿标王主动申请离队,首选下家完全出乎意料

澜归序
2026-03-26 06:08:07
国家出手逮捕的3名华人首富,疯狂敛财坑害百姓,每个都罪有应得

国家出手逮捕的3名华人首富,疯狂敛财坑害百姓,每个都罪有应得

林轻吟
2026-03-25 07:15:32
日本不再欢迎中国人?3月起日本签证“一刀切”,华人进退两难!

日本不再欢迎中国人?3月起日本签证“一刀切”,华人进退两难!

有范又有料
2026-03-25 14:08:39
9中9轰20+9+5!杨瀚森付出一切遭库克坑苦 G联赛首次百分百命中率

9中9轰20+9+5!杨瀚森付出一切遭库克坑苦 G联赛首次百分百命中率

颜小白的篮球梦
2026-03-26 10:15:13
2026-03-26 15:43:00
封面新闻 incentive-icons
封面新闻
第一眼,看封面。了解权威信息,看真实新闻故事(互联网新闻信息服务许可证:51120170004)。
345493文章数 888720关注度
往期回顾 全部

科技要闻

Meta高管狂分百亿期权,700名员工却下岗

头条要闻

上海妈妈寻亲27年悬赏市区一套房:不用尽孝 要个拥抱

头条要闻

上海妈妈寻亲27年悬赏市区一套房:不用尽孝 要个拥抱

体育要闻

35岁替补门将,凭什么入选英格兰队?

娱乐要闻

张雪峰家人首发声 不设追思会丧事从简

财经要闻

黄仁勋:芯片公司的时代已经结束了

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

亲子
艺术
教育
手机
时尚

亲子要闻

售卖“增高神药”让孩子“猛长20厘米”?多家店铺被查

艺术要闻

哪一座桥不是风景?

教育要闻

教育部部署开展2026年全国中小学生安全教育周活动

手机要闻

苹果回应iPhone自动打电话 升级系统可解决

皮衣+裙,高级到炸

无障碍浏览 进入关怀版