网易首页 > 网易号 > 正文 申请入驻

Meta用1500亿参数赌一把,DeepSeek 671B却让它

0
分享至


1500亿参数对6710亿参数,Meta的Llama 3.3和DeepSeek-V3本不该出现在同一张擂台。但Tom's Guide的实测把这场不对等较量变成了教科书级案例——有时候,模型大小只是入场券,真正决定胜负的是你怎么用它。

测试者没跑分,没测代码生成,而是设计了5个真实场景:省钱、读新闻、抗焦虑、搞创意、做决策。这些才是普通人打开AI的真正理由。

第一关:省钱

提示词很具体——"我每周食品杂货预算75美元,帮我制定省钱计划"。DeepSeek直接甩出一份可执行的周计划,把75美元拆成蛋白质、碳水、蔬果、杂项四类,每类给具体金额和采购建议。鸡肉 thighs 比 breast 便宜40%,冷冻蔬菜营养不差还耐放,批量采购大米和豆类——这些细节让计划像是从一个会过日子的朋友嘴里说出来的。

Meta AI的回应则像财务软件的自动回复。它列了通用原则:用优惠券、买当季食材、减少浪费。没错,但没用。测试者原话:「DeepSeek gave me a plan I could actually use. Meta gave me a TED talk.」

差距不在知识量,而在交付形态。一个给答案,一个给框架。

第二关:读新闻

测试用的是当时正在发酵的科技事件。DeepSeek的摘要带时间线,标注信息来源,主动说明哪些部分基于公开报道、哪些是推测。Meta AI同样完成了任务,但少了那层"来源意识"——它不会告诉你"这部分我没把握"。

这对25-40岁的读者很关键。你们不是怕AI说错,是怕AI说错却不自知。DeepSeek的谨慎在这里成了信任资产。

第三关:抗焦虑

提示词模拟了一个常见场景:工作 overwhelm,需要快速理清优先级。DeepSeek用了"大脑清空"(Brain Dump)技巧,引导用户把所有待办事项倒出来,再按紧急-重要矩阵分类。过程中穿插具体话术:"这个任务可以推迟到周四吗?""这件事.delegate 给同事的成本是什么?"

Meta AI的建议更标准:深呼吸、列清单、一次只做一件事。心理健康领域的"正确废话"。

测试者的观察很毒:「Meta sounds like a wellness app. DeepSeek sounds like a project manager who's been in the trenches.」

第四关:搞创意


要求是为一款虚构的环保产品设计营销概念。DeepSeek产出了三个差异化方案,每个带目标人群、核心信息、渠道建议。Meta AI给了一个方案,但展开得像 Wikipedia 条目——全面,却没法直接拿去用。

创意任务有个隐藏评分标准:输出是否处于"可执行"状态。DeepSeek的答案接近初稿,Meta的接近调研笔记。

第五关:做决策

最后一题是经典的"选offer"困境:两份工作,薪资、通勤、成长空间各有优劣。DeepSeek建了决策矩阵,给每个维度赋权重,引导用户填入个人偏好,最后算出加权得分。它没替你做决定,但把模糊焦虑转化成了可讨论的结构。

Meta AI列出了 pros and cons,然后建议你"听从内心"。

五轮打完,比分悬殊。DeepSeek在实用性、结构化、用户视角三个维度全面压制。Meta AI不是不能回答问题,是它的默认模式是"提供信息",而DeepSeek的默认模式是"解决问题"。

这背后有个产品哲学差异。Meta把AI当成搜索的升级版,DeepSeek(至少在这个版本里)把它当成外包大脑的接口。一个问"你想知道什么",一个问"你想完成什么"。

参数规模的反转更有意思。Meta的1500亿对DeepSeek的6710亿,但后者用了混合专家架构(MoE),每次只激活370亿参数。更少的活跃计算量,更好的结果。这对"大力出奇迹"的信仰是个微妙打击。

测试者最后补了一句:「If Meta wants to win these matchups, it needs to stop optimizing for engagement and start optimizing for outcomes.」

话糙理不糙。Llama 3.3是开源生态的标杆,但开源不等于好用。Meta把模型放出来,让社区去长出手脚;DeepSeek选择自己长出手脚,哪怕模型封闭一些。

两条路线没有绝对高下。但如果你今天打开AI是为了搞定某件事——而不是研究AI本身——实测结果已经很明显了。

最后一个细节:测试者注意到DeepSeek的回复长度普遍比Meta长30%-40%,但阅读负担反而更轻。因为它的结构更清晰,小标题、编号、加粗用得克制而有效。Meta的回复像一篇流畅的散文,DeepSeek像一份标注好的检查清单。

产品经理出身的读者应该懂这种差别。不是字数问题,是信息架构问题。

这场1500亿对6710亿的较量,最终输的不是参数,是交付思维。Meta把AI当内容生产,DeepSeek把它当任务代理。用户要的是后者,但前者更容易刷到存在感——这或许是Meta真正的困境。

下一轮AI Madness,测试者说要让Claude和DeepSeek碰一碰。你押谁?

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
伊朗最高领袖,“最详细伤情”披露

伊朗最高领袖,“最详细伤情”披露

中国新闻周刊
2026-04-30 16:23:05
珠海风云,千亿国资帝国亏空迷局

珠海风云,千亿国资帝国亏空迷局

栗滴财经
2026-04-30 18:22:14
被困霍尔木兹海峡的部分船员已遇难!联合国呼吁紧急营救

被困霍尔木兹海峡的部分船员已遇难!联合国呼吁紧急营救

闪电新闻
2026-04-30 14:56:57
英国国王查尔斯给特朗普送了钟,还“贴脸开大”!

英国国王查尔斯给特朗普送了钟,还“贴脸开大”!

新民周刊
2026-04-30 18:45:52
陕西男子3次报警,民警拒不派警,致两家四口被杀,法院咋判的?

陕西男子3次报警,民警拒不派警,致两家四口被杀,法院咋判的?

就一点
2026-04-29 17:28:35
南海军演,全世界开始讲道理了

南海军演,全世界开始讲道理了

智先生
2026-04-30 21:36:25
霸王茶姬“水银门”被通报,网友:好歹毒的商战!

霸王茶姬“水银门”被通报,网友:好歹毒的商战!

广告创意
2026-04-30 15:43:46
美日菲“肩并肩2016”演习提前结束,主要是中国围观舰艇太强

美日菲“肩并肩2016”演习提前结束,主要是中国围观舰艇太强

三叔的装备空间
2026-04-30 11:25:21
孙杨私生子风波升级,处处忍让的张豆豆,终究不再顾及所谓体面

孙杨私生子风波升级,处处忍让的张豆豆,终究不再顾及所谓体面

一盅情怀
2026-04-30 15:59:37
“开除韩国瑜”风暴升级,季麟连被逼道歉辞职,郑丽文被围攻逼宫

“开除韩国瑜”风暴升级,季麟连被逼道歉辞职,郑丽文被围攻逼宫

共工之锚
2026-04-30 13:27:18
拥抱人民币果然是个幌子,阿联酋要跟美国一起掀桌子了

拥抱人民币果然是个幌子,阿联酋要跟美国一起掀桌子了

混沌录
2026-04-30 22:01:15
一女子举报身为公职人员的前男友索贿 当事人称系借款 纪委监委已展开调查

一女子举报身为公职人员的前男友索贿 当事人称系借款 纪委监委已展开调查

红星新闻
2026-04-30 15:20:27
朝鲜展示在俄乌战场缴获的西方武器,包括“豹”-2、M1A1“艾布拉姆斯”坦克!普京:铭记俄朝士兵并肩作战的英勇事迹

朝鲜展示在俄乌战场缴获的西方武器,包括“豹”-2、M1A1“艾布拉姆斯”坦克!普京:铭记俄朝士兵并肩作战的英勇事迹

每日经济新闻
2026-04-30 21:50:12
重庆官二代、“红顶女律师”彭静失联,或涉政商利益输送链漩涡!

重庆官二代、“红顶女律师”彭静失联,或涉政商利益输送链漩涡!

兵叔评说
2026-04-30 16:54:27
浙江男子花860万买了套排屋,收房时傻眼,院子里有一个“凸起”,业主:跟老家的厕所一样,开发商:不利因素已公示

浙江男子花860万买了套排屋,收房时傻眼,院子里有一个“凸起”,业主:跟老家的厕所一样,开发商:不利因素已公示

极目新闻
2026-04-30 10:33:16
孙杨他妈是嫌孙杨“凉”得还不够彻底吗?

孙杨他妈是嫌孙杨“凉”得还不够彻底吗?

葱哥说
2026-04-30 21:24:28
十年来年轻人口减半:北京为什么越来越留不住年轻人了?

十年来年轻人口减半:北京为什么越来越留不住年轻人了?

阜成门六号院
2026-04-30 18:27:12
许家印都不敢这么干啊!五粮液,疯狂改业绩

许家印都不敢这么干啊!五粮液,疯狂改业绩

说财猫
2026-04-30 22:18:27
尿酸危机,席卷中国

尿酸危机,席卷中国

DT商业观察
2026-04-29 11:59:38
致敬帕勒莫!维尼修斯6分钟内罚丢3个点球,球迷看傻眼了

致敬帕勒莫!维尼修斯6分钟内罚丢3个点球,球迷看傻眼了

仰卧撑FTUer
2026-04-30 21:41:06
2026-05-01 07:32:49
野生运营
野生运营
懂点产品,懂点AI,正在努力给平淡日子搞点新花样。
2035文章数 30关注度
往期回顾 全部

科技要闻

9000亿美元估值,Anthropic即将反超OpenAI

头条要闻

英国国王给特朗普送了口钟 还贴脸开大"有需要尽管敲"

头条要闻

英国国王给特朗普送了口钟 还贴脸开大"有需要尽管敲"

体育要闻

季后赛场均5.4分,他凭啥在骑士打首发?

娱乐要闻

孙杨博士学历有问题?官方含糊其辞

财经要闻

易会满被“双开”!

汽车要闻

专访捷途汪如生:捷途双线作战 全球化全面落地

态度原创

家居
本地
数码
旅游
手机

家居要闻

灵动实用 生活艺术场

本地新闻

用青花瓷的方式,打开西溪湿地

数码要闻

机械革命耀世18 Pro游戏本270HX Plus + 5070 12GB,10499元

旅游要闻

人文|古城梧州看骑楼

手机要闻

华硕创X 2026骁龙X2 Elite二合一创作本上架,12999元

无障碍浏览 进入关怀版