网易首页 > 网易号 > 正文 申请入驻

今年的天才少女“有点多”

0
分享至

最近几天,Deepseek在AI圈子里太火了。

12月26日,Deepseek宣布全新系列模型DeepSeek-V3首个版本上线并同步开源。

官方称,DeepSeek-V3多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。

此外,官方技术论文还披露,v3模型的总训练成本为557.6万美元,GPT-4o等模型的训练成本约为1亿美元。

随后,Deepseek开始刷屏。

12月27日,有媒体报道了罗福莉将加入小米一事,并将罗福莉称为95后“天才少女”。而这个“天才少女”,也来自Deepseek。

之后,雷军千万年薪挖角天才少女的报道也刷屏了。

事实上,早在12月20日就有媒体报道过DeepSeek罗福莉将加入小米一事,但当时的报道中并没有将罗福莉称为天才少女。该消息也没有刷屏。

而最近几天,两个刷屏的事都很突然,而且几乎是同时,到底啥情况?

DeepSeek-V3好评众多

但给自己挖了个坑

媒体文章再现“震惊体”

DeepSeek-V3一经发布,便收获无数好评。

一方面,是有多项数据显示,其在多个评测中取得高分。另一方面,则是其低廉的训练成本。

很多大佬也对DeepSeek-V3给出了高度评价。

比如,Meta科学家田渊栋称,DeepSeek-V3的训练看上去是“黑科技”,这是非常伟大的工作。

Menlo Venture的投资人表示:“53页的技术论文是黄金。”

不过,DeepSeek-V3也给自己挖了一个坑。

很快就有人发现,当用英文“what model are you”向DeepSeek-V3提问它是哪家大模型时,它却给出了“ChatGPT”的答案。

而用中文或给“what model are you”加上问号,DeepSeek-V3则能够正确回答。

不过,DeepSeek官方还未对此做出回应。

有分析认为,之所以会出现这一幕,或许是因为DeepSeek-V3的训练数据中可能包含了大量ChatGPT生成的文本,导致它“记住了”ChatGPT的某些输出,并错误地将自己识别为ChatGPT。

今日,三言测试发现,该BUG已修复。

三言还测试了几个此前曾让众多大模型翻车的问题。

1、1个笼子里装着免子和鸡,一共有20个头,45只脚,请问免子和鸡各有多少只?

这个问题其实是无解的。日前,三言在测试另一款大模型时,对方给出了错误的答案。

DeepSeek-V3则是先通过设方程,解出兔子的数量为2.5只,鸡的数量为17.5只。

然后又指出,动物的数量应该是整数,这表明题目中给出的数据可能有误,或者问题本身存在矛盾。

2、9.11和9.9哪个数字大?

这个问题曾让一众大模型打脸。

DeepSeek-V3给出了正确的答案。

3、蒸一个包子需要5分钟,蒸10个包子需要几分钟?

这个问题也曾让某大模型出糗,该大模型不知道包子可以同时蒸,得出了需要50分钟的错误答案。

DeepSeek-V3也给出了正确答案。

4、为什么爸妈结婚没叫我参加婚礼?

这个问题DeepSeek-V3分析给出了四种原因。

5、麻辣螺丝钉怎么做?

日前,三言测试另一款大模型时,这个问题也让它翻车了。该大模型一本正经的给出了做法。

而DeepSeek-V3指出了螺丝钉不能食用,并给出了“麻辣螺蛳”的做法。

从回答这些问题来看,DeepSeek-V3的能力确实还不错。

据悉,DeepSeek还被称为“AI界拼多多”。

这源于今年5月,DeepSeek V2开源模型发布,将推理成本被降到每百万token仅 1块钱,约等于Llama3 70B的七分之一,GPT-4 Turbo的七十分之一。

当时,DeepSeek就被冠以“AI界拼多多”之称。

据悉,这背后是DeepSeek提出了一种崭新的MLA架构,把显存占用降到了过去最常用的MHA架构的5%-13%,同时,DeepSeek独创的DeepSeekMoESparse结构,也把计算量大幅降低。

这也是DeepSeek的过人之处。

不过,从这次刷屏的媒体文章来看,标题中充斥着“震惊全球”、“AI界拼多多”等标签。不知道是媒体的一贯做法,还是有意这么标签化定位。

并且,“震惊体”在AI界实在是太常见了。好多大模型发布时,都“震惊”过。但是“震惊”过后,很快就褪去热度。

罗福莉能力到底如何?

从电子专业转到计算机专业

第一年对编程没有任何认知

从连python都不会,4个月就投了论文

8篇ACL论文有2篇是一作

公开信息显示,罗福莉本科就读于北京师范大学计算机专业,硕士(保研)毕业于北京大学计算语言学研究所,研二时在自然语言处理领域顶级会议ACL 2019上发表8篇论文,其中两篇为一作。毕业后,罗福莉加入阿里达摩院机器智能实验室。期间,她主导开发的多语言预训练模型VECO,被纳入阿里达摩院深度语言模型体系AliceMind。此外,她还主导了AliceMind的开源工作。

2022年,罗福莉离开阿里,在DeepSeek担任深度学习研究员,参与了DeepSeek的MoE大模型DeepSeek-V2的开发。

罗福莉的百度百科已经更新为小米AI实验室负责人,尽管上了两天热搜和刷屏,小米方面却迟迟未回应天才少女加盟的事。

从“罗福莉”词条的编辑历史来看,12月28日才有了该词条,并且是由多位不同的网友编辑而来。

据悉,罗福莉在ACL 2019上发表8篇论文一事曾登上知乎热搜。

当时,罗福莉在知乎发文回应称,当年ACL她投了一长一短,然后都中了,其他paper都只是部分参与了实验室同学的research。

罗福莉还表示,其朋友圈不乏ACL中了两篇一作长文的人。其次,这次投稿ACL paper是其近一年的产出,所以她为自己是付出了足够的努力的,当然也可能也有运气成分加持。

2021年6月,罗福莉曾在其公众号的一篇文章中写道:“这一年我收获了人生中大多数人认识我的标签——8篇顶会文章(并非全一作),并因此被网友‘挂’上了知乎,‘荣获’(被黑)什么天才AI美少女萝莉的称号。”

之后,罗福莉还曾在其公众号的文章中透露过自己的保研经历。

罗福莉称,自己的保研经历跟一般保研完全不同,她是在三月份就积极联系各个学校的导师,发邮件给他们,附加简历,介绍我自己(包括绩点和个人做过的项目经历以及科研成果),然后询问老师是否有保研名额,并且表示自己可以去实习。

此外,罗福莉还曾在访谈视频中透露,她并非本来就是计算机专业的,而是电子专业。一次偶然的机会,她转到了计算机专业。

罗福莉称,她在计算机专业第一年对编程没有任何认知,别人三分钟解出来的课题,她要花三个小时。

但她的进步也是相当快的。

罗福莉称,她大三的时候就开始联系北大各个方向的老师,去他们组内实习,她从连python都不会的一个人,4个月以后就投了自然语言处理顶会论文。

她还曾表示,论聪明程度来说,她应该是中下水平的。自己平时做事很傻,丢三落四,经常出门忘带钥匙、走迷路、坐过电梯等等。

值得一提的是,罗福莉的访谈视频,都是达某院拍的。

从以上内容来看,罗福莉可能并没有那么神乎其神。

她自己也证实,所谓的8篇ACL论文,有6篇是部分参与。

虽然网络上有一些罗福莉往日的相关信息,但在小米挖角之前,罗福莉确实没什么名气。

三言以“罗福莉”为关键词搜索百度资讯,相关内容只有两页,发布最早的是10天前。

如今突然刷屏,不知道算不算是营销行为。从其转专业第一年不熟悉编程,后来就成绩名列前茅,不会python,4个月就投了论文来看,确实是天才。

今年的天才少女“有点多”

今年6月,还有一位数学天才少女,引发赞叹,后来的结果大家都知道了。

这次的天才少女罗福莉也有不同寻常的经历,相信她有相应的实力。小米也应该尽快回应,到底加入没加入。

在此之前,文生视频大模型Pika发布时,其开发团队创始人之一的郭文景也被称为“天才少女”。

但也是很快,Pika和郭文景就没了声音。

这次的“天才少女”,还叠加了“Deepseek”和“雷军”两个buff,至于这两个buff有没有额外的属性加成,还需要让子弹飞一会儿。

本文源自:三言Pro

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
美国也没想到,转为中国籍仅6年,谷爱凌竟已成美国头号劲敌

美国也没想到,转为中国籍仅6年,谷爱凌竟已成美国头号劲敌

削桐作琴
2026-02-25 18:15:14
法足协主席:出于对德尚的尊重,世界杯结束前不再谈法国新帅

法足协主席:出于对德尚的尊重,世界杯结束前不再谈法国新帅

懂球帝
2026-03-28 00:05:05
三湾改编保留骨干中竟潜藏3位高级叛徒,其中1人曾任总政治部主任

三湾改编保留骨干中竟潜藏3位高级叛徒,其中1人曾任总政治部主任

鉴史录
2026-03-27 21:31:59
程潇不愧是“奶潇”

程潇不愧是“奶潇”

情感大头说说
2026-03-16 00:19:50
心源性猝死的人越来越多?医生再次强调:宁可喝茶水,也别做5事

心源性猝死的人越来越多?医生再次强调:宁可喝茶水,也别做5事

任医生聊健康
2026-03-28 10:13:36
大反转!美官员痛批马斯克:中国电车占全球70%份额,都是你的错

大反转!美官员痛批马斯克:中国电车占全球70%份额,都是你的错

大卫聊科技
2026-03-28 12:11:00
我国历史上,至今下落不明的10个著名人物,无论怎么找都找不到人

我国历史上,至今下落不明的10个著名人物,无论怎么找都找不到人

小杨历史
2026-03-28 05:49:07
千万不要过度锻炼!护士再三提醒:55岁后,3种锻炼能不做就不做

千万不要过度锻炼!护士再三提醒:55岁后,3种锻炼能不做就不做

王二哥老搞笑
2026-03-28 10:56:02
张志新的儿女今何在?背后的真相令人泪目

张志新的儿女今何在?背后的真相令人泪目

深度报
2026-03-01 23:48:59
刚刚,被全世界遗忘的马杜罗,等来了美国法庭的判决

刚刚,被全世界遗忘的马杜罗,等来了美国法庭的判决

沧海旅行家
2026-03-28 12:25:40
留守猫发现来喂自己的是认识四五年的仇人,瞬间气成牛魔王:受死吧,红蛋

留守猫发现来喂自己的是认识四五年的仇人,瞬间气成牛魔王:受死吧,红蛋

拜见喵主子
2026-03-27 12:24:49
奥运冠军刘璇:36岁结4次婚,都嫁给同一人,老公真实身份曝光!

奥运冠军刘璇:36岁结4次婚,都嫁给同一人,老公真实身份曝光!

拳击时空
2026-03-28 07:08:02
张雪峰的病,速效救心丸能救吗?

张雪峰的病,速效救心丸能救吗?

中国新闻周刊
2026-03-25 16:23:30
完辣!东契奇这回真禁赛了...三巨头81分守住第三!

完辣!东契奇这回真禁赛了...三巨头81分守住第三!

柚子说球
2026-03-28 14:14:34
试管婴儿对女性伤害有多大?网友:同感,只有经历过的人才会懂

试管婴儿对女性伤害有多大?网友:同感,只有经历过的人才会懂

带你感受人间冷暖
2026-03-15 18:54:19
山东小伙网恋成都富婆,相差14岁,奔现5天即领证

山东小伙网恋成都富婆,相差14岁,奔现5天即领证

丁铗惊悚影视解说
2026-03-24 18:26:09
京圈“顶级富二代”落马:该对有钱人祛魅了……

京圈“顶级富二代”落马:该对有钱人祛魅了……

不二表姐
2026-03-26 23:45:09
刘伯承给开国将帅排座次:论懂人情世故,贺龙第一,陈赓第二

刘伯承给开国将帅排座次:论懂人情世故,贺龙第一,陈赓第二

历史回忆室
2026-03-26 16:16:06
2020年女子当众扇儿子耳光,儿子直接跳楼,如今女子已自杀身亡

2020年女子当众扇儿子耳光,儿子直接跳楼,如今女子已自杀身亡

观察鉴娱
2026-03-18 09:09:10
天文学家彭罗斯:人类的死亡只是宇宙的幻象,生命是不可能终结的

天文学家彭罗斯:人类的死亡只是宇宙的幻象,生命是不可能终结的

心中的麦田
2026-03-06 19:27:32
2026-03-28 14:52:49
金融界 incentive-icons
金融界
投资者信赖的财经金融门户网站
9194706文章数 546119关注度
往期回顾 全部

科技要闻

遭中国学界"拉黑"后,这家AI顶会低头道歉

头条要闻

牛弹琴:伊朗狠角色强硬嘲讽美国 却被美移出猎杀名单

头条要闻

牛弹琴:伊朗狠角色强硬嘲讽美国 却被美移出猎杀名单

体育要闻

“我是全家最差劲的运动员”

娱乐要闻

王一博改名上热搜!个人时代正式开启!

财经要闻

我在小吃培训机构学习“科技与狠活”

汽车要闻

置换补贴价4.28万起 第五代宏光MINIEV正式上市

态度原创

教育
亲子
房产
健康
公开课

教育要闻

健康学校怎么建?今晚19点35分,《教育纵深》聚焦山东如何深入落实“健康第一”

亲子要闻

为什么说人这辈子一定要生个孩子?

房产要闻

6.8万方!天河员村再征地,金融城西区开发全面提速

干细胞抗衰4大误区,90%的人都中招

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版