网易首页 > 网易号 > 正文 申请入驻

李沐老师回归B站!带着大模型创业成果填坑来了

0
分享至

西风 发自 凹非寺
量子位 | 公众号 QbitAI

终于,AI大神李沐回来了!带着他的大模型创业最新成果——

一个专门为复杂场景角色扮演设计的大模型,名为Higgs-Llama-3-70B

得知消息的不少网友已激动在评论区催更,李沐老师也回应,视频坑还是会填的:

想你的365天。

终于回来了,视频都盘包浆了。

那沐神到底干啥去了?这就透过Higgs-Llama-3-70B瞧一瞧。

定睛一看,Higgs-Llama-3-70B是沐神去年联合创立的公司Boson AI,推出的Higgs开源系列大模型中的第一个,基于Llama 3打造,做了完整的SFT、RLHF。

它不仅能在角色扮演任务上表现优异,在通用领域上的指令遵循和推理方面也很有竞争力。

左击Claude3,右打Gemini

团队在两个新基准测试MMLU-Pro和Arena-hard上展示了Higgs-Llama-3-70B的能力。

他们还特地强调所有基准测试终将导致过拟合,已尽量从微调数据中排除了基准测试数据及其训练示例。

具体来说,MMLU-Pro是MMLU的扩展,团队认为MMLU-Pro是在模型完成训练之后发布,较少受到其他已发布模型的过拟合影响。

拿来做比较的模型也都一水的很强。

而Higgs-Llama-3-70B的表现优于谷歌在5月I/O大会上最新推出的模型Gemini-1.5-Flash、Claude3家族“中杯”Claude-3-Sonnet以及Llama3-70B-instruct。

再来看Arena-hard,该基准包含了来自Chatbot竞技场的500个具有挑战性的真实用户查询。

Higgs-Llama-3-70B的表现排名第四:

除此之外,使用相同的base model,Higgs-Llama-3-70B在6个基准测试中均优于LLama-3-70B-Instruct。

虽然距离GPT-4o还有不小的差距,但值得注意的是沐神团队放出的只是通用能力的基准测试,并且强调并未针对性刷榜。

而且Higgs-Llama-3-70B毕竟是为角色扮演专门设计的,相关效果展示团队未具体给出。

团队表示Higgs-Llama-3-70B只是个开胃菜,将进一步探讨角色扮演性能、训练后的处理流程、零基础建立数据中心、在云端使用GPU以及未来整合多个服务提供商的策略。

之后也会发布更多Higgs系列模型。

开发角色扮演Agent

这次李沐大模型创业方向终于浮出水面,倒是一定程度印证了之前关于沐神创业方向的猜想。

此前有消息爆料,从亚马逊首席科学家的职务上离职后,李沐联手其导师、另一位亚马逊出身AI大牛Alex Smola创办了创业公司Boson AI。而公司方向是利用大模型能力,做和游戏娱乐有关的项目。

这回官方终于给出了个准信儿,确实跟游戏沾边:

自2023年成立Boson AI以来,我们一直致力于利用AI技术为企业赋能,旨在革新故事讲述、知识学习和信息洞察的方式。我们协助客户开发Agent,使其能够扮演多种角色,如游戏角色、语言教师、保险代理和金融顾问。

目前官网主页也已更新Higgs-Llama-3-70B模型。

还晒出了团队创始成员,除李沐和Alex Smola外,还有四位成员。

李沐和Alex Smola,量子位此前也有介绍过。

李沐,是二者之间大家比较熟悉的那一位。自己有很厉害的经历,加上在小破站传道授业,打下了响当当的知名度。

Alex Smola,更是一个AI届的神级大牛。

直接上数据:Smola在Google Scholar上的被引用次数,超过17万次。其中,被引次数前三的所著论文,被引数统统破万。

除了是ML著作《动手学深度学习》的主要作者外,Smola这些年的履历也很值得好好了解一番——

1996年,Smola在慕尼黑工业大学完成硕士学业,而后又在柏林工业大学拿下计算机科学博士学位。博士毕业后,他先后去往柏林GMD软件工程和计算机体系结构研究所、NICTA(澳大利亚信息与通信技术研究中心)工作。

2004年起,Smola在NICTA的统计机器学习项目中,担任高级首席研究员和项目负责人;到了2008年,Smola选择入职雅虎研究院

2012年春天到2014年年底,2年多的时间里,Smola的工作地点是谷歌研究院

期间,他开始担任CMU的教授。也是这个时候,他成为了李沐的博士导师,二人结缘。

2016年7月,Smola成为了亚马逊的一员,致力于构建AI和机器学习工具。首要任务之一,是让AWS和开发者社区建立和保持联系,让更多的开发者共同建设亚马逊深度学习库MXNet。

离职创业前,Smola在亚马逊担任的职位是杰出科学家和副总裁。

值得一提的是,由于Smola在分布式深度学习框架领域曾提出并行LDA(Latent Dirichlet Allocation)的框架——这是参数服务器概念的最早来源,因此,Smola也被业界称为参数服务器之父

其他四位成员如下。

Shuai Zheng,2019年从香港科技大学获得计算机科学博士学位。

之后就职亚马逊,领导亚马逊的分布式系统和LLM训练工作,包括开发可扩展的分布式训练和推理架构、具有数千亿参数的更智能模型,以及更快的分布式优化算法。

施行健,2014年本科毕业于上海交通大学,2018年获香港科技大学博士学位。

曾担任亚马逊担任高级应用科学家,领导过两个项目:AutoGluon Multimodal和DeepEarth。

其中AutoGluon Multimodal通过应用基础模型,突破了传统自动机器学习工具的限制。DeepEarth致力于为地球科学领域构建基础模型。之前他还参与了如Apache/MXNet等开源项目。

Yi Zhu,加州大学默塞德分校博士学位。

同样曾在亚马逊AI团队,担任高级应用科学家。研究主要关注大语言模型、多模态学习、自监督学习和视频理解,曾参与AutoGluon、GluonCV等开源项目。

Yizhi Liu,2012年毕业于浙江大学计算机系。

曾先后在百度实习,担任聚胜万合首席软件工程师、奇虎360技术部经理,之后成为亚马逊高级软件开发工程师。

△领英主页尚未更新

最后,量子位认识的一位团队成员推荐大家用不同的人设、persona来测试Higgs-Llama-3-70B,“可能有惊喜哦”

以及One more thing …

大神李沐创业,肯定是不缺投资的,量子位听闻,知名技术创业者已经打钱支持了。

不过一切以官方信息为准吧。祝福李沐老师一切顺利~

参考链接:
[1]https://boson.ai/about/
[2]https://szhengac.github.io/
[3]https://sxjscience.github.io/
[4]https://bryanyzhu.github.io/
[5]https://www.linkedin.com/in/yizhi-liu-20810558?original_referer=https%3A%2F%2Fwww.google.com%2F

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
本月开始中国或将迎来4大涨价潮:除油价以外,这4类也要涨价了

本月开始中国或将迎来4大涨价潮:除油价以外,这4类也要涨价了

混沌录
2026-03-28 15:49:05
中东大战,是资本主义最后一次自救,历史上是苏联两次挽救了他们

中东大战,是资本主义最后一次自救,历史上是苏联两次挽救了他们

芳芳历史烩
2026-03-27 08:42:31
万斯批评内塔尼亚胡!伊朗议长:美军士兵只能藏在酒店和公园,何谈对伊地面战!德国、加拿大、英国、法国、意大利、日本集体呼吁

万斯批评内塔尼亚胡!伊朗议长:美军士兵只能藏在酒店和公园,何谈对伊地面战!德国、加拿大、英国、法国、意大利、日本集体呼吁

每日经济新闻
2026-03-27 23:57:25
洛桑去世真相:博林25年后坦白,他其实没喝多少酒

洛桑去世真相:博林25年后坦白,他其实没喝多少酒

观察者海风
2026-03-26 23:12:53
反转了?刘晓庆紧急删文,亲外甥猛烈回击,才知她下半生如此凄苦

反转了?刘晓庆紧急删文,亲外甥猛烈回击,才知她下半生如此凄苦

可乐谈情感
2026-03-28 09:56:57
7国设下鸿门宴?中方掀桌拒不赴会!法国气疯,叫嚣掐断中国命脉

7国设下鸿门宴?中方掀桌拒不赴会!法国气疯,叫嚣掐断中国命脉

天气观察站
2026-03-28 15:02:43
70艘货船被扣,美方指责公报私仇,中方一句话反将一军

70艘货船被扣,美方指责公报私仇,中方一句话反将一军

花寒弦絮
2026-03-28 18:08:26
张雪峰女儿亲自辟谣!父母恩爱没离婚,回应三个问题,口才很意外

张雪峰女儿亲自辟谣!父母恩爱没离婚,回应三个问题,口才很意外

离离言几许
2026-03-27 14:42:23
4万股东突发踩雷,这家公司白天大涨,晚上股票被实施st风险警示

4万股东突发踩雷,这家公司白天大涨,晚上股票被实施st风险警示

有范又有料
2026-03-28 10:13:07
吴京回应谢楠登上《乘风2026》:我和儿子已经搬好板凳准备就绪

吴京回应谢楠登上《乘风2026》:我和儿子已经搬好板凳准备就绪

东方不败然多多
2026-03-28 14:29:22
全红婵首次回应是否重返国家队:想留在队中 因为有很多想见的人

全红婵首次回应是否重返国家队:想留在队中 因为有很多想见的人

念洲
2026-03-28 15:11:44
老师穿短裙蕾丝袜上课,学生连头都不敢抬!老师穿衣底线到底在哪

老师穿短裙蕾丝袜上课,学生连头都不敢抬!老师穿衣底线到底在哪

小羽叨叨叨
2026-03-26 13:24:34
女排联赛决赛江苏队3-0完胜上海队爆冷夺冠

女排联赛决赛江苏队3-0完胜上海队爆冷夺冠

曾蠃爱旅行
2026-03-28 18:16:39
媒体称保罗会进入火箭教练组!搭档乌度卡改造球队,优势隐患并存

媒体称保罗会进入火箭教练组!搭档乌度卡改造球队,优势隐患并存

金风说
2026-03-28 18:16:27
法国主持G7外长会议,日韩代表合影时“吊尾”,卢比奥满脸不开心

法国主持G7外长会议,日韩代表合影时“吊尾”,卢比奥满脸不开心

丁丁鲤史纪
2026-03-28 18:11:29
军衔最高的12位开国女军官,都是什么军衔?

军衔最高的12位开国女军官,都是什么军衔?

幽州校尉
2026-03-28 07:31:51
张雪峰去世后,第一个被骂的明星出现了!网友强烈呼吁封杀

张雪峰去世后,第一个被骂的明星出现了!网友强烈呼吁封杀

星星没有你亮
2026-03-26 18:26:16
恒大蛀虫刘永灼,他挥霍败家的疯狂堪比许家印

恒大蛀虫刘永灼,他挥霍败家的疯狂堪比许家印

篮球看比赛
2026-03-28 12:14:02
越打越出惊喜!以色列传来好消息,美军彻底歇菜:8年无法再开战

越打越出惊喜!以色列传来好消息,美军彻底歇菜:8年无法再开战

知法而形
2026-03-26 17:28:20
迈阿密国际官方:梅西是史上首位被冠名球场看台的现役球员!

迈阿密国际官方:梅西是史上首位被冠名球场看台的现役球员!

历史第一人梅西
2026-03-28 18:03:10
2026-03-28 19:40:49
量子位 incentive-icons
量子位
追踪人工智能动态
12359文章数 176426关注度
往期回顾 全部

科技要闻

遭中国学界"拉黑"后,这家AI顶会低头道歉

头条要闻

45岁男子驾车时突发心梗离世 2天前还在外地跑马拉松

头条要闻

45岁男子驾车时突发心梗离世 2天前还在外地跑马拉松

体育要闻

“我是全家最差劲的运动员”

娱乐要闻

王一博改名上热搜!个人时代正式开启!

财经要闻

卧底"科技与狠活"培训:化工调味剂泛滥

汽车要闻

置换补贴价4.28万起 第五代宏光MINIEV正式上市

态度原创

艺术
时尚
亲子
家居
公开课

艺术要闻

中国油画学会三十年艺术展 | 油画选刊(一)

龙虾来了,厌蠢症炸了

亲子要闻

爱玩沙子是孩子的天性,这套#太空沙玩具 在家就能实现玩沙子的快乐,关键比去游乐场玩干净卫生。#儿童玩...

家居要闻

曲线华尔兹 现代简约

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版