网易首页 > 网易号 > 正文 申请入驻

31岁,创业半年,近20亿融资,他的大模型牛在哪里?

0
分享至

创始人31岁,公司成立仅2个月,一家AI公司天使轮获得近20亿元投资,投资机构包括了最头部的几家VC,如红杉资本、今日资本、砺思资本等。

这家公司名字听起来有些特别:月之暗面(Moonshot AI),由清华大学交叉信息学院、智源青年科学家杨植麟领衔创立于2023年4月,公司总部设立在北京,同时在上海临港设有分公司。

近日,这家明星大模型公司完成创业首秀,宣布在“长文本”领域实现了突破,推出了首个支持输入20万汉字的大模型moonshot,以及搭载该模型的智能助手产品Kimi Chat。

创始人杨植麟表示,“目前,团队成员在50人左右。首轮融资及接下来的新一轮融资,都将主要用于技术产品的研发,以及团队扩展上。”

今年6月,The Information评选了五家最有可能成为中国OpenAI的公司,其中月之暗面(Moonshot AI)就位列其中。

一家如此年轻的创始团队,为何被资本和业界一致寄予厚望?我们从其创始人经历,以及其对公司的业务规划、行业的思考等层面来进行一一展现。

01

清华毕业时成绩年级第一

师从苹果AI研究负责人

曾在Google人工智能实验室工作

创业新人杨植麟是典型的学院派创业者。相比王小川、王慧文这些互联网时代的风云创业者,杨植麟在公众中的知名度稍逊。但在AI圈和创投圈眼中,他在这一波大模型创业浪潮中的关注度丝毫不弱于前二者。

杨植麟

原因之一是,杨植麟在AI圈子中的履历堪称翘楚。

早在高中时期,杨植麟就表现优异,他在没有任何编程基础的情况下,被选拔进信息学奥林匹克竞赛培训班,最终顺利通过竞赛保送清华大学。

清华求学时,杨植麟师从清华大学计算机系知识工程实验室(KEG)带头人、智源研究院学术晶院长、悟道项目负责人唐杰教授。最终他以满分成绩通过所有程序设计课程,并以年级第一的成绩毕业。

根据机器之心此前的报道,2015年从清华计算机系毕业后,杨植麟前往美国卡内基梅隆大学攻读博士,师从苹果AI研究负责人Ruslan Salakhutdinov和谷歌首席科学家William Cohen。

博士期间,杨植麟先后以一作身份,发表Transformer-XL和XLNet两项工作,谷歌学术被引次数近两万。Transformer-XL成为首个全面超越RNN的注意力语言模型,论文成为NeurIPS 2019与ACL 2019的最高引论文之一;XLNet则在20项任务上超越谷歌BERT模型,一鸣惊人。

除开学术成果,杨植麟的职业经历也是AI圈中的“顶配”。根据GitHub上的个人资料,杨植麟曾在Google和MetaPlatforms的人工智能实验室工作。在创立Moonshot AI前,杨植麟还与他人共同创立了循环智能(Recurrent AI),红杉中国也对该公司进行了投资。

杨植麟的学术和创业实践背景,让月之暗面(Moonshot AI)成为了投资机构追逐的明星项目。在公司成立的前两个月,融资的消息就流传出来了。

据杨植麟介绍,公司的名称来源于自己最喜欢的英国摇滚乐队发行的专辑《The Dark Side of The Moon》(月之暗面),月之暗面是月亮的背面,令人好奇和向往。摇滚精神是其公司很重要的一个底色。

杨植麟认为,公司最主要的一个特色其实是人才密度。“我们希望通过这种很高的人才密度以及组织力量,能够打造一个很快迭代的组织机器,让人才能够快速基于我们现有和未来发展出的技术,开发出比较好的产品。”

据了解,月之暗面(Moonshot AI)创始团队核心成员参与了Google Gemini、Google Bard、盘古NLP、悟道等多个大模型的研发,多项核心技术被Google PaLM、Meta LLaMa、Stable Diffusion等主流产品采用。

而一位行业内人士指出,市场上大模型相关的人才非常稀缺,真正有相关经验、有计划有认知、愿意创业且在合适的年龄的人其实并没有那么多,在算法创新方面的人才稀缺程度则比之更甚。这也是月之暗面(Moonshot AI)被资本热捧的重要原因。

02

首创20万字超长输入

以此为切口构建大模型竞争力

月之暗面(Moonshot AI)首秀产品有何特别?

当前大模型输入长度普遍较低的现状对其技术落地产生了极大制约,例如:目前大火的虚拟角色场景中,由于长文本能力不足,虚拟角色会轻易忘记重要信息。

月之暗面(Moonshot AI)观察到了“大模型输入长度受限带来的应用困难”,据杨植麟介绍,大模型moonshot支持20万字超长输入。“据我们所知,全球其他家目前还没有(支持这么长的文本的大模型产品)。”

杨植麟表示,做长文本,不管是存储、算力还是带宽,消耗其实都非常大。做长文本只是其“登月计划”的第一步,先从长文本入手克服困难。“当我们去看计算机系统发展史,一个必然的趋势是,都是从最开始的很小内存的计算机服务,再到很大的内存的服务。所以我觉得大模型肯定也是会有一样的趋势,从现在很少内存的大模型,到以后的很大内存。而且这个可能是决定模型的应用最关键的因素之一,我们是觉得这里面它的重要性其实非常大,另一个是刚刚说到的参数量。当AI计算足够复杂时,需要有足够大的内存来管理这个过程。我们要去真正克服这些困难,在这里面做了算法的优化。”

换言之,当大家都在拼AI的处理器时,他还把目光瞄向做大AI的内存。

据杨植麟介绍,moonshot可实现完整的上下文接入,不管是50个文档还是10个链接,可以同时对这些内容去进行处理。以Kimi Chat的一些实际使用为例,他进行了详细介绍。

来源:月之暗面(Moonshot AI)

案例二:出差发票太多?全部拖进Kimi Chat,它可快速整理信息。

案例三:发现了新的算法论文时,Kimi Chat能够直接帮你根据论文复现代码。

杨植麟在发布会上分享了公司未来的发展规划,他表示将会以长文本输入为核心构建其底座大模型的差异化竞争力。他认为这是行业现在最需要解决的问题,也是通往下一步产品化路上的最大卡点。

03

最高优先级做ToC产品

道很宽,市场不会只有一家OpenAI

杨植麟透露,未来公司不会拘泥于单一产品,而是多个产品共同发展。“大模型公司不可能说只局限在一个很狭窄的方向上,因为这是它的成本结构所决定的。不管是娱乐、还是生产力的工具与场景,还有多模态,我们都会去做尝试。”

另外,他还表示,Moonshot AI现在最高优先级的任务是在C端找到产品、技术以及市场的方向。但同时也会以开放心态去看B端的方向。“我觉得首先会分成ToB和ToC,它可能是两个不同的阵营。我们肯定是坚定在ToC这个阵营,ToC会产生头部的Super APP(超级应用),我认为这些Super APP会是基于自研的模型做出来的,因为需要在用户体验上能够有差异化,我们希望能够在Super APP 里面去占领一个比较好的位置。但同时我们还会觉得可能会出现一个长尾的各种各样的应用,这样的应用有可能是基于开源模型去做的。”

在杨植麟看来,短期来看,国内大模型公司与美国存在差距,但长期来看是比较乐观的。“虽然OpenAI在某些智能领域做得很好,但可能在某些特定场景中,比如生成图片的美学价值上,它暂时还无法超过Midjourney。由于AI是异质化的,面向不同人的智能维度完全不一样,每个公司可能都有自己擅长的部分。”

所以,对于当下而言,相比于商业模式,他认为现阶段的核心议题是产品创新。做到产品创新的关键,在于公司的人才和组织能力。“大模型有点类似登月计划,本身需要自顶向下的规划和统筹,但同时,我们需要鼓励自下而上的创新,保持一定程度的开放性和组织的扁平化,这样创新就更容易发生。

而在未来,杨植麟说希望月之暗面(Moonshot AI)通过AI给个人提供更便捷、更强大、更个性化的普惠产品。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
包揽赛季三冠!29岁樊振东独取2分 率队问鼎德甲+队史首次斩3冠王

包揽赛季三冠!29岁樊振东独取2分 率队问鼎德甲+队史首次斩3冠王

风过乡
2026-05-31 22:21:30
女生办健康证性生活却被印在上面,内容太辣眼!医院态度让人气愤

女生办健康证性生活却被印在上面,内容太辣眼!医院态度让人气愤

小鋭有话说
2026-05-31 14:57:47
疯狂的黄俄计划:80万东北土地、2千万东北人民,沙俄全想要?

疯狂的黄俄计划:80万东北土地、2千万东北人民,沙俄全想要?

鹤羽说个事
2026-05-28 23:03:03
重磅!美记曝光雷霆灰熊交易方案:霍姆格伦成筹码,西部要变天

重磅!美记曝光雷霆灰熊交易方案:霍姆格伦成筹码,西部要变天

酷侃体坛
2026-06-01 09:25:02
德国巨头卡了中国30年的空气悬架,被上海嘉定一个镇解决了

德国巨头卡了中国30年的空气悬架,被上海嘉定一个镇解决了

闻识
2026-06-01 02:15:52
亚历山大直言这是失败赛季:没能完成卫冕目标 文班的实力独一档

亚历山大直言这是失败赛季:没能完成卫冕目标 文班的实力独一档

罗说NBA
2026-06-01 06:40:03
郑丽文启程访美,“反独”成共同语言,港媒:民进党“抹红”无效

郑丽文启程访美,“反独”成共同语言,港媒:民进党“抹红”无效

海峡导报社
2026-06-01 07:10:03
事态升级!全网紧急下架林志玲作品,20 年内娱生涯彻底归零

事态升级!全网紧急下架林志玲作品,20 年内娱生涯彻底归零

未曾青梅
2026-05-29 22:26:21
神级躺赢!索汉提前锁定NBA总冠军戒指 本季先后效力马刺尼克斯

神级躺赢!索汉提前锁定NBA总冠军戒指 本季先后效力马刺尼克斯

醉卧浮生
2026-06-01 05:45:13
释永信在监狱能申请吃素不能

释永信在监狱能申请吃素不能

熊太行
2026-05-30 14:45:23
3死惨剧!脱把40秒追尾,22个雷达为何没“看”见死劫?

3死惨剧!脱把40秒追尾,22个雷达为何没“看”见死劫?

趣味萌宠的日常
2026-05-31 16:28:10
官方高调肯定,平台迅速解决提出问题的人:耿同学危

官方高调肯定,平台迅速解决提出问题的人:耿同学危

红色少女主播
2026-05-31 14:35:39
军事 | 普京将此残骸交于美方,到底什么意思?

军事 | 普京将此残骸交于美方,到底什么意思?

新民周刊
2026-06-01 09:08:31
官网5大专家预测总决赛:3人看好马刺夺冠 文班布伦森争FMVP

官网5大专家预测总决赛:3人看好马刺夺冠 文班布伦森争FMVP

罗说NBA
2026-06-01 06:23:45
马科斯已料到大选结局,暗示莎拉当选总统后,不要推翻目前的政策

马科斯已料到大选结局,暗示莎拉当选总统后,不要推翻目前的政策

奇思妙想生活家
2026-06-01 10:17:25
江浙沪父母到底有多能托举?网友调侃:这辈子只剩喝咖啡的苦

江浙沪父母到底有多能托举?网友调侃:这辈子只剩喝咖啡的苦

另子维爱读史
2026-06-01 09:59:38
给阿嬷的情书,新加坡官媒连批三天,最后承认:这东西,真挡不住

给阿嬷的情书,新加坡官媒连批三天,最后承认:这东西,真挡不住

娱说瑜悦
2026-05-30 17:03:54
中央气象台发布强对流、台风预警:今早至明天,吉林、辽宁等地将有10级以上雷暴大风,局地不排除有龙卷;贵州、广西、广东等有短时强降水

中央气象台发布强对流、台风预警:今早至明天,吉林、辽宁等地将有10级以上雷暴大风,局地不排除有龙卷;贵州、广西、广东等有短时强降水

鲁中晨报
2026-06-01 07:11:04
俄军前线两天损失近3000人,梅德韦杰夫威胁与欧洲开战

俄军前线两天损失近3000人,梅德韦杰夫威胁与欧洲开战

山河路口
2026-05-31 23:31:23
余承东:欢迎PK问界M9 70余项行业领先技术及第一,违反广告法了吗

余承东:欢迎PK问界M9 70余项行业领先技术及第一,违反广告法了吗

沙雕小琳琳
2026-05-30 09:08:05
2026-06-01 12:28:49
张通社
张通社
深耕产业园区的科创信息服务平台,源于张江、立足上海、服务科创。
2061文章数 195关注度
往期回顾 全部

财经要闻

网红驱蚊产品,标注化妆品竟含农药成分

头条要闻

牛弹琴:巴黎又乱了火光冲天 马克龙都看得目瞪口呆

头条要闻

牛弹琴:巴黎又乱了火光冲天 马克龙都看得目瞪口呆

体育要闻

哭过之后,文班亚马想给波波维奇打电话

娱乐要闻

张凌赫活动商场玻璃被挤爆5人受伤

科技要闻

关停三年后,天涯社区今起开放访问

汽车要闻

上市三周交付3603台!华境S跻身旗舰大六座第一梯队

态度原创

教育
房产
时尚
手机
亲子

教育要闻

打印准考证!2026山东高考|准考证打印全流程(含时间 + 入口 + 问题解答)

房产要闻

红动五月!全国抢入核心资产,广州盯紧凯旋新世界!

女人不管多大年纪,夏天都要准备一条白色阔腿裤,百搭又清爽

手机要闻

肖战同款4K实况神机 荣耀600元气版开售在即

亲子要闻

世界牛奶日遇上儿童节:这三种“奶制品”别给孩子当牛奶喝

无障碍浏览 进入关怀版