今天,AI+消费机器人公司「灵宇宙」宣布,已于近期完成2亿元的Pre-A轮融资。
这轮融资的投资方,包括上海国际集团旗下的国方创新、国泰海通、广发信德、滴滴出行、拉卡拉旗下考拉基金、润建股份等头部金融机构和上市公司,以及老股东超额追投。
灵宇宙是我从去年开始就一直关注的公司。
当时灵宇宙CEO顾嘉唯,一位曾打造过百度BaiduEye、爆款绘本阅读机器人Luka等产品的资深从业者,他希望为全球家庭及个人用户打造新的“伙伴型”AI机器人。
在打造机器人的同时,他还在迭代新一代的硬件OS,希望让万物在AI的加持下充满“灵性”。
今年1月,灵宇宙的第一款产品,为3~12岁AI世代原住民打造的随身AI终端——“小方机”亮相CES后,立刻引起各方关注。
*小方机使用展示
之后的一段时间,这款通过拍摄、理解、交流等方式,为新新人类提供即时学习和情感陪伴的小方机,销量在各电商平台名列前矛。
今年618期间“灵宇宙小方机”正式上市,就登顶618 AI玩具及玩具总榜双榜第一。
今年的“双十一购物节”,“小方机”在各类平台上的销售总额同比618增长超过230%。
![]()
*用户使用小方机
但就在灵宇宙业绩飙升的同期,各种AI硬件也在不断出现。面对各种和小方机面孔相似的AI产品,顾嘉唯认为,灵宇宙的技术厚度和产品人机交互体验,让小方机的用户体验脱颖而出。
他告诉我,灵宇宙基于过去在Luka时期积累的高质量数据,再加上一套能够精准分拆任务的Multi-Agent架构,让小方机接到任务后可以精准并迅速地理解、响应用户需求。

在用技术能力提升产品直观体验的基础上,顾嘉唯对小方机里的软件功能进行了精心设计。
比如,小方机里为每位AI原住民配备了专属超级伴学团队(包括达尔文、爱因斯坦、曹文老师等),通过角色演绎、互动故事、轻游戏等形式,激发他们探索世界的热情。
小方机里的内容具备互动性和趣味性,背后也离不开灵宇宙的多模态AI空间交互技术和“关系算法”。它们,一起帮助小方机持续沉淀用户的探索轨迹、兴趣偏好、记忆序列与成长数据,让孩子们能和经小方机呈现出的世界互动,和小方机里的内容一起成长。
有了能满足用户体验的技术和兼具趣味与个性化的产品功能,年轻一代的孩子们,会愿意在这里持续探索世界。

这种精心设计的产品,背后藏着顾嘉唯打造整个智能家庭生态的图景。他希望,通过消费级硬件先进入家庭场景,实现大规模“铺量”,从而持续回收来自真实世界的、宝贵的人机交互数据。
这些多个场景的真实数据,将形成一个越滚越快、让对手难以逾越的“数据飞轮”,类比特斯拉销售FSD套件收集数据的“南坡路径”,驱动LingOS与背后AI大脑迭代。然后,让“万物有灵,人机共生”的家庭智能生态成为可能。
这是他一直以来的目标。
![]()
以下是本轮融资完成时,我与顾嘉唯的最新交流。
半年内销量增长230%的小方机
Q:距离第一次见面刚好过去一年。很好奇灵宇宙这一年的进展,产品和商业化都有哪些重要突破?
顾嘉唯:过去一年,我们的产品在 CES 第一次亮相,接着就进入了快速商业化的阶段。618期间,小方机正式上线,立刻成为京东AI玩具榜的第一。后来我们在天猫上架小方机,双11过后统计,相比618的销售增长达到了230%。
![]()
商业化的进展非常重要,核心是,它非常有利于我们的数据闭环规划,这是驱动LingOS迭代和进步的关键。另外在产品功能上,我们保持着半个月一更新的速度,现在功能也非常丰富。
整体来说,过去一年最大的价值我自己之前说过的很多东西做到了这个产品里。大家终于看明白,哦,原来你做的这件事就是下一个儿童手表呀。这市场可大了去了,是一年20亿元净利润的业务板块。
Q:小方机是这波AI硬件里比较早发布的产品,但其实这一年里有很多类似的产品出现。你怎么看这种现象?
顾嘉唯:说实话,我没有太在意大家是不是在做差不多的事情。我上一次创业做的绘本阅读机器人Luka,全球卖了近千万台,也有很多同类。但整体我认为跑得快、体验好才是最重要的。
现在很多AI硬件都做得很薄,交互就是聊几句就结束了,对用户来说完全没有吸引力。但今天灵宇宙的小方机,首先在体验和交互上,横向对比已经非常成熟了。比如,它不仅可以精准快速地意图识别、回应,还内置海量持续OTA可升级的功能,例如最近上架的“魔法相机”,能让万物活起来。
另外,我们在硬件设计上也有很多坚持和创新。就拿屏幕来说,虽然我们需要高清的屏幕,但还是选择了能保护视力的类纸屏。既要护眼、又要高清,还要低功耗,本来是不可能三角,我们还是通过供应链上的努力解决了,也构建了软硬件连调的技术壁垒。
等于不管是软件还是硬件层面,小方机认真做了很多有新意的设计,现在整体是一个功能相对完备,兼具实用性和趣味性的产品,和市场上的其他产品有巨大代差。
我想,只要使用过的用户都会懂。但是我还是会跟团队说,iPhone头两代软件体验也没有做到让所有人都满意,甚至是当时体验过的人都觉得差强人意,但是只要方向对了,保持高速迭代,软件是可以不断交付出超预期的体验,刷新用户市场的口碑和新认知的。
Q:现在小方机里用户反馈最好的功能是?
顾嘉唯:我们产品迭代非常快,功能非常多,现在甚至在尝试简化,希望聚焦把产品功能和用户的Journey搭起来,带着用户一步步用起来。
现在小方机里有几个Aha moment。
首先是各种和角色打Facetime,这个和大家在Facebook里打视频电话类似,结合空间4D的感知交互+角色引擎,这样就能融合人的第一视角和环境。第二是让各种物体动起来,让用户有这个世界"活过来"、栩栩如生的体验,比如“魔法相机”就用了这个技术,这个功能上架后用户粘性和活跃度都特别高。
功能的核心价值,就是把用户的使用体验做到了极致,还由此沉淀出了社区,以瀑布流形式呈现内容,衍生出了各种各样的玩法。
现在我们可以把你身边各种东西,平面的、立体的、虚拟的、实物的都变成“活灵活现的存在”。万物可以“开口说话”,AI可以“开眼理解”,世界可以“活灵活现”,也可以像真实事物一样发生行为,孩子们用的时候会有一种沉浸式的感觉。未来“刷空间”会成为一种新的时尚,这里的空间是虚实融合的,甚至是分不清真实还是模拟的世界。
我自己叫它“万物有灵”。一是开口,二是行动,让所有物体看起来像真实发生在孩子们身边的事物一样。
之后,我们还会把对家长有价值的功能和对孩子有乐趣的功能拉通。这样做家长会更好地了解孩子的兴趣爱好,会和孩子一起成长。
Q:现在新一代的AI硬件都会讲求新的个性化和交互体验,做好这些需要技术基础。灵宇宙是怎么做的?
顾嘉唯:我们做了非常多的技术创新和优化,其中最关键的一点是数据。做 Luka 的时候,我们积累了非常多绘本的数据集,算是全球最大规模之一的绘本内容。
![]()
*Luka绘本阅读机器人
绘本很好的一点是:它是人类知识和信息的浓缩。
我们做 Luka 的“通用讲读”时,就不是走老路——图像识别、调音频、OCR 转 TTS 这一套,而是直接上了迁移式学习,做成“通用泛化讲读”。这样做的好处是,把图像都结构化一遍之后,就能让所有内容"活过来"。
现在我们在这些绘本内容上做了一层结构化训练。任何一本绘本、百科书、教材,它都能理解里面的内容、关系,然后用一个视频生成的 Lora 模型——核心是视频生成的可控性和物理引擎的理解——就能主动推理成“会动的画面”。
也就是,我们做了一个基于物件、动作、行为、环境的空间交互行为大模型,产品可以基于自己看到的内容推理,实时生成视频。比如孩子问了一个这道题怎么做的问题,小方机就可以把这些东西演出来,同时也推理出来,而不是直接给你答案。
有了这些技术基础,我们的产品只要打磨好,就能迅速铺量。小方机在双十一的排行榜上好几个第一,618也是第一,这些都是过去积累下的产品技术结果创造的商业价值。
这种思路给了产品很多功能上的创新体验。比如我们可以和很多老师合作,做出独有的、专有的内容。我们也可以让孩子和他日常最喜欢的玩具/宠物/各种角色/甚至他的阿贝贝互动。
在故事机那个时代,我们是绘本内容里做真实场景数据闭环做最多的公司。现在时代给了一个窗口期,让我们基于之前的积累,能做新的事情。
AI时代的步步高,阿尔法世代的社交货币
Q:听起来小方机背后有很多技术打磨。如果总结一下,你觉得哪些是最重要的?对产品功能影响最深的?
顾嘉唯:在这些功能背后,关系算法和空间AI交互是我们的技术核心。
抖音时代,内容是通过推荐算法出现。现在我们做了一套“关系算法”,让产品与用户有伙伴关系式的记忆,所以各种小方机里的IP、内容会主动和用户打电话、发自己的朋友圈,建立情感依赖和信任。这种价值厚度,是很多产品都没办法比拟的。
还有空间AI交互。它能让用户在各种地点,把物理世界变成可操作的界面,现在能实现拍摄后让东西动起来,之后还可以更深一步交互。
这种就是万物有灵的体现,也是公司的理念:World as prompt,World as interface。
![]()
Q:所以你会说,小方机是阿尔法世代的“抖音/小红书”?
顾嘉唯:没错。孩子们会拥有属于自己的新时代内容,比如AI朋友圈,里面有真人,也会有AI,但确实是围绕孩子"关系"的朋友圈。
举个例子,孩子去植物园,可能就会有"人"在小方机里发一条达尔文小时候去植物园的故事朋友圈。再比如,孩子拍了一张图片,可能会想和曹老师讨论里面的知识,也可能会请"3D绘画喵"帮忙生成一张画。所以,一切内容和形式都是围绕着他们的生活定制的。
而且,我们有关系算法、有记忆,这些角色会随着孩子成长也一起成长,就和在小方机里“养崽”一样,也就是把内容变成主动的、个性化的模式。目前我们最关注的事情之一,就是用户产生的人均AI互动内容。现在这个数据的增长速度非常快,都是AI和用户共同创作出来的内容。
这些设计对家长也有好处,家长会提前发现孩子的兴趣爱好。他会知道孩子对什么东西感兴趣,从一个启发式的小兴趣点的开始发掘,可以慢慢变成孩子真的擅长的事情。
Q:和现在的抖音相比,它最大的区别是?
顾嘉唯:张一鸣当年做的推荐算法,所有内容都在云端通过算法连接给用户。内容通过用户的点击、停留时长分发。
但我们今天有AI,有个性化生成,真的能做到完全的千人万面。每个人看到当下的内容,就是基于当下的内容生成,专门给到这个人的。它们是完全基于每个个体的内容。
所以,这波 AI 会完全做到极度个性化,甚至未来,界面都是实时生成出来的,这就又回到关系算法,我们还可以基于这个角色和用户的关系来生成内容。这样做之后,小方机里的每一个角色就会有成长体系,汇聚起来真正成为个性化、无穷尽的新时代抖音。
Q:做抖音还需要运营和各种内容供给的机制。灵宇宙是怎样设计的?
顾嘉唯:过去已经出现了非常多优秀的教育、娱乐内容,我们现在可以用AIGC重新交互一遍。除了我们在灵宇宙现在有一个"造人、造景、造记忆"的技术中台和分发端 AgentNET,这套方案能让外部开发者的产品进入小方机,类似智能手机里的 App Store,能让我们LingOS上的内容和功能都更丰富。
就像愤怒的小鸟之于iPhone一样,我也要找到自己的下一个“愤怒小鸟”。它不太可能会在第一天出现,但我要把灵宇宙的App Store搭好,这样才会产生更多玩法。
最终目标:真机数据让万物有灵
Q:聊聊灵宇宙这轮的融资吧。这次拿这些机构的钱,原因是什么?
顾嘉唯:这次的融资,你能看到,很多都是有战略价值的“深口袋”的钱。
这些“深口袋”资本,不仅资金充裕、周转周期长,耐心也很足。这种资本的核心价值在于两点:一是能持续加注资金,二是明白消费硬件绝不是靠“烧钱”做起来的。
过去SaaS模式或互联网的烧钱玩法,在消费硬件领域根本没有这样成功的案例。像影石、大疆、拓竹、Plaud,没有一家是烧钱烧出来的。甚至,即便苹果做iPhone,靠第一款产品就爆火也是很难的。
所以硬件行业有自身规律,我们需要找到这样的耐心资本,一步步打磨产品体验,实现健康的现金流增长。那种ROI算不过来、退货率高还硬撑的模式,肯定是难以为继的。
这轮融资之后,我们弹药非常充足,会持续招聘有逻辑、有韧性和有自驱力的年轻人,扩充品牌、营销、分销等方向。业务方面,我们会出海,也会在明年发布新的离身/分体产品。
Q:不仅消费级AI硬件,灵宇宙要做新一代硬件OS,也是一件长期的事。另一个疑问是,灵宇宙要生成个性化、可互动的世界,看起来和李飞飞的空间智能目标类似?
顾嘉唯:之前在硅谷工作时,我和李飞飞老师的交流也很多。ImageNet 出来后,深度学习遇到了瓶颈,我们当时都在找新的解题思路,核心其实是想实现两个维度的突破:
一个是“数字孪生”类的合成能力。比如有了图像后,能不能通过不断推演,加速内容生成,最终做出原来的实景中没有的内容。
另一个是真实场景数据的挖掘。这条路以前没有AI的压缩能力,像我们当年在微软做的Life Camera,虽然能胸前挂着记录一整天,但既没法高效查看、总结,又因为视频存储量太大,根本存不下,更别说实现“生命日志”、“生命流”的回溯,进而打造个人分身或助理了。但现在的AI,让这件事变得可行了。
所以现在有两条路径在并行:一个是仿真路径,这个方向NVIDIA这类有大算力、强资源的公司肯定是最强的。另一个是真机数据路径,我觉得这条线有机会创造新价值,现在Meta也在走,还把相关实验室和具身实验室合并,并行拓展数据源——这和特斯拉FSD当年的思路同源。
我为什么做这个路径,因为当年Mobileye的联创Ziv给了我很大启发,他想做OrCam(盲人眼镜上的摄像头),靠记录盲人的视觉需求收集真机数据,理解人如何操作物理世界。
虽然当时没有ScalingLaw、Transformer这些技术,想法没法落地,但就像科幻电影里描述的,从文本数据到联网获取监控、摄像头数据,再到渗透物理世界,这个概念很打动我。
2014年凯哥(地平线创始人,百度IDL深度学习实验室创办人余凯)带我进入深度学习领域,我们打造的百度大脑,从图像识别到自动驾驶,从眼镜到机器人,尝试过各种,其中百度BaiduEye,核心就是想打通线上线下,通过设备铺量收集物理世界的真实数据。到了现在这个节点,两条路径开始耦合,涌现真实世界智能的可能性越来越大了。
所以,我现在想做的,就是靠设备铺量,补全具身智能和空间智能缺失的真实数据集,再让智能涌现。
而且人类的学习本就是两个维度:第三视角去解读场景、做推理,第一视角去实践探索、反复验证修正。比如孩子眼睛看到拖鞋不在原来的地方,没了,就会推理说妈妈可能回来了,这个过程特别有意思。我现在想走通的“数据南坡”路径,核心逻辑就是这个。
Q:这个路径为什么是现在更可能成功?
顾嘉唯:一个人一天要触碰的东西是非常多的。今天我们有机会把操作系统变成整个世界,而不是屏幕里的GUI或者PC上的可执行文件,那么其实是有机会跑通真机数据智能涌现的逻辑的。
以前,GPT使用文本模型预测下一个Token,那如果能把物件、空间、动作、行为这些维度放在一起做数据涌现的话,我觉得,我们是有机会预测出下一个行为的。所以,这就是我为什么做Luka的升级和小方机,一个是让Luka带手脚和轮足去执行任务,另一个是让小方机这个随身设备构建第一视角的交互数据集。
之前,这个方向还没有人做成。甚至从行业一开始讨论这个路线到现在,已经有很多当年的公司消失了,但这是我笃信的路径。
更重要的是,现在灵宇宙有Luka卢卡时期的技术积累,团队有更多的商业经验,可以用小方机这样的产品做出AI时代的步步高,这是一个商业版图的机会启动点。从这里切入,继续完善数据版图,是一个很有希望的开始。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.