谷歌苹果华人大佬创业，融资3.5亿，或憋多模态模型大招|算法|大模型|苹果公司|知名企业|自然语言处理

谷歌苹果华人大佬创业，融资3.5亿，或憋多模态模型大招

2026-01-14 19:33:29　来源: 智东西

北京举报

分享至

谷歌工作了14年的戴明博，与苹果的杨寅飞共同创立了Elorian。

编译 |万贵霞

编辑 |云鹏

智东西1月14日消息，据美国科技媒体The Information报道，两位科技大厂前AI研究员——谷歌DeepMind前成员戴明博（Andrew Dai）与苹果前研究科学家杨寅飞（Yinfei Yang），联合创立了Elorian公司。该公司专注于开发能够同时理解和处理文本、图像、视频及音频的AI模型。

目前，Elorian正在推进一轮规模达5000万美元（约合人民币3.5亿元）的种子轮融资，Striker Venture Partners有望成为本轮领投方，双方洽谈已进入关键阶段。

戴明博出身于高知家庭，他父亲是机构学和机器人学领域大佬戴建生。作为Elorian的CEO，他之前在谷歌DeepMind任职超14年，负责数据驱动型预训练相关工作。他深耕深度学习领域20年，曾在剑桥大学、爱丁堡大学攻读过学位，是机器学习方向的博士。

Elorian另一位联合创始人杨寅飞，学生时期曾在南京邮电大学Echo实验室，参与差分进化算法参数控制相关研究，毕业作品Apollo3D（阿波罗3D）获苏州机器人世界杯第五名。他还参与癫痫诊断研究，开发MRI图像配准与可视化系统，之后在美国宾夕法尼亚大学攻读硕士学位。

在AI创业从“拼应用”转向“拼底层能力”的背景下，具备长期基础模型研究经验的华人科学家正加速走向创业前台，Elorian成为近期视觉AI赛道中备受关注的案例之一。

01.

前谷歌DeepMind与苹果研究员联合创业

据The Information报道，Elorian公司由戴明博与杨寅飞联合创立。

戴明博与杨寅飞的领英个人资料显示，二人目前就职于一家“隐形（Stealth）”状态的公司，戴明博是该公司的CEO。

业内普遍认为，这家“隐形”公司很可能是Elorian。

▲“隐形（Stealth）”的领英主页资料（图源：领英）

1、戴明博，深耕DeepMind 14年，担任Gemini预训练工作

据戴明博领英个人资料显示，他在谷歌DeepMind工作超过14年，是Gemini数据领域的联合负责人，担任Gemini预训练工作。

此前，戴明博曾参与谷歌SGE的建模工作，在谷歌大脑（Google Brain）从事自然语言处理研究，在谷歌健康（Google Health）从事电子健康记录研究，并参与了Google Now的开发。

▲戴明博（图源：领英）

在领英自我介绍中，戴明博写到自己在深度学习领域拥有丰富经验，研究方向包括自然语言理解和大型语言模型。

戴明博2003-2006年在英国剑桥大学计算机科学专业学习；2007-2012年在爱丁堡大学攻读机器学习博士。

他过去20年来一直从事预训练相关研究。其研究主要集中在开发评估AI模型训练数据质量的技术，并确保模型使用来自各种不同来源的数据进行训练。

据相关报道消息，戴明博出生于高知家庭，他的曾祖父毕业于金陵大学（南京大学前身），爷爷毕业于厦门大学土木工程系。

戴明博的爸爸则是开辟了国际机构学和机器人学研究新领域的大佬、现南方科技大学机器人研究院院长戴建生。

▲戴明博在福建莆田的家庭合照，右下1为戴建生，左上1为戴明博（图源：公众号angrysprite不可言喻）

可能受父亲的耳濡目染，戴明博也攻读机器学习相关专业，从事谷歌DeepMind相关工作，且创立了Elorian公司。

2、杨寅飞，横跨谷歌苹果，主攻视觉和语言多模态模型领域

杨寅飞领英主页资料显示，他于2022年1月加入苹果，担任苹果公司AI机器学习部门的研究科学家。

▲杨寅飞（图源：谷歌杨寅飞主页）

杨寅飞在学生阶段就开始接触行业相关工作。据杨寅飞的谷歌个人介绍，2007年12月至2009年7月，他曾作为研究助理在南京邮电大学Echo实验室进化计算研究组工作，参与设计了一种用于控制差分进化算法参数的新方法。

在本科阶段，杨寅飞完成的毕业作品名为Apollo3D（阿波罗3D），主要用于Robocup足球模拟器中的Simu-Robot动作设计。该作品曾在苏州机器人世界杯比赛中获得第五名。

▲杨寅飞的毕业作品Apollo3D图像演示（图源：Source Forge）

2010年5月至10月，杨寅飞参与了一项跨校、跨国合作研究，与南京航空航天大学的郑刚及田纳西理工大学的 Forrest Sheng Bao合作，围绕AI与脑磁图（MEG）结合的癫痫诊断软件展开研究，目标是验证机器学习方法在癫痫诊断中的可行性。

在具体实现上，他参与开发了一套用于MRI图像配准与可视化的软件系统，并结合基于SAM-kurtosis algorithm（SAM[g2]）计算的结果，对来自CTF脑磁图系统的数据进行处理。该项目源码已开源，并发布在Source Forge平台。

▲MRI图像可视化系统CTF-SAM-OUT的图像演示（图源：Source Forge）

2011年5月至2012年5月，杨寅飞担任Longin Jan Latecki教授的研究助理，该教授是美国天普大学（Temple University）计算机与信息科学系的博士生导师。

▲2012年，Longin Jan Latecki教授发表论文《基于足迹检测的跟踪方法，实现对非静态目标物体的导航》，杨寅飞担任二作（图源：天普大学主页）

2012年至2013年，杨寅飞在美国宾夕法尼亚大学攻读硕士学位，研究方向包括计算机视觉、机器人学和自然语言处理。

2013-2017年期间，他先后在亚马逊和Redfin担任研究工程师，负责机器学习和计算机视觉领域的研究。

之后，他在谷歌任职超4年，从事自然语言处理的研究，包括语义检索（semantic retrieval）、多语言表示（multilingual representation）和多模态表示（multimodal representation）等。

2022年，杨寅飞担任苹果公司AI机器学习部门的研究科学家，主要研究视觉和语言基础模型。

他于去年12月离开苹果，与戴明博一起筹划创立Elorian。

02.

Elorian能同时理解图像、视频和音频，

计划融资3.5亿元

戴明博在The Information的电话采访中说，Elorian专注于构建能够通过同时处理图像、视频和音频来对物理世界进行视觉解读和分析的AI模型。

戴明博还说，虽然机器人技术是Elorian的一个潜在应用领域，但这家初创公司设想了许多其他应用，不过他并未详细说明。杨寅飞尚未对此置评。

视觉推理模型因具备多模态功能整合能力，专为机器人系统等复杂AI应用场景设计，从而节省开发人员拼接不同AI模型的工作量。

一些研究人员向外媒解释道，这项技术对于需要解读和理解图像以执行高级任务的AI智能体来说非常有价值。

在融资方面，外媒据戴明博和另一位知情人士透露，初创公司Elorian正在与投资者洽谈，计划进行约5000万美元（约合人民币3.5亿元）的种子轮融资。

该知情人士还说，由风投公司CRV前普通合伙人Max Gazor于去年10月创立的风险投资公司Striker Venture Partners正在洽谈领投此轮融资。

03.

结语：视觉推理AI成为巨头与创企关注焦点

从最早仅处理文本的大模型，到如今同时理解图像、视频与音频的多模态系统。这一被称为视觉推理的研究领域，如今已成为包括谷歌、OpenAI和Anthropic在内的众多大型AI提供商和初创公司的关注焦点。

Elorian的出现，正是这一浪潮中的缩影，其能否在视觉推理这一关键赛道中跑出差异化路径，仍有待时间验证。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.