![]()
谷歌工作了14年的戴明博,与苹果的杨寅飞共同创立了Elorian。
编译 |万贵霞
编辑 |云鹏
智东西1月14日消息,据美国科技媒体The Information报道,两位科技大厂前AI研究员——谷歌DeepMind前成员戴明博(Andrew Dai)与苹果前研究科学家杨寅飞(Yinfei Yang),联合创立了Elorian公司。该公司专注于开发能够同时理解和处理文本、图像、视频及音频的AI模型。
目前,Elorian正在推进一轮规模达5000万美元(约合人民币3.5亿元)的种子轮融资,Striker Venture Partners有望成为本轮领投方,双方洽谈已进入关键阶段。
戴明博出身于高知家庭,他父亲是机构学和机器人学领域大佬戴建生。作为Elorian的CEO,他之前在谷歌DeepMind任职超14年,负责数据驱动型预训练相关工作。他深耕深度学习领域20年,曾在剑桥大学、爱丁堡大学攻读过学位,是机器学习方向的博士。
Elorian另一位联合创始人杨寅飞,学生时期曾在南京邮电大学Echo实验室,参与差分进化算法参数控制相关研究,毕业作品Apollo3D(阿波罗3D)获苏州机器人世界杯第五名。他还参与癫痫诊断研究,开发MRI图像配准与可视化系统,之后在美国宾夕法尼亚大学攻读硕士学位。
在AI创业从“拼应用”转向“拼底层能力”的背景下,具备长期基础模型研究经验的华人科学家正加速走向创业前台,Elorian成为近期视觉AI赛道中备受关注的案例之一。
01.
前谷歌DeepMind与苹果研究员联合创业
据The Information报道,Elorian公司由戴明博与杨寅飞联合创立。
戴明博与杨寅飞的领英个人资料显示,二人目前就职于一家“隐形(Stealth)”状态的公司,戴明博是该公司的CEO。
业内普遍认为,这家“隐形”公司很可能是Elorian。
![]()
▲“隐形(Stealth)”的领英主页资料(图源:领英)
1、戴明博,深耕DeepMind 14年,担任Gemini预训练工作
据戴明博领英个人资料显示,他在谷歌DeepMind工作超过14年,是Gemini数据领域的联合负责人,担任Gemini预训练工作。
此前,戴明博曾参与谷歌SGE的建模工作,在谷歌大脑(Google Brain)从事自然语言处理研究,在谷歌健康(Google Health)从事电子健康记录研究,并参与了Google Now的开发。
![]()
▲戴明博(图源:领英)
在领英自我介绍中,戴明博写到自己在深度学习领域拥有丰富经验,研究方向包括自然语言理解和大型语言模型。
戴明博2003-2006年在英国剑桥大学计算机科学专业学习;2007-2012年在爱丁堡大学攻读机器学习博士。
他过去20年来一直从事预训练相关研究。其研究主要集中在开发评估AI模型训练数据质量的技术,并确保模型使用来自各种不同来源的数据进行训练。
据相关报道消息,戴明博出生于高知家庭,他的曾祖父毕业于金陵大学(南京大学前身),爷爷毕业于厦门大学土木工程系。
戴明博的爸爸则是开辟了国际机构学和机器人学研究新领域的大佬、现南方科技大学机器人研究院院长戴建生。
![]()
▲戴明博在福建莆田的家庭合照,右下1为戴建生,左上1为戴明博(图源:公众号angrysprite不可言喻)
可能受父亲的耳濡目染,戴明博也攻读机器学习相关专业,从事谷歌DeepMind相关工作,且创立了Elorian公司。
2、杨寅飞,横跨谷歌苹果,主攻视觉和语言多模态模型领域
杨寅飞领英主页资料显示,他于2022年1月加入苹果,担任苹果公司AI机器学习部门的研究科学家。
![]()
▲杨寅飞(图源:谷歌杨寅飞主页)
杨寅飞在学生阶段就开始接触行业相关工作。据杨寅飞的谷歌个人介绍,2007年12月至2009年7月,他曾作为研究助理在南京邮电大学Echo实验室进化计算研究组工作,参与设计了一种用于控制差分进化算法参数的新方法。
在本科阶段,杨寅飞完成的毕业作品名为Apollo3D(阿波罗3D),主要用于Robocup足球模拟器中的Simu-Robot动作设计。该作品曾在苏州机器人世界杯比赛中获得第五名。
![]()
▲杨寅飞的毕业作品Apollo3D图像演示(图源:Source Forge)
2010年5月至10月,杨寅飞参与了一项跨校、跨国合作研究,与南京航空航天大学的郑刚及田纳西理工大学的 Forrest Sheng Bao合作,围绕AI与脑磁图(MEG)结合的癫痫诊断软件展开研究,目标是验证机器学习方法在癫痫诊断中的可行性。
在具体实现上,他参与开发了一套用于MRI图像配准与可视化的软件系统,并结合基于SAM-kurtosis algorithm(SAM[g2])计算的结果,对来自CTF脑磁图系统的数据进行处理。该项目源码已开源,并发布在Source Forge平台。
![]()
▲MRI图像可视化系统CTF-SAM-OUT的图像演示(图源:Source Forge)
2011年5月至2012年5月,杨寅飞担任Longin Jan Latecki教授的研究助理,该教授是美国天普大学(Temple University)计算机与信息科学系的博士生导师。
![]()
▲2012年,Longin Jan Latecki教授发表论文《基于足迹检测的跟踪方法,实现对非静态目标物体的导航》,杨寅飞担任二作(图源:天普大学主页)
2012年至2013年,杨寅飞在美国宾夕法尼亚大学攻读硕士学位,研究方向包括计算机视觉、机器人学和自然语言处理。
2013-2017年期间,他先后在亚马逊和Redfin担任研究工程师,负责机器学习和计算机视觉领域的研究。
之后,他在谷歌任职超4年,从事自然语言处理的研究,包括语义检索(semantic retrieval)、多语言表示(multilingual representation)和多模态表示(multimodal representation)等。
2022年,杨寅飞担任苹果公司AI机器学习部门的研究科学家,主要研究视觉和语言基础模型。
他于去年12月离开苹果,与戴明博一起筹划创立Elorian。
02.
Elorian能同时理解图像、视频和音频,
计划融资3.5亿元
戴明博在The Information的电话采访中说,Elorian专注于构建能够通过同时处理图像、视频和音频来对物理世界进行视觉解读和分析的AI模型。
戴明博还说,虽然机器人技术是Elorian的一个潜在应用领域,但这家初创公司设想了许多其他应用,不过他并未详细说明。杨寅飞尚未对此置评。
视觉推理模型因具备多模态功能整合能力,专为机器人系统等复杂AI应用场景设计,从而节省开发人员拼接不同AI模型的工作量。
一些研究人员向外媒解释道,这项技术对于需要解读和理解图像以执行高级任务的AI智能体来说非常有价值。
在融资方面,外媒据戴明博和另一位知情人士透露,初创公司Elorian正在与投资者洽谈,计划进行约5000万美元(约合人民币3.5亿元)的种子轮融资。
该知情人士还说,由风投公司CRV前普通合伙人Max Gazor于去年10月创立的风险投资公司Striker Venture Partners正在洽谈领投此轮融资。
03.
结语:视觉推理AI成为巨头与创企关注焦点
从最早仅处理文本的大模型,到如今同时理解图像、视频与音频的多模态系统。这一被称为视觉推理的研究领域,如今已成为包括谷歌、OpenAI和Anthropic在内的众多大型AI提供商和初创公司的关注焦点。
Elorian的出现,正是这一浪潮中的缩影,其能否在视觉推理这一关键赛道中跑出差异化路径,仍有待时间验证。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.