![]()
编辑|冷猫
你想象中真正的 AI 是什么样子的?
至少有一点,大多数人会同意:未来的 AI,应该具备像人一样思考的能力。
问题在于,我们现在研究大模型走的这条路,能通向真正的「思考」吗?
当前最先进的大模型系统,几乎是在整个人类可获取的历史数据之上训练出来的:网页、书籍、代码、论文、对话,数万亿 token。训练大模型所需的数据,远超任何一个人类个体一生所能接触的总和。
AI 需要整个互联网来学习,而人类只需要一个童年。人类在成年之前,所接触的语言、文本与符号,顶多只有几十亿 token,相差几个数量级。
正是从这个问题出发,一家几乎没有产品、没有盈利、也不急于商业化的 AI 创业公司,从 GV、Sequoia 和 Index 拿到了1.8 亿美元融资,并获得了 Andrej Karpathy 的公开力挺。
它的名字,叫 Flapping Airplanes。
![]()
Flapping Airplanes 是一家基础 AI 研究实验室,专注于解决「数据效率」这一核心问题,并正在探索一些看似怪异、但可能至关重要的新思路 —— 从重新思考损失函数,到甚至质疑和重构梯度下降本身。该公司的研究团队成员中包括 IMO、IOI、IPhO 奖牌得主等顶尖人才。
Flapping Airplanes 称,其融资用来组建 AI 的新防线:一个想象中的世界,模型可以在不用摄入互联网一半内容的情况下达到人类水平的思考。
他们的估计是:在人类与现有模型之间,样本效率存在着 10 万倍到 100 万倍的差距。
要实现如此数量级的跃迁,仅靠渐进式改进是不够的 —— 需要真正的 Big ideas。
他们在推文中表示,公司的唯一目标,是做真正优秀、能够改变范式的研究。尽管目前并不急于商业化,但这些工作最终将在企业级应用、机器人、交易系统、科学发现等领域释放出巨大的价值。
「Flapping Airplanes」这个名字,正是公司文化的写照:我们是谁、我们在做什么,本身就是 out-of-distribution 的。非常非典型的活跃性公司文化,从他们的推文中能看出一丝严谨学术之外的跳脱。
![]()
我们甚至发现,Flapping Airplanes 官方推特的关注列表里,真的有旧金山机场和两大美国航司……(这是真的要起飞了)
![]()
一家没有产品、没有盈利、也不急于商业化的 AI 创业公司获得融资的事情似乎有些似曾相识。
主流观点是:AI 已经发展到如此阶段,一家新的、以研究为导向的创业公司,几乎不可能在竞争和执行层面上战胜现有巨头。「就你们这么几个人,怎么可能和 Google 竞争?」
但 Andrej Karpathy 毫不留情地指出:这种说法,在 OpenAI 成立时就是错的;后来,又一次被证明是错的。
![]()
当然,持续扩大规模、在有效路径上进行局部优化,仍然会带来惊人的进步。但与此同时,我们正以极快的速度解锁大量进展,整个领域被扬起了巨大的「技术尘埃」。
而且,前沿大模型与「一个只消耗 20 瓦功率的人类大脑」这一智慧奇迹之间,依然存在着巨大的鸿沟。正因如此,我认为,能够带来接近 10 倍提升(而非 10% 微增)的研究级突破,其概率依然非常高 —— 高到值得持续下注、持续寻找。
真正棘手的问题,当然在于:如何创造出能够孕育这种突破的环境。
Karpathy 认为,这样的环境极为罕见。但他盛赞 Flapping Airplanes,他们具备(罕见的)从上到下的全栈理解能力,并且对人才有极好的判断力。
希望扑翼飞机能够打开人工智能的航空新时代。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.