“让机器看见”,这句话说得轻松,做起来才知道有多麻烦。摄像头拍到的画面里,桌子是平面还是凹坑?半透明玻璃瓶到底在哪个位置?用云端AI处理,网络一卡,产线上的机械臂可能就焊错了地方。一家丹佛的公司Luxonis,想把这个“看见”的动作压缩到一颗小设备里完成。他们刚刚拿到1400万美元的A轮融资,领投方是Denali Growth Partners。
这笔钱的用途很明确:把他们2025年推出的最新一代OAK4相机铺到更多的工厂和零售场景里去。这种相机不是我们平时用的那种只输出画面的设备,它把多个视觉传感器和计算单元做到一个机身里。关键是,它跑的不是那种动不动几百GB的云端大模型,而是压缩到INT8或者FP16精度、能在边缘直接运行的AI模型。
![]()
用数据说话。Luxonis说自家的深度精度能到1/32亚像素,什么意思?就是你盯着桌上的可乐罐,普通方案可能判断“这是个圆柱体,大概离你20厘米”,而它能精确识别罐体表面的弧度起伏和真实距离。这种级别的感知,直接决定了机械臂是稳稳握住杯子,还是捏扁了罐头。更关键的是,本地算力意味着机器不用每做一个动作都往云端发请求——延迟消失了,断网也能干活。
这家公司的成立路径有点特别。2019年成立,科技创业常见的VC路不走,2020年反而跑去做了一次Kickstarter众筹。结果6500多个支持者投了130万美元,成了他们最初的底盘。到现在,算上这轮,Pitchbook数据显示他们的累计融资额已经超过2300万美元。
Luxonis手里的牌是软硬件的组合。硬件就是刚才说的OAK相机系列,各种形态可以即插即用;软件则是他们开源的DepthAI平台,让开发者能基于它构建具有自主决策能力的视觉感知自动化系统。这套开源生态相当于在围墙里开了一扇门,吸引外部开发者一起把视觉感知这个“物理AI”的最前端搞得更扎实。
为什么说现在是“物理AI”的当口?看看圈子里钱往哪儿流就知道了。做具身智能的Generalist AI拿了4亿美元,贝索斯押注的机器人软件公司Physical Intelligence融了6亿美元。这些公司都在给机器人造“大脑”,但如果“眼睛”看不清、反应慢,“大脑”再聪明也白搭。视觉感知,是整个智能自动化体系里最先接触物理世界的那个界面。
Luxonis想做的就是这块界面的标准化。通过把感知、计算、软件堆栈打包进一个设备里,在边缘端把视觉数据处理干净,再喂给后端的语言视觉模型或者视觉动作模型。对于25到40岁、每天都在和延迟、带宽、模型部署作斗争的工程师来说,这个思路的吸引力在于:它不是在画一个“全知全能”的AI大饼,而是先解决产线上一个摄像头能不能在20毫秒内做出正确判断的具体问题。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.