作者丨欧雪
编辑丨袁斯来
过去两年,主流AI交互依赖于输入框——用户先组织语言提问,AI再给出答案。
这种“对话式”交互效率极高,却与人类最自然的认知路径相悖。我们认识世界,从来不是从“提问”开始,而是从“看见”开始。
一家成立于2025年的年轻公司Chance AI,正在尝试解决这个问题。它提出了另一种AI产品形态——Visual Agent(视觉智能体),试图让AI从“回答问题”的工具,进化为“看懂世界”的系统。
Chance AI的创始人曾熙,路径横跨学术与产业。他在巴塞罗那大学获得博士学位,研究方向是认知科学与当代艺术,关注人类如何通过视觉理解世界。毕业后进入消费电子行业,在OnePlus、OPPO负责产品与设计,随后加入字节跳动,在Flow部门参与豆包等AI产品从0到1的探索。
之前的从业经历让他意识到一个结构性问题:大语言模型擅长“生成语言”和“回答问题”,但对于人类如何在现实世界中基于视觉形成判断,AI提供的支持仍非常不足。
2025年1月他从字节离开,3月注册公司,7月正式运营,9月上线首款产品Chance AI。
Chance AI以摄像头为核心交互入口,用户打开即可拍摄眼前事物,AI实时进行视觉推理。
在实际使用中,它被广泛用于逛展时解读艺术品、购物时分析穿搭、识别卡牌与潮玩版本、检测皮肤状态,以及拍菜单、识植物、看宠物等日常探索。曾熙向硬氪透露,目前大部分使用场景由用户自发挖掘,而非团队预设。
![]()
Chance AI被用于逛展时解读艺术品(图源/企业)
从技术来看,其Visual Agent在衡量多模态模型视觉推理能力的权威基准MMMU-Pro评测中取得86.07分,位居世界第一。
今年3月,Chance AI成为Art Central官方AI合作伙伴,这是AI首次进入国际大型艺术展会的“观看过程”。在现场,观众用摄像头对准艺术品,AI会实时参与观看,一边看一边交流。
![]()
AI首次进入全球大型艺术展会的“观看过程”(图源/企业)
支撑这一体验的是其刚推出的“Live模式”——实时视觉交互系统。与行业中已有的实时识别不同,其Live模式可以在实时视觉场景中,将知识检索、内容对比、上下文理解、多能力调度等多种视觉智能能力整合为一个完整的、具备实时响应能力的智能体。
![]()
Chance AI上线的Live模式使用场景(图源/企业)
截至目前,Chance AI全球总下载量超过20万,月活跃用户在4-6万之间。
曾熙透露,公司目前几乎没有进行市场投放,所有增长均来自自然传播,其核心用户是25岁以下的年轻人。
谈及未来规划,曾熙表示,2026年最重要的目标是在北美学生群体中进行更大规模的扩张。但这不是传统意义上的市场推广,而是深入用户社群,挖掘年轻人真实的使用场景。
与纯AI应用层创业者不同,这位拥有硬件大厂背景的连续创业者,从一开始就把“软硬一体”写进了产品路线图。曾熙认为,未来适合他们产品的硬件形态,应该是一颗包揽人们所有视觉信息的摄像头。
我们对曾熙做了访谈,聊了聊他对行业发展以及技术路线的看法。
以下是访谈节选:
硬氪:目前很多AI产品都有视觉能力,Chance AI的差异化优势在哪里?
曾熙:我认为接下来很难有一家独大的AI公司了,大家会分得很开。我们选择深耕视觉,是因为今天大家还没关注到,但未来会是主流。
我们的护城河不是模型多强,而是能多快跟真实用户交互。今天我们自己设计的功能不到20-30%,剩下都是用户告诉我们的——拍皮肤、看菜单、识别卡牌、吐槽……你要做到这些,必须跟用户离得足够近。我们曾经在6个小时内满足了一个纽约大学的潮流文化社团的需求,让他们能识别特定卡牌。这是Google或OpenAI做不到的。
硬氪:目前APP没有任何收费内容,未来的商业模式怎么走?
曾熙:我们目前有三个方向。第一,高级功能订阅,这是今年的计划。我们工程能力比较好,成本做得低,所以没有迫切的收费压力。第二,硬件授权,我们正在和一些硬件厂商聊,他们投入在硬件很难有时间打磨模型层之上的产品,这是我们擅长的。第三,广告推荐,但会非常谨慎。对我们来说,优先级最高的是先养成用户习惯——让用户看到什么都习惯性地先拍一拍。如果你成为一个入口级的产品,商业机会自然会出现。
硬氪:你们会自己做硬件吗?大概什么时候?
曾熙:看行业情况。当我们判断供应链成熟以后,一定会奋不顾身地杀进去。但更重要的是,我们不会为了做硬件而做硬件。
我们的本质是视觉推理能力,Live模式只是这种能力的一个展现。我们认为未来的随身AI硬件一定是一个摄像头,可以包揽你所有眼睛正在看的东西,然后提供下一步有价值的行动。这是我们跟所有现有产品的本质区别——我们的起点没有输入框,起点就是“看”。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.