网易首页 > 网易号 > 正文 申请入驻

视启未来——两大AI领军人物看中的“空间智能模型”公司

0
分享至

有人说,中国硬科技已站上世界之巅,但就AI大模型的技术水平而言,中国仍处于追赶美国的阶段。这个结论正确吗?我们和昊辰资本创始人汤涛先生就此进行了讨论。他的观点是:至少该结论在“空间智能模型”领域是不正确的。一个来自于粤港澳大湾区数字经济研究院(IDEA研究院)的顶级科学家团队,开发出了全球领先的“空间智能模型”。这个团队的带头人,就是昊辰资本天使轮投资项目视启未来(深圳)科技有限公司(下文简称视启未来)的创始人——张磊博士。


图/张磊博士

视启未来的由来

张磊博士,是中国人工智能奠基人张钹院士的得意门生,也是拥有200余篇顶会论文、Google Scholar引用超6.2万次的IEEE Fellow。2024 年,张磊博士发布了通用视觉大模型 Grounding DINO 1.5,一举摘得视觉领域 SOTA(当前最优) 桂冠。在 COCO、LVIS 等多个国际权威测试中,该模型以绝对优势力压谷歌、Meta、微软等行业巨头,成功在全球舞台上为中国视觉大模型占据顶尖位置,彰显了国产 AI 的强劲竞争力。同年,团队推出的 DINO-X 模型更是凭借独一份的“泛化感知”能力,成为李飞飞团队和英伟达、银河通用、腾讯 Robotics X 实验室等国内外顶尖机构在发布重要研究成果时的重点引用对象,进一步确立了团队在全球空间 AI 领域的话语权。

Grounding DINO 1.5模型,一经公布便获得了IDEA 研究院创院理事长、世界顶级 AI 专家、美国国家工程院和英国皇家工程院外籍院士沈向洋的罕见转发推荐。要知道,这位AI界大佬素来惜字如金,转发频率堪称“一年一转”。这份难得的认可,无疑是中国原创AI模型向全球行业吹响的奋进号角。

张钹院士、沈向洋院士作为AI届领军人物,看到并认可张磊博士在“空间智能模型”中的研究突破,看好该技术广泛的应用前景,鼓励并支持了张磊博士的研究产业化步伐。

2025年8月,张磊博士正式创立视启未来,张钹院士和沈向洋院士担任公司顾问,全力支持公司发展。“很高兴的是,昊辰资本在Grounding DINO 1.5发布之初,就取得了与张磊博士团队的密切联系,并且参与了视启未来的天使轮投资”,汤涛先生无不兴奋地告诉我们。

技术产业化与模型突破并行

视启未来的两位重量级顾问--张钹院士和沈向洋院士,在学术界享有极高的声誉,在技术产业化方面拥有丰富的经验,在日常讨论中给团队提供了很多方向性的建议。在他们的关心指导下,公司从成立第一天起就确立了双措并举的方针——技术要落地,研究要前瞻。一方面,通过产业合作实现技术落地,要快速构建起可持续的商业模式;另一方面,要大胆投入前沿研究,保持技术在世界范围内的领先性。

在技术落地方面,公司成立不过四个月,就凭借DINO-X模型“泛化感知”的独特能力迅速打开市场,与招商局集团、美团机器人以及安凯微建立了深度合作,在工业场景、低空经济场景以及智能家居场景实现了空间模型的落地,从而让泛化感知技术可以提供精准化、个性化的AI增值服务。

在前沿研究方面,视启未来的核心目标是实现空间感知模型与VLA(视觉-语言-动作)的结合,即通过将自身的通用感知能力与VLA架构融合,构建更符合物理世界规律的智能系统。同时,3D空间感知也是视启未来的重点研究方向。“我们希望将感知能力打磨至极致,以此切入更多长尾且高价值的细分场景。与此同时,我们正着手将这类核心能力融入具身智能体系,希望帮助具身突破瓶颈,而这一过程需要开展大量针对性的研究与探索工作。”张磊这样概括公司的路线图。


图/张磊博士指导完成的研究工作SegDINO3D,运用视频数据完成三维空间的物体感知

具身智能中的创新型务实解法

张磊博士对具身智能本质的理解是机器人要实现“看得清、想得明白、做得动”,必须以视觉感知为核心。因此,张磊的研究理念始终围绕“视觉原生”展开。他相信“视觉是机器与环境交互的基础”,强调“机器的最终行动依赖的是视觉与行动闭环,而非仅仅依赖语言”。 多年的研究积累也让张磊团队形成清晰的技术演进路径:从2D物体检测与识别出发,逐步向3D空间理解延伸,最终实现机器人与物理世界的精准交互。当前张磊团队的核心研究方向之一是将2D感知升级为3D理解,解决具身智能的关键问题——通过视觉信息判断物体的空间位置、表面结构,进而确定最优操作角度。

对于具身机器人而言,视觉是连接感知、规划与行动三大基石的核心纽带,是机器从“看懂”到“做到”的必经之路。而在具身智能领域,VLA(视觉-语言-动作)架构虽为主流技术路线,却尚未实现产业大规模实际落地,核心瓶颈包括模型架构的可行性存疑和训练数据量的严重不足。具身赛道已形成的共识是,先解决数据规模和质量问题,再推进模型创新。

在此背景下,为了促使具身智能走向通用化这一核心命题,全球科技界正展开多元探索:特斯拉专注真实数据仿真,英伟达聚焦数据泛化,李飞飞团队聚焦3D空间的生成与构造,而杨立昆团队倡导的JEPA模型,试图探索数据抽象。总体来说,这些探索路径各异,但都尚未实现实质性突破。“物理AI”、“空间智能”、“世界模型”这些新诞生的概念背后,本质都是在争夺对新事物的定义权。

视启未来的研究方向,给这场竞争提供了务实的创新方向。公司以2D空间理解为根基增加连续的空间维度的变化,从而延伸到3D空间,为3D理解提供了坚实支撑。沿着这条路径,团队已经取得了可观的成果。张磊博士指导的研究工作OVSeg3R模型,进一步解决了开放世界中三维空间物体检测和分割的难题,且正在打破制约具身智能发展的“数据量级不足”的瓶颈。


图/最新3D分割模型OVSeg3R分割效果刷新了全球同类模型分数

以机械臂抓取物体的场景为例,传统VLA模型需要收集不同颜色、形状、环境下的海量实物交互数据,成本高且效率低。张磊则认为,抓取动作本身具有通用性,通过引入通用感知能力,可极大程度减少VLA对操作数据的依赖,放大现有数据的利用效率,让VLA完成各类物体的抓取,达成全场景的真实泛化。这一创新思路从根本上降低了数据依赖,为具身智能规模化应用创造了条件。

汤涛先生如此总结:“空间智能模型企业正迎来技术迭代与产业融合的双重红利,发展前景无限广阔。视启未来在空间智能模型领域已具备全球技术领先优势,不仅与头部企业达成合作,完成产业落地验证并推进相关业务,更凭借硬核技术为具身智能的通用化发展提供了无限想象空间与坚实支撑。我们坚信,视启未来必将成长为中国乃至全球‘空间智能模型’赛道的独角兽企业。”

一个在“空间智能模型”领域全球领先的公司,它的未来,确实值得期待。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
北京某公证处银行存款惊现巨额差异,1.8亿缩水至44万!

北京某公证处银行存款惊现巨额差异,1.8亿缩水至44万!

特约前排观众
2026-02-07 00:10:05
缅北七年亲历者讲述:男女都会遭性侵,坐水牢放毒蛇,伤口撒辣椒

缅北七年亲历者讲述:男女都会遭性侵,坐水牢放毒蛇,伤口撒辣椒

今朝牛马
2026-02-06 17:57:17
国家税务总局:2月25日起可预约办理2025年度个税汇算

国家税务总局:2月25日起可预约办理2025年度个税汇算

界面新闻
2026-02-07 07:53:49
仅一夜!NBA诞生9笔大交易!快船闹剧终结,骑士招募詹姆斯

仅一夜!NBA诞生9笔大交易!快船闹剧终结,骑士招募詹姆斯

篮球扫地僧
2026-02-06 21:56:26
前美职联球员:梅西保持水准年年都会是MVP,他提升整个联赛水平

前美职联球员:梅西保持水准年年都会是MVP,他提升整个联赛水平

兰亭墨未干
2026-02-07 08:45:09
日本中华烟4元一盒国内60元,不是歧视是规则!真相你必须知道

日本中华烟4元一盒国内60元,不是歧视是规则!真相你必须知道

复转这些年
2026-02-06 23:57:47
张靓颖,丝袜这么可爱呀

张靓颖,丝袜这么可爱呀

陈意小可爱
2026-02-04 12:51:16
上海两小将打服众人!小偰已胜任主控,马典成可取代刘礼嘉太全面

上海两小将打服众人!小偰已胜任主控,马典成可取代刘礼嘉太全面

篮球资讯达人
2026-02-07 01:03:15
清朝画家罗聘称能看到鬼,还画下了鬼的样子,从乾隆时期流传至今

清朝画家罗聘称能看到鬼,还画下了鬼的样子,从乾隆时期流传至今

优趣纪史记
2026-02-07 03:09:14
监狱监控曝光:爱泼斯坦女友在牢房踱步,狼吞虎咽地吃着监狱食物

监狱监控曝光:爱泼斯坦女友在牢房踱步,狼吞虎咽地吃着监狱食物

阿晪美食
2026-02-07 08:35:59
电磁弹射:中压直流那么优秀,为什么美国一开始就选了中压交流?

电磁弹射:中压直流那么优秀,为什么美国一开始就选了中压交流?

星辰大海路上的种花家
2026-02-06 09:40:04
史上最“散装”的冬奥会,来了

史上最“散装”的冬奥会,来了

中国新闻周刊
2026-02-06 22:38:06
贵金属价格飙升推高奖牌价值 米兰冬奥奖牌或成奥运史上最昂贵奖牌

贵金属价格飙升推高奖牌价值 米兰冬奥奖牌或成奥运史上最昂贵奖牌

环球网资讯
2026-02-06 11:15:59
年产250亿双袜子,全球每3双就有1双来自这里!浙江小镇大唐如何织就袜业韧性样本

年产250亿双袜子,全球每3双就有1双来自这里!浙江小镇大唐如何织就袜业韧性样本

新质界
2026-02-07 08:18:23
为什么有的人预判能力这么强?网友:简直是人生的贵人

为什么有的人预判能力这么强?网友:简直是人生的贵人

靓仔情感
2026-02-06 20:36:14
英超仅1球!曼联弃将坑惨切尔西 夏窗面临被清洗

英超仅1球!曼联弃将坑惨切尔西 夏窗面临被清洗

球事百科吖
2026-02-07 07:07:41
日本一男子潜入烤肉店偷16斤牛肉全吃光被抓,该男子回应表示“因为辞职后没有收入才这么做”

日本一男子潜入烤肉店偷16斤牛肉全吃光被抓,该男子回应表示“因为辞职后没有收入才这么做”

都市快报橙柿互动
2026-02-06 13:52:32
加拿大人彻底破防!超六成喊话:快把中国车卖给我

加拿大人彻底破防!超六成喊话:快把中国车卖给我

娱乐洞察点点
2026-02-07 06:09:15
12月6日北京雪飞天!苏翊鸣最后一跳绝杀日本选手夺冠

12月6日北京雪飞天!苏翊鸣最后一跳绝杀日本选手夺冠

林子说事
2026-02-06 19:02:58
《生命树》白芍远走广州藏两层深意,多杰张勤勤的关系早有伏笔

《生命树》白芍远走广州藏两层深意,多杰张勤勤的关系早有伏笔

怂熊剧场
2026-02-07 04:17:14
2026-02-07 09:19:00
投中网 incentive-icons
投中网
创新经济的智识与洞见
12082文章数 15392关注度
往期回顾 全部

科技要闻

小米千匹马力新车亮相!问界M6双动力齐报

头条要闻

媒体:敏感时刻 一个"极为罕见"情况在日本出现

头条要闻

媒体:敏感时刻 一个"极为罕见"情况在日本出现

体育要闻

西甲射手榜第2,身价不到姆巴佩1/40

娱乐要闻

微博之夜抢C风波 杨幂工作室9字讨说法

财经要闻

爱尔眼科董事长旗下7家精神病院骗保

汽车要闻

宝马"本命年"关键词:20款新车与"新世代"耐力赛

态度原创

时尚
健康
旅游
数码
军事航空

冬天不要只穿“黑白灰”!看看这些彩色的穿搭,简单又高级

转头就晕的耳石症,能开车上班吗?

旅游要闻

西安城墙唯一一个“圆角”,藏着什么秘密?很多老西安都答错了

数码要闻

【IT之家开箱】罗技GPW5雪豹电竞鼠标图赏,业界首发可调电磁微动

军事要闻

美国“肯尼迪”号核动力航母完成首次海试

无障碍浏览 进入关怀版