![]()
11月16日,由国家高新区人工智能产业协同创新网络、中央广播电视总台《赢在AI+》节目组、清华大学可持续社会价值研究院、中国人民大学交叉科学研究院、赛迪研究院人工智能研究中心、中关村发展集团等联合主办的2025人工智能+大会在北京中关村国际创新中心&中关村国家自主创新示范区会议中心举行。
论坛第一场圆桌对话由清华大学交叉信息研究院教授、副院长徐葳主持,对谈嘉宾有智谱华章董事长刘德兵、范式联合创始人首席科学家、执行董事陈雨强、阶跃星辰创始人兼首席执行官姜大昕、清华大学交叉信息研究院助理教授、星海图联合创始人许华哲。
圆桌论坛围绕“生态协同,场景驱动AI新质引擎”展开,四位嘉宾分享自身背景,提及AI两年核心变化:产业应用落地、国产化算力铺开、从模仿到强化学习范式转变、机器人能力提升。
1、智谱华章坚持开源战略,认为开源能促进行业发展,与商业化共生,通过云服务、行业深度共创实现商业价值增长。
2、范式智能以“帮企业提升经营效率”为核心,采用AI软硬结合一体机模式,在多行业实现规模化商业落地。
3、Agent技术质变源于大模型推理与多模态能力进步,阶跃星辰聚焦智能终端Agent,期待其成为人机交互新入口,具备做事、在场、有记忆、能进化的特性。
4、具身智能生态中,大学提供人才与创意,公司投入资源与数据,新型研发机构灵活攻坚关键领域,三者需协同发力。
5、嘉宾看好的AI落地场景:教育(培养AI人才)、工程设计(物理仿真加速)、智能终端陪伴(工作生活辅助)、2C家庭服务(机器人替代繁琐家务)。
6、AI发展需“顶天立地”,既要原始创新,也要商业落地,生态协同(企业、高校、政府等)与人才培养是成功关键。
以下为圆桌对话全文:
徐葳:各位领导,各位同仁,大家上午好!欢迎来到圆桌论坛,今天的题目叫作生态协同,共探未来边界。我们特别讨论的词是场景驱动X新质引擎。今天非常荣幸请到四位嘉宾,这四位嘉宾是在业界里面又能打又能讲的嘉宾,我们一起聊聊AI的话题。
今天讨论的话题是AI真正要顶天,要真正做有基础门槛的原始创新,又能立地,我们得能活下去,能赚钱,能产生可持续的生态。这场圆桌,我们希望能少一点精神内耗的宏大叙事,多一点让大家抄作业的实战经验。
四位嘉宾都是业内最知名的人物,我觉得大家需要介绍。但还是让大家有一分钟的时间快速介绍一下自己,顺便用一句话说一下在您眼中,过去这两年AI变化最大的一件事是什么?
刘德兵:大家好,很高兴参加本次论坛,我是智谱华章董事长刘德兵,智谱是一家战斗在一线的企业,我们现在特别关注基模的发展、行业应用,以及生态合作伙伴一起协作往前发展。
最近两年我们看到AI最大的变化是什么?说实话非常多,大家都感受到这个变化非常快,技术突破日新月异,产业应用的发展也非常快,就我个人而言感触最深的就是现在产业应用逐渐落地,我们特别期待更多杀手级的应用,包括与行业深度结合的应用能够快速出来,这是我们感受最深的。
陈雨强:大家好,我是范式智能陈雨强,范式智能是人工智能AI技术能力提供商,我们为企业提供人工智能能力,帮助这些企业进行人工智能转型。
回到徐老师的问题,过去两年,AI在技术层面、应用层面都有非常多的进展。我们从算力层面来说,越来越铺开国产化信创的算力,这也给行业带来一些新的机会。
姜大昕:大家上午好,我叫姜大昕,来自阶跃星辰。阶跃星辰是23年4月份成立的大模型创业公司。过去2年多时间,阶跃星辰也打造了1+N的模型矩阵。所谓1,就是基础语言模型,我们陆续发展了STEP系列,从1到3的基础模型。N是指多模态,多模态涵盖了从语音到图像、视频,甚至到音乐的全方位模型矩阵。
回答徐老师的问题,如果说过去三年,我会说ChatGPT,正是因为ChatGPT的出现,让我决定投身大模型行业。给我印象的时候是去年9月份,OpenAI发布O1的preview模型。我们一直认为智能的演化分为三个阶段,从模仿学习到强化学习,到自主学习。我认为ChatGPT代表了模仿学习的高光时刻,O1模型的出现代表了整个范式的转变,从模仿学习全面进入了强化学习的阶段。
许华哲:大家好,我是清华大学交叉院的,星海图的许华哲。星海图是一家具身智能公司,也是做人形机器人。过去两年我最深的感受是两件事,一是以大模型为主导的AI,所有人都在用,我日常电脑上就开着三五个不同的模型,让他们比赛。二是机器人方面,我们发现这些机器人从最开始路都不稳,到能跳舞,能干活,逐渐走到工厂,机器人也是大模型的明天,将来机器人会走到千家万户。
徐葳:感谢各位的介绍。我们从顶天立地的角度谈谈生态,现在前沿技术都需要高持续的投入,但是商业上跑通是怎么考虑的,因为我们觉得AI发展到今天,不能只赢在跑分,论文里面,而应该是真实世界里面,不能说赚到,保证能亏得起。请各位老师结合自己的经历聊聊如何把高科技过渡到好生意。
刘总,智谱华章是国内非常少数的既做大模型非常前沿和尖端的,同时扶持大模型的生态,也在2B、2G商业化走得很重。我理解做这样的公司都有一个纠结,比如说开源,不开源没人用生态,开源多了就投掷了自己未来发展。智谱华章在开源和商业化方面怎么算这笔账的,有没有一些平衡?
刘德兵:我们公司来自清华大学,有清华的基因,对开源和学术分享,我们有自己的职责,我们很喜欢开源,很喜欢分享,喜欢技术的发展,这是我们心里主观上愿意做的事情。我们从实际公司战略发展考虑,开源对整个行业发展非常有利,尤其对人工智能行业,有自己的特点。人工智能本身需要千千万万有知识、有技术的各行各业人才,共同贡献。
我们把基础模型拿出来以后,上面还有很多待解决的问题,很多应用的发展需要做。包括基础模型也需要很多研究,甚至现在很多人做非transformer架构的问题,大家开源把架构拿出来大家都可以玩儿。如果之前没有开源,寂寞的成本太高。开源本身对整个行业的发展至关重要,我们是完全支持的。
智谱华章22年发布第一个千义模型的时候就做了开源,后面有40多个模型都做了开源,我们在开源上非常坚决。同时我们确实要回答一个问题,开源会不会影响我们的商业收益。我们自己看这是相互共生的状态,不是相互抵触的,首先需要行业整体发展,公司个人才有发展,这是非常重要的。
我们在开源架构的基础上,商业收益也是属于快速增长的。这里面有几个点,比如说我们直接通过云服务提供API相关的调用,开源生态大了,自然而然转化为互惠用户,这是很大的增长。我们想象未来AI本身成为社会的基础设施,各行各业赋能的时候,这里面蕴含着巨大的商业价值,可能是万亿级别的。
开源不会替换掉的。我们和行业深度结合的应用上,现在有了开源以后,第三方公司会拿开源模型赋能行业,我们作为大公司和商业深度结合,甚至对原型模型进行修改,使用的原始数据不是原本数据,这时候我们就可以发挥更大的作用,我们在商业深度共创方面作出更多的贡献。这里面蕴含着巨大的商业价值。我们公司非常倡导开源,也希望站在开源的角度,整个行业发展的前提下,促进公司本身商业发展,健康发展。
徐葳:感谢刘总,做行业基础设施促进行业的发展,是非常值得尊重的一条路。
陈老师,范式应该是所做AI公司的前辈公司了,它是典型从AI原生企业能够实现商业成功的代表。您从最开始做了一个非常高冷、高科技的机器学习平台,到今天能够在金融、制造、能源等场景规模化落地、上市,您这么重投入,这么技术含量爆表的公司当年怎么熬过来了,发展这些年过程中,哪些关键的事儿真正影响到让高科技走到高价值的商业逻辑?
陈雨强:我们当时创业的时候是看到了AI改变行业的能力,之前我们在互联网公司,发现产生了很多的价值,包括对用户和商业品牌价值,所以促使我们创业。创业以后,我们发现这个事情没有想象那么简单。后来我们想明白一个道理,首先它的空间非常大,以GPT来说,今天AI改变GPT空间没有那么高,我们是成百上千倍的空间。
如果以GPT为标准,我们企业做的事情跟过去几百年技术改变社会的事情没有特别大的区别。那些事情可能不会改变,在一千年前我们有钱庄、金融、借贷,现在也有。经过历代技术的变革,从区域变成全国,从信息化到实时、个人。我们想明白人工智能对冲商业化关键是帮助企业改变北极星,让企业经营获得提升,这个可以有持续长期的获利可能。
从商业模式来讲,在国内我们也发现除了提供一些基础能力,有政府平台的基础能力,我们发现人工智能软硬结合一体机也是一个相对好的商业模式,这也对我们商业化有非常重要的贡献。
徐葳:从价值发现出发,从真正能够应用场景出发开发技术,而且还有一个非常好的架构。感谢陈老师。
姜老师,阶跃星辰这几年尤其是Agent技术和大模型终端部署方面做了很多的探索,大家对于Agent又期待,又怀疑,我们每个人都希望Agent能够成为未来的操作系统,未来能干很多事情,又担心现在又变成RPA自动化脚本+大模型,最后用途非常有限。希望您能够谈谈,您觉得Agent技术在这几年真正质变的地方在哪儿,和对话机器人、RPA最大的差别是什么,大模型上终端有哪些值得讨论的事情?
姜大昕:大家都有一个感受,Agent非常火,大家说今年是Agent的元年,围绕Agent的概念有很多的问题。Agent究竟是什么?如果把Agent和大模型相比,它的应用从聊天逐渐走向做事儿。什么叫聊天,你想做一个旅行的计划,以前跟大模型说话,会给你一个旅行的攻略,如何订机票、每天做什么,这是停留在纸面上,并没有物理帮你订酒店、门票,Agent技术还是得益于大模型技术的发展,一是推理能力逐步增强,去年OpenAI的O1技术使得大模型长思维链的能力,执行多步规划的能力,执行多项任务的能力有了明显的提高。
这是一个前提。二是多模态技术不断进步,使得模型能够感知世界,并且理解用户的环境,可以一起完成很多的任务。今年Agent之所以很火是有这两个技术前提引爆的。
Agent也有不同的种类,有的叫作基础Agent,有的开发者用过绝对编程coding,有的做文案工作的用过DeepReads,这是基础的Agent。还有通用Agent,它可以操作你的电脑、手机,帮你完成一些日常的任务。
阶跃星辰比较着重的一点叫智能终端Agent。我们觉得智力技能终端将来有可能成为AI的入口,以自然语言的方式和人类进行交互。展开讲讲智能终端分为三类,分别是人、车、家。人就是以手机为核心的可穿戴设备的扩展,包括大家使用的耳机、手环,甚至可以帮助你监测健康的情况。车就是智能驾驶、智能座舱,随着智能驾驶技术发展,人会解放双手,车是未来第三空间,车里面通过Agent的交互可以进行娱乐,甚至工作。家就是AIOT智能设备,包括具身智能。阶跃星辰看好的方向就是以大模型作为智能终端的大脑,让它和每个人用最自然的方式交互,帮助人类完成各种各样的任务。
徐葳:让Agent走到真正的终端上去,这是大模型的能力,这是非常有前景的事情。
许华哲老师,您在学校做研究,参与创业,参与各种新型研发结构,站在三栖位置,对于具身智能的研究方向上,大学、公司、新型研发机构各自承担什么样的角色,如何配合起来构建生态?
许华哲:具身智能和现在整体AI有一点小小不同,因为它更早期的阶段,具身智能里面探索ScalingLaw,找到正确的路还是主要的话题,也有各种各样落地的尝试。在各个行业里面,大学是人才密集度最高的时候,清华也是创新高地,很多时候最好的想法都来自学校。学校也有自己的问题,比如说我自己,资源量肯定和公司没有办法比,所以有时候需要大规模的训练,大家谈ScalingLaw的时候需要很多卡,公司投入获得很多的数据,比如说硅谷有公司说有27万小时的数据,我们没有获得这样的数据体量,公司大概看清了一条路,投入大量的资源。
新型研发机构是另外一种感觉,足够灵活,可以下决心做一件事,但是不一定追求ROI,一定把收入打过来,可以做重要的事情,也许短期看起来不是最高收益的事儿,但是长期来看对机构,甚至对国家都有非常重大的意义。这三者在一起,才能构建这样一个良好的生态。
徐葳:生态也很重要,这是中国能够成功的一个原因,就是我们能够把这些生态非常好地配合起来。
关于场景落地的问题,如果只能选一个最看好的AI大型场景落地,会选哪些,针对这个场景,希望大家能用两到三分钟说一下自己最熟悉的场景,希望在座的能够讨论一些,这里面有什么希望,为什么它能跑得起来,眼前最大的坑是什么呢?相信在座的观众都希望大家真诚地建议,能够通过大家的分享,让大家少踩坑,少交学费。
刘德兵:现在AI在各个行业应用都非常好,如果只能选一个场景,公司各个行业都在做,如果只能选一个,我会选择教育。因为我觉得在AI教育方面,首先确实已经落地了,有很多事儿可以做,AI办学,帮助学生解决问题,包括帮助学生解决心理问题,各种行业都可以。AI是长期的事儿,不是说现在快成了,跑到AGI就结束了,这是未来一百年的事儿,我们要培养新型人才,会用AI、研究AI的人才,小时候培养起,然后职教、大学,有更多的AI人才,AI发展、AI科技竞争才能走在前面。现在我们跟上了,跑得不错,后边我们要超越,教育必不可少,而且可能有很大改变的方向。我们公司很愿意在里面投入,这不是一家就能做成的事儿,需要很多合作伙伴一起做,全行业的人,教育从业者、第三方公司一起来做,教育特别值得投入。
陈雨强:刚才说选一个行业,我想了一下,可能主要分享一下我们的经验,很多经验非常好地落地,我们也做了很多行业,我觉得发展比较好。我们做得最近比较有意思的一个行业,或者我们尝试新的一些方向,它不是语言大模型,是做设计的。现在做设计大模型的比较多,最近进展比较多,做一些3D物理模型,我们做物理仿真的模型,我们在一些关键领域,比如说飞机制造,以及比较高端的民用领域,比如说汽车制造,都需要做非常多的设计和设计模拟,比如说峰谷、风压、外形,汽车更多的是内部空间和外部性能权衡,安全、重量方面都要权衡。
过去这里面会有一些困难,过去模拟还是基于有限元等软件,如果做得足够机械,有限元非常多,模拟非常慢,即使有AI的加持,如果做得精细,跑数月都是有的。我们尝试使用大模型的方式,这个架构和语言模型不太一样,用这样的方式加速或者模拟一些结果。我们模拟的时候会发现Foundationmodel还是很重要的。过去主要是解决单独车或者飞机,某些流体的模拟,可能在更广泛的场景下存在这样一些基础模型。这样的模型不缺,数据上也是很难的问题。技术层面上也需要更多的模型或者架构创新。真的有一天我们会发现,这些技术确实可以应用到合作的一些非常重要的场景里面去,这些场景可能会成为制造领域里面比较有突破性的关键技术。这是我们小小的分享。
徐葳:AIForScience领域一定对很多行业会带来很大的变化。
姜大昕:回答徐老师第一个问题,我们选择了智能终端作为聚焦的行业,我补充聊聊我们为什么选择智能终端,我们对智能终端的期待是什么。为什么选择智能终端,因为我们认为智能终端会成为下一个人机交互的接口。计算机发展的历史上,每次人机交互的改变都会带来深刻的变革。最早计算机通过命令行的方式交互,然后是GUI触摸屏的方式。大模型的出现,机器会通过自然的方式与人类交互,包括自然语言,这会带来非常大的变革。
从入口角度来讲,大家会认为AI很遥远,AI在哪里,如何使用AI,如果AI就在你的身边,就在你的智能终端里面,在手机里,AI是不是变得随时可以触达,随时可以帮助你。
我们对未来智能终端有什么期待?它会做事,总在场,有记忆,能进化。智能终端应该是Agent,Agent最大的特点就是能够帮助人类完成一些复杂的任务,第一个特点是它要能够做事。第二个特点就总在场,智能终端可以陪伴你,能够判断周围的环境,听到用户的声音,随时感知用户身体的情况。所有智能终端无时无刻不在收集用户周围的情况,用户下达的任务的时候不用解释发生了什么,大模型的痛点就是编很长的串,给它解释为什么这样做,如果总在场,你就可以直接下达任务,根据你周边的环境替代你完成某些任务。第三个特点是有记忆,现在大模型的缺陷就是没有记忆,今天说的事情,它明天就忘记了,我们如何为智能终端增加一个长期的记忆,让它能够记住你的偏好、喜好,过去发生什么事情。第四个特点就是在记忆基础上不断进化,智能体不断学习新的技能,在用户交互当中提炼反馈,通过这个反馈指导自己不断地进化,让用户觉得智能体越来越聪明,越来越懂你,这是我们对未来的期待。
徐葳:姜老师,智能终端不是场景,智能终端是干什么用的?场景有什么用?
姜大昕:我先说一个科幻电影里的场景,大家看到科幻电影《HE》里面萨曼莎,或者《钢铁侠》里面的贾维斯,每个人心中都有一个贾维斯,或者小朋友看过的一个机器猫,就是你身边陪伴你的搭子,各种场景下帮你完成任务。我想到的一些场景是什么样呢?比如说工作的时候,突然老板让你去开会,原先订的主题,你做了精心的准备,会议开了一半,突然换了一个话题,你是不是希望有一个助手把电脑里面相关的资料准备好,回答老板突如其来的问题,这是工作中的场景。
还有一个场景,每个人都是第一次做父母,教育孩子的时候,碰到很多手足无措的情况。孩子哭了,不知道安慰,还是鼓励,不可能这个事情发生完了以后,到夜深人静的场合把白天的事情回忆起来,问大模型怎么办。你非常希望有一个终端的设备,包括眼镜和耳机,可以看到周围的环境,孩子的表情,悄悄告诉你怎么处理,我们智能终端想象的都是学习和工作中的场景,让它真正成为用户的好伙伴。
许华哲:我有一个不太一样的思路,具身智能最难的事儿才是正确的场景,而不是现在就能做的事情。我们前一阵子跑了20多个场景,包括车场发动机制造,物流里面流水线分拣,还有蛋糕厂,具身智能能不能解决这些场景呢?一定程度随着智能发展可以解决。反过来这些场景能不能帮助我们达到AGI那一步呢?很难,我们应该直接挑战2C场景,进到家里,某种程度是一个智能终端,只不过是一个机器人智能终端。在家里和机器人对话,配置相应的能力定义好产品,比如说把衣服叠了,桌子清理了,可能没有办法帮我们做红烧肉,但是我们现有的能力进去,才有可能达到我们追求的AGI。另外一个角度,我用大模型的时候,它只是给我们提效,让原来的事情两小时变成一小时,现在一小时可以干两件事儿,机器人进家干的都是我不想干的,帮我省了一小时,这也是特别有意义。
徐葳:感谢几位,刚才的场景落地,现在几位高科技公司的AI都有比较大的引领,是教育场景,改善工程设计,原来计算机科学一百年没解决的问题,现在希望解决它,包括跟人的互动是最复杂的场景,以这种巨复杂的场景来牵引,因为一个简单的场景带不起最先进的技术,用最复杂的场景降维打击。
感谢四位嘉宾非常坦诚、接地气的分享,刚才看到一个清晰的脉络,人工智能目前是一个典型的顶天和立地的结合,场景非常接地气,但是场景带来的需求和技术的挑战需要非常大的技术变革。当然这里面生态的协同,包括科技企业,包括高校,包括政府的支持,在新型研发机构的支持下,这样才有可能做出来,因为它毕竟是一个顶天和立地的结合。无论是算法,还是开发机器人,还是Agent,还是什么,最终还是需要人才,人才是人工智能未来的希望。
今天的圆桌就到这里,我们希望今天大家带走的不光是台上几位嘉宾说的金句,而是我们有一个共识,人工智能未来的发展是一个生态,谁能找到真正有价值的场景,谁能培养这样的人才,才能够形成我国人工智能的成功。
最后再次感谢四位嘉宾,感谢每一位在座的观众,谢谢大家。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.