![]()
雷递网 雷建平 1月29日
过去的一年,是国产GPU爆发的一年,摩尔线程、沐曦、壁仞科技、天数智芯纷纷上市,昆仑芯、阿里平头哥也纷纷酝酿IPO,一家名为曦望(Sunrise)的国产GPU公司也浮出水面,并在一年时间融资近30亿元。
当然,曦望并不是凭空冒出来的新手,曦望的前身是商汤科技的大芯片部门。
当下,曦望搭建了一个豪华团队,其中,曦望Sunrise董事长为前商汤执行董事徐冰,两位联席CEO分别为前AMD、昆仑芯架构师王勇、百度“凤巢之父”王湛。王湛日前接受雷递网创始人雷建平的专访,讲述了为何加入曦望团队,投身国产GPU浪潮,以及曦望为何能一年融资30亿的幕后故事。
参加到芯片自主建设会让自己感到有荣誉感
![]()
资料显示,王湛是百度创始元老、前资深副总裁,王湛1999年毕业于北京大学物理系,2000年加入百度,是百度创始团队成员,首位产品经理。王湛建立了百度产品管理体系以及商业产品部,是百度搜索“凤巢”系统的总设计师。2011到2013年管理百度整体销售体系,包括直销分公司,渠道部、 大客户销售等工作。2013到2015年负责用户消费业务群组,包括数字娱乐、数字内容及互联网证券等业务。
王湛此后出任百度集团战略协同和执行总负责人,负责跨体系业务协同工作的推进、战略执行的监督与管理、及公司跨体系对外战略合作的推动。王湛亲手打造了百度的核心产品和商业体系,在曦望,他将以“商业领袖+生态构建者”的角色,统领公司商业化产品的发展、客户拓展,以及生态体系的搭建。
在出任曦望联席CEO之前,王湛处于半退休状态,此番也算是重新出山。王湛日前接受雷递网创始人雷建平专访时表示,之所以投身国产GPU浪潮,就几个原因:
首先是机遇。王湛一直非常关注中国的科技和AI发展,离开百度后,王湛做投资很多年,做投资人的时候,王湛看到了AI浪潮代表了未来最大的一个机遇,而在中国的AI发展里,AI有三个要素——芯片、数据和算法。
王湛认为,在数据和算法方面,中国绝对没有问题,是领先世界的,但芯片这件事情处于卡脖子的状态。所以如果有幸能参与到中国芯片的自主建设,让中国在这方面取得重大突破,会让自己非常有荣誉感,这是促使王湛重新回到一线,在曦望担任联席CEO的主要原因。
此外,做芯片这件事情,不仅仅有荣誉,还有巨大的商业价值。王湛在曦望负责整个公司的运营管理和商业化,这些事情与王湛在百度过去多年积累的经验、人脉和资源高度契合,可以把王湛的能力和过去的积累充分发挥出来。所以,当徐冰和王勇找到王湛的时候,大家一拍即合,王湛也义无反顾的投身到曦望来做国产GPU。
投资人投曦望是深思熟虑的决定
近期,曦望宣布一年内完成近30亿元战略融资,投资方包括三一集团旗下华胥基金、范式智能、杭州数据集团、正大机器人、协鑫科技、游族网络、北京利尔等产业投资方,以及无极资本、IDG资本、心资本、高榕创投、中金资本、普华资本、松禾资本、易方达资本、工银投资、海通开元、越秀产业基金、银泰投资、国元基金、粤民投、华民投等国内知名 VC/PE 机构,还有诚通混改基金、杭州金投、杭州高新金投等国资背景资本。
在多个国产GPU纷纷上市之际,有人认为国产GPU赛道已经没有新的机会之际,为何曦望能一下子拿到这么多融资?
王湛对雷递网表示,投资人投资曦望是经过深思熟虑的。曦望的投资方中有大量的产业方股东,产业方股东意味着第一他们都是上下游的产业,自身做业务,会特别关注这个公司的业务是不是真正立得住,是不是真正可能跑出来。
“曦望不是一家新公司,我们2020年就已经成立,我们过去是在商汤内部,做了两款的量产的芯片,技术实力还是非常强的。2025年我们独立化运作以后,我们有好的产品,我来了以后很快建立了商业化体系,商业化上也取得突破。”王湛说,投资人是充分看到了曦望的实力和潜力,愿意来对曦望进行投资。
曦望Sunrise董事长徐冰补充说, 大模型行业过去一年也发生了很大变化,预训练有所收敛,并没有出现百模大战,近期,英伟达也花200亿美元“收购”Groq这样一家极致推理芯片的公司,Groq确实也能解决训推一体GPU产品端存在的一些问题。
资本不会只投曦望一家极致推理的公司,也会大面积寻找还有没有其他技术路径的推理芯片公司。徐冰认为,推理在未来会是一个万亿级的赛道,会有很多新的优秀芯片公司出现。
要重写中国AI产业损益表
![]()
对算力厂商、AI原生应用开发者而言,推理能效、SLA 稳定性与Token成本,才是决定业务毛利率与用户体验的核心指标。因此,曦望选择不与训推一体GPU拼参数,而是聚焦真实场景的单位经济性,成为现有算力系统的 “推理分流与成本优化层”—— 与本土芯片厂商合作为客户构建推理加速专区,形成独特的合作生态。
王湛说,“如果能让推理成本下降 90%,并提供更稳定的服务,我们的竞争就不是‘又一个芯片’,而是‘重写中国 AI 产业的损益表’。曦望的目标是极致降低大模型推理成本与门槛,让算力变得普惠且可广泛获取,从而释放AGI的全部潜力。”
在演讲中,王湛指出,大家每天使用的AI服务,可以把它分成三层,最上面的一层是AI应用层,大家现在用AI来做智能办公,来做内容创作。随着AI应用的发展,在千行百业里出现各种各样的AI应用,来帮助各行各业降本增效。正是因为这些AI应用的发展,它使得现在AI使用的渗透率越来越高,也使得AI的推理算力需求越来越大。
在这个AI应用层的下面——大模型驱动层。曦望适配了很多的大模型。这里面既有大语言模型,也有多模态模型,其实也有视觉模型。这些大模型,他们被训练出来以后,就是靠不断地去推理完成各种各样的任务。
GPU的算力要通过软件栈与调度系统的紧密协同,才能够转化为实际的应用价值。所以,算力底座要做好,它不仅是GPU要做好,而且它要有非常适配的软件栈,整个是一个系统工程。在一个算力服务的过程中会出现很多的问题,硬件的问题大概占40%,软件的问题有45%,还有15%是存储系统会出现的问题。
在硬件问题中,GPU的相关问题占大头(75%),而在软件问题中的配置错误是一个突出的原因。平时一个推理集群,少则几百台机器,多则成千上万台。这么大的一个机群,要想把它运维服务好,不仅要通过经验,通过人,还要通过有非常先进跟复杂的系统。所以说,打造一个好的算力底座有很多的困难跟挑战。
王湛指出,曦望基于自研的GPU和全栈优化,跟合作伙伴共同推出了推理系统级解决方案,软硬件深度协同,首先可以实现从底层芯片到上层平台的全栈优化,将芯片的算力在模型推理场景中充分发挥出来。第二是把复杂的底层工程,封装成对用户友好的服务,实现了算力资源的弹性、按需供给;第三点,这个算力平台具有开箱即用的特点,曦望提供集成的模型市场和应用开发工具,能大幅度降低技术的门槛。
综上,曦望现在的商业模式是芯片硬实力,加上软硬一体的软实力,形成一句话,叫token as a service,曦望会把这个token的服务与合作伙伴一起共建,把它做好。从而跟合作伙伴一起来建立实现百万token一分钱。
以下是专访王湛部分内容:
![]()
雷建平:目前曦望和商汤是什么关系?
王湛:商汤现在还是我们单一的第一大股东,商汤的董事长兼CEO徐立也会来到发布会到场,跟我们共同开启百万token的合作。
雷建平:曦望的管理层很多都出自百度,百度给AI行业真是贡献了不少人才。
王湛:我觉得百度是在中国AI领域做的很早,而且人才济济的公司,曦望的合作伙伴第四范式,董事长CEO戴文渊这次也来到活动现场,戴文渊也是以前我在百度的老同事。你可以这么看,就是今天在中国AI界,不管是做大模型也好,还是包括做芯片也好,都有大量的创始人是有百度背景的。所以说有百度背景,在中国的AI领域是一个很常见的一个事情。
雷建平:网上有一种观点认为,人工智能领域存在较大的泡沫,也有观点认为,Token消耗量非常大,即使存在泡沫,其规模也可能不会很小。对此,您怎么看?
王湛:我觉得肯定不是很大的泡沫,我经历了互联网泡沫破灭阶段,互联网泡沫那个时候是90年代末,那个时候全球互联网人群很少,所以那个时候真的是一个泡沫,什么意思?就是一个概念,大家都觉得这个概念很好,但真正的使用人数很少,大量的人完全都没有用,这真是炒出来的。
AI可不是,AI产品出来以后,一旦突破就是上亿用户,比所有的互联网产品都快得多,而且这几年没有下降这个趋势。
你看今年春节最热的是什么?最热的是这两天已经新闻出来了,各家大厂发红包让大家来用AI。还有很多机器人公司想上春晚,为什么大家都要上?就是因为已经到了爆发点了,人群用的已经很多很多了,但大家希望通过春节加它的口碑加速,再进一步的发展。
所以我们可以想象到今年春节过完,中国的AI的渗透率、使用率会进一步有巨大的提升,这种渗透率、使用率的巨大提升代表了什么?代表的就是整个AI产业的价值巨大提升。
所以AI跟过去的概念就不一样,大家不要觉得说它涨得特别快,特别热度很高,一些公司起得很猛,好像就是泡沫,不是的,是因为用户量的巨大增长,对行业的渗透度在迅速的增长,这个比起当年的互联网快得多。
雷递由媒体人雷建平创办,若转载请写明来源。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.