网易首页 > 网易号 > 正文 申请入驻

AICC AI Infra技术创新圆桌 共话大模型时代的掘金利器

0
分享至

北京2023年12月20日/美通社/ -- 2023年大模型智能应用涌现,带来了大模型工程实践的爆发,在大模型进一步落地应用过程中,AI Infra作为连接硬件和上层应用的中间层基础设施,无疑是关键的一环。

近日,AICC 2023人工智能计算大会上,量子位主编方驭洋主持“AI Infra:大模型时代掘金利器”圆桌论坛,与浪潮信息AI应用架构师朱红、潞晨科技副总裁梁爽、始智AI wisemodel创始人兼CEO刘道全、无问芯穹商务副总裁李枫,围绕大模型时代AI Infra概念、行业地位、发展挑战和多元化算力等关键问题展开思想碰撞。

与会嘉宾指出,AI Infra是支撑AI和大模型的底座,大模型训练和推理是复杂的系统工程,需要在硬件、软件以及训练、推理等各个层面和角度深入优化,解决算力成本、训练门槛和多元化算力等挑战,发扬开源思想,推动人工智能快速发展。

以下是圆桌论坛问答实录:

主持人:目前AI Infra的概念并不统一,有人把它定义为AI所需要的全部硬件基础设施,有人强调它是算力层跟应用层之间的软件堆栈,请问各位如何定义AI Infra?在当前整个AI产业当中,扮演着什么样的角色?

朱红:从业界角度来说,大家认为AI Infra是硬件之上的软件层。从浪潮信息的角度来看,应用层之下的硬件、软件都可以纳入AI Infra中,也可以称之为AI中台或者AI平台。

AI Infra在整个AI产业中起着承上启下的作用,因为AI由算力驱动,而算力的发挥取决于AI Infra层。

梁爽:我觉得AI Infra包含硬件、软件。大模型一般需要在成千上万的计算卡上进行分布式训练,用户如果采用原生软硬件方案,在海量参数的情况下可能会出现显存溢出,很难把硬件的利用效率发挥出来。通过数据并行、张量模型并行、流水线并行等方式,AI Infra为客户提供更强的计算能力,能够在大模型训练时高效地把分布式硬件利用起来。同时,训练大模型的成本可能高达上千万,我们的AI Infra目标是把训练成本减少一半、时间减少一半,这也是用户关心的点。

刘道全:AI Infra还有一个更宽泛的范围,除了前面已提到软硬件系统,还包括网络、存储等硬件和软件等。大模型的训练、推理是一个系统工程,需要在计算、网络、存储等各个层面优化,才能更好地把性能和效率发挥出来。

从大模型社区的角度来说,我们现在更多地把模型和数据集汇聚起来,后续还会把应用开发层、模型训练、部署和推理等相关的开源工具软件也汇聚起来,让大家更容易地获取和使用,提升工作效率。

李枫:在我们看来,AI Infra是支撑以大模型为代表的AI技术的底座,包括硬件、软件、工具链和优化方法等,是一个整体解决方案。无问芯穹成立刚刚半年,此前我们公开露面不是很多,业内很多朋友记得我们团队,就是从“M×N”开始的。我们在AI Infra上,着眼于软硬一体的整体解决方案,做从算法到芯片、从芯片集群到模型、再从模型到应用的三阶段“M×N”中间层产品,一方面帮助AI开发者们克服目前多元异构算力初阶软件生态,以及异构算力池的影响,另一方面依托我们行业领先的AI计算优化能力,助力提高算力的供给水平、持续降低计算成本、提高大模型的落地能效。

主持人:随着大模型热潮的到来,大家对于大模型工程实践有了更明确的认知。大模型训练和推理是一件非常复杂的事情,需要很多基础设施作为支撑,也正因为此,AI Infra越来越受到关注,请各位嘉宾谈谈大模型应用面临哪些挑战?

朱红:效率是大模型应用的核心挑战,包括刚才提到延迟、速度等都属于效率范畴。浪潮信息认为效率需要从横向和纵向来看,首先是纵向的效率是AI计算平台的效率如何发挥出来,是大家非常关心的点;第二,横向的效率亦即稳定性,无论是训练还是推理都能够长期运行,这是保障。

浪潮信息的很多工作聚焦在这两个层面,也就是怎么解决纵向和横向的效率问题,然后去推动大模型的落地应用,这是我们服务客户过程中发现的挑战和解决思路。

梁爽:对于客户来说,AI大模型应用的挑战包括推理延迟、推理速度,以及如何减少推理参数,还有一些量化技术。在终端应用场景,比如像“智能座舱”,客户对于硬件的需求更为敏感,现在智能驾驶大多数采用高通芯片,能不能实现大模型推理、推理能不能达到主流加速卡的效果,这对于相关应用来说都是非常重要的。这种终端场景的硬件算力是有限的,又牵扯到模型压缩技术和推理优化,我们也在做推理方面的研发工作。

刘道全:大模型应用最大的问题是应用跟模型的脱节。因为最终到应用层面,需要从业务角度去考虑。现实是应用方面的人员大都不懂模型,而模型方面人员多数也很难体会实际应用场景。大模型厂商都想着怎么把模型的通用能力提升起来,但是对应用的理解和认知其实可能远远不够。无论是ToB应用还是ToC应用,每个环节和流程都有很多的业务知识在里面,怎么把这一部分业务知识跟模型能力结合起来,就需要应用和模型开发人员共同参与进来,可能才能真正的解决问题,做出好的应用。

现阶段始智AI是从社区切入,能够更多地了解行业需求,不管是应用端的需求,还是模型层等的需求,最终是希望打通大模型应用开发的环节,让后续应用开发环节不再需要关心模型怎么调,模型相关事务都可以在平台上基本自动化的完成,做到应用跟模型的分离。这里涉及很多中间环节,我们也可以跟潞晨科技、无问芯穹等中间各方合作,一起把中间的环节串起来,让更多的人更方便地使用大模型。

在这个过程中,开源社区就有重要地位和作用。开源社区是行业信息的汇集地,在从应用到底层的框架到更底层芯片的架构中起到承上启下的作用。大模型和中间工具软件最终还是需要落地应用才能创造价值,整个过得始终离不开社区承上启下的作用。我们未来不会自己去做应用,还是希望在中间联合更多合作伙伴把大模型应用开发的环节打通,最后让应用变得简单,让AI落地也更简单。

李枫:因为大模型落地成本很高,做推理很贵,大部分人接受不了这个价格,我们利用软硬一体化优势,首先把成本降下来,其次软硬一体化能够发挥异构算力潜能,可以把模型开发训练门槛降低,让更多创造者有能力进入这个领域,这是我们的考虑。

另外,大模型如果想真正在行业落地,还需要行业数据。这时候一定需要软硬结合,才能去做行业落地的完整方案,而非仅依靠模型。因为一个模型的落地,不足以实现一个场景。

主持人:看来大模型应用和普及的核心关键是“效率”,各位嘉宾都有着丰富的一线实践经验,请大家分享一下真正降低大模型普及门槛的着力点,技术或者是生态领域都可以谈一谈。

梁爽:开源大模型框架系统是我们推动大模型应用和普及的实际行动,也填补了国内相关技术空白。AI之所以发展的如火如荼,与开源精神和无数开源社区贡献者密不可分。潞晨科技开源大模型框架,也是希望能够把研发成果共享给大家,让AI能够发展的更好,降低AI的门槛,提升生产力。

刘道全:首先,解决刚才提到的应用跟模型脱节的问题,关键是促进应用层和模型层之间的互动交流,这需要让更多应用场景里的人参与到大模型应用的开发中。

第二,数据质量比较好的场景,也是大模型落地更容易的方向,比如银行、金融、电商等领域,还有工业领域已经实现IoT数据采集和自动化的场景等,总体上有了高质量的数据,就有大模型应用落地更好的基础。

第三,目前大模型应用的聚焦点更多的还是AI技术领域,而对于核心场景应用需求的挖掘还不够,未来在应用场景和需求方向上做更多的探索。

主持人:除了开源软件包括框架层面的进展,我们现在面临着一个很大问题,就是算力的紧缺,从软硬件结合角度,有哪些可以努力改进的地方?

朱红:开源确实是促进AI产业发展、推动行业落地的很关键的一步,对于整个产业推动也是很大。浪潮信息目前也在尝试把自身工作以类似的方式推出去,加速大模型的应用和普及,降低行业应用门槛。

李枫:针对算力紧缺的问题,首先要“把能用的算力用得更好”,可以从推理端进行更多量化,通过减少模型的存储空间和计算需求来提高推理效率,使得同样算力可以跑更多的模型。第二,“把以前利用不了的算力用起来”,也就是对于模型训练考虑异构化,通过异构计算平台把更多的算力使用起来。

主持人:当前大模型训练等底层支撑面临算力多元化的挑战,现在从AI Infra层面考虑还是要做更多元化的适配。目前各位是否有相关技术布局?

朱红:多元算力支撑是现在非常热的话题,也是浪潮信息持续关注的方向。我们两年前发布“源1.0”大模型之后,就开始考虑在推理阶段适配更多推理硬件,也落地了一些实际工作,能够把当时百亿规模模型,高效地推理跑起来。现在,“源 2.0”也在做各种硬件适配。

当然,模型训练也是我们重点关注的方向,我们也在与比较有潜力的算力提供方进行更多优化工作,也引入了开源工作。目的是希望无论是商业化软硬件方案,还是硬件+开源软件的方案,我们都能够支持用户又快又好地把训练、推理跑起来。

梁爽:我们已经适配了比较多的硬件。相比国外,国内的多元算力在算子数量、生态系统等方面确实存在差距。这时,就需要多元算力厂商和用户一起去做研发适配,争取能够尽快地赶上。

刘道全:适配工作其实并不是我们自己去做,我们目前和一些多元算力厂商的探索更多是生态层面的合作。社区可以作为一个很好的入口,让大家可以先体验一下多元算力的能力,这也是比较重要,特别是很多偏应用的中小企业,很多可能还没有使用过多元算力。体验之后才能更好地了解相关芯片在推理和训练方面的能力。

李枫:我们的布局核心是“M×N”中间层。其中“M”和“N”都是指多元适配,在硬件侧支持多种芯片,在模型侧支持多种大模型,这一中间层具备大模型推理引擎、训练引擎、异构算力评测等能力,使大模型算法能运行在多种芯片上,并实现最优训练与推理效率,相当于是在大模型和不同芯片之间搭建了桥梁。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
8年深情输给林心如?霍建华一句“太黏人”,道尽陈乔恩的遗憾

8年深情输给林心如?霍建华一句“太黏人”,道尽陈乔恩的遗憾

木子娱你同行
2026-06-09 09:09:36
刚离完婚,妻子就得知初恋破产消息,她老公,离婚登记能撤销吗

刚离完婚,妻子就得知初恋破产消息,她老公,离婚登记能撤销吗

朗威谈星座
2026-06-09 10:29:53
男子伪装成饭店员工,将醉酒女子从丈夫身边带走性侵,获刑三年六个月

男子伪装成饭店员工,将醉酒女子从丈夫身边带走性侵,获刑三年六个月

环球网资讯
2026-06-09 08:02:15
注意了!支付宝地区改到平壤,页面立刻整洁干净,评论区全是实话

注意了!支付宝地区改到平壤,页面立刻整洁干净,评论区全是实话

谭谈社会
2026-06-07 11:46:12
李四川领先6.2%,吴子嘉揭内幕:苏巧慧被自家“猪队友”拖垮

李四川领先6.2%,吴子嘉揭内幕:苏巧慧被自家“猪队友”拖垮

小陆搞笑日常
2026-06-09 12:26:58
现在已经不是房价涨不涨的问题了,而是低价房源一夜间消失了

现在已经不是房价涨不涨的问题了,而是低价房源一夜间消失了

专业聊房君
2026-06-09 08:35:10
美智库:如果日本再不修复对华关系,代价将越来越大!

美智库:如果日本再不修复对华关系,代价将越来越大!

阿龙聊军事
2026-06-09 12:10:02
拉波尔特专访:追忆曼城旧时光,直言欧战“冤案”至今隐隐作痛

拉波尔特专访:追忆曼城旧时光,直言欧战“冤案”至今隐隐作痛

赛场名场面
2026-06-08 12:16:22
6款AI大模型挑战高考数学!一款拿下148分,压轴题成分水岭

6款AI大模型挑战高考数学!一款拿下148分,压轴题成分水岭

新京报
2026-06-08 21:23:19
丑陋1-2!马刺险胜,文班历史第一,布伦森空砍32+5,唐斯没球权

丑陋1-2!马刺险胜,文班历史第一,布伦森空砍32+5,唐斯没球权

老侃侃球
2026-06-09 11:35:37
5岁男孩突然双肺大面积变白,竟与妈妈用的这东西有关!医生紧急提醒:用错了很危险

5岁男孩突然双肺大面积变白,竟与妈妈用的这东西有关!医生紧急提醒:用错了很危险

环球网资讯
2026-06-06 14:09:07
订婚前夜撞破男友出轨,女子光脚雨中狂奔,母亲十米外默默守护

订婚前夜撞破男友出轨,女子光脚雨中狂奔,母亲十米外默默守护

北纬的咖啡豆
2026-06-08 19:47:08
油价或连跌超0.53元/升,6月油价两连跌中,6月18日油价再调整

油价或连跌超0.53元/升,6月油价两连跌中,6月18日油价再调整

油价早知道
2026-06-09 09:24:36
儿媳生下孙子,我给了20万,护士突然拦住我:您儿媳生的是双胞胎

儿媳生下孙子,我给了20万,护士突然拦住我:您儿媳生的是双胞胎

风起见你
2026-06-09 13:20:56
特朗普遭纽约球迷集体狂嘘!詹姆斯曾表态:篮球圈没人在意少他这一个观众

特朗普遭纽约球迷集体狂嘘!詹姆斯曾表态:篮球圈没人在意少他这一个观众

奇思妙想生活家
2026-06-09 11:28:18
地球都是印度的,凭啥给钱?一群印度人在国内吃喝玩乐,事后逃单

地球都是印度的,凭啥给钱?一群印度人在国内吃喝玩乐,事后逃单

小徐讲八卦
2026-06-09 10:10:38
杜聿明俘获7名侦察兵,他决意处决,副参劝阻,事后杜聿明致谢

杜聿明俘获7名侦察兵,他决意处决,副参劝阻,事后杜聿明致谢

唠叨说历史
2026-06-05 15:12:09
终于!宋凯代表足协发声,董路就“擅自带队出国比赛”进行澄清

终于!宋凯代表足协发声,董路就“擅自带队出国比赛”进行澄清

林子说事
2026-06-08 15:22:00
“老人去世,侄子要3万才摔盆!”女儿夺过盆,举动让全场傻眼

“老人去世,侄子要3万才摔盆!”女儿夺过盆,举动让全场傻眼

一丝不苟的法律人
2026-06-09 11:33:50
iOS 27发布!AI不是重点,玻璃效果吸睛,相机界面又改回去了

iOS 27发布!AI不是重点,玻璃效果吸睛,相机界面又改回去了

雷科技
2026-06-09 04:33:12
2026-06-09 13:59:00
美通社PRNewswire incentive-icons
美通社PRNewswire
全球最大的商业新闻通讯社
64729文章数 12318关注度
往期回顾 全部

科技要闻

一文看懂苹果WWDC26:库克告别,Siri重生

头条要闻

赛后对裁判判罚不满 尼克斯主帅:这种尺度会影响胜负

头条要闻

赛后对裁判判罚不满 尼克斯主帅:这种尺度会影响胜负

体育要闻

谁会花400万,去看一场尼克斯的比赛?

娱乐要闻

痞幼生日会曝光!黑天鹅蛋糕价值3万

财经要闻

俞浩深陷争议 百亿追觅谁来托底?

汽车要闻

轴距加长/提供六座布局 奔驰纯电GLC五座鎏金版预售34.9万起

态度原创

健康
时尚
亲子
本地
军事航空

干细胞新规落地,打干细胞更容易还是更难了?

这几年做得最正确的一个决定,分享给你们

亲子要闻

让低龄儿童“有处骑行”是儿童友好必答题

本地新闻

用杨柳青年画的方式,打开天津

军事要闻

美媒:以色列窃听美伊谈判 美称不可接受

无障碍浏览 进入关怀版