网易首页 > 网易号 > 正文 申请入驻

【睿见】胡延平:AI大模型商业化处于第一步起步、第二步预热的初始阶段

0
分享至



让大模型从能用(问答与生成质量堪用),走向易用(功能与部署方便好用),再走向真正可用(低成本高效率与用户场景融合),这是AI大模型商业化要走的三步路。目前它处于第一步起步、第二步预热的初始阶段。未来还有较长的路要走。

本文系盘古智库学术委员、DCCI-未来智库与FutureLabs-未来实验室首席专家,信息社会50人论坛成员胡延平接受采访内容。文章来源于《环球时报》2024年3月30日。

本文大约3000字,读完约7分钟。


揭秘长文本能力背后

“文件,拖进来;网址,发出来”——Kimi大模型的首页上写着这样一段话,似乎在告诉用户,它的主营业务是分析长文本。《环球时报》记者按照提示,将一篇包含图片、数据表格和公式的英文论文发给Kimi,它很快就向记者总结了这篇论文在研究什么以及有哪些创新观点。根据Kimi的说法,它最擅长为科研人员、大学生和律师等梳理资料并给出分析。“Kimi的特别之处在于它非常善于理解人们所说的话,并能以合理的方式做出回应。”科技新闻网站Dataconomy如此评价道。

Kimi究竟是如何做到这些的?大模型的底层逻辑是:预测下一个“token”(可以简单理解为“字”或“词”)。按此逻辑,大模型在预测时,考虑的前文(上下文窗口)范围越长,就越可能得到更准的结果。例如,如果前文只有一个“时”字,那就有“时间”“时空”等很多答案,但如果前文是“1993年1月在北京创办的环球时”,那模型预测出下一个字是“报”的概率就高了很多倍。

“月之暗面”公司的工作人员在接受《环球时报》记者采访时表示,上下文窗口的长度很容易“虚构”,而“我们与众不同的地方在于,我们走真实的‘长上下文窗口’路线,确保模型可以对整个上下文窗口内的信息做无损压缩,不丢失细节。”这意味着大模型可以获得3项能力:一是记住之前和用户聊过什么,可以在多轮对话中保持更长时间的连贯性;二是对长篇内容的理解会更到位;三是用户可以对模型提出个性化要求,如让模型按照某种风格翻译内容。

该公司工作人员告诉记者,Kimi的优势“是在20万字的上下文上,做到长度、无损压缩水平(质量)和推理成本这三者的平衡”,但随着200万字无损上下文内测的展开,也面临一定挑战。分析机构申万宏源的报告显示,他们认为Kimi的优势在于“在长文本单点能力上实现了突破,精准定位办公人群”。

《环球时报》记者还关注到,当前国内大模型支持的上下文长度普遍要优于海外的顶尖大模型。例如,GPT-4 Turbo的能力约为10万汉字,Claude 3约为16万汉字。“在文本长度方面,Kimi等中国企业目前显著领先于国外企业,这一点非常有助于形成特色优势。”盘古智库学术委员、DCCI-未来智库与FutureLabs-未来实验室首席专家胡延平28日接受《环球时报》记者采访时表示。

巨头涌入长文本赛道

在Kimi大模型3月18日官宣“200万汉字”这一参数后,国内多家人工智能巨头也纷纷秀起了“肌肉”,有媒体直言,“Kimi掀起了大模型长文本竞赛”。22日,阿里云旗下的通义千问向所有人免费开放1000万字的长文档处理功能;23日,360智脑宣布正式内测500万字长文本处理功能,且该功能即将入驻360AI浏览器;还有消息称,百度文心一言或在下月将长文本输入能力升级为200万—500万字。

那么,为何这么多大模型企业都瞄准了长文本这一赛道?

“长文本顺应了人工智能的发展趋势之一。”胡延平告诉《环球时报》记者,人工智能大模型有3个主要的发展趋势,即广度方面走向基于长文本、长记忆、多传感的“系统认知”,深度方面走向“多重思考、复杂判断、创新生成”,维度方面走向“多模态”交互,而长文本正是顺应了第一个发展趋势,同时长文本也是现实需求的重要体现。“月之暗面”创始人杨植麟也曾表示,通往通用人工智能(AGI),无损的长上下文将会是一个很关键的基础技术。“历史上所有的模型架构演进,本质上都是在提升有效的、无损的上下文长度。”杨植麟曾把发展人工智能比作“登月”,而长文本就是“登月”的第一步。

胡延平介绍说,长文本在原理上如同大模型的参数量,都是越高越好,这能够让大模型注意到、知道更多用户希望其知道的信息,由此为用户生成能够对应到特定领域的高质量的、更系统的内容。“特别适合企业、科研学术、创作型用户,以及要求知识库、知识管理等对应到自身场景情境需求的用户。”

聚焦中国创新的英文科技媒体Pandaily援引一位分析师的话称,由于Kimi的技术门槛不是很高,所以未来必将面临激烈竞争。据了解,大模型的应用效果不仅取决于“计算”能力,还取决于“内存”能力,前者关乎技术硬件问题,后者则由长文本能力来决定。相比之下,发展长文本不仅投入少,且更贴合于产业应用。或许正是这些可预见的商业落地前景,才让诸多人工智能企业都押注长文本。天风证券研究所计算机首席分析师缪欣君告诉《环球时报》记者,中长期来看,大模型的竞争格局很有可能是几家头部厂商占据主导地位。

然而,也有业内人士指出,“卷”上下文长度并不是一笔划算的买卖。扩充上下文长度不仅会降低大模型回答问题的速度,还会增加算力成本。此外,研究表明,上下文长度在扩充到一定限度后,其对模型整体能力的提升也是有限的。这也是海外大模型停止长文本之战的原因之一。有评论称,“盲目烧钱一哄而上,不可取。”

AI应用落地三步走

由于使用效果较好,Kimi大模型受到二级市场投资者的关注,近期多个概念股涨停。此外,用户激增一度让Kimi的服务器“崩溃”。上月,“月之暗面”完成10亿美元的新一轮融资。《南华早报》称,该公司创下了自2022年11月ChatGPT发布以来,中国人工智能初创企业最大单笔融资纪录。

分析人士认为,商业可落地性是Kimi被看好的重要原因。实际上,“月之暗面”此前已经表示今年将制定初步的商业化方案。

该公司向《环球时报》记者回应称,“我们看到用户诉求逐渐变得强烈,包括在高峰时期用户会询问我们能不能付费解决排队等待的问题,所以这一块今年会有初步的方案出来,目前还在筹备中,后续有消息会及时跟大家通报。”

“长文本是AI应用落地的重要标志。”胡延平告诉《环球时报》记者,长文本能大幅提高大模型问答、内容生成的个性化程度和准确率。相当于既能帮用户解决问题,也能帮AI企业解决大模型本身的一些问题。在科研、学习、创作、娱乐、服务等领域,将得到广泛应用。不过,他也表示,长文本更吃算力,单次问答的推理成本显著高于短问答,“一旦用户规模增加,企业算力基础设施成本激增,所以从商业角度是否可持续还有待观察。”胡延平进一步分析说,未来长文本必然是大模型的基础能力,在不同收费标准前提下,为用户提供不同长度文本输入和输出服务,包括相应的上下文和记忆,会成为普遍现实。

那么,大模型在商业落地时要注意哪些问题?胡延平认为,一方面要在前述“广度-深度-维度”3个方面着力,另一方面需要从个性化、场景化、系统化角度深度切入,为每一个企业、个人用户提供“长专精小快灵”的管家式服务。长即长期长度,专即专业专门,精即精细精准,小即小投入低成本高效率,快即快速响应实时能力,灵即灵动部署随需应变的云与端模块化流变能力。

盈利和成本也是长文本大模型走向落地必须解决的问题。有科技分析师表示,如果大家都宣布免费开放,那么企业的盈利问题将日益严峻。还有报道指出,目前Kimi每天投放广告获客就要“烧掉至少20万元”。缪欣君也表示,制约国内AI应用发展的关键之一是成本。

“让大模型从能用(问答与生成质量堪用),走向易用(功能与部署方便好用),再走向真正可用(低成本高效率与用户场景融合),这是AI大模型商业化要走的三步路。目前它处于第一步起步、第二步预热的初始阶段。未来还有较长的路要走。”胡延平说。

中国科学院自动化研究所研究员、联合国人工智能高层顾问机构专家曾毅在接受《环球时报》记者采访时表示,长文本处理信息的能力扩展到现在水平,无疑是一个重要进展。但他不认为长文本在未来是一个单独发展的赛道。“它会是一个基础性的变革,但真正要解决的问题还是产生多模态的理解能力,从看似智能的信息处理能力转变为真正具有理解能力的人工智能,这可能才是整个社会所需要的。” ■


文章来源:《环球时报》

责任编辑:王毅博

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
国内油价调整消息:新一轮油价大幅下调时间定了!5月7日今日油价

国内油价调整消息:新一轮油价大幅下调时间定了!5月7日今日油价

有料财经
2024-05-07 00:05:24
她白天做戴笠秘书,晚上做秘密夫人,出国一年,戴笠才知自己被骗

她白天做戴笠秘书,晚上做秘密夫人,出国一年,戴笠才知自己被骗

胥言
2024-05-06 18:17:30
1955年,干部子弟比父母官大小,皮定均儿子:我就说你是个和尚

1955年,干部子弟比父母官大小,皮定均儿子:我就说你是个和尚

历史伟人录
2024-05-06 10:04:36
湖南省交通厅回应“安慈高速开通2年半就出现裂缝”:情况属实,正在处置

湖南省交通厅回应“安慈高速开通2年半就出现裂缝”:情况属实,正在处置

极目新闻
2024-05-06 16:23:35
没人觉得她很可怕吗...突然就理解郑凯了。

没人觉得她很可怕吗...突然就理解郑凯了。

娱乐圈酸柠檬
2024-05-07 00:59:47
医药巨头在法庭上承认:新冠疫苗有致命副作用!

医药巨头在法庭上承认:新冠疫苗有致命副作用!

景来律师
2024-05-06 00:05:37
日媒记者:看到“爆买”的中国游客,感慨时代变迁

日媒记者:看到“爆买”的中国游客,感慨时代变迁

环球网资讯
2024-05-07 07:05:29
官宣,倒计时!皇马“强硬条款”签约姆巴佩!阿天才中场主动来投

官宣,倒计时!皇马“强硬条款”签约姆巴佩!阿天才中场主动来投

头狼追球
2024-05-07 10:58:20
临近就职,萧美琴再向大陆喊话,不到24小时,民进党遭到暴击?

临近就职,萧美琴再向大陆喊话,不到24小时,民进党遭到暴击?

DS北风
2024-05-06 18:32:18
173腿长107,一周硬控5000万人,她转进你的心了!

173腿长107,一周硬控5000万人,她转进你的心了!

生如稗草
2024-04-03 11:19:22
辽篮惨败广东,赵继伟赛后霸气回应,他无比怀念的人回来了

辽篮惨败广东,赵继伟赛后霸气回应,他无比怀念的人回来了

室内设计师阿喇
2024-05-07 03:53:54
又要谈崩了

又要谈崩了

牛弹琴
2024-05-06 07:41:37
辽粤G3!广东半场领先辽篮3分,赵继伟低迷,郑智刘诗雯观战

辽粤G3!广东半场领先辽篮3分,赵继伟低迷,郑智刘诗雯观战

天涯沦落人
2024-05-06 20:40:38
困难重重!朱立伦党主席成空壳,没人马没资源空有乌纱帽

困难重重!朱立伦党主席成空壳,没人马没资源空有乌纱帽

张友骅
2024-05-07 10:18:52
留意!双脚出现5个表现,多半是血糖超标了!

留意!双脚出现5个表现,多半是血糖超标了!

人民日报健康客户端
2024-05-05 17:42:04
女子称住山西襄汾一如家酒店裸睡被人强行刷开房门,酒店回应

女子称住山西襄汾一如家酒店裸睡被人强行刷开房门,酒店回应

潇湘晨报
2024-05-05 20:59:10
离大谱!暴雪确认艾泽拉斯背面大陆剧情,魔兽世界还能再战20年!

离大谱!暴雪确认艾泽拉斯背面大陆剧情,魔兽世界还能再战20年!

魔兽世界情报局
2024-05-07 00:07:13
滕哈赫:今年我们输了4场这不是很多 我为失利负责,会继续战斗

滕哈赫:今年我们输了4场这不是很多 我为失利负责,会继续战斗

直播吧
2024-05-07 06:18:10
上海惊现“付费马桶圈”!九毛一次,会员充1000用13.8万次

上海惊现“付费马桶圈”!九毛一次,会员充1000用13.8万次

嘿哥哥科技
2024-05-07 00:19:20
浙江:女子趁婆婆不在家,将婆婆的菜全倒掉:她才55岁,不算很老

浙江:女子趁婆婆不在家,将婆婆的菜全倒掉:她才55岁,不算很老

心轩专栏
2024-05-07 00:17:01
2024-05-07 11:46:44
盘古智库
盘古智库
盘古智库官方账号
5055文章数 9689关注度
往期回顾 全部

科技要闻

论文一窥苹果AI大计,Siri这回要变厉害了

头条要闻

中国发现全球最大的恐爪龙类足迹 平均长度超过36厘米

头条要闻

中国发现全球最大的恐爪龙类足迹 平均长度超过36厘米

体育要闻

归化奥斯卡,足协有何顾忌?

娱乐要闻

44岁董洁携顶顶拍杂志 与儿子相互依偎

财经要闻

香飘飘接得住泼天富贵吗?

汽车要闻

配国产首颗车规级7nm芯片 吉利银河E5官图发布

态度原创

本地
时尚
数码
公开课
军事航空

本地新闻

食味印象 | 潍坊:碳水脑袋的人间乐园

真正衣品好的女人,一般很少穿一身黑,看这些气质女人就行了

数码要闻

直面烘干痛点,“烘完直接穿”终得以实现!石头H1 Air、石头M1 Pure深度评测

公开课

父亲年龄越大孩子越不聪明?

军事要闻

美国暂停向以色列运送美制弹药

无障碍浏览 进入关怀版