网易首页 > 网易号 > 正文 申请入驻

AI内卷长文本,是噱头还是刚需

0
分享至


经济观察报 记者 任晓宁 2024年AI(人工智能)大模型行业的第一场竞争热潮,从长文本开始。

在AI新锐月之暗面公司宣布大模型产品Kimi已经可以支持200万字无损上下文(Long-Context)之后,360、阿里巴巴、百度纷纷跟上。百度文心一言宣布即将免费开放200万—500万长文本能力,阿里通义千问直接上线1000万字长文本,360也官宣内测500万字长文本。

大模型的技术方向有多种,长文本只是其中一种,它是一个相对于短文本而言的概念。此前用户在通义千问、文心一言等语言模型的对话框只能输入几千字,现在能输入几百万字甚至上千万字。

不论长文本竞争得有多激烈,各大模型公司有多么全情投入,一个首先存在的疑问是:为什么是长文本?一位大模型公司人士向经济观察报记者直言,这是最近业内讨论的热点,但长文本是否值得全力投入,目前并没有定论。

长文本热潮,与市场行情有关。推出200万字无损上下文后,Kimi一度爆火,带动华策影视、掌阅科技、中广天择等多个概念股涨停。此前大众鲜有了解的创业公司月之暗面,站在了聚光灯下。“如果你是其他大模型公司的产品经理,你会不会眼红?”担任过经纬创投副总裁的投资人庄明浩说,当下很多公司其实并不知道如何让大模型从技术走向产品,既然Kimi用长文本验证了一条路,并且得到了超出预期的正反馈,其他公司自然也可以效仿。

为什么是长文本

长文本进入大众视野,始于今年3月初,当时月之暗面旗下的Kimi爆火,特色就是长文本。

与市场上其他大模型产品相比,Kimi的区别是,它鼓励用户先发进去一个文档或链接,用户可以根据文档或链接中的内容展开问答。

月之暗面公司相关负责人告诉记者,这是公司成立之初就定下的策略:“既然要做,总要做点不一样的。”月之暗面公司创始人杨植麟在此前的采访中也多次提到,长文本是实现通用人工智能(AGI)的第一步。

月之暗面于去年3月成立,Kimi于去年10月上线,可以上传的文档最多是20万字。3月18日,Kimi宣布已支持200万字上下文输入。对比来看,目前文心一言的文本上限约2.8万字,OpenAI(美国大模型公司)需要付费的GPT-4Turbo(OpenAI最新一代产品),上下文窗口为12.8万tokens(约50万个汉字)。

Kimi鼓励用户上传文档和链接,直观体现长文本能力,让用户有直接感知,进而引发讨论。这些与其他大模型产品不一样的地方,让Kimi迅速出圈。随后其他大模型公司跟进长文本赛道。

在Kimi出圈之前,今年Sora(Ope-nAI旗下文生视频大模型产品)也火爆一时。为什么国内大模型公司没有卷Sora所代表的文生视频,却在3月卷起了长文本?

“因为Sora难啊。”庄明浩说。

一位大模型公司技术人士告诉记者,长文本在技术层面难度并不算高,需要的算力不像预训练那么多,所以很多公司都能负担得起。并且,国外大模型公司已经“卷”过了一轮长文本,长文本的核心技术在开源层面做得比较好,并没有技术封锁。

“如果一个国内的大模型公司做不了长文本,我们可能会认为他们的技术不过硬。”该技术人士说。

既然并无技术难度,为何360、百度、阿里此前并未推出长文本功能,而是在Kimi推出之后突然跟上。对于此现象,记者曾向360和阿里通义千问方面进行了解,但未获得回复。不过,通义千问此前提到,其长文档处理能力,是通义千问模型能力持续提升、模型功能反复打磨的结果。

记者询问了其他几家大模型公司对于长文本功能的上线规划,他们都提到,自己的产品有长文本能力。对于是否会上线上百万长文本的问题,他们没有回答。

谁在用长文本

华东一家电子公司技术负责人最近一直在用AI大模型的长文本功能,每天能用几十次。

去年10月,经同行推荐,上述技术负责人接触到Kimi的长文本功能。在电子行业,经常会有专业性很强,且长达几万字以上的文档需要处理,文档中有复杂的数据格式,阅读费时费力。之前他主要使用ChatGPT帮忙阅读文档,ChatGPT免费版支持的最长文档是4kb(4千字节,约2000个汉字),他不得不把长文档拆分成很多小段,使用感受并不好。国外另一款产品Claude3(美国人工智能初创公司Anthropic的大模型产品)支持几万字长文本,但每天免费次数只有20次。

Kimi支持20万字上下文阅读,目前正在内测200万字的上下文功能。上述技术负责人的感受是,长文本的确很有用。之前做技术研究时,遇到其他领域的问题,他经常需要问公司同事。现在他把公司内部文档扔进对话框,就能立刻得出准确答案。“它能准确、高效地总结出完整的核心思想。”上述技术负责人说,对于电子行业,内容完整很重要,非长文本产品实现不了。

经常使用长文本后,他很感慨,以前还是把AI的能力想小了,“你不能只把AI当做简单的聊天工具,那样就太大材小用了。它真的能在工作、生活中帮到你,能在各行各业中应用。”

通义千问方面称,长文本能力是金融、法律、科研、医疗、教育等领域专业人士的刚需。这些人士可通过通义千问快速读研报、分析财报、读科研论文、研判案情、读医疗报告、解读法律条文、分析考试成绩、总结深度文章。“长文本的价值不容小觑。”AI上市公司创新奇智首席技术官张发恩带领产研团队研发了面向行业的垂类大模型。他最近也在关注大模型长文本技术,并坚信它是一个非常有用的技术。如果要充分挖掘大模型的潜力,用户需输入充足的信息,在这方面,长文本技术的引入显得尤为关键。

他也提到,大模型长文本的技术原理不算复杂,但想做好很难。常见的现象是,用户输入长文本,并针对输入的内容进行了提问,但做得不好的大模型会遗漏关键信息,导致回答质量不高。

真假与争议

多家公司宣布上线长文本后,一些质疑的声音也出现了。质疑者认为后来者上线的并不是真正的长文本技术,而是RAG技术。RAG是一种被称为检索增强生成的技术,这种技术可以从文档中搜索出相关内容,并把这些内容给到大模型做推理。

月之暗面公司相关负责人向记者强调,与其他公司的产品不同,Kimi的长文本是无损压缩技术的长上下文,RAG是有损压缩技术。他举例说,比如读一本100万字的书,Kimi的长文本技术会逐字逐句挨个读,读完100万字再归纳总结做分析。RAG技术可能只读了这本书每一页的第一行,就去归纳总结做分析。在最终呈现的效果上,无损压缩技术输出的内容更真实、全面、有效。

“如果是真正的无损压缩技术,现在应该没有公司愿意给用户免费使用500万字或1000万字的长文本。”上述相关负责人说,1000万字长文本情景下,发布一个简单的对话任务,半天时间才能收到结果,机器推理成本也翻了几十倍。

另一方面,文本长度是不是越长越好,目前也并没有形成共识。“去年大模型公司都在卷参数,从千亿卷到万亿,意义并不大。”庄明浩称,今年大模型开卷的文本长度,可能也没有太大意义,“谁会经常把1000万字的文本喂给大模型?”

上述电子公司技术负责人告诉记者,他不准备使用有1000万字长文本的产品,现在的200万字足够满足工作需求了。

张发恩觉得,长文本可以卷,但卷的视野可以从文本拓展到多模态内容。长文本的真正含义应该是Long-Context-Window(长上下文窗口)。今年2月,在Sora发布的同一天,谷歌发布了最新一代多模态大模型Gemini1.5Pro,它能把一段几分钟长度的图书馆书架的视频放进对话框,并整理视频中出现的所有图书的名字。张发恩认为,这也是Long-Context-Window的能力,值得重视。

他也提醒说,长文本只是大模型的一个技术特色,除了长文本之外,大模型还有高效训练、多模态、模型压缩、安全伦理等多方面的问题需要研究,“今天大家盯着长文本是好事,但也不能忘了其他,做好大模型需要多面开花。”

版权声明:以上内容为《经济观察报》社原创作品,版权归《经济观察报》社所有。未经《经济观察报》社授权,严禁转载或镜像,否则将依法追究相关行为主体的法律责任。版权合作请致电:【010-60910566-1260】。


任晓宁经济观察报记者

TMT新闻部资深记者
关注并报道TMT(科技、传媒、通信)领域重大事件,擅长行业分析、深度报道。
联系邮箱:renxiaoning@eeo.com.cn
微信号:tangtangxiaomo

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
官方通报广州一女子商场跳楼砸中人

官方通报广州一女子商场跳楼砸中人

央广网
2024-04-29 08:40:13
追问山西运城问界M7事故:品牌方责任更大,还是供应商责任更大?

追问山西运城问界M7事故:品牌方责任更大,还是供应商责任更大?

火山诗话
2024-04-28 21:48:00
新冠灭活疫苗之父被抓后,奇怪的事情出现了,网友:后遗症说通了

新冠灭活疫苗之父被抓后,奇怪的事情出现了,网友:后遗症说通了

影孖看世界
2024-04-28 21:03:44
工厂出售!退出中国大陆!

工厂出售!退出中国大陆!

中国半导体论坛
2024-04-28 17:05:47
告别!亚洲第一飞人落幕,苏炳添轰10秒50,名次第5无缘达标奥运

告别!亚洲第一飞人落幕,苏炳添轰10秒50,名次第5无缘达标奥运

林小湜体育频道
2024-04-28 21:06:56
到底是谁丢了底线?多地严查小店卖创可贴,原来我们误会执法者了

到底是谁丢了底线?多地严查小店卖创可贴,原来我们误会执法者了

顾礼先生
2024-04-28 16:00:30
贾跃亭称已还清100亿美元债务,却被大V光速打脸:还了跟没还一样

贾跃亭称已还清100亿美元债务,却被大V光速打脸:还了跟没还一样

可达鸭面面观
2024-04-28 15:28:34
NBA官宣年度大奖:戴格诺特当选最佳主教练 率雷霆西部第十变第一

NBA官宣年度大奖:戴格诺特当选最佳主教练 率雷霆西部第十变第一

罗说NBA
2024-04-29 06:36:37
塞力斯问界M7声明与博世冲突,谁的谎言如此不堪?谁在玩弄车主?

塞力斯问界M7声明与博世冲突,谁的谎言如此不堪?谁在玩弄车主?

美芳
2024-04-28 22:27:57
提前3轮夺冠!巴黎法甲三连冠!12年10冠+第50冠 冲三冠王

提前3轮夺冠!巴黎法甲三连冠!12年10冠+第50冠 冲三冠王

念洲
2024-04-29 06:07:51
990万元!周鸿祎迈巴赫成交!半个车圈到场

990万元!周鸿祎迈巴赫成交!半个车圈到场

证券时报e公司
2024-04-28 19:42:38
“新冠疫苗之父”被捕,很多人吓坏了

“新冠疫苗之父”被捕,很多人吓坏了

燕梳楼2021
2024-04-28 13:13:25
博世称问界M7涉事车辆并未搭载博世智驾系统

博世称问界M7涉事车辆并未搭载博世智驾系统

鞭牛士
2024-04-28 17:32:15
曼城2-0森林!仍落后榜首1分,德布劳内助攻双响,哈兰德复出破门

曼城2-0森林!仍落后榜首1分,德布劳内助攻双响,哈兰德复出破门

侃球熊弟
2024-04-29 01:26:15
76人1-3尼克斯濒临出局 布伦森47+10创6纪录恩比德末节5中0

76人1-3尼克斯濒临出局 布伦森47+10创6纪录恩比德末节5中0

醉卧浮生
2024-04-29 05:20:45
哪吒汽车CEO张勇回应品牌改名

哪吒汽车CEO张勇回应品牌改名

21世纪经济报道
2024-04-28 11:29:25
2天8个瓜,四字顶流塌房,黄晓明疑似恋爱,关晓彤被罚,出轨离婚

2天8个瓜,四字顶流塌房,黄晓明疑似恋爱,关晓彤被罚,出轨离婚

兮说戏说
2022-05-27 22:56:54
五一彻底打消了去新加坡旅游的念头!网友分享太真实,替我省钱了

五一彻底打消了去新加坡旅游的念头!网友分享太真实,替我省钱了

美美谈情感
2024-04-28 17:39:18
博世打脸问界!隐藏式门把手未弹出让三人错失救援机会

博世打脸问界!隐藏式门把手未弹出让三人错失救援机会

映射生活的身影
2024-04-28 23:50:06
“新冠疫苗之父”杨晓明被抓!个人履历曝光,评论区彻底失控!

“新冠疫苗之父”杨晓明被抓!个人履历曝光,评论区彻底失控!

古希腊掌管松饼的神
2024-04-28 09:10:08
2024-04-29 09:02:44
经济观察报
经济观察报
最具影响力的财经类周报
90386文章数 1602318关注度
往期回顾 全部

科技要闻

马斯克想把特斯拉中国数据送出国 这事太难

头条要闻

运城高速回应问界M7致3死事故:涉事养护车在移动作业

头条要闻

运城高速回应问界M7致3死事故:涉事养护车在移动作业

体育要闻

湖人的G4,尽人事得到了回报

娱乐要闻

张杰谢娜发文为何炅庆生,亲如家人!

财经要闻

问界M7追尾起火3人遇难 四大疑问待解

汽车要闻

鸿蒙首款行政旗舰轿车 华为享界S9实车亮相车展

态度原创

艺术
家居
时尚
数码
军事航空

艺术要闻

共度北京108小时 北京当代2024“凝聚”全球36座城市100余家艺术机构

家居要闻

光影之间 空间暖意打造生活律动

人到中年穿裙子更提气质,夏季借鉴好这些搭配技巧,时尚高级优雅

数码要闻

苹果公司将于5月7日在伦敦举行另一场发布会 可能仅面向媒体

军事要闻

也门胡塞击落美军"死神"无人机 并展示残骸

无障碍浏览 进入关怀版