网易首页 > 网易号 > 正文 申请入驻

知乎AI革命:智能搜索与实时问答的融合

0
分享至


作者 |骆轶航
邮箱 |tluo@pingwest.com

在生成式人工智能(Generative AI)的信息技术跃迁背景下,如何看待知乎当下和未来,有三个基本的视角:

  • 它是大语言模型预训练中文语料最重要来源之一,例如最近现象级的大模型聊天应用Kimi Chat,就以知乎为重要的训练资料来源(甚至是80%以上的来源)。

  • 每一个在知乎上提问的用户,其实都是在发prompt(提示词);而每一个知乎的答主,基本都相当于基于个人知识和经验(语料)、价值观和思考逻辑(算法和思维链)的人肉语言模型。基于此,基于大语言模型的“数字人答主”会在知乎陆续出现。

  • 鉴于“提问——回答”是知乎作为内容社区运转的基本逻辑,也是一系列大语言模型工具运转的基本逻辑,还是搜索引擎20年持续进化的主线——Google、百度,还有新型的AI问答聚合工具Perplexity,近期所做的一切,实质都是搜索引擎的AI化。因此,知乎的搜索属性——基于AI的搜索,将得到强化。

基于这三个视角,在AI的众声喧哗之侧的知乎,有以下可能拥抱生成式人工智能浪潮的方式:

  • 做更好的中文预训练语料提供商,成为高质量中文语料的永动机,提供更高质量的、由人而不是机器创造的中文内容,让这些内容有更多被采集、使用和预训练的可能。参与国家级中文语料库建设,成为重要的语料建设者。

  • 整个社区的激进AI化。AI进行提问,更负责回答。知乎社区将出现大量的AI数字人作为独立的IP——历史的、科技的、医学的、文学的垂直领域数字人,让他们回答用户的提问,给出用户想要的答案。

  • 以搜索为突破,以知乎自己的大模型能力(知海图AI)为依托,让大模型参与部分问题答案的生成和总结,提示用户追问,引导用户在知乎社区内进行“多轮对话”,从而吸引更多的答主,让大模型成为激发用户活跃度的催化剂。

以上三个路径,第一个保守,第二个激进,第三个是前两者的结合。知乎选择哪条路径,取决于知乎是什么,它在大语言模型生态产业链当中的角色是什么,以及它擅长什么。


3月20日的“发现大会”上,知乎推出了三个与AI相关功能——

一个是搜索,帮助用户找到社区的“共识”。

它其实相当于知乎站内的Perpelexity——用户提出问题,知海图AI模型基于社区内的内容,生成用户需要的答案。并不是所有的内容都能在知乎上找到答主生成的答案,很多时候,一个有深度的、需要专业知识支撑的问题,需要很久才能有专业领域的答主提供高质量的答案。但这样的问题,散落在社区各个角落的答主们针对其它问题的各条高质量答案,是可以作为参考依据的。这个时候,如果AI能通过搜索和生成,将这些答案里的有价值信息提炼出来,进行有效的推理,就能为一个“新鲜出炉”的专业问题提供一个立等可取的答案,提问的用户就可以能为快,然后再等其它的专业答主陆续赶到,下场答题。

在灰度测试这个功能的时候,知乎消费电子领域的专业答主Navis Li提出过一个专业问题:俄罗斯或前苏联好像有一个著名的镜头可以实现旋转的焦外虚化效果,镜头具体是什么?讲真,面对这种极度偏门专业的冷知识,等人来答需要花很长的时间,也可能等不到。但基于AI搜索,知乎其它专业答主和社区创作者在其它问题下面的答案经过提炼、分析和推理,给出了一个准确的答案。

第二个是实时问答,用于完成公共编辑。


它相当于AI生成的站内维基百科。一个高质量的提问下面可能有成百甚至上千的答案,其中的高赞答案可能也不下几十个。是不是每个人都有时间和耐心读完所有的答案,再形成一个自己需要的知识输出?这恐怕不太现实。它需要一个基于创作者的答案的“最佳答案”,也就是最佳答案的提炼、萃取的维基百科功能。早年的知乎是有这个功能的,大家通过公共编辑,对所有的回答进行总结,“众创”出一个最佳回答。这个初衷是理想的,现实却有些骨感。它反倒成了知乎颇受争议的功能。因为人的主观、偏见和倾向是难以避免的,是容易制造更大冲突、对立和争议的,以至于知乎不得不下线了这个功能。

真正适合做“维基百科”工作的,是AI。AI的偏见不能说没有,但可以通过强化训练得到约束和控制。AI的提炼和推理能力是呈指数级提升的。因此,基于创作者回答的“最佳回答”,现在有了更好的生成者——大语言模型。这个实时问答其实是基于AI的公共编辑,让用户得到一个简单、直接和有效答案的路径更直接、更快速。

第三个是不断提问和追问的功能,甚至可以不需要提示词。

知乎长期是一个比较单向度的产品:一问多答。尽管有算法推荐的关联提问,但它不是同一个用户实时提出的问题,未必折射了一个提问者内心最大的好奇心和疑惑。现在看完了一个问题的回答,可以基于这个回答和提炼出来的“最佳答案”进行追问——追问甚至不需要主动输入提示词,而是AI自动生成。它其实在鼓励用户在知乎社区里进行“多轮对话”——就像一个人在ChatGPT和Kimi Chat上做的那些事一样。针对用户的追问,AI可以给出它的答案,答主们也应该会陆续赶到现场。

这样,知乎作为一个“问答社区”的形态,就有可能从“一问多答” 向“多问多答” 演进。在一个基于问答的内容社区里,提问是最大的供给侧。过去的提问主要依靠的是人们的好奇心和求知欲,现在可以有AI加持和赋予的灵感。这么做的好处当然也很直观——产生更多的问题,以及相应的更多的答案。

一个搜索,一个实时问答,一个追问,它们背后都基于知乎的AI,知乎把这个三合一的AI功能叫“发现 · AI搜索”,在首页的左侧给了一个“四芒星”的logo。

看上去,它有搜索,但不是一个专门的搜索框。它有大模型对话,但不以对话界面的方式呈现。它可以追问,但AI不是唯一的答主。它看上去还是那个知乎,还需要大量有好奇的提问者,还需要高质量的专业答主。然后,AI站在他们的身侧。

在前面的知乎拥抱AI的三条路径里,知乎选择的是第三条。这条路径的最终指向,是知乎作为一个知识问答社区最关键的命脉——用户的活跃、持续不断的高质量问题,以及高质量的可信赖的答案。

知乎相信“发现·AI搜索”会成为知乎社区的活水,但它高度警惕整个社区的激进AI化——大量的AI生成问题,大量的AI回答问题。社区里充满了机器人和数字人的提问者和答主,大量甚至大多数问题和答案都是AI生成的。

在硅星人与知乎创始人、CEO周源最近的一次对话中,周源对“NPC答主”的态度高度审慎:“平台不应该主动做这个事儿,平台为什么要让自己的体系里面产生这么多NPC呢?”


他认为知乎的“AI搜索”是一个“不依赖原来的信息流,换了一种基于大模型的能力和交互的方式,而对后续产生数据反馈非常直接”的功能。这个“数据的直接反馈”,是指向活生生的“人”的,而不是AI的。作为提问者,能够更快、更直接得到他们想到的答案;作为答主,能够让自己的回答被更频繁地搜索、调取、索引和再度生成为新的内容。作为普通的浏览型用户,能够换一个界面和交互,用“搜索”和“发现”到更多过去需要下拉很多次信息流才能找到的问题和答案,这对于一个社区的活跃度是非常重要的事。它们将产生更多的内容,也是大语言模型训练所用的语料。

“AI本身是一个语言模型,不会遇到问题。只有人才会在社会中遇到问题。你失恋了,下岗了,人才会有这种痛苦和欲望。人产生的问题和相应的内容才是可信的。AI 可以辅助你,但是如果把这层光明层去掉,AI只是自循环的,我觉得就没有太大价值了”,周源对硅星人说。

基于这个认知,他反对让“AI搜索”生成的答案和问题,以机器人的IP形式出现,而坚持只让它们出现在“四芒星”的角标里面,以私聊的方式出现,只属于用户个人,而不呈现在由提问者和答主这些真正的“创作者”出现的信息流里。

面对AI,知乎真正要回答的问题是:人类如何与AI共享智慧,又保持对人类原创性的尊重和鼓励。这不是一个新问题,但需要一个新的解法。目前,它给出答案是:透过AI,让人们发现人类创造的更大的世界,人类创作的更多的内容,而不是用AI发现更多AI生成的内容。

它指向了一个更为关键的问题:当世界上越来越多的内容是由AI生成的,人类的经验和人类创造的内容,会不会变成一种日益边缘化的稀缺资源?AI生成内容的前提和基础是人类经验生成的语料——即人类通过历史、社会、经济、科技实践创造的内容——无论它们是文章、数据、图像、声音、视频还是代码。但如果人类创造的内容在AI生成的几何级增长“挤压 ”下变成一种稀缺资源,未来AI生成内容的经验从何而来,语料又从何而来?

这对每一个人都很重要,对事实上已成为全世界中文语料的重要资源库——知乎来说,更是一个必答题。


“人工智能发展离不开芯片、模型、数据三个重要因素。芯片确实卡脖子,但芯片是一个工程学的问题,只要有了一定的规模,就能够迭代起来,我们工程师还是很厉害的。模型有开源优势,进化速度也不会慢。只有数据是不可再生资源,而且还没办法马上拥有。无论投10亿美金还是投100亿美金,都不可能在短时间里建立一个UGC社区,语料是一种不可再生资源”,周源认为。

“你把语料当成静态的,即便他是这样的,那也得把它看成是一片土地。你不能在一块土地上把玉米割了,然后去另外一个地方销售,不管这片土地明天有没有虫灾,” 周源认为,全球的语料都存在着一种贫瘠化甚至枯竭化的可能,就像石油一样。

因此,让数据的供给和消费的飞轮能够转起来,让更多的数据变成大模型训练的语料,被AI“消费”的同时,更多的语料能够被反哺、AI能激发人类再创造更好的内容,变成更有价值的语料,就变成了知乎在生成式人工智能浪潮下寻求答案的最有价值求解——尤其在它已经是全球中文互联网语料中绕不过去的存在的情况下。

成为可再生的持续供给的全球最大中文语料库有什么价值?来自美国的答案是:Google已经向美国最重要的内容社区Reddit累计支付了6000多万美元,用于购买高质量的语料。

来自中国的答案是什么?在数据交易市场已经在政府和市场的双轮驱动下已经日臻成熟的情况下,中文语料将成为重要的可被交易的数据资源。谁是最重要的中文语料库,将成为继芯片和算力之后,另一种稀缺但重要的“水”。谁都知道,AI的发展,往往是“卖水”的人最先赚到钱。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
他是原中央政治局常委,1967年却吞药自尽,离世之后骨灰下落不明

他是原中央政治局常委,1967年却吞药自尽,离世之后骨灰下落不明

江东浪流史
2024-04-20 12:29:02
1万枚导弹没打服乌克兰,我们比俄军强大的多:要用重拳砸碎幻想

1万枚导弹没打服乌克兰,我们比俄军强大的多:要用重拳砸碎幻想

帅先工场
2024-04-27 16:05:34
斯诺克世锦赛战报!中国独苗留住希望,黑马第一个晋级8强

斯诺克世锦赛战报!中国独苗留住希望,黑马第一个晋级8强

土土女排
2024-04-27 15:27:04
《红海行动2》曝首款海报,却因制服引争议

《红海行动2》曝首款海报,却因制服引争议

影视原说a
2024-04-26 18:40:12
广州增城区冰雹暴雨席卷庄稼地,果园老板:荔枝受天气影响恐缩产

广州增城区冰雹暴雨席卷庄稼地,果园老板:荔枝受天气影响恐缩产

潇湘晨报
2024-04-27 21:16:11
超越巴萨暂升第二,赫罗纳33轮71分,西甲历史除皇萨&马竞外最高

超越巴萨暂升第二,赫罗纳33轮71分,西甲历史除皇萨&马竞外最高

直播吧
2024-04-27 22:43:21
忽悠年轻人社保缴满15年等退休,你退休了他们可不会给你养老

忽悠年轻人社保缴满15年等退休,你退休了他们可不会给你养老

唠叨张师傅
2024-04-27 14:57:28
回应场边争执!克洛普:和萨拉赫已经在更衣室谈好了,这事过去了

回应场边争执!克洛普:和萨拉赫已经在更衣室谈好了,这事过去了

直播吧
2024-04-27 22:05:14
精准盘点中国足坛史上六大前锋,现役只有1人

精准盘点中国足坛史上六大前锋,现役只有1人

第一体育
2024-04-03 16:43:47
时间定了!欧洲揭晓美国降息谜底,中美金融战迎来“大结局”?

时间定了!欧洲揭晓美国降息谜底,中美金融战迎来“大结局”?

蓝色海边
2024-04-27 18:28:47
内塔尼亚胡:“绝对不会接受!”

内塔尼亚胡:“绝对不会接受!”

参考消息
2024-04-27 20:23:43
最后关头,中美还是没谈拢,王毅另外发出3份请柬,统一强音传开

最后关头,中美还是没谈拢,王毅另外发出3份请柬,统一强音传开

说天说地说实事
2024-04-27 17:01:51
美国阴谋曝光!美打算在蒙古境内设立军事基地,蒙古回应很清醒

美国阴谋曝光!美打算在蒙古境内设立军事基地,蒙古回应很清醒

布衣的呼喊
2024-04-27 09:46:58
梅根给卡戴珊妈妈送“垃圾”果酱和“枯萎”柠檬,被拖到网上批评

梅根给卡戴珊妈妈送“垃圾”果酱和“枯萎”柠檬,被拖到网上批评

土澳的故事
2024-04-27 15:37:47
杭州多城区出台购车补贴,他们坐不住啦!

杭州多城区出台购车补贴,他们坐不住啦!

杭州综合频道
2024-04-27 18:17:20
美国海军领先中国150年,055大驱造一万艘也没用,我们是在吹牛?

美国海军领先中国150年,055大驱造一万艘也没用,我们是在吹牛?

星辰故事屋
2024-04-14 15:56:15
55岁女子确诊胰腺癌,强忍泪水坦言:腰部早出现了问题,不曾重视

55岁女子确诊胰腺癌,强忍泪水坦言:腰部早出现了问题,不曾重视

奇妙的本草
2024-04-27 20:00:05
曝拼多多公然违反苹果规定,利用灵动岛向用户推送广告,且不留痕迹

曝拼多多公然违反苹果规定,利用灵动岛向用户推送广告,且不留痕迹

西游日记
2024-04-26 11:11:48
西藏转世灵童,晒佛现场放满“尸袋”749局调查后发现真相

西藏转世灵童,晒佛现场放满“尸袋”749局调查后发现真相

真实故事汇
2023-10-17 17:55:55
汪峰逛北京车展遇到李斌,两个人相谈甚欢!汪峰全程一副大佬架子

汪峰逛北京车展遇到李斌,两个人相谈甚欢!汪峰全程一副大佬架子

娱乐八卦木木子
2024-04-27 22:08:26
2024-04-28 05:48:50
硅星人
硅星人
硅(Si)是创造未来的基础,欢迎来到这个星球。
1201文章数 10232关注度
往期回顾 全部

科技要闻

特斯拉这款车型刚上市几天,就上调价格

头条要闻

租车开网约车遭遇车损"套路":有人扣完押金还要倒补

头条要闻

租车开网约车遭遇车损"套路":有人扣完押金还要倒补

体育要闻

9-13!斯佳辉逆转未果,无缘世锦赛八强,中国选手全部出局

娱乐要闻

金靖回应不官宣恋情结婚的原因

财经要闻

北京房价回到2016年

汽车要闻

5月上市/智能化丰富 海狮 07EV正式到店

态度原创

教育
手机
亲子
健康
房产

教育要闻

初中物理常考易错题型之一!很多初中生直到高中才真正弄明白

手机要闻

OPPO Find X7 Ultra 512GB卫通版明天首销:6799元

亲子要闻

孩子静悄悄 必定在作妖

这2种水果可降低高血压死亡风险

房产要闻

海南最新房价出炉,三亚跌价最猛!

无障碍浏览 进入关怀版