网易首页 > 网易号 > 正文 申请入驻

老是出错的AI搜索,要被夸克整顿了?

0
分享至

现在是周日,天都黑了,眼瞅着快到 23 点 59 分了,差评君的量子计算文章还没写完。

主要这玩意又烧脑,要查的资料还多,再加上搜集数据、整理观点啥的,那都不是一般的费时间。

那有差友可能就要问了,你小子这两年天天吹 AI,咋这时候你就记不起来用?

该说不说,AI 搜索这玩意在我这儿确实 能帮上忙,但不多。

经常用的哥们都知道,AI 给你的东西乍一看经常还可以,起码外行看起来是挺唬人的;

但你要是门儿清,仔细一读就会发现这玩意是一眼丁真,有的数据找不着来源、有的概念是旧版本、甚至它给的有些论文都根本是编的,所以最后调研一圈,哥们经常会浪费了俩小时。。。

完事我再上网一搜,发现吐槽这事的还不是少数。

网友们也发现了 AI 会乱编游戏攻略和剧情, 甚至百科网页里明明有的东西它都能搞错。

该说不说,AI 搜索这东西打几年前 New Bing 那时候就在做了,但现在都 2025 年了,还会掉链子,那属实是有点不应该。

不过这倒不是 AI 本身不行, 主要大模型这块儿有一些根本问题,实在是不好规避,比如幻觉。

简单来说,大语言模型这东西,本质上其实是基于概率统计的模型。所以模型可能会脑补一些不存在的信息,尤其是在面对信息碎片化、缺乏明确答案的问题时,这种幻觉就更加明显。

而另一方面, AI 搜索啥的都是靠搜索引擎在网页里扒数据, 但这里面既有学术报告,也有营销软文,甚至还有谣言和垃圾信息。信源的质量很难保证,所以才很容易生成错误答案。

这就跟在垃圾堆里挖矿似的,挖到的东西就不光有金子,更多的还是垃圾。

虽说这都是大模型自己的问题,但咱要想让 AI 搜索不胡说八道,是真就完全没有办法了吗?

有的兄弟,有的。

咱国内这边还有高手,阿里的 夸克团队为了把 AI 搜索搞好,这次他们就专门做了一套优化方法。

比如说,一般的模型不是爱胡乱脑补嘛,那就 直接换成聪明的,现在最先进的推理模型,这就能在一定程度上解决问题。

但要用在 AI 搜索上,如果只靠外挂 DeepSeek,那其实也不好说就能做到深度融合,发挥出推理模型的优势。

要想最大化推理大模型的能力,靠自家手段反而更保险,这也是为啥做机器人的 Figure 会脱离 OpenAI,转投自研。 而夸克他们也是用的阿里自家的推理大模型。

然而对于传统 AI 搜索信源质量差的问题,这就没法靠大模型解决了。

拿开头差评君在研究的量子计算来说,如果想知道现在的学术界有啥操作这些微观粒子的新思路,还得靠最新的权威资料,比方说 顶尖大学的研究数据,学术论坛里大佬们的最新观点啥的,这些在网上都找不太着。

但要想搭建这样一个数据库,那可就不容易了,知网的收费大家还记得吧,而你要想搞专业 AI 搜索,光知网的数据还远远不够。

所以国内真正有这个实力的,其实大家都能想到,也就剩那几家了。 而他们阿里这次就专门掏钱搞了数据库。

不过,虽然人家说是这么说,这些介绍听起来头头是道,但你要问我他们这是不是在吹牛,那我只能说,在没有亲身体验之前,咱还真不敢轻易下定论,更别提直接盖章认证了。

毕竟,之前的 AI 搜索…前面也说了,大家都懂的。当然为了给差友们一个客观交代,差评君我也是主动出击,提前要来了内测名额,上手好顿体验。

而结果嘛,说句实在话,还真有点出乎意料。 人家大厂这技术力,还真不是盖的。

不多 bb 了,直接给兄弟们看成果。

比如第一个测试,我问一个它经典科幻思想实验, 有点烧脑的祖父悖论问题,考验考验这玩意的推理能力。

向上滑动查看更多

实话说,夸克的回答分析纬度比我想的还要多,除了大家能想到的技术预言测试,还提到了检测异常粒子、检查虫洞稳定性啥的概念, 甚至知道从技术伦理观变迁这个思路( 出自 1895 年的科幻小说《 时间机器 》 )来证伪,属实有点实力。

而且整个回答看着也是相当有逻辑的。

不过为了测试它的多轮提问能力,我还专门连续追问了几个问题,如果人家武器用的未来科技,你咋检测? 如果这凶手是平行时空的,那能不能定罪?

向上滑动查看更多

结果夸克 AI 不但能够记住这一串问题的上下文语境,逻辑一致,还层层递进地深入解答,分析判决有啥困难,得想啥办法通过法律手段给他判了。

这里面人家还给出了不少参考信息,除了援引法律法规,还参考了像《相对宇宙》这种科幻美剧,甚至提到了宇宙学家 Tegmark 在《 Our Mathematical Universe 》里提出的数学宇宙假说。

整个对话过程可以说相当自然、信息连贯, 跟罗老师和大刘坐一桌开研讨会似的。

不过光推理那还只是基本功, AI 这玩意真要让人高看,那还得有拿得出手的本事,比如说写作。

估计夸克团队也是早想到哥们要测这个,专门把 AI 写作入口放到搜索框顶上,里边还把诗歌的体材字数啥的都归纳好了,什么小作文、文案、问卷、心得体会都会搞。

我让他以量子力学里经典的双缝干涉实验为主题写一首七言律诗。

你别说,这还真挺像那么回事的,小味儿马上就有了。

但是对咱们来说,测了这么多 AI ,一般的文章生成那都是洒洒水,没啥意思,要来就给他上上强度,直接让他生成 ppt , 先来一份 20 页以上的火星殖民可行性报告吧。

结果没想到人家考虑这么详细,各种保障就不说了,甚至连预算从哪来都考虑进去了。到最后还支持换模版,调大纲,那还真挺实用的,我觉得换个颜色,再凑点字数,应该都能拿去 NASA 拉赞助了。( )

但相比其他 AI 搜索,更让我直呼牛逼的是它在知识可视化这块儿。

拿量子计算来说,这里面有大量严谨枯燥的数学分析,物理概念,纯看文字能累死。

但对夸克 AI 搜索来说,要理解这些就轻松很多了,比方我让他整理目前主流的量子计算方向,人家可以给你画框图画表,逐个分析。

不过,就这还只是问答环节的能力, 你要用了它搜索框下面的功能组件,才会发现这玩意的多模态有多厉害。

就比如说,人家不仅支持照片输入和文字识别,还把这种能力开发到了能直接搜题的程度。

咱直接按首页的解题大师,把张融合了近代史和物理的烧脑题丢给它看看。

你瞅瞅,直接就能出答案,如果你还是看不懂,那还可以夸克追问。说白了这东西可以当学习机使, AI 家教整上了。

除了这个,人家这回答的专业性还很强,就比如说我想了解量子力学这玩意到底怎么跟哲学挂钩的,从搜索框上这个学术搜索里边问就完了。

结果人家不仅回答得很详细,参考了一堆学术资料,还能生成大纲和脑图,最后还附带图片和相关视频,生怕我看不懂是吧。

完事你别说,我后面还专门查了量子力学跟哲学交叉的文献资料 ,发现就算在这种小众冷门的学科里,人家这回答也是相当专业的,这可比经常出幻觉的大模型高的不知道哪里去了。

而这其实就是前面说的, 他们夸克团队自建了专业数据库,还跟知网、万方等顶尖数据库深度合作 ,这才把权威专业做好。甚至他们在医疗上也投入巨大。

又有学术上的专业,又有强大的泛化能力,这我是真喜欢。

不过要我说,夸克 AI 这波更新,最牛的还不全在搜索上, 因为这玩意压根就不是光用来搜索的。

比如当你提问写作问题时,它会自己调用上面咱说的那个写作助手;问健康问题时,它又会调用夸克健康助手;提问学习问题时,它不光给你讲,还在下面指路课程视频和资料。

也就是说,这玩意是带智能的, 能主动识别你想干啥,根据你的不同意图来自动调用各种数据和 AI 工具,最大完成度的来实现任务,满足各位的需求。

所以说,夸克这哪是搞了个 AI 搜索,完全是搞出了 AI 搜索的完全体,超级 AI 应用嘛。

实际上,不光咱是这么看的,前几天阿里巴巴官号也发布了夸克升级产品的视频,贴上了 “ 阿里 AI 旗舰应用 ” 的标签。

但要我说的话,夸克 AI 的更新其实是整个 AI 应用层面变革的缩影,跟之前只会单纯问答解决问题的 AI 应用相比 ,夸克实际上说明 AI 正在从问答搜索时代迈向全域 AI 时代。

说人话就是,这样一个搜索框里能呈现的就不只是一般的问答里,更是一个 AI 超级框,满足用户的所有需求,找答案、做分析、写方案、写作、解题,作图等等,成为用户的个人全能助手。

从这个层面上来说, AI 对大家的便利会进一步提高,与其担忧 AI 的威胁,不如先拥抱 AI 的机遇,善用夸克这样的智能工具吧。

撰文:纳西

编辑:江江 & 面线

美编:焕妍

图片、资料来源

Cognitive Mirage : A Review of Hallucinations in Large Language Models

Philosophic Foundations of Quantum Mechanics

夸克、微博等,部分图源网络。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
沉迷养猪的丁磊,去年赚了338亿

沉迷养猪的丁磊,去年赚了338亿

大佬灼见
2026-03-13 12:21:50
宋美龄书法对比:钢笔字似小学生,英文手稿如中学生!

宋美龄书法对比:钢笔字似小学生,英文手稿如中学生!

书画相约
2026-03-26 07:49:18
新消息!伊朗突然宣布了!

新消息!伊朗突然宣布了!

达文西看世界
2026-03-23 20:29:16
国际原子能机构总干事:美伊或将在巴基斯坦举行会谈

国际原子能机构总干事:美伊或将在巴基斯坦举行会谈

界面新闻
2026-03-25 22:29:47
航天少帅谭瑞松被判死缓 不执行死刑和终身监禁

航天少帅谭瑞松被判死缓 不执行死刑和终身监禁

小鹿姐姐情感说
2026-03-26 02:23:54
多名医生建议:血糖不超过这个值,该吃吃该喝喝,吃点甜的更健康

多名医生建议:血糖不超过这个值,该吃吃该喝喝,吃点甜的更健康

健康之光
2026-03-24 22:20:04
上海VS天津胜券在握!李花三兄弟无法阻挡,卢伟全力冲击十二连胜

上海VS天津胜券在握!李花三兄弟无法阻挡,卢伟全力冲击十二连胜

老叶评球
2026-03-26 17:04:22
你见过哪些员工因为作死被开除的事情?网友:去副总院里偷石榴

你见过哪些员工因为作死被开除的事情?网友:去副总院里偷石榴

另子维爱读史
2026-03-24 21:35:06
暗杀逼退卡塔尔,以色列打错算盘!巴铁核武镇场,给伊朗免死金牌

暗杀逼退卡塔尔,以色列打错算盘!巴铁核武镇场,给伊朗免死金牌

起喜电影
2026-03-26 15:40:09
重磅实锤!瓜帅即将告别曼城,下一站彻底跳出英超

重磅实锤!瓜帅即将告别曼城,下一站彻底跳出英超

澜归序
2026-03-26 06:02:38
伊朗挂断王毅电话后发全球照会,萨勒曼震怒

伊朗挂断王毅电话后发全球照会,萨勒曼震怒

空间展示知识
2026-03-26 07:06:58
内塔尼亚胡:对恶绝不手软,才是对和平最大的负责

内塔尼亚胡:对恶绝不手软,才是对和平最大的负责

老马拉车莫少装
2026-03-22 23:24:28
瞒天过海40年!李嘉诚成最大赢家,日产百万桶,把石油全卖给中国

瞒天过海40年!李嘉诚成最大赢家,日产百万桶,把石油全卖给中国

阿凫爱吐槽
2026-03-24 00:54:18
2-0!3-1!意大利背水一战 法国志在复仇巴西 熊皇姆巴佩皇马内战

2-0!3-1!意大利背水一战 法国志在复仇巴西 熊皇姆巴佩皇马内战

万花筒体育球球
2026-03-26 17:12:13
美国总统特朗普表示将于5月中旬访华,外交部:元首外交对中美关系发挥着不可替代的战略引领作用,中美双方就特朗普总统访华事保持着沟通

美国总统特朗普表示将于5月中旬访华,外交部:元首外交对中美关系发挥着不可替代的战略引领作用,中美双方就特朗普总统访华事保持着沟通

潇湘晨报
2026-03-26 16:25:20
捡漏成功!广州市一栋三层别墅拍卖,被人捡漏170.6万就竞得,还要啥套间

捡漏成功!广州市一栋三层别墅拍卖,被人捡漏170.6万就竞得,还要啥套间

阿离家居
2026-03-26 16:52:37
有没有人敢爆自己的瓜?网友:确定玩这么大吗?

有没有人敢爆自己的瓜?网友:确定玩这么大吗?

夜深爱杂谈
2026-02-18 20:55:58
美议员喊话特朗普:如果北京不答应美国要求,就不准中国做一件事

美议员喊话特朗普:如果北京不答应美国要求,就不准中国做一件事

让心灵得以栖息
2026-03-26 05:03:07
世人最尊敬的清华校长携巨款去了美国,真相令所有人沉默…

世人最尊敬的清华校长携巨款去了美国,真相令所有人沉默…

背包旅行
2026-03-25 15:05:36
火箭108-110森林狼!杜兰特看清现实,申京也迷茫,一人该被重用

火箭108-110森林狼!杜兰特看清现实,申京也迷茫,一人该被重用

鱼崖大话篮球
2026-03-26 15:37:49
2026-03-26 18:35:00
差评XPIN incentive-icons
差评XPIN
用知识和观点Debug the world!
10468文章数 489521关注度
往期回顾 全部

科技要闻

Meta高管狂分百亿期权,700名员工却下岗

头条要闻

男子从四家公司贷出共计356万元 实际到手却仅8万多元

头条要闻

男子从四家公司贷出共计356万元 实际到手却仅8万多元

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

张雪峰家人首发声 不设追思会丧事从简

财经要闻

长护险谁能享受?享受多少?解答来了

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

时尚
本地
旅游
家居
健康

皮衣+裙,高级到炸

本地新闻

救命,这只酱板鸭已经在我手机复仇了一万遍

旅游要闻

视点|陶然亭公园海棠春花文化节,解锁春日新体验

家居要闻

傍海而居 静观蝴蝶海

转头就晕的耳石症,能开车上班吗?

无障碍浏览 进入关怀版