网易首页 > 网易号 > 正文 申请入驻

小力也能出奇迹的搜索Agent,可能是大模型突围的一个方向

0
分享至

新年刚至,陈天桥携手代季峰率先打响开源大模型的第一枪,正式发布其自研的旗舰版搜索智能体模型—— MiroThinker 1.5 ,堪称智能体模型领域的最强“小钢炮”。最直观的体现来自基准测试的性能评测:面对GPT‑5‑High、Gemini‑3‑Pro、DeepSeek‑V3.2等一系列国内外顶尖模型,MiroThinker 1.5在四项基准测试中表现均毫不逊色。

性能非常不错!

其实这个结果在直觉上非常的合理,如果我们需要AI通晓所有已有的知识,那为什么我们非得让它背下来?唐诗宋词的电子版在互联网上有非常多,能让AI知道搜索和呈现内容不就完了。

MiroThinker-v1.5给我的感觉就是这个,传统意义上上最核心的大模型LLM,在这套框架里面的主要作用,一个是总结,一个是判断。

对象就是数据,然后小的那个30B的模型,本身不负责产生数据,因为这个size的模型就跟人和小型生物的脑子大小一样,容量的差距太大了,没法比。


所以数据都是通过search搜索引擎来的。

PART 01

系统运行所需工具

可以看到,要想运行这么一套系统,最少只需要3类工具。分别是:

  • tool-python:python代码,用来创建沙盒环境,写一些小工具

  • search and scrape_webpage :搜索引擎,最起码得有个google serper的API

  • jina scrape llm_summary :jina的信息提取和总结API(前段时间刚被收购



简单理解的话,对于一个问题,它会先用python代码开启一个新的环境,然后用搜索工具搜内容,最后用内容理解来做分析和总结。


启动环境这一步,可以说是必须项,但并不产生内容。

而我的理解,就是第二步的搜索网页应该是最核心的一步,因为它决定了数据质量,如果搜出来的是垃圾,那就不可能在后续有好的结果。

PART 02

搜索引擎核心参数

在这个dev_ mcp_ servers里面找到了这个文件。


看到里面主要有两个搜索引擎在发力,第一个是google search,默认返回10条结果。


核心参数就是这8个:

  • q: Search query string

  • gl: Optional region code for search results in ISO 3166-1 alpha-2 format (e.g., 'us')

  • hl: Optional language code for search results in ISO 639-1 format (e.g., 'en')

  • location: Optional location for search results (e.g., 'SoHo, New York, United States', 'California, United States')

  • num: Number of results to return (default: 10)

  • tbs: Time-based search filter ('qdr:h' for past hour, 'qdr:d' for past day, 'qdr:w' for past week, 'qdr:m' for past month, 'qdr:y' for past year)

  • page: Page number of results to return (default: 1)

  • autocorrect: Whether to autocorrect spelling in query

看了下,最核心的应该就是q,也就是“搜索内容”,这个跟大模型的Prompt一样,甚至重要性超过Prompt。

另外还有sougou的搜索引擎使用,但是从逻辑上看,简陋了很多,接的是腾讯云的api,gl,hl,location什么的都没有。


看到这里,我觉得微调后的大模型能用起作用的应该主要是q,搜索内容,其他参数可以用python判断,也可以根据网页的元数据判断,唯有q得经过琢磨。

落到这个具体的google 搜索mcp也是一致的,唯有这个q是来自于别的地方传参。


PART 03

实际测试案例

为了验证下代码和实际产物是否匹配,我试了下这个问题。

大话西游2最适合做首发的宝宝是什么,以及理由

这是它的思考过程

用户问的是"大话西游2最适合做首发的宝宝是什么,以及理由"。这是关于游戏《大话西游2》的问题,用户想知道哪个宝宝最适合做首发(初始召唤)以及为什么。 这是一个需要搜索最新信息的问题,我需要搜索关于大话西游2首发宝宝推荐的相关内容。让我使用google_search来查找相关信息。

可以看到用的是google 搜索,结果还不错,都是相关的,但是的确时间都比较久,大多在20年前。


接下来的思考说明了,它也意识到了这个问题,然后它把时间强调在26年。


可能是数据太少,比较小众,退而求其次到2024年。


后续的几个步骤也都尽量在缩小范围,直到具体到某个召唤兽,金不换,我觉得是问题比较大的,因为到这一步的时候,搜索的q已经把《大话西游》这个最重要的词给筛掉了,而导致了各种乱七八糟的结果都出来了,有药的,有营销的,甚至还有得马赛克的。


但好在后面拉回来了,把大话西游2给加上了。


从结果来看,信源的真实度没问题,基本上都是较大的网站或者论坛的内容,但是时效性不够,大多都是1几年的,还有16年的。


当然了,我这个样本还是有点儿小众,不符合一般的测试内容,不过我最想表达的还是,数据的来源是核心。

大的大模型LLM靠自己生成不是100%靠谱,agent,比如miro这样的靠搜索引擎,其实也很难说靠谱。

但我觉得Mirothinker绝对是一个非常好的切入思路,与其在卷生卷死的大模型训练上搞,不如另辟蹊径做这种搜索类型的原生agent大模型。

小力出奇迹!

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
爆大冷!2-3!保级队奇迹逆袭,西蒙尼又搞砸了:耻辱4连败

爆大冷!2-3!保级队奇迹逆袭,西蒙尼又搞砸了:耻辱4连败

足球狗说
2026-04-23 03:00:34
任泽平退款731万,恒大高管们开始退钱了

任泽平退款731万,恒大高管们开始退钱了

互联网大观
2026-04-22 13:44:17
北京大学教授乔晓春言论惹争议,我们应该上纲上线吗?

北京大学教授乔晓春言论惹争议,我们应该上纲上线吗?

总在茶余后
2026-04-22 21:14:14
特朗普改口,宣布延长停火,美国想拉中国下水?中方把话挑明了

特朗普改口,宣布延长停火,美国想拉中国下水?中方把话挑明了

兵器海陆空视频
2026-04-22 19:04:24
我为什么要曝光全国数十家公检法机关援引“空气法”发布公告

我为什么要曝光全国数十家公检法机关援引“空气法”发布公告

追月数星
2026-04-22 19:33:12
当极氪8X售价公布:我就知道友商悬着的心,已经死了!

当极氪8X售价公布:我就知道友商悬着的心,已经死了!

少数派报告Report
2026-04-20 09:24:53
十五部门:加强青年婚恋观引导,探索住房、出行、消费等多领域联动的生育支持政策

十五部门:加强青年婚恋观引导,探索住房、出行、消费等多领域联动的生育支持政策

界面新闻
2026-04-22 11:51:12
伊朗“内鬼” 竟是路由器

伊朗“内鬼” 竟是路由器

每日经济新闻
2026-04-22 13:52:09
2悍将伤退+比分定格1-0,巴萨虽豪取西甲8连胜,却让争冠埋隐患

2悍将伤退+比分定格1-0,巴萨虽豪取西甲8连胜,却让争冠埋隐患

侧身凌空斩
2026-04-23 05:47:33
布达诺夫视察前线曾遇俄军偷袭,大胆跳海,成功撤退!

布达诺夫视察前线曾遇俄军偷袭,大胆跳海,成功撤退!

项鹏飞
2026-04-22 18:53:14
新问界M9及加长版亮相:49.98万元起,余承东称要让同行“永远追不上”

新问界M9及加长版亮相:49.98万元起,余承东称要让同行“永远追不上”

凤凰网科技
2026-04-22 21:58:05
最后时刻签了,高市将全面梭哈?中日航班已停飞,解放军准时出海

最后时刻签了,高市将全面梭哈?中日航班已停飞,解放军准时出海

铁锤简科
2026-04-22 14:07:01
《生化9》大尺度mod!牛奶比基尼内含大雷比头还大

《生化9》大尺度mod!牛奶比基尼内含大雷比头还大

游民星空
2026-04-22 16:09:39
浪胃仙整容失败!在昆明被网友偶遇,真人又壮又老,差点认出是他

浪胃仙整容失败!在昆明被网友偶遇,真人又壮又老,差点认出是他

离离言几许
2026-04-22 07:06:44
不尊重中国领土完整!巴萨遭批:中国特供不发外网 甩锅临时工

不尊重中国领土完整!巴萨遭批:中国特供不发外网 甩锅临时工

念洲
2026-04-22 10:43:07
宁德“回击”比亚迪:充电快2分多钟,称高端车磷酸铁锂是减配

宁德“回击”比亚迪:充电快2分多钟,称高端车磷酸铁锂是减配

明镜pro
2026-04-22 16:55:17
中国驻美大使谢锋:中国大蒜做梦也没想到,有朝一日会被列为“国家安全威胁”

中国驻美大使谢锋:中国大蒜做梦也没想到,有朝一日会被列为“国家安全威胁”

每日经济新闻
2026-04-22 11:09:45
19岁女儿挪用父亲公司公款1700万元当“榜一大姐”,父亲带其自首,律师:钱款能否追回和自首无关,关键在打赏是否会被认定为善意取得

19岁女儿挪用父亲公司公款1700万元当“榜一大姐”,父亲带其自首,律师:钱款能否追回和自首无关,关键在打赏是否会被认定为善意取得

极目新闻
2026-04-22 21:48:16
太惨了!燃油车再迎大降价:最大跌幅50%,豪华车带头“跳水”

太惨了!燃油车再迎大降价:最大跌幅50%,豪华车带头“跳水”

沙雕小琳琳
2026-04-23 02:29:16
降级夜主帅拒谈去留:英超100分神话为何一年崩塌

降级夜主帅拒谈去留:英超100分神话为何一年崩塌

竞技风云录
2026-04-23 07:01:06
2026-04-23 07:16:49
平凡AI incentive-icons
平凡AI
高校AI从业者
70文章数 24关注度
往期回顾 全部

科技要闻

对话梅涛:没有视频底座,具身智能走不远

头条要闻

伊朗:美违反停火协议 不可能重新开放霍尔木兹海峡

头条要闻

伊朗:美违反停火协议 不可能重新开放霍尔木兹海峡

体育要闻

网易传媒再度签约法国队和阿根廷队

娱乐要闻

蜜雪冰城泰国代言人 被扒出辱华黑历史

财经要闻

医院专家号"秒空"!警方牵出黑色产业链

汽车要闻

纯电续航301km+激光雷达 宋Pro DM-i飞驰版9.99万起

态度原创

旅游
游戏
时尚
公开课
军事航空

旅游要闻

让文明“开口说话”,埃及多举措挖掘旅游业潜力(国际视点)

《黑旗RE》画面流出被批拉完了!育碧紧急回应

用了8年还心动,这笔钱是花得真值啊

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

特朗普宣布延长停火 伊朗表态

无障碍浏览 进入关怀版