网易首页 > 网易号 > 正文 申请入驻

小力也能出奇迹的搜索Agent,可能是大模型突围的一个方向

0
分享至

新年刚至,陈天桥携手代季峰率先打响开源大模型的第一枪,正式发布其自研的旗舰版搜索智能体模型—— MiroThinker 1.5 ,堪称智能体模型领域的最强“小钢炮”。最直观的体现来自基准测试的性能评测:面对GPT‑5‑High、Gemini‑3‑Pro、DeepSeek‑V3.2等一系列国内外顶尖模型,MiroThinker 1.5在四项基准测试中表现均毫不逊色。

性能非常不错!

其实这个结果在直觉上非常的合理,如果我们需要AI通晓所有已有的知识,那为什么我们非得让它背下来?唐诗宋词的电子版在互联网上有非常多,能让AI知道搜索和呈现内容不就完了。

MiroThinker-v1.5给我的感觉就是这个,传统意义上上最核心的大模型LLM,在这套框架里面的主要作用,一个是总结,一个是判断。

对象就是数据,然后小的那个30B的模型,本身不负责产生数据,因为这个size的模型就跟人和小型生物的脑子大小一样,容量的差距太大了,没法比。


所以数据都是通过search搜索引擎来的。

PART 01

系统运行所需工具

可以看到,要想运行这么一套系统,最少只需要3类工具。分别是:

  • tool-python:python代码,用来创建沙盒环境,写一些小工具

  • search and scrape_webpage :搜索引擎,最起码得有个google serper的API

  • jina scrape llm_summary :jina的信息提取和总结API(前段时间刚被收购



简单理解的话,对于一个问题,它会先用python代码开启一个新的环境,然后用搜索工具搜内容,最后用内容理解来做分析和总结。


启动环境这一步,可以说是必须项,但并不产生内容。

而我的理解,就是第二步的搜索网页应该是最核心的一步,因为它决定了数据质量,如果搜出来的是垃圾,那就不可能在后续有好的结果。

PART 02

搜索引擎核心参数

在这个dev_ mcp_ servers里面找到了这个文件。


看到里面主要有两个搜索引擎在发力,第一个是google search,默认返回10条结果。


核心参数就是这8个:

  • q: Search query string

  • gl: Optional region code for search results in ISO 3166-1 alpha-2 format (e.g., 'us')

  • hl: Optional language code for search results in ISO 639-1 format (e.g., 'en')

  • location: Optional location for search results (e.g., 'SoHo, New York, United States', 'California, United States')

  • num: Number of results to return (default: 10)

  • tbs: Time-based search filter ('qdr:h' for past hour, 'qdr:d' for past day, 'qdr:w' for past week, 'qdr:m' for past month, 'qdr:y' for past year)

  • page: Page number of results to return (default: 1)

  • autocorrect: Whether to autocorrect spelling in query

看了下,最核心的应该就是q,也就是“搜索内容”,这个跟大模型的Prompt一样,甚至重要性超过Prompt。

另外还有sougou的搜索引擎使用,但是从逻辑上看,简陋了很多,接的是腾讯云的api,gl,hl,location什么的都没有。


看到这里,我觉得微调后的大模型能用起作用的应该主要是q,搜索内容,其他参数可以用python判断,也可以根据网页的元数据判断,唯有q得经过琢磨。

落到这个具体的google 搜索mcp也是一致的,唯有这个q是来自于别的地方传参。


PART 03

实际测试案例

为了验证下代码和实际产物是否匹配,我试了下这个问题。

大话西游2最适合做首发的宝宝是什么,以及理由

这是它的思考过程

用户问的是"大话西游2最适合做首发的宝宝是什么,以及理由"。这是关于游戏《大话西游2》的问题,用户想知道哪个宝宝最适合做首发(初始召唤)以及为什么。 这是一个需要搜索最新信息的问题,我需要搜索关于大话西游2首发宝宝推荐的相关内容。让我使用google_search来查找相关信息。

可以看到用的是google 搜索,结果还不错,都是相关的,但是的确时间都比较久,大多在20年前。


接下来的思考说明了,它也意识到了这个问题,然后它把时间强调在26年。


可能是数据太少,比较小众,退而求其次到2024年。


后续的几个步骤也都尽量在缩小范围,直到具体到某个召唤兽,金不换,我觉得是问题比较大的,因为到这一步的时候,搜索的q已经把《大话西游》这个最重要的词给筛掉了,而导致了各种乱七八糟的结果都出来了,有药的,有营销的,甚至还有得马赛克的。


但好在后面拉回来了,把大话西游2给加上了。


从结果来看,信源的真实度没问题,基本上都是较大的网站或者论坛的内容,但是时效性不够,大多都是1几年的,还有16年的。


当然了,我这个样本还是有点儿小众,不符合一般的测试内容,不过我最想表达的还是,数据的来源是核心。

大的大模型LLM靠自己生成不是100%靠谱,agent,比如miro这样的靠搜索引擎,其实也很难说靠谱。

但我觉得Mirothinker绝对是一个非常好的切入思路,与其在卷生卷死的大模型训练上搞,不如另辟蹊径做这种搜索类型的原生agent大模型。

小力出奇迹!

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
停了13年!厦门超级“网红烂尾楼”地标终于活过来了!

停了13年!厦门超级“网红烂尾楼”地标终于活过来了!

GA环球建筑
2026-01-09 13:54:38
中国为何几乎不拍“元朝历史剧”?不是不想拍,而是确实不能拍

中国为何几乎不拍“元朝历史剧”?不是不想拍,而是确实不能拍

老踝是个手艺人
2026-01-07 09:24:27
斗智:乌克兰人的“无间道”战术

斗智:乌克兰人的“无间道”战术

近距离
2026-01-02 10:55:21
A股:从今天起,历史或将惊人相似!4100点大级别主升浪要来了吗?

A股:从今天起,历史或将惊人相似!4100点大级别主升浪要来了吗?

股市皆大事
2026-01-09 11:51:15
官媒发文,曝光王思聪与秦岚真实关系,原来黄圣依一个字都没说错

官媒发文,曝光王思聪与秦岚真实关系,原来黄圣依一个字都没说错

看尽落尘花q
2026-01-08 02:22:16
三星长公主没想到,自己下嫁保安丢的面子,竟被18岁儿子找了回来

三星长公主没想到,自己下嫁保安丢的面子,竟被18岁儿子找了回来

削桐作琴
2026-01-08 21:22:07
TOP14位身高170以上的女神,有颜有灯有演技

TOP14位身高170以上的女神,有颜有灯有演技

素然追光
2026-01-02 02:45:02
算分!U23国足VS澳大利亚,开球时间确定,王钰栋和李昊影响出线

算分!U23国足VS澳大利亚,开球时间确定,王钰栋和李昊影响出线

体育大学僧
2026-01-09 12:31:13
孟加拉没有未来?现实触目惊心:不是发展太慢,而是被锁死了上限

孟加拉没有未来?现实触目惊心:不是发展太慢,而是被锁死了上限

远方风林
2026-01-08 02:05:03
算了,不写陈志了,他就是一个“脸大头圆光有钱”的马仔

算了,不写陈志了,他就是一个“脸大头圆光有钱”的马仔

热点菌本君
2025-11-03 15:04:39
格陵兰发达到什么水平?我去了才发现,差距真的太大

格陵兰发达到什么水平?我去了才发现,差距真的太大

娱乐八卦木木子
2026-01-07 15:14:07
把蔡正元花钱都判刑的女检察官陈舒怡,被国家正式列入清单了!

把蔡正元花钱都判刑的女检察官陈舒怡,被国家正式列入清单了!

百态人间
2026-01-08 16:30:15
又一个巨头崛起!年入8715亿,超越华为,成第三民营企业!

又一个巨头崛起!年入8715亿,超越华为,成第三民营企业!

牛牛叨史
2025-12-23 23:07:38
26年央视春晚嘉宾名单曝光,牛鬼蛇神混子引争议

26年央视春晚嘉宾名单曝光,牛鬼蛇神混子引争议

杜鱂手工制作
2026-01-06 18:48:05
于存为毛泽东做饭11年,1971年毛泽东亲自安排:你去给美国人做饭

于存为毛泽东做饭11年,1971年毛泽东亲自安排:你去给美国人做饭

历史龙元阁
2026-01-08 15:20:03
社评:面对霸权胁迫,欧洲不能再装睡了

社评:面对霸权胁迫,欧洲不能再装睡了

环球网资讯
2026-01-09 00:06:11
被垫脚了!伦纳德再次受伤,快船欲哭无泪

被垫脚了!伦纳德再次受伤,快船欲哭无泪

德译洋洋
2026-01-09 15:10:09
访华第2天,李在明得偿所愿,不到24小时,高市对中国提出2个请求

访华第2天,李在明得偿所愿,不到24小时,高市对中国提出2个请求

近史博览
2026-01-08 09:36:51
皇马2-1马竞!21次进西超杯决赛 与巴萨争冠 巴尔韦德任意球破门

皇马2-1马竞!21次进西超杯决赛 与巴萨争冠 巴尔韦德任意球破门

侃球熊弟
2026-01-09 04:59:16
终于轮到日本“强烈抗议”了:80年了,日本从未像今天这样憋屈

终于轮到日本“强烈抗议”了:80年了,日本从未像今天这样憋屈

梁讯
2026-01-09 01:43:03
2026-01-09 15:48:49
平凡AI incentive-icons
平凡AI
高校AI从业者
60文章数 24关注度
往期回顾 全部

科技要闻

市场偏爱MiniMax:开盘涨42%,市值超700亿

头条要闻

"老板"拉群开口就要150万 女财务付100万后感觉天塌了

头条要闻

"老板"拉群开口就要150万 女财务付100万后感觉天塌了

体育要闻

金元时代最后的外援,来中国8年了

娱乐要闻

檀健次恋爱风波越演越烈 上学经历被扒

财经要闻

郁亮的万科35年:从"宝万之争"到"活下去"

汽车要闻

英伟达的野心:做一套自动驾驶的“安卓系统”

态度原创

本地
数码
健康
艺术
公开课

本地新闻

云游内蒙|“包”你再来?一座在硬核里酿出诗意的城

数码要闻

避免老设备“变砖”,Bose开源SoundTouch智能音箱API

这些新疗法,让化疗不再那么痛苦

艺术要闻

Sean Yoro:街头艺术界的“冲浪高手”

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版