网易首页 > 网易号 > 正文 申请入驻

不止是代码生成:Qwen3-Coder在“感知-规划-行动”循环中的惊艳表现

0
分享至

刚刚火速用Qwen3-Coder试了下我最近一直卡着的一个任务,先给大家看下消耗。这个任务跑了1个小时18分钟 ,token的使用量input用了19万多一点儿,output将近1万。

你可能觉得这个数据好像还行,但是这是我前两天跑的一样的项目,我整整坐着看了3个多小时,实际上模型跑了22个小时多,吃掉了将近2880万的token,一个小时1百万,非常恐怖的消耗,且很贵。

我先来说一下我最近一直在搞的这个项目,其实需求很简单,就是「爬虫+可视化+AI feature」。

但是具体的要求有点儿复杂,你看我最开始的需求很长,且包含了大量的链接。

因为我需要AI帮我做一个英国funding机会的整合站,要求它针对于每个funding主体设计一个爬虫,然后数据保存的时候要针对于数据类型的最大公约数进行设计,这个其实很trick,比如UKRI这个主体下面有好几个分部,比如EPSRC,ESRC等等,但是其他的主体就没这个东西,所以只有在获取到所有的funding信息后才能做这一步;最后做一个数据展示。

不过可惜的是,这个任务太复杂了,我直接给到这个页面,大多数的AI都会被页面里非常多的链接弄晕头,失败的有很多Claude-4-sonnet,Gemini-2.5-Pro。

所以我改变了策略,一个个的来,最后整合,我这里是在Qwen Code里面做的测试,结合Trae这个编辑器,可以很方便的比较代码历史记录。

使用方法很简单,先安装Node.js,版本要在20及以上,然后在命令行输入这两行代码。

npm install -g @qwen-code/qwen-code

qwen --version

然后输入qwen就能激活下面的环境。

你需要配置下这三个参数,建议使用modelscope魔搭的API,速度很快,不过开源模型,后续会上的平台会有很多。

export OPENAI_API_KEY="your_api_key_here"
export OPENAI_BASE_URL="your_api_base_url_here"
export OPENAI_MODEL="your_api_model_here"

我的第一句Prompt是让Qwen3 Coder先了解我的主要需求,内容如下:

做一个静态网站,从我提供的funding body整合所有的funding opportunity,要用爬虫爬取,整合所有的funding机会,并且用最大公约数来展示简要和关键信息,打开之后跳转到具体的funding详细页面

这个Prompt我在Claude和Gemini那得到的反馈都是直接给我来了一套框架,里面有详细的前端代码,后端代码,爬虫代码,数据保存逻辑等,我最开始觉得这样挺专业的,但是那3个小时的时间让我发现,它的确可以生成非常多的代码,但是后面稍微一改动就是一大片,又慢又费token。

Qwen3-Coder的思考逻辑很「克制」,表现就是它并没有想着给我从哪找一套框架先放在当前的文件夹里,它的任务分解跟其他的AI类似,但是顺序不一样,它提出的是先做爬虫,然后数据存储,最后做可视化。

也是这么一提示我,才让我觉得有点儿上道了,本来不就应该这样嘛,你不得分析下数据是什么样的再去设计存储和可视化?

Qwen3-Coder拿到我给的UKRI链接后,就试着查看下了网页信息,主要目的是找里面具体的funding信息。

定位的逻辑以及结果是很准确的,把带有opportunity字眼的链接找到了。

但是有个问题,那就是只有后面两个才是我需要的信息。

但是代码写的很惊艳,那就是它“自主”的排除了opportunity/后面是空值和feed/的两种情况,保留了正确的信息。

这一点儿我是没有告诉它的,非常聪明。

因为我这里有一个Claude Code的对比,对于同样的任务,Claude设计了一个很复杂的逻辑,但其实结果很不理想,第一页有10个funding机会,它每次都只能找到6,7个。

接下来它开始执行爬虫操作,这里碰到个问题,那就是代码运行没报错,但是也没有返回任何有用的信息。

这个挺正常的,因为爬虫总是需要修改几次的,但是Qwen3-Coder的操作让我有点儿大开眼界,它在之前的网页分析中得知UKRI是有feed的,然后它竟然很聪明的测试了下feed,结果可行。

所以它就直接重构了代码用feed来获取funding信息,结果不出意外的成功了,爬到的内容用json格式来保存,都没问题。

就这一点儿,我这两天各种Agent试过不下20次,没有一个找到用feed这个方法的。

接下来的网页可视化没问题,这一点儿对于绝大多数的AI都很简单,但是有个问题,那就是它只爬取到了20个信息,而实际上UKRI的网站上有超过100+项目,然后我就提出了这个问题。

Qwen3-Coder的反应的也很快,它做了两个操作(1)看看Feed最大的数量是多少,结果是20,所以这条路走不通了 (2)尝试返回到老办法,网页直接获取。

它接下来的操作是环环相扣的,可以很清楚的看到Agent需要的“感知-规划-行动”的循环一直都在,它行动的每一步都进行了细致的思考与调整。

这是最后做的半成品,从界面美观度,说实话不如Claude做的那么花里胡哨,但是对于一个信息集合站来说也足够了。

因为让我惊喜的是这一步,就是在我点击了其中一个funding后,它不是直接跳转到真实的地址,而是有个中间步,就是类似于对于这个funding的简要描述。

我觉得这个好的点有两个:首先我没有说,它这么做说明它“自主“的觉得这样好,其次就是我本来就打算加一个AI功能,就是调用AI工具对funding先进行初步的分析和筛选,最后做一个匹配。

那么多出来这一步,其实就是放AI分析的好去处。

与Qwen3-Coder的这次协作编程,整体体验下来非常流畅高效。首先它的任务成功率很高,处理长上下文的能力也很强。但最让我惊喜的,还是它对我编程意图的把握——基于这种深刻理解,它做出的几次“自主”决策,其精准度和前瞻性都相当出色。凭借如此卓越的表现,再结合其开源这一关键优势,我认为Qwen3-Coder已经具备了真正撼动Claude-4系列在编程领域领先地位的巨大潜力。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
医生:肝癌最危险信号,不是腹痛,而是频繁出现这几种异常

医生:肝癌最危险信号,不是腹痛,而是频繁出现这几种异常

芹姐说生活
2026-04-21 16:24:11
联合国秘书长发言人在记者会上用中文问好 并表示希望联合国的多语种服务越来越好

联合国秘书长发言人在记者会上用中文问好 并表示希望联合国的多语种服务越来越好

每日经济新闻
2026-04-21 14:32:56
有没有人敢爆自己的瓜?网友:确定玩这么大吗?

有没有人敢爆自己的瓜?网友:确定玩这么大吗?

夜深爱杂谈
2026-02-18 20:55:58
研究表明:男性嫖娼率6.4%,女性出轨率15%,且越有钱越开放!

研究表明:男性嫖娼率6.4%,女性出轨率15%,且越有钱越开放!

黯泉
2026-04-01 17:28:39
全网震惊!买超暗度陈仓被戳穿,邵晴是幌子,真嫂子身份浮出水面

全网震惊!买超暗度陈仓被戳穿,邵晴是幌子,真嫂子身份浮出水面

一盅情怀
2026-04-21 19:22:53
存款大局已定!若无意外,2026年银行利率或将迎来4大变化

存款大局已定!若无意外,2026年银行利率或将迎来4大变化

复转这些年
2026-04-21 18:33:57
四川突放大招!27家银行同一天解散,储户存款怎么办?

四川突放大招!27家银行同一天解散,储户存款怎么办?

说故事的阿袭
2026-04-21 16:56:44
白人女性与黑人女性的体味差异,网友真实分享引发热议

白人女性与黑人女性的体味差异,网友真实分享引发热议

特约前排观众
2025-12-22 00:20:06
德国前女足球员塔玛拉在生下二娃几天后不幸离世,年仅32岁

德国前女足球员塔玛拉在生下二娃几天后不幸离世,年仅32岁

懂球帝
2026-04-21 10:23:08
Opta更新英超降级概率:热刺升至58.3%,西汉姆联36.9%

Opta更新英超降级概率:热刺升至58.3%,西汉姆联36.9%

懂球帝
2026-04-22 01:35:10
林涛卸任国务院副秘书长,已任厦门市委书记(附简历)

林涛卸任国务院副秘书长,已任厦门市委书记(附简历)

中国城市报
2026-04-21 22:11:52
两性关系:不管你信不信,女性过了56岁后,基本都有这5个现状

两性关系:不管你信不信,女性过了56岁后,基本都有这5个现状

娱乐洞察点点
2026-04-22 00:03:09
浦东机场坐出租车,被“转包”后遭“天价车费”!司机不开发票,驾车撞人

浦东机场坐出租车,被“转包”后遭“天价车费”!司机不开发票,驾车撞人

新民晚报
2026-04-21 18:29:27
正式复出?杜兰特发声,官宣决定,右膝伤情曝光,谁注意训练情况

正式复出?杜兰特发声,官宣决定,右膝伤情曝光,谁注意训练情况

天光破云来
2026-04-22 00:32:24
普通家庭千万不要买“小联排别墅”,看着很高级,住着却难受!

普通家庭千万不要买“小联排别墅”,看着很高级,住着却难受!

装修秀
2026-04-20 10:50:03
歼10直飞伊朗,美以都没敢拦!谁也没想到,背后藏着一个天大的局

歼10直飞伊朗,美以都没敢拦!谁也没想到,背后藏着一个天大的局

寻墨阁
2026-04-20 18:51:46
美国开始退钱了:涉33万企业1650亿美元,多数涉及中国

美国开始退钱了:涉33万企业1650亿美元,多数涉及中国

观察者网
2026-04-21 10:56:03
真相找到了!3月我国低价给日本出口天然气,其实是一场中转误会

真相找到了!3月我国低价给日本出口天然气,其实是一场中转误会

南生今世说
2026-04-21 18:59:12
A股:刚刚,国务院重磅发布,释放一信号,明日很可能迎来新变化

A股:刚刚,国务院重磅发布,释放一信号,明日很可能迎来新变化

另子维爱读史
2026-04-21 19:57:07
特朗普已做好开战准备?王毅曾警告:中美一旦冲突,结局只剩一个

特朗普已做好开战准备?王毅曾警告:中美一旦冲突,结局只剩一个

蜉蝣说
2026-04-21 11:23:11
2026-04-22 01:52:49
平凡AI incentive-icons
平凡AI
高校AI从业者
70文章数 24关注度
往期回顾 全部

科技要闻

创造4万亿帝国、访华20次,库克留下了什么

头条要闻

三国取消飞航许可 赖清德无法窜访斯威士兰

头条要闻

三国取消飞航许可 赖清德无法窜访斯威士兰

体育要闻

一到NBA季后赛,四届DPOY就成了主角

娱乐要闻

宋承炫晒宝宝B超照,宣布老婆怀孕

财经要闻

现实是最大的荒诞:千亿平台的冲突始末

汽车要闻

全新坦克700正式上市 售价42.8万-50.8万元

态度原创

教育
时尚
健康
游戏
本地

教育要闻

对不起,我有点“抠”

顶流复工,已判若两人

干细胞抗衰4大误区,90%的人都中招

涨价两周即回调!索尼官方PS5数字版定价重回399美元

本地新闻

春色满城关不住|白鹃梅浪漫盛放,吴山藏了一片四月雪

无障碍浏览 进入关怀版