网易首页 > 网易号 > 正文 申请入驻

测完阿里最强开源模型 Qwen3 和通义 APP,我最想推荐给身边人的AI变了

0
分享至

4月29日凌晨,阿里巴巴开源新一代通义千问模型 Qwen3,参数量仅为DeepSeek-R1 的1/3,成本大幅下降。

我自己衡量大模型会看三个点:成本、效率、体验。

忽略成本谈体验,都是耍流氓。

真正的开发者和普通用户,不仅会看哪个模型结果好,还会看哪个产品功能丰富,更会在意要花多少算力、多少钱、多长时间。

从数据来看,Qwen3 性能指标全面超越 R1、OpenAI-o1 等全球顶尖模型,登顶全球最强开源模型。

体验链接:http://chat.qwenlm.ai

在 DeepSeek R2 出来之前,Qwen3 的模型能力是明确领先的,产品能力更是有跨越式优势的。

比如 Qwen3 除了文字、代码、数学,还有视频、绘画等能力和日常高频的场景预设。

先看几个视频效果:


Prompt:一只胖胖的卡皮巴拉在吃草


Prompt:阳光透过树林和绿叶洒下来


Prompt:火车穿越金黄的田野驶来


Prompt:跳动的柴火


Prompt:松鼠在落叶中演奏摇滚乐


Prompt:两个女人表面微笑实则想杀了对方

推理能力、数据计算、代码能力等等,已经有不少朋友测试过了,是 Qwen3 的优势强项。

而相对不引人注意的视频生成能力,看效果也已经达到了第一梯队。

手机上通义APP也是满血版,最新Qwen3模型生视频任意用

关键还是不限次数,开源免费的啊!!

市面上哪还有生图、生视频产品,能不限制免费使用的。

真的用起来,只有一个感受:真香!

日常其他场景,体感上效果可以说是又快又好。比如我想研究一下 Agent 与 MCP 的关系:

思路很清晰,严谨,结果的完整度很高,还可以根据想要更快/更多思考,选择需要的思考量。

比如有时候就想要一个直来直去的简单回答,或者希望秒出答案也也给出思考过程,调节“思考长度”就很合适。

在更长的“思考长度”下,Qwen3 会执行更多中间步骤,如分解问题、逐步推导、验证答案等,给出更深思熟虑的答案;而在“非推理模式”下,模型会直接生成答案。

同一个问题,Qwen 3 可以完成“快思考”和“慢思考”,这类似于人类在回答简单问题时,凭经验或直觉快速作答,面对复杂难题时再深思熟虑,仔细思考给出答案。

比如下面就是 Qwen3 一键生成的介绍自己的卡片效果:

回答数学、地理交叉学科的问题,Qwen3 也可以表现的很好:

比如下面这道题,曾难倒一众大模型:

“一架飞机从北京起飞,先向北飞了 1000 公里,再向西飞了 1000 公里,再向南飞了 1000 公里,再向东飞了 1000 公里,这架飞机可以飞回北京吗?”

由于地球是个球体,纬线长度随纬度升高而变短,因此按照题目规定的路径,飞机是无法飞回原地的。

Qwen3 调用数学和地理知识,不仅回答正确,还给出了扩展思考。

如果我是老师的话,我肯定要给 Qwen 更多分,公式步骤更全,计算过程更详细。

日常问题的话,在通义APP上打字会更快、更方便顺手。

再来一道弱智吧的题目:买一台三千块左右的电脑大概需要多少钱?

Qwen3 注意到了题目中存在的矛盾 —— 提到了「三千块左右 」的预算,但又问「大概需要多少钱 」,由此猜测是用户想了解电脑价格或配置。

于是,Qwen3 列出了 3000 元能买到笔记本、台式机和组装台式机,分别介绍了它们的机型、配置和缺点,并以表格的形式给出了总结建议。

拿《2024年高考全国甲卷数学(理)》试题再来试一下。

答案也是完全正确。结果就是 、

要知道,设计和训练混合推理模型的难度,是远超单纯的推理模型的。

训练混合推理模型,有复杂的机制,相当于模型要学习两种不同的输出分布,要做到两个模式融合且基本不影响任何一种模式下的效果,很考验训练过程的训练策略。

最终的效果也就是,Qwen3 在具体问题的表现上更好。

除了生产力和生活使用,我还试了一下一些有意思的小话题。

比如:将“I love Qwen3-235B-A22B”这句话的所有内容反过来写

这个问题很多模型会出现CoT的问题,造成幻觉或者莫名其妙的奇葩回答。

但 Qwen3全部都对了。

再比如脑筋急转弯一类的问题:“小红有2个兄弟,3个姐妹,那么小红的兄弟有几个姐妹?”

推理过程和最终答案也都没问题。可见不同的几类细分Qwen3模型,在基本表现上都是优秀线以上。

像之前我常测试的生成天气预告卡片、贪吃蛇等等,对于Qwen3来说已经是基本操作了。

Prompt:创建一个 HTML 文件,包含 CSS 和 JavaScript,用来生成动画天气卡片,卡片用不同的动画形式直观地表示以下天气状况:风 (例如移动的云、摇曳的树木)、雨 (例如落下的雨滴)、太阳 (例如闪耀的光线)、雪 (例如飘落的雪花、积雪),并排显示所有卡片,底部有一个漂亮的按钮可以切换动画速度。

Qwen3 几乎是秒出代码,速度非常快,在处理简单任务时显然有自己的算力分配逻辑。

再比如下面这个小球游戏:

Prompt:编写一个 Python 程序,展示一个球在旋转的六边形内弹跳。球应受到重力的影响,并且必须真实地反弹到旋转的墙壁上。

有一说一,这个小球在旋转六边形里弹跳的程序,Qwen3 编得真不错,既没有出现小球掉出来的情况,也没有弹跳角度不合理或者程序卡死的情况。

经典的贪吃蛇小游戏也完成得很顺利,也是秒出,就是审美很像80年代电脑界面,想要更好看的话Prompt要更长更细致一点。

我又尝试了一些好玩的,比如生成一个表情小游戏,提示词来自 @甲木

请你扮演一个Web游戏开发者。设计并生成一个**表情符号反应堆 **的游戏。 1、核心创意: 一个快节奏的反应游戏。屏幕上会快速闪过一个目标表情符号(例如:笑脸),下方会同时出现3-4个选项表情符号,玩家需要在限定时间内(例如1-2秒)点击与目标匹配的那个表情符号。 2、玩法: - 屏幕中央显示目标Emoji。 - 下方按钮区域快速刷新3-4个Emoji选项,其中一个是正确的。 - 玩家需在计时条走完前点击正确的Emoji。 - 点击正确得分,速度加快;点击错误或超时则游戏结束(或扣除生命值)。 - 显示最高分。 3、技术实现 (HTML/JS/CSS): - HTML: 用于显示目标Emoji、选项按钮、计时条、得分。 - CSS: 设计简洁明快的界面,计时条动画。 - JavaScript: 存储一个Emoji列表。 随机选择目标Emoji和干扰项。 动态更新按钮内容。 实现计时器逻辑和倒计时动画。 处理点击事件,判断对错,更新得分/状态。 控制游戏节奏(逐渐加快)。 4、趣味点: 简单上手,考验反应速度,利用通用的Emoji增加亲和力和趣味性,适合碎片时间玩。
Qwen3-235B-A22B think

再来一个小游戏,同样是甲木的提示词:

请你扮演一个Web游戏开发者。设计并生成一个**单一的HTML文件**,使用HTML Canvas、CSS和JavaScript,制作一个简单的像素风格宠物收集小游戏。 **重点要求:** 1、一定要注意审美,做出来的网页要有美感。 2、页面要有设计感,有足够的传播度 **要求:** 1.  **游戏内容 (由你生成):**     *   **游戏名称:** (例如:“像素爪爪接星星” 或 “方块萌宠大作战”)     *   **宠物描述:** 描述一个简单的像素宠物形象(可以用文字描述其构成,例如“一个10x10像素的橙色方块身体,上方有两个小三角形耳朵”),并给它起个名字。     *   **玩法说明:** 简要说明如何用左右箭头键移动宠物,目标是接住从上方掉落的“金元宝”(或其他像素物品),并显示得分。 2.  **HTML结构:**     *   包含标题、宠物描述和玩法说明。     *   一个 ` ` 元素 (`id= "gameCanvas"`) 用于绘制游戏。     *   一个区域 (`id="score"`) 显示当前得分。 3.  **CSS样式 (内部 `

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
突发!伊朗大规模导弹袭击,全球市场应声跳水

突发!伊朗大规模导弹袭击,全球市场应声跳水

魏家东
2026-04-07 14:12:21
“还真把自己当盘菜了”,北京职高女被全网嘲笑,含金量0人买单

“还真把自己当盘菜了”,北京职高女被全网嘲笑,含金量0人买单

朗威谈星座
2026-04-07 16:58:24
我的妈呀!梁静茹怎么会变成这样?好像那艺娜啊!

我的妈呀!梁静茹怎么会变成这样?好像那艺娜啊!

动物奇奇怪怪
2026-04-07 16:40:51
决定中国国运时刻马上就到来,撑过去就是胜利,但是警惕内鬼破坏

决定中国国运时刻马上就到来,撑过去就是胜利,但是警惕内鬼破坏

誮惜颜a
2026-04-07 16:57:55
80年纪登奎主动辞去职务后,邓小平找他谈话:再继续做一些工作吧

80年纪登奎主动辞去职务后,邓小平找他谈话:再继续做一些工作吧

海佑讲史
2026-04-07 17:45:04
特朗普1岁混血外孙,首次公开亮相,蒂芙尼越发高调伊万卡却缺席

特朗普1岁混血外孙,首次公开亮相,蒂芙尼越发高调伊万卡却缺席

译言
2026-04-07 08:39:57
6连胜也挨骂!乌度卡怒吼申京滚回去,火箭更衣室要炸

6连胜也挨骂!乌度卡怒吼申京滚回去,火箭更衣室要炸

阿晞体育
2026-04-07 14:04:46
特朗普已做好开战准备?王毅曾警告:中美一旦冲突,结局只有一个

特朗普已做好开战准备?王毅曾警告:中美一旦冲突,结局只有一个

聚焦真实瞬间
2026-04-07 03:50:09
我发现很多不幸福的家庭,是因儿子没养家能力,还帮他结婚造成的

我发现很多不幸福的家庭,是因儿子没养家能力,还帮他结婚造成的

小马达情感故事
2026-04-06 18:55:08
为什么现在打篮球的人越来越少了?网友:社会碎片化后必然的结果

为什么现在打篮球的人越来越少了?网友:社会碎片化后必然的结果

另子维爱读史
2026-04-06 22:31:50
我们并没有用40年走完发达国家200年的路

我们并没有用40年走完发达国家200年的路

文青大叔说
2026-03-13 08:13:38
美军上校说了大实话,派B2深入中国核心区,就像派出老头乐

美军上校说了大实话,派B2深入中国核心区,就像派出老头乐

萧栝记录风土人情
2026-04-07 11:27:20
CBA常规赛4月8日6场焦点战:青岛PK残阵广东,CCTV5播广厦PK山东

CBA常规赛4月8日6场焦点战:青岛PK残阵广东,CCTV5播广厦PK山东

薇说体育
2026-04-07 15:54:57
他已任安徽一县副县长!

他已任安徽一县副县长!

凤凰网安徽
2026-04-07 16:41:37
张雪峰遗产继承浮出水面:几亿留给女儿,让全网父母破防不是钱…

张雪峰遗产继承浮出水面:几亿留给女儿,让全网父母破防不是钱…

华人星光
2026-03-29 12:22:37
新冠后遗症对人体的最大影响,很多人深受其害,有些人还不自知

新冠后遗症对人体的最大影响,很多人深受其害,有些人还不自知

呼吸科大夫胡洋
2026-02-22 11:39:12
马杜罗被捕后暴瘦13公斤

马杜罗被捕后暴瘦13公斤

烽火观天下
2026-04-07 12:34:13
博主自称在韩国读汉语言文学博士,毕业半年找不到工作,网友:太抽象了

博主自称在韩国读汉语言文学博士,毕业半年找不到工作,网友:太抽象了

可达鸭面面观
2026-04-07 13:02:01
就在所有人以为,大战即将结束的时候,伊朗突然打出了最猛导弹雨

就在所有人以为,大战即将结束的时候,伊朗突然打出了最猛导弹雨

何氽简史
2026-04-07 17:55:43
世界名画:日本男乒全队冷漠死死盯着王楚钦庆祝 张本智和呆若木鸡

世界名画:日本男乒全队冷漠死死盯着王楚钦庆祝 张本智和呆若木鸡

风过乡
2026-04-07 07:01:02
2026-04-07 19:07:00
AI异类 incentive-icons
AI异类
从硅谷到中关村,AI信息与测评
144文章数 6关注度
往期回顾 全部

科技要闻

满嘴谎言!OpenAI奥特曼黑料大起底

头条要闻

英媒:伊朗最高领袖病重昏迷 无法参与任何国家决策

头条要闻

英媒:伊朗最高领袖病重昏迷 无法参与任何国家决策

体育要闻

官宣签约“AI球员”,这支球队被骂惨了...

娱乐要闻

女首富陈丽华离世 被曝生前已分好遗产

财经要闻

10万亿财政转移支付,被谁拿走了?

汽车要闻

不止是大 极狐首款MPV问道V9静态体验

态度原创

游戏
时尚
家居
旅游
教育

劲爆大雷新作与你共探神秘小树林 面红娇羞白天可别玩

杨超越之后,全网头像锦鲤的C位被她抢走了

家居要闻

雅致惬意 感知生活之美

旅游要闻

2026年清明节假期国内出游1.35亿人次

教育要闻

可乐、鱼腥草进教室…武汉商学院这堂“食品感官分析”课,夯爆了

无障碍浏览 进入关怀版