网易首页 > 网易号 > 正文 申请入驻

元石科技正式发布问小白5,性能直追GPT-5

0
分享至

机器之心发布

机器之心编辑部

本月初,AI 圈翘首以盼的 GPT-5 终于问世,在数学、实际编程、多模态理解、推理等多个领域实现了新的 SOTA。

与此同时,国内厂商也在全力加速,持续迭代自研模型与技术栈,力求在全球竞逐中不落下风。

今日,国产 AI 厂商元石科技重磅推出「All in One」旗舰模型 —— 问小白 5,成为其迄今为止最智能、最快捷、最实用的 AI 系统。尤其值得强调的是:问小白 5 的各项基准测试榜单成绩最接近 GPT-5,这使其成为当前国产大模型中最具代表性的对标者。

而得益于全方位增强的模型能力,问小白 5 在智能水平上实现了重大突破,可以在生活、学习、金融、科技等领域提供更实用、更专业的解答。

同时,作为一个统一的系统(All in One),问小白 5 能够智能识别何时快速响应,何时需要更长时间的思考。这种「动态思维模式」让用户无需在不同模式之间切换,既能满足日常的高效问答,又能在专业任务中提供专家级的回答。

目前,问小白 5 已经面向所有用户开放,访问官网 wenxiaobai.com 或更新 App 至最新版即可体验。



性能直追 GPT-5

国产大模型新标杆来了

大模型是否真正具备了「顶级实力」,还要看它们在权威测试中的 PK 成绩。

AA-Index是一个综合性的 AI 基准评估指标,通过整合数学推理、科学问答、编码与语言理解等多个维度,为全世界共 228 款大模型提供了统一、全面、有信度的智能能力比较参考,便于科学、公正地评估模型整体表现。

结果显示,问小白 5 以64.7 分的 AA-Index 指标超过 Gemini2.5 Pro ,并成为智能水平最接近 GPT-5 的国产 AI 大模型



另外,在STEM、前沿知识、代码编程、指令遵循等细分领域,问小白 5 的表现尤为亮眼,从而在复杂推理和结构化等多样化任务中展现出了更强的稳定性。

STEM 能力:深度推理与专业知识融合

STEM涵盖了全美数学竞赛(AIME)与博士级学科知识推理(GPQA),是顶尖模型(以 GPT-5 为代表)衡量其复杂逻辑推理能力核心突破的关键评测。

问小白 5 以86 分的 STEM 成绩接近全球领先的 GPT-5。



前沿知识能力:人类终极学术挑战

前沿知识能力旨在衡量模型能否在人类知识边界进行探索、辅助科学发现,这是以 GPT-5 为代表的顶尖模型致力于实现的核心价值。而「人类终极学术挑战」(HLE)便是评估这一能力的权威基准。

问小白 5 在代表前沿知识能力(HLE)的基准测试中,进一步将国产大模型的智能水平提升到17.7 分,展现了其在深度理解和真实推理能力上的优异能力,仅次于最强的 GPT-5。



代码编程能力:新基准更专业更显实力

LiveCodeBench作为一个高难度、抗数据污染的基准,旨在真实评测模型「思考 - 编码 - 验证」的端到端解题能力,并强调最终代码的稳健性与可执行性。

在此项评测中,问小白 5 以79.2的成绩脱颖而出。



指令遵循:精准遵循未知指令的泛化能力

IFBench(Instruction Following Benchmark)通过评测模型对新颖、未知指令的泛化能力,直击大模型指令过拟合的核心痛点,而这正是 AI 实用性的关键体现。行业标杆 GPT-5 在此能力上表现卓越。

在 IFBench 的严苛测试中,问小白 5 以58.1 分的成绩,不仅大幅领先国内其他顶尖模型,更在全球范围内展现出强大的竞争力。这一分数直观地证明了其卓越的指令遵循泛化能力,是其能够精准可靠、值得信赖的核心体现。



对于广大用户而言,问小白 5 的出现无疑提供了又一个更强大的国产大模型选项。

国产全能 AI 搭子

陪写、陪聊、陪干活

随着模型能力的持续提升,问小白 5 展现出了面向实际应用场景的广泛适用性以及处理现实问题的更强实用性。在包括学科知识、写作、办公、角色扮演、编程、分析规划和医疗健康在内的各个领域,它都能轻松拿捏。

从学术尖端到生活日常,问小白 5 展现了 GPT-5 级全能实力,且在中文环境下,问小白 5 更懂用户!

职场助手

问小白 5 像是一位周到的专业伙伴,擅长从繁杂的日常任务中快速识别重点,并在多线程任务管理、会议材料整理、跨部门沟通支持与项目进度跟踪等场景中,成为用户值得信赖的得力助手。比如入职体检报告的审查:

Prompt:这是即将入职员工的入职体检报告,请协助我理解并总结出体检结果,是否符合国家规定的用人健康需求。



运营分析

问小白 5 对海量数据的深度挖掘与多维度解读能力,使其能够在行为解读、活动效果复盘、渠道 ROI 优化与市场趋势研判等场景中,成为用户敏锐且高效的数据决策伙伴。

有了问小白 5,工作中的各种难题将迎刃而解。比如在订阅制产品中的收入预测与用户留存分析:

Prompt:我是一个出海 AI 产品,现有 8,000 名月度订阅会员,会员费 30 美元 / 月,平均每月流失率为 7%。若通过三种策略(改进注册体验、推出季度会员折扣、优化流失用户推送通知)将流失率降低至 6% 或 5%,模拟未来 12 个月内对月度总收入(MRR)的影响。



角色扮演

角色扮演是 AI 时代专属的私密游戏,在大模型的帮助下可以一秒切换人生剧本!

有了问小白 5,无论是霸道总裁、历史人物、都市游戏,还是奇幻精灵,它都能精准代入。并且,我们还可以和「小白」来一场沉浸式恋爱游戏。

Prompt:小白,请您扮演活泼外向的女生,渴望甜蜜恋爱。通过日常对话积累好感度(初始 1 / 上限 600),随好感升级关系:陌生人→好友→恋人→夫妻。用口语化中文回复。触发随机剧情时标注 "触发",添加场景描写与内心戏,用 emoji 表达情绪。现在往我们开始吧。



学科知识

在学术研究和知识探索场景中,问小白 5 宛如一位博学而高效的学术搭档,善于将庞杂信息精准解析,并转化为层次分明、逻辑严谨的知识体系,为科研工作者和学习者提供更高效的支持。

因此,在教学辅助、学术研究、技术解读与跨领域学习等场景中,问小白 5 可以充分发挥智能助手的作用。

Prompt:这是问小白技术团队荣获 ACL 2025 TOP26 杰出论文奖的论文,请帮我总结识别文献中的理论框架和模型,分析它们如何支持货挑战现有知识体系。



最后,问小白 5 的 API 合作通道即将开启,欢迎邮件联系:wenxiaobai@ai123.ink

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
地主王学文救起晕倒的女红军,她拉开衣襟的那刻,王学文吓一跳

地主王学文救起晕倒的女红军,她拉开衣襟的那刻,王学文吓一跳

磊子讲史
2026-01-06 10:38:15
俾路支武装发动大规模突袭,巴基斯坦公布最新伤亡数据

俾路支武装发动大规模突袭,巴基斯坦公布最新伤亡数据

兵国大事
2026-02-01 18:15:54
历代皇室为何把王莽的头颅当宝贝,前后收藏了272年,它有何特别

历代皇室为何把王莽的头颅当宝贝,前后收藏了272年,它有何特别

千秋文化
2026-01-30 21:47:10
全是假的!涉及多个品牌,检测结果触目惊心!很多人家里老人、小孩都在吃...

全是假的!涉及多个品牌,检测结果触目惊心!很多人家里老人、小孩都在吃...

上观新闻
2026-02-01 18:29:09
江诗丹顿手表1元起拍,因“未达到保留价”流拍,拍卖公司人员回应:起拍价是处置单位设定

江诗丹顿手表1元起拍,因“未达到保留价”流拍,拍卖公司人员回应:起拍价是处置单位设定

红星资本局
2026-02-01 15:24:17
亲家有没有钱,一看便知:没钱的亲家,大多有以下4个坏习惯

亲家有没有钱,一看便知:没钱的亲家,大多有以下4个坏习惯

千秋文化
2025-12-03 10:05:36
《楚门的世界》《盗梦空间》等25部影片入选“美国国宝”

《楚门的世界》《盗梦空间》等25部影片入选“美国国宝”

澎湃新闻
2026-02-02 15:45:05
2026春节档将陆续有十部电影上映,周星驰两部,你期待哪几部?

2026春节档将陆续有十部电影上映,周星驰两部,你期待哪几部?

小Q侃电影
2026-01-30 19:02:29
20年来首次动刀!带薪年假或增至10天起,条例修订只是个开始?

20年来首次动刀!带薪年假或增至10天起,条例修订只是个开始?

boss外传
2026-02-01 18:00:03
新首相基本确定?高市就赌中国会认栽,话音刚落,俄出手教训日本

新首相基本确定?高市就赌中国会认栽,话音刚落,俄出手教训日本

妙知
2026-02-02 16:15:49
太骚了,阿什利-扬:我们都在讨论卡塞米罗的不看人传球助攻

太骚了,阿什利-扬:我们都在讨论卡塞米罗的不看人传球助攻

懂球帝
2026-02-02 14:55:18
一箱油半箱税,电车零成本上路?2026年政策调整,油电公平来了?

一箱油半箱税,电车零成本上路?2026年政策调整,油电公平来了?

现代小青青慕慕
2026-01-18 13:52:27
幸亏汪小菲带孩子走了!大S墓碑正面曝光,具俊晔的小心机藏不住了

幸亏汪小菲带孩子走了!大S墓碑正面曝光,具俊晔的小心机藏不住了

八星人
2026-02-02 09:15:44
刚跟中国签完协议,斯塔默就面临下台风险,51%民调要求立刻解职

刚跟中国签完协议,斯塔默就面临下台风险,51%民调要求立刻解职

素年文史
2026-02-01 20:40:17
郑爽彻底垮了!抱娃与张恒当街互撕,穿搭邋遢状态诡异疑精神失常

郑爽彻底垮了!抱娃与张恒当街互撕,穿搭邋遢状态诡异疑精神失常

八卦王者
2026-02-01 21:14:07
爷爷每年给孙子买生肖金条,目前已买8根,称“无论金价涨跌都要买,想留点东西给他”

爷爷每年给孙子买生肖金条,目前已买8根,称“无论金价涨跌都要买,想留点东西给他”

极目新闻
2026-02-02 14:24:54
《环球时报》记者独家连线格陵兰岛居民:“我们对美国的认知已发生永久性改变”

《环球时报》记者独家连线格陵兰岛居民:“我们对美国的认知已发生永久性改变”

环球网资讯
2026-02-02 06:55:05
历史正重演!当美国演起苏联,中国却玩回了美国的剧本?

历史正重演!当美国演起苏联,中国却玩回了美国的剧本?

风云人物看历史
2026-01-31 16:49:08
莱昂纳德100%递补入选全明星!首次世界队VS美国队就有BUG!

莱昂纳德100%递补入选全明星!首次世界队VS美国队就有BUG!

篮球大图
2026-02-02 08:27:55
一家七口离奇失踪,聋哑父亲坚守18年等到大儿子:是妈妈把我卖了

一家七口离奇失踪,聋哑父亲坚守18年等到大儿子:是妈妈把我卖了

牧愚君
2024-02-24 16:27:27
2026-02-02 19:39:00
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12238文章数 142562关注度
往期回顾 全部

科技要闻

阿里筑墙,腾讯寄生,字节偷家

头条要闻

捧红王菲、那英的袁惟仁走了 曾被陶晶莹公开调侃

头条要闻

捧红王菲、那英的袁惟仁走了 曾被陶晶莹公开调侃

体育要闻

澳网男单决赛,属于阿尔卡拉斯的加冕仪式

娱乐要闻

57岁音乐人袁惟仁去世,家属发文悼念

财经要闻

金银暴跌 全球股市遭遇“黑色星期一”

汽车要闻

雷克萨斯LC500将于今年底停产 "最美雷克萨斯"谢幕

态度原创

房产
艺术
健康
教育
军事航空

房产要闻

狂卖1548亿后,海南又上演疯狂抢地!

艺术要闻

马斯克花5万买的折叠屋,是预制住宅的未来吗?

耳石症分类型,症状大不同

教育要闻

女大学生每月要3000生活费,被拒后威胁父母:不给我就自己想办法

军事要闻

委内瑞拉外长会见美外交使团团长

无障碍浏览 进入关怀版