网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

通义实验室推出通用智能体评测基准PawBench

2026-06-05 18:52:13　来源: 财闻

上海举报

0

分享至

6月5日，通义实验室推出评测基准PawBench，v1.0版本已开源。它面向个人助理与通用智能体场景，将底座模型与运行框架（Harness）纳入同一评测体系。据介绍，PawBench不是单纯做一个模型排行榜，而是把“模型、Harness、任务”三者放在一起做交叉评测。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

兄弟俩开货车跑货运，在高速上偶遇许久未见同为货车司机的老爸。网友：希望天下所有的爸爸都平平安安！

环球网资讯 2026-06-27 14:04:20
153 跟贴 153
小组第三排名跌至第8位韩国队已命悬一线

封面新闻 2026-06-27 13:54:11
2895 跟贴 2895

我国核聚变堆超导磁体研发取得重要突破

新京报 2026-06-27 10:12:23
2234 跟贴 2234

演员王安宇发布登报声明：本人王安宇，不慎遗失中国传媒大学本科毕业证书和学位证书，现声明作废

都市快报橙柿互动 2026-06-27 16:07:41
801 跟贴 801
卢卡申科“突然”飞抵俄罗斯

上观新闻 2026-06-27 13:05:52
925 跟贴 925

山姆，又出事了！“蠕动的虫子！”

今晚报 2026-06-27 17:03:00
1037 跟贴 1037

最新：河南省内外高校在豫招生预估分数线汇总

大象新闻 2026-06-27 11:02:16
201 跟贴 201
小姑娘上一次哭得眼眶通红，下一场直接飒爽过桩。最后的回眸惊艳众人！

学申论的谈妹 2026-06-27 20:52:49
105 跟贴 105

中国代表：绝不允许“新型军国主义”成势为患

新华社 2026-06-27 14:25:20
1099 跟贴 1099
欧洲热浪已致上百人死亡，为什么不开空调？

中国能源网 2026-06-25 10:05:41
1208 跟贴 1208
名记：伦纳德已表明他不愿意与活塞签下续约合同

北青网-北京青年报 2026-06-27 12:56:20
241 跟贴 241
陕西省人民政府关于李曙升任职的通知

陕西省人民政府网站 2026-06-28 06:54:06
22 跟贴 22
成渝巴士正式开通运营：单程50元/人，每日7:00至18:00发班

封面新闻 2026-06-27 15:53:12
278 跟贴 278
Siegel：湖人不会在自由球员市场上不惜一切代价留住詹姆斯

北青网-北京青年报 2026-06-27 12:56:07
336 跟贴 336
中国反制裁工具箱将增添"新利器"

澎湃新闻 2026-06-27 16:21:28
65 跟贴 65
中俄空军在日本海等空域联合巡航

新京报 2026-06-27 17:49:52
360 跟贴 360
志愿填报大家谈城市、学校、专业，填报志愿优先考虑哪个

中国青年报 2026-06-27 18:04:14
44 跟贴 44
比亚迪荣膺可持续发展国际大奖，闪充技术赋能马可波罗新丝路

大象新闻 2026-06-27 19:18:03
101 跟贴 101
中国海军83舰编队结束对俄罗斯友好访问

环球网资讯 2026-06-27 10:48:13
117 跟贴 117
第38届大众电影百花奖投票正火热进行

中国电影报 2026-06-26 12:41:53
6 跟贴 6
30岁男子深夜赶海被海浪卷走漂流8小时后游上岸

闪电新闻 2026-06-28 09:07:22
0 跟贴 0
东鹏辟谣董事长不喝自家饮料，消费者真正关心的是健康问题

映射生活的身影 2026-06-28 09:12:41
0 跟贴 0
男子在马路上遭两车“夹击”！这些离谱行为可能会让你陷入危险

武汉消防 2026-06-28 09:07:47
0 跟贴 0
200万粉丝网红诋毁袁隆平成果，中国食品报痛批

齐鲁壹点 2026-06-28 09:11:15
0 跟贴 0

我老公不知道算不算厉害，86年的，40岁了，初中没有毕业

我老公不知道算不算厉害，86年的，40岁了，初中没有毕业

游戏收藏指南

2026-06-28 08:58:45

高志凯“爱国赛道”弯道超车，直接超越金灿荣、张维为两位前辈

高志凯“爱国赛道”弯道超车，直接超越金灿荣、张维为两位前辈

壹家言

2026-06-28 07:02:39

瞒不住了！台海都是假象，美国真正的恶仗，已经打到中国家门口

瞒不住了！台海都是假象，美国真正的恶仗，已经打到中国家门口

倔强旳牵强

2026-06-26 20:46:18

提拔的代价。37岁，之前P7还能苟3年，升职P8后一年被裁

提拔的代价。37岁，之前P7还能苟3年，升职P8后一年被裁

蚂蚁大喇叭

2026-06-27 17:47:45

Stein：约基奇可能将续约谈判推迟至2027年

Stein：约基奇可能将续约谈判推迟至2027年

北青网-北京青年报

2026-06-28 07:56:06

WTT美国大满贯：男单首场大爆冷！世界冠军2:3被淘汰，国乒2连胜

WTT美国大满贯：男单首场大爆冷！世界冠军2:3被淘汰，国乒2连胜

国乒二三事

2026-06-27 13:12:47

南大博士发帖怒斥韩红！此前她感慨遭遇“最冷酷无情的人世间”

南大博士发帖怒斥韩红！此前她感慨遭遇“最冷酷无情的人世间”

火山詩话

2026-06-27 15:08:14

双标玩到极致！法国报社劝民众别装空调不环保，自己大楼空调全开

双标玩到极致！法国报社劝民众别装空调不环保，自己大楼空调全开

魔都姐姐杂谈

2026-06-27 17:46:23

随着比利时5-1，伊朗1-1，世界杯最新积分榜出炉

随着比利时5-1，伊朗1-1，世界杯最新积分榜出炉

侧身凌空斩

2026-06-27 13:07:54

原来他们是两口子，曾大红大紫却丁克一辈子，如今都住上海养老院

原来他们是两口子，曾大红大紫却丁克一辈子，如今都住上海养老院

叹为观止易

2026-06-28 05:42:57

国米牺牲速度只求性价比：两笔交易放缓两名豪门级新援再出传闻

国米牺牲速度只求性价比：两笔交易放缓两名豪门级新援再出传闻

国际足球冷雪

2026-06-28 09:19:10

“开家长会怎么办？”另类小情侣被嘲，孩子出生自带“满背”！

“开家长会怎么办？”另类小情侣被嘲，孩子出生自带“满背”！

林林先生

2026-06-21 10:10:03

复旦大学教授：基因检测证实，成吉思汗很可能是汉高祖刘邦的后代

复旦大学教授：基因检测证实，成吉思汗很可能是汉高祖刘邦的后代

青史卷中人

2026-06-28 00:40:24

网红黄一鸣账号已被封禁，近日因宠物狗未牵绳与路人发生冲突，争执中曾说“我是百万网红”“我要把你发到网上”

网红黄一鸣账号已被封禁，近日因宠物狗未牵绳与路人发生冲突，争执中曾说“我是百万网红”“我要把你发到网上”

洪观新闻

2026-06-25 15:44:55

巴西VS日本！谁能赢？罗纳尔多给出了1个答案

巴西VS日本！谁能赢？罗纳尔多给出了1个答案

体育哲人

2026-06-27 22:04:01

1-0，0-0！世界杯悲喜两重天，伟大奇迹正式诞生，韩国却坐享其成

1-0，0-0！世界杯悲喜两重天，伟大奇迹正式诞生，韩国却坐享其成

海棠尝金桔

2026-06-27 13:23:52

加纳巫医：世界杯属于C罗和葡萄牙；下咒时误伤到土耳其

加纳巫医：世界杯属于C罗和葡萄牙；下咒时误伤到土耳其

懂球帝

2026-06-27 12:44:22

黄植诚婚后妻子赴美失联，宅院连夜查封，屋内究竟搜到何物

黄植诚婚后妻子赴美失联，宅院连夜查封，屋内究竟搜到何物

磊子讲史

2026-06-23 12:00:56

维斯塔潘撞车改变一切！拉塞尔意外夺杆，安东内利：我看错了

维斯塔潘撞车改变一切！拉塞尔意外夺杆，安东内利：我看错了

体育妞世界

2026-06-28 07:12:58

世界杯疯狂一夜：英格兰头名加纳战平，韩国已确定出局

世界杯疯狂一夜：英格兰头名加纳战平，韩国已确定出局

赵或是个热血青年

2026-06-28 07:17:57

财闻APP官方账号

63428文章数 10715关注度

往期回顾全部

科技要闻

DeepSeek最新论文：如何让大模型跑得更快

头条要闻

热浪席卷欧洲网友一家出游落地当天妈妈就脱水进医院

头条要闻

热浪席卷欧洲网友一家出游落地当天妈妈就脱水进医院

体育要闻

世界杯最火门将，站到了阿根廷和梅西面前

娱乐要闻

四提白玉兰终封后，杨紫：仍觉不真实

财经要闻

两只股票撑起的韩国股市，半年熔断 33 次

汽车要闻

搭载华为乾崑ADS 5 全新猛士M817上市售29.99万起

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

家居

时尚

艺术

手机

公开课

家居要闻

绿意盎然自然之境

今年夏天被“这件单品”刷屏，时髦又气质！

艺术要闻

看完他的局部，我原谅了整个世界的不完美

手机要闻

用回收内存省成本，这款复古手机降价了

公开课

李玫瑾：为什么性格比能力更重要？

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版