网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

LMSYS Org 更新基准测试报告，Claude-3 超越 GPT-4

2024-03-28 16:31:15　来源: 硅星Breaknews

上海举报

0

分享至

品玩3月28日讯，LMSYS Org 近日公布最新基准测试报告，Claude-3 得分以微弱优势超越 GPT-4，成为该平台“最佳”大语言模型。

根据LMSYS Org 旗下的基准测试平台 Chatbot Arena显示，Anthropic 的 Claude 3 Opus 以 1253 比 1251 的微弱优势击败了 GPT-4，OpenAI 的 LLM 被挤下了榜首位置。由于比分过于接近，出于误差率方面的考量，该机构让 Claude 3 和 GPT-4 并列第一，GPT-4 的另一个预览版也并列第一。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

GPT-4V学会用键鼠上网，人类眼睁睁看着它发帖玩游戏

量子位 2023-11-04 13:48:01
0 跟贴 0
用GPT-4V“操纵”iPhone，无需训练可完成任意指令

量子位 2023-11-15 17:18:41
0 跟贴 0

Mac专属大模型框架来了！两行代码部署，能聊本地数据，支持中文

量子位 2024-03-04 16:53:32
28 跟贴 28

长文本杀不死RAG:SQL+向量驱动大模型和大数据新范式,MyScale开源

机器之心Pro 2024-04-11 14:33:11
30 跟贴 30
后Sora时代，CV从业者如何选择模型？卷积还是ViT

机器之心Pro 2024-02-18 16:18:40
10 跟贴 10

比LoRA还快50%！一张3090超越全参调优，UIUC联合LMFlow提出LISA

机器之心Pro 2024-04-01 15:29:05
18 跟贴 18

大语言模型权重、激活的全方位低bit可微量化，已集成进商用APP

机器之心Pro 2024-03-07 16:00:01
0 跟贴 0
字节“开盒”OpenAI所有大模型，揭秘GPT-3到GPT-4进化路径

量子位 2023-11-04 13:47:32
0 跟贴 0

GPT-4 更强的标志，原来藏在了 logo 里

爱范儿 2024-02-20 17:25:29
25 跟贴 25
大跌眼镜！GPT-4V错觉挑战实录：该错的没错，不该错的反而错了

量子位 2023-11-06 11:02:41
0 跟贴 0
GPT-4找到我女朋友的过敏原

量子位 2024-01-09 13:34:53
0 跟贴 0
不爱国？无人在乎神舟十八号发射，网友：房贷、车贷把我压垮！

鹏飞深文 2024-04-28 14:16:14
92595 跟贴 92595
很多地方把“为人民服务”变成“为大局服务”，这两者有啥区别？

翻开历史和现实 2024-04-25 13:12:17
27133 跟贴 27133
2-0完胜，曼城3连胜，落后领头羊1分，德布劳内2妙传，哈兰德破荒

侧身凌空斩 2024-04-29 01:25:13
82 跟贴 82
3比2！大逆转，锁定决赛，江苏女排复仇山东，杨涵玉独木难支

撒丁岛体育 2024-04-28 21:23:06
130 跟贴 130
曾经卖7000元的顶配商务本，现在成了闲鱼上最火的洋垃圾

雷科技 2023-12-20 17:03:55
681 跟贴 681
天才出局！丹麦小将无缘16强；大逆转！卢布抢七0-5落后成功翻盘

大秦壁虎白话体育 2024-04-28 21:51:55
19 跟贴 19
Deepfake假CFO骗走公司1.8个亿，员工：视频会议每个人都很真实啊

量子位 2024-02-11 13:35:56
217 跟贴 217
河南纪委披露：剑桥大学博士、“80后”干部柳敬元已落马

澎湃新闻 2024-04-28 17:35:02
2078 跟贴 2078
12-4变10-6！火箭错失纪录，希金斯告急，8强将出炉，4种子幸存？

刘姚尧的文字城堡 2024-04-29 06:45:06
42 跟贴 42
感谢申花！免费送给武汉三镇一位王牌锋霸，本轮爆发送出绝杀助攻

评球论事 2024-04-28 20:44:37
117 跟贴 117
1-0到2-2！皇马太狠了：6战5次掀翻拜仁，奔向欧冠决赛，19亿对决

侃球熊弟 2024-04-29 06:05:03
464 跟贴 464
1-1大冷门，意甲第18战平意甲第4，卡纳瓦罗上任第2场就取得分数

凌空倒钩 2024-04-28 22:58:29
18 跟贴 18
马保国现身酒吧表演闪电五连鞭现场观众大声叫"好"

火炼树 2024-04-28 23:14:47
8962 跟贴 8962
“离谱的AI扩图”火了！张张那叫一个出其不意

量子位 2023-12-05 13:17:05
0 跟贴 0
2024春晚，互联网大厂怎么不“打架”了？

钛媒体APP 2024-01-31 14:29:18
1528 跟贴 1528
突然关闭！疑似跑路！天津某知名培训机构爆雷！

天津族 2024-04-28 07:34:33
2 跟贴 2
肖战作品海外大受欢迎！包揽平台三年榜首！不求名利，名利自来

淡淡闲聊 2024-04-26 21:24:39
65 跟贴 65
990万元！周鸿祎迈巴赫成交！市场价不到100万，本人回应：我都懵了

每日经济新闻 2024-04-28 20:41:34
3370 跟贴 3370
开鲁县土地“有偿使用费”再调查：张家兄弟称是招商引资而来，早年平整土地花费巨大

红星新闻 2024-04-28 23:30:17
157 跟贴 157
太突然！86岁琼瑶宣布

我爱大绍兴 2024-04-26 15:31:03
128 跟贴 128
哪吒汽车CEO张勇回应品牌改名

21世纪经济报道 2024-04-28 11:29:25
3643 跟贴 3643
常住人口再创新历史新高解读深圳人口增长的背后

南方都市报 2024-04-28 16:36:19
768 跟贴 768
一路走好！网红卷毛哥去世，从生病到离开仅10天，女儿泣不成声

科普说娱乐 2024-04-27 21:51:27
592 跟贴 592
乌军总司令：前线困难重重局势有恶化趋势

参考消息 2024-04-28 20:12:13
12719 跟贴 12719
Agent4Rec来了！大模型智能体构成推荐系统模拟器，模拟用户行为

机器之心Pro 2023-11-15 16:03:56
2 跟贴 2
这家俄罗斯媒体，是要挑起一场对作家方方的网暴吗？

七分日记 2024-04-28 23:31:22
914 跟贴 914
Llama 3低比特量化性能下降显著！全面评估结果来了|港大北航ETH

量子位 2024-04-27 18:12:51
0 跟贴 0
洗米嫂关闭社交账号，彻底告别过去！洗米华坐牢后不再炫富变低调

娱小小新 2024-04-26 16:01:10
37 跟贴 37
调查：四分之一乌克兰民众认为身边大多数人在逃避征兵

周观环宇 2024-04-26 13:11:05
2 跟贴 2

《幕府将军》泽井杏奈冷艳销魂感人至深！她很性感火辣

《幕府将军》泽井杏奈冷艳销魂感人至深！她很性感火辣

释凡电影

2024-04-28 21:00:07

公公曝光儿媳出轨公职人员，大尺度聊天和开房记录贴满车身巡游！

公公曝光儿媳出轨公职人员，大尺度聊天和开房记录贴满车身巡游！

莫问先生

2024-04-28 20:56:16

日元崩盘了，美国财长耶伦的态度却发生了180度的转变

日元崩盘了，美国财长耶伦的态度却发生了180度的转变

高天SEKH

2024-04-28 23:41:58

感谢他八辈祖宗！打了疫苗之父杨晓明三针疫苗，14亿国人一扫阴霾

感谢他八辈祖宗！打了疫苗之父杨晓明三针疫苗，14亿国人一扫阴霾

荷兰豆爱健康

2024-04-29 05:42:51

王宝强马蓉的儿子已经长大，一眼就能看出是谁亲儿子，太像了!

王宝强马蓉的儿子已经长大，一眼就能看出是谁亲儿子，太像了!

娱乐八卦木木子

2024-04-28 21:14:12

马筱梅真牛！和张兰韩国聚餐，一举动彰显地位,小菲一身行头超百w

马筱梅真牛！和张兰韩国聚餐，一举动彰显地位,小菲一身行头超百w

琪琪侃娱

2024-04-29 08:12:00

周鸿祎迈巴赫990万元拍出！本人回应：我都蒙了

周鸿祎迈巴赫990万元拍出！本人回应：我都蒙了

温州商报

2024-04-29 09:33:00

关键时刻双方四球星连续得分！哈登：就像是场表演都是精英球员

关键时刻双方四球星连续得分！哈登：就像是场表演都是精英球员

直播吧

2024-04-29 07:02:12

田馥甄内地复出失败！音乐节宣布取消其演出，本人发声强撑体面

田馥甄内地复出失败！音乐节宣布取消其演出，本人发声强撑体面

萌神木木

2024-04-27 22:17:58

疯狂的职业索赔：有人一年内以“无证拍黄瓜”向1372家餐饮店索赔

疯狂的职业索赔：有人一年内以“无证拍黄瓜”向1372家餐饮店索赔

澎湃新闻

2024-04-28 21:40:27

上海，一男子在某超市买了4包中华香烟，一共花了280元

上海，一男子在某超市买了4包中华香烟，一共花了280元

王晓爱体彩

2024-04-29 07:50:26

布林肯结束访华不到24小时，中方宣布与美签署协议，一对大熊猫将赴美

布林肯结束访华不到24小时，中方宣布与美签署协议，一对大熊猫将赴美

匹夫来搞笑

2024-04-28 18:24:03

周鸿祎：试了库里南才明白问界M9真是一千万以内最好SUV

周鸿祎：试了库里南才明白问界M9真是一千万以内最好SUV

手机中国

2024-04-26 14:04:09

1.76亿，重签湖人！紫金军找到建队核心，詹姆斯生涯暮年感谢有你

1.76亿，重签湖人！紫金军找到建队核心，詹姆斯生涯暮年感谢有你

呆哥聊球

2024-04-29 09:54:28

【刘达】一句顶一万句？难道毛主席在厕所里的话，也顶一万句？！

【刘达】一句顶一万句？难道毛主席在厕所里的话，也顶一万句？！

年之父

2024-04-28 06:10:03

湖人机会来了？掘金队官方：穆雷左小腿拉伤，能否出战G5存疑

湖人机会来了？掘金队官方：穆雷左小腿拉伤，能否出战G5存疑

懂球帝

2024-04-29 08:16:15

一屋住七对情侣？每晚都是“战斗”到半夜，楼下大爷直呼受不了

一屋住七对情侣？每晚都是“战斗”到半夜，楼下大爷直呼受不了

社会潜伏者

2024-04-28 05:30:03

问界M7碰撞起火3人遇难，这时我才看懂了华为智选模式

问界M7碰撞起火3人遇难，这时我才看懂了华为智选模式

闲醉山人

2024-04-28 16:43:23

王毅要美支持中国统一，布林肯拒绝回答，不到一天中方反制

王毅要美支持中国统一，布林肯拒绝回答，不到一天中方反制

林子说事

2024-04-28 22:28:40

向阳市委书记路边吃饭，却被副局长调100武警恐吓，结局大快人心

向阳市委书记路边吃饭，却被副局长调100武警恐吓，结局大快人心

八哥讲故事

2024-01-28 17:27:20

硅星Breaknews

655文章数 12关注度

往期回顾全部

科技要闻

马斯克想把特斯拉中国数据送出国这事太难

头条要闻

正部级"老虎"韩勇被逮捕通报指其"不敢担当斗争"

头条要闻

正部级"老虎"韩勇被逮捕通报指其"不敢担当斗争"

体育要闻

湖人的G4，尽人事得到了回报

娱乐要闻

田馥甄遭抵制，蔡依林却能稳稳捞金？

财经要闻

问界M7追尾起火3人遇难四大疑问待解

汽车要闻

配置更丰富静态体验2024款欧拉好猫

态度原创

房产

手机

旅游

亲子

家居

房产要闻

力度越来越大！落户两年享本地居民购房政策，海南第16城松绑限购！

手机要闻

iPhone 16机模曝光：摄像头模组回归iPhone X设计

旅游要闻

入境游热度持续攀升 “畅游中国”更便捷

亲子要闻

妈妈不舍得给孩子买五十元的裤子，给自己做了好几百的美甲和头发

家居要闻

光影之间空间暖意打造生活律动

© 1997-2024 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 广告服务 | 不良信息举报 Complaint Center | 廉正举报

无障碍浏览进入关怀版