网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

【五号雷达-数据快讯】Pinocchio - 事实知识评估数据集

2024-03-27 13:50:18　来源: 五号雷达

上海举报

0

分享至

Pinocchio数据集由清华大学、伊利诺伊大学芝加哥分校和剑桥大学的研究人员联合创建，旨在全面评估大型语言模型（LLMs）在事实知识存储与推理能力方面的表现。该数据集包含了20,000个多样化的事实问题，这些问题覆盖了不同的来源、时间线、领域、地区和语言。数据集涵盖了7个不同的任务来测试LLMs在多事实推理、处理结构化与非结构化知识、识别细微事实差异、抵抗对抗性示例等方面的能力。Pinocchio为研究人员提供了一个强大的工具，以理解模型在多个维度上的能力，并促进LLMs在事实知识方面的发展。

详情请参见五号雷达：https://www.5radar.com/result?key=Pinocchio

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

参不参加会议是个问题，想当“带头大哥”不容易

迎风立调侃 2024-05-29 06:44:19
2598 跟贴 2598
杭州不限购后河南购房者花2300多万3天连买8套房

鲁中晨报 2024-05-28 22:35:48
18533 跟贴 18533

这事儿｜选调生不满嘉峪关，官方确认其已离职

澎湃新闻 2024-05-29 07:18:27
5246 跟贴 5246

越闹越大！王处长凭一己之力，把沈阳送上了热搜，评论区炸锅！

番茄说史聊 2024-05-28 22:00:59
196 跟贴 196
北上广“米其林”撑不住：多家餐厅一夜间关店跑路

金错刀 2024-05-29 09:59:26
702 跟贴 702

以军装甲部队进入加沙地带南部城市拉法市中心

央视新闻客户端 2024-05-28 17:06:07
18603 跟贴 18603

前京东副总裁蔡磊被传“装病” 好友晒图辟谣

都市快报橙柿互动 2024-05-28 16:51:04
3473 跟贴 3473
俄财政部长称俄罗斯人自己想提高税收，税收即将大幅上涨

亡海中的彼岸花 2024-05-29 07:48:02
1697 跟贴 1697

日本超市被曝西瓜按片卖！折合人民币接近5块钱，网友：日本人好可怜

可达鸭面面观 2024-05-29 09:47:48
7825 跟贴 7825
哈马斯拍摄假视频的幕后工作被猪队友传到了网上

狗剩说电影 2024-05-29 00:02:58
3015 跟贴 3015
挪威正式承认巴勒斯坦国

央视新闻客户端 2024-05-28 19:09:15
6893 跟贴 6893
政治局集体学习首提构建就业友好型发展方式，专家这样解读

第一财经资讯 2024-05-28 21:34:08
2934 跟贴 2934
大V揭台岛网军，分工明确：反串、假中立、酸文……在大陆各领域制造矛盾

不掉线电波 2024-05-28 21:15:25
4499 跟贴 4499
乌议长：泽连斯基将担任总统直至选举产生新总统

央视新闻客户端 2024-05-29 08:28:15
1248 跟贴 1248
钟薛高创始人回应直播带货还债：拖欠729位员工薪资

财联社 2024-05-28 20:09:14
3437 跟贴 3437
美股收盘：纳指突破17000点创新高英伟达狂飙近7%

财联社 2024-05-29 05:20:05
2588 跟贴 2588
北京多区发放汽车消费券，实探车市：车企推限时购车权益抢客户

新京报 2024-05-28 18:03:19
2591 跟贴 2591
豪言不假！爱德华兹29+10+9连中制胜球拼到5犯终赢东契奇一场

醉卧浮生 2024-05-29 11:12:34
544 跟贴 544
新华社评论员：促进高质量充分就业

新华社 2024-05-28 23:54:08
910 跟贴 910
IMF上调今年中国经济增长预期0.4个百分点至5%

财联社 2024-05-29 10:04:06
1606 跟贴 1606
39岁C罗渴望参加2026年世界杯！即将续约一年！FIFA主席公开点赞

风过乡 2024-05-29 07:16:51
0 跟贴 0

丢死人了，我家那死老头子不知道从哪里听说，老年人过夫妻生活

丢死人了，我家那死老头子不知道从哪里听说，老年人过夫妻生活

四象八卦

2024-05-28 22:23:40

女服务员穿成这样，害得我没心思吃饭，这回是有福了！哈哈哈哈

女服务员穿成这样，害得我没心思吃饭，这回是有福了！哈哈哈哈

水泥土的搞笑

2024-05-28 07:50:16

非法获利320万，罚款2千块！这是在开玩笑，还是侮辱大众智商呢?

非法获利320万，罚款2千块！这是在开玩笑，还是侮辱大众智商呢?

苗苗情感说

2024-05-28 22:35:58

两名士兵在埃及发生的事件中丧生，其中一名是哈马斯支持者

两名士兵在埃及发生的事件中丧生，其中一名是哈马斯支持者

亡海中的彼岸花

2024-05-28 19:35:52

名校校长的＂后宫＂：88名女教师，霸占87人？！

名校校长的"后宫"：88名女教师，霸占87人？！

北国向锡安

2024-05-11 09:55:37

蒋万安话音刚落，30国不许收台，解放军被逼上硬菜，对岸呼吁克制

蒋万安话音刚落，30国不许收台，解放军被逼上硬菜，对岸呼吁克制

青年的背包

2024-05-28 17:01:59

范冰冰戴10公斤珠宝在泰国复出，座驾成亮点。网友：沦落成这样了

范冰冰戴10公斤珠宝在泰国复出，座驾成亮点。网友：沦落成这样了

华人星光

2024-05-28 12:43:55

戈贝尔错位要球华子不给连续两次示意其拉开戈贝尔似乎略显不满

戈贝尔错位要球华子不给连续两次示意其拉开戈贝尔似乎略显不满

小豆豆赛事

2024-05-29 11:37:38

霍启刚三兄弟罕同框，36岁霍启仁太帅气，穿搭看出和俩哥哥区别！

霍启刚三兄弟罕同框，36岁霍启仁太帅气，穿搭看出和俩哥哥区别！

独特的文史

2024-05-28 20:16:39

阿拉法特的错误，造成了巴勒斯坦的苦难，中国当年的劝告他没有听

阿拉法特的错误，造成了巴勒斯坦的苦难，中国当年的劝告他没有听

文史达观

2024-05-23 14:23:18

弘一法师：永远不要跟别人吐露太多，因为，你迟早会后悔

弘一法师：永远不要跟别人吐露太多，因为，你迟早会后悔

娱乐小可爱蛙

2024-05-29 11:04:45

法网第3日综述：郑钦文轻松过关，朱琳难求一胜，德约3-0晋级

法网第3日综述：郑钦文轻松过关，朱琳难求一胜，德约3-0晋级

ALL体育

2024-05-29 06:16:53

冯提莫首次素颜直播，面部状态判若两人，观众：脖子上的是草莓？

冯提莫首次素颜直播，面部状态判若两人，观众：脖子上的是草莓？

风尘Game

2024-05-28 14:55:01

牛掰！次轮第47顺位？崔永熙正式冲击NBA第一站……

牛掰！次轮第47顺位？崔永熙正式冲击NBA第一站……

篮球实战宝典

2024-05-28 20:18:00

运动抗癌“实锤”了！肿瘤专家：最佳的抗癌运动被找到，不是走路

运动抗癌“实锤”了！肿瘤专家：最佳的抗癌运动被找到，不是走路

39健康网

2024-05-25 22:00:49

东莞楼市全军覆没，东莞待售二手房翻倍增加，松山湖降价明显

东莞楼市全军覆没，东莞待售二手房翻倍增加，松山湖降价明显

有事问彭叔

2024-05-29 12:29:58

长江一支流恶臭熏天、鱼虾死亡，当地干部: 没有必要做毒性分析，喝茅台也能喝死人

长江一支流恶臭熏天、鱼虾死亡，当地干部: 没有必要做毒性分析，喝茅台也能喝死人

封面新闻

2024-05-28 18:50:15

国足3消息：王大雷出任中泰战队长，李源一退出国足，韦世豪摊牌

国足3消息：王大雷出任中泰战队长，李源一退出国足，韦世豪摊牌

球场新视角1号

2024-05-28 23:06:25

东风导弹泄密案：国安追查６年无果，却意外被一卖菜老汉揪出真凶

东风导弹泄密案：国安追查６年无果，却意外被一卖菜老汉揪出真凶

元芳

2024-05-25 10:03:50

曝拉爵确定曼联首签人选，欲4000万趁火打劫！马奎尔求见争取留队

曝拉爵确定曼联首签人选，欲4000万趁火打劫！马奎尔求见争取留队

罗米的曼联博客

2024-05-29 08:57:23

探测数据要素市场，把握数字经济机遇。

154文章数 2关注度

往期回顾全部

科技要闻

王传福再放狠话，燃油车要成“非主流”

头条要闻

白天辉4年受贿11亿元获死刑曾在反腐片里揭露赖小民

头条要闻

白天辉4年受贿11亿元获死刑曾在反腐片里揭露赖小民

体育要闻

阿根廷一代神锋，击碎了沙特的金元足球梦

娱乐要闻

张若昀怎么剧外比剧内更惨兮兮…

财经要闻

东方通收购藏雷花6亿买来"业绩变脸"

汽车要闻

新哈弗H6苦练内功向燃油车绝缘智能SAY NO

态度原创

手机

艺术

健康

教育

军事航空

手机要闻

vivo S19续航体验功能机般耐用拒绝每天充电

艺术要闻

穿越时空的艺术：《马可·波罗》AI沉浸影片探索人类文明

晚餐不吃or吃七分饱，哪种更减肥？

教育要闻

再不看来不及了！高考日语阅读题型及解题关键剖析！

军事要闻

美国一架F-35坠毁飞行员弹射逃生被送医

© 1997-2024 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 广告服务 | 不良信息举报 Complaint Center | 廉正举报

无障碍浏览进入关怀版