网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

【五号雷达-数据快讯】WebInstruct - 大规模指令数据集

2024-05-09 11:40:01　来源: 五号雷达

上海举报

0

分享至

WebInstruct数据集由卡内基梅隆大学和滑铁卢大学联合构建，旨在通过从网络预训练语料库中提取指令数据，以增强大语言模型的推理能力。该数据集包含1000万个高质量的指令-响应对，覆盖数学、科学、工程等多个领域。WebInstruct的创建过程包含3个步骤，首先，通过爬取多个测验网站创建多样化的种子数据集，利用fastText模型从Common Crawl召回相关文档；其次，使用开源大模型如Mixtral提取候选的Q-A对；最后，通过Mixtral-8×7B和Qwen-72B对提取的Q-A对进行精细化处理，以确保数据的质量。该数据集的独特之处在于，它完全从网络挖掘而来，无需人工众包或GPT-4蒸馏，为构建更优质的指令微调数据集提供了新的范式。

详情请参见五号雷达：https://www.5radar.com/result?key=WebInstruct

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

参不参加会议是个问题，想当“带头大哥”不容易

迎风立调侃 2024-05-29 06:44:19
2501 跟贴 2501
杭州不限购后河南购房者花2300多万3天连买8套房

鲁中晨报 2024-05-28 22:35:48
18974 跟贴 18974

越闹越大！王处长凭一己之力，把沈阳送上了热搜，评论区炸锅！

番茄说史聊 2024-05-28 22:00:59
192 跟贴 192

乌议长：泽连斯基将担任总统直至选举产生新总统

央视新闻客户端 2024-05-29 08:28:15
4943 跟贴 4943
前京东副总裁蔡磊被传“装病” 好友晒图辟谣

都市快报橙柿互动 2024-05-28 16:51:04
3545 跟贴 3545

以军装甲部队进入加沙地带南部城市拉法市中心

央视新闻客户端 2024-05-28 17:06:07
18351 跟贴 18351

俄财政部长称俄罗斯人自己想提高税收，税收即将大幅上涨

亡海中的彼岸花 2024-05-29 07:48:02
1361 跟贴 1361
津巴布韦呼吁国际社会提供粮食援助

新京报 2024-05-28 14:18:09
7795 跟贴 7795

哈马斯拍摄假视频的幕后工作被猪队友传到了网上

狗剩说电影 2024-05-29 00:02:58
2877 跟贴 2877
日本超市被曝西瓜按片卖！折合人民币接近5块钱，网友：日本人好可怜

可达鸭面面观 2024-05-29 09:47:48
5875 跟贴 5875
挪威正式承认巴勒斯坦国

央视新闻客户端 2024-05-28 19:09:15
6849 跟贴 6849
政治局集体学习首提构建就业友好型发展方式，专家这样解读

第一财经资讯 2024-05-28 21:34:08
2880 跟贴 2880
大V揭台岛网军，分工明确：反串、假中立、酸文……在大陆各领域制造矛盾

不掉线电波 2024-05-28 21:15:25
4366 跟贴 4366
安徽滁州通报滁河水体污染处置进展情况：全椒县委主要负责同志被免职

界面新闻 2024-05-29 09:36:19
615 跟贴 615
北京多区发放汽车消费券，实探车市：车企推限时购车权益抢客户

新京报 2024-05-28 18:03:19
2588 跟贴 2588
钟薛高创始人回应直播带货还债：拖欠729位员工薪资

财联社 2024-05-28 20:09:14
3390 跟贴 3390
美股收盘：纳指突破17000点创新高英伟达狂飙近7%

财联社 2024-05-29 05:20:05
913 跟贴 913
IMF上调今年中国经济增长预期0.4个百分点至5%

财联社 2024-05-29 10:04:06
86 跟贴 86
这事儿｜选调生不满嘉峪关，官方确认其已离职

澎湃新闻 2024-05-29 07:18:27
1 跟贴 1
39岁C罗渴望参加2026年世界杯！即将续约一年！FIFA主席公开点赞

风过乡 2024-05-29 07:16:51
0 跟贴 0
豪言不假！爱德华兹29+10+9连中制胜球拼到5犯终赢东契奇一场

醉卧浮生 2024-05-29 11:12:34
0 跟贴 0
一夜关店！中国“穷鬼”，正暴击米其林

金错刀 2024-05-29 09:59:26
0 跟贴 0

英国给中方开天价罚单！793万英镑若不按时缴，英国：国际法院见

英国给中方开天价罚单！793万英镑若不按时缴，英国：国际法院见

慎独赢

2024-05-29 13:21:55

神十八圆满完成首次出舱！美军担忧情况出现，中国果然在下一大棋

神十八圆满完成首次出舱！美军担忧情况出现，中国果然在下一大棋

田间农人阿馋

2024-05-28 22:19:27

黄圣依儿子安迪获高尔夫冠军，12岁身材魁梧，典型的富家公子哥

黄圣依儿子安迪获高尔夫冠军，12岁身材魁梧，典型的富家公子哥

素素娱乐

2024-05-27 08:54:48

这谁顶得住嘛！杨紫这身材，这才是尤物啊！

这谁顶得住嘛！杨紫这身材，这才是尤物啊！

冷却爱情

2024-04-19 10:10:08

老同事长期被领导挤兑，退休后当评委否决上亿项目，领导满脸堆笑请他吃饭，他说：我没资格！

老同事长期被领导挤兑，退休后当评委否决上亿项目，领导满脸堆笑请他吃饭，他说：我没资格！

职场火锅

2024-05-28 20:30:41

母亲拾荒培养出985儿子，婚礼仪式岳父听到母亲名字，竟当场下跪

母亲拾荒培养出985儿子，婚礼仪式岳父听到母亲名字，竟当场下跪

纸鸢奇谭

2024-05-08 08:51:32

PS港服年中大促来袭！PS+年费最低7折海量大作优惠

PS港服年中大促来袭！PS+年费最低7折海量大作优惠

游民星空

2024-05-29 10:06:16

【小八卦】成毅，迪丽热巴，钟楚曦，宋祖儿，大小S，古力娜扎，吴青峰，王红权星

【小八卦】成毅，迪丽热巴，钟楚曦，宋祖儿，大小S，古力娜扎，吴青峰，王红权星

毒舌一姐

2024-05-29 12:05:14

太会营销了！小s二女儿真容眼距“超宽”，脸型扁平，颜值太一般

太会营销了！小s二女儿真容眼距“超宽”，脸型扁平，颜值太一般

阿桥侃娱乐

2024-05-29 08:11:01

离谱！大衣哥给孙子办满月宴：村民喝400元酒，亲戚喝8699的茅台

离谱！大衣哥给孙子办满月宴：村民喝400元酒，亲戚喝8699的茅台

圈里的甜橙子

2024-05-28 17:17:54

太阳报：拉爵转会新规——25岁以下、不要超巨、教练无法指定球员

太阳报：拉爵转会新规——25岁以下、不要超巨、教练无法指定球员

直播吧

2024-05-29 10:45:03

辽宁省发布6名省管干部任前公示

辽宁省发布6名省管干部任前公示

鲁中晨报

2024-05-28 22:06:07

容易短寿的10件事！

今日养生之道

2024-05-27 10:34:38

单身汉娶四十二岁寡妇，新婚夜寡妇红着脸喊疼，他才发现寡妇秘密

单身汉娶四十二岁寡妇，新婚夜寡妇红着脸喊疼，他才发现寡妇秘密

益阳爱娱乐吖

2024-05-27 01:39:52

IPhone“备忘录”是生活工作必备神器，让它吃灰是你最大的损失！

IPhone“备忘录”是生活工作必备神器，让它吃灰是你最大的损失！

天边的孤雁

2024-05-16 15:20:03

四川最大“号贩子”案告破！利用“外挂”软件“霸占”华西专家号

四川最大“号贩子”案告破！利用“外挂”软件“霸占”华西专家号

川医观察

2024-05-28 16:11:58

全剧终!杨振宁亮出底牌，翁帆万般无奈，只能独自扬帆起航

全剧终!杨振宁亮出底牌，翁帆万般无奈，只能独自扬帆起航

娱乐白名单

2024-05-26 18:17:30

41岁央视著名主持在泰国“男孩街”坠亡，画面流出，大量隐情被扒

41岁央视著名主持在泰国“男孩街”坠亡，画面流出，大量隐情被扒

求实者

2024-05-26 22:21:10

伊利天价牛奶？700元一箱！卡车司机：就靠为难我们来发财的吗？

伊利天价牛奶？700元一箱！卡车司机：就靠为难我们来发财的吗？

火山诗话

2024-05-28 19:24:42

华子：我告诉牛仔队的帕森斯 G6回来时我会给他带新签名鞋

华子：我告诉牛仔队的帕森斯 G6回来时我会给他带新签名鞋

直播吧

2024-05-29 12:10:15

探测数据要素市场，把握数字经济机遇。

154文章数 2关注度

往期回顾全部

科技要闻

王传福再放狠话，燃油车要成“非主流”

头条要闻

外国女孩被中国父母收养走红网络能说一口流利河南话

头条要闻

外国女孩被中国父母收养走红网络能说一口流利河南话

体育要闻

阿根廷一代神锋，击碎了沙特的金元足球梦

娱乐要闻

张若昀怎么剧外比剧内更惨兮兮…

财经要闻

东方通收购藏雷花6亿买来"业绩变脸"

汽车要闻

新哈弗H6苦练内功向燃油车绝缘智能SAY NO

态度原创

时尚

家居

亲子

本地

军事航空

中年女人缺的不是衣服，而是这些搭配技巧，轻松打造女神范儿

家居要闻

与美共生空间线条勾勒生活风雅

亲子要闻

家有萌娃，萌娃看电视模仿跳水！

本地新闻

食味印象｜歙县限定！枇杷味儿的清甜初夏

军事要闻

以军装甲部队进入加沙地带南部城市拉法市中心

© 1997-2024 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 广告服务 | 不良信息举报 Complaint Center | 廉正举报

无障碍浏览进入关怀版