网易首页 > 网易号 > 正文 申请入驻

景联文科技高质量大模型训练数据汇总!

0
分享至

3月25日,2024年中国发展高层论坛年会上,国家数据局局长刘烈宏在“释放数据要素价值,助力可持续发展”的演讲中表示,中国10亿参数规模以上的大模型数量已超100个。

当前,国内AI大模型发展仍面临诸多困境。其中,较为突出的就是高质量数据集的匮乏,这极大阻碍了大模型效果提升。特别是专业的行业应用数据集,其获取难度更大,这导致大模型可使用的数据量受到限制,进而对大模型效果形成阻碍。

景联文科技是大语言模型数据供应商,致力于为不同阶段的模型算法匹配高质量数据资源。



世界知识类书籍、期刊、论文及高价值社区文本数据:

l中文书籍 250万本

l高质量外文文献期刊 8500万篇

l英文高质量电子书 200万本

教育题库:

l千12教育题库 1800万

l大学题库 1.1亿,800万带解析

l英文题库 500万

专业知识类期刊、专利、代码:

l中文数字专利 4000万

l程序代码(代码注释) 20万

多轮对话:

l文本多轮对话 1500万

l中英文剧本(电影、电视剧、剧本杀) 6万

音频数据:

l普通话 65万小时

图片生成及隐式/显示推理多模态数据:

l图文复杂描述 600万

l图文推理问答对 600万

生物数据:

l核酸库4000万

l蛋白库50万

l蛋白结构库 19万

l通路库 1000万

l生信工具

药学数据:

l药物研发数据库 1300万

l全球上市数据库 80万

l一致性评价数据库 25万

l生产检验数据库 40万

l合理用药 300万

l多维文献 1亿

l原料药数据库 1100万

化学数据:

l化合物数据库 1.6亿

l反应信息数据库 4100万

l物化性质数据库 1.6亿

l谱图数据库 20万

l晶体信息数据库 100万

l安全信息数据库 180万

l商品信息数据库 740万

材料数据:

l金属材料数据 20万

l纳米材料数据 30万

l相图数据 6万

l材料性能数据 20万

l材料腐蚀数据

l表面处理数据

l焊接材料数据

专利数据:

l全球专利基础著录数据 1.3亿

l全球专利原文数据 1亿

l全球专利附图数据

l全球专利法律状态数据

l全球专利法律状态数据

l全球专利引文数据

l全球专利分类索引数据

l全球专利重点申请人工商关联数据

l全球生化医药专利深加工数据

l全球专利全文数据

医疗器械数据:

l国内政策法规数据 3千

l行业标准数据

l中国医疗器械审评数据 20万

l中国医械临床试验数据 5千

l全球医械临床试验数据 7万

l医用耗材中标数据 1400万

l医用耗材带量采购数据 400万

l医用设备招投标数据38万

景联文科技|数据采集|数据标注|大语言模型训练数据

助力人工智能技术,赋能传统产业智能转型升级

文章图文著作权归景联文科技所有,商业转载请联系景联文科技获得授权,非商业转载请注明出处。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
风波升级!举报铁头的人出现了,称日本警察很感谢我,人还在东京

风波升级!举报铁头的人出现了,称日本警察很感谢我,人还在东京

辣条小剧场
2024-06-03 19:14:22
不自信?网传某市医院设备简介:38种仪器设备,只有7个是国产

不自信?网传某市医院设备简介:38种仪器设备,只有7个是国产

小萝卜丝
2024-06-03 14:46:21
马斯克有一个伟大的计划:将全车电线从5000米,降至100米

马斯克有一个伟大的计划:将全车电线从5000米,降至100米

互联网.乱侃秀
2024-06-02 20:22:55
黄仁勋:中国人非常擅长忍受痛苦。

黄仁勋:中国人非常擅长忍受痛苦。

泸沽湖
2024-06-03 10:24:20
比亚迪卖疯了!5月新能源车卖了超33万辆!赛力斯也发布了成绩单

比亚迪卖疯了!5月新能源车卖了超33万辆!赛力斯也发布了成绩单

每日经济新闻
2024-06-02 17:10:07
106国参加瑞士和会:中方拒绝参会,与世界文明为伍,勿忘雅尔塔

106国参加瑞士和会:中方拒绝参会,与世界文明为伍,勿忘雅尔塔

大风文字
2024-06-03 10:27:47
俩游客横渡峡谷落水失联!遇险者身份曝光,至少犯了6大致命错误

俩游客横渡峡谷落水失联!遇险者身份曝光,至少犯了6大致命错误

洛洛女巫
2024-06-03 12:36:09
过“紧日子”的地方政府,已经把手伸进老百姓的口袋里去了

过“紧日子”的地方政府,已经把手伸进老百姓的口袋里去了

浮事记
2024-06-03 11:48:21
广汽本田告别黄埔,员工含泪道别却无怨言,这是怎样的魅力?

广汽本田告别黄埔,员工含泪道别却无怨言,这是怎样的魅力?

音乐时光的娱乐
2024-06-03 20:27:52
噩耗!武汉派出所副所长因公殉职,被歹徒狂刺15刀,抓捕现场曝光

噩耗!武汉派出所副所长因公殉职,被歹徒狂刺15刀,抓捕现场曝光

六毛朵朵
2024-06-03 11:29:26
悲剧 两驴友被冲走后续,完整视频还原现场,红衣男是知名户外博主

悲剧 两驴友被冲走后续,完整视频还原现场,红衣男是知名户外博主

趣味萌宠的日常
2024-06-03 17:07:43
太丢脸了!荷兰海军护卫舰穿越台湾海峡,被两岸当渔船,直接无视

太丢脸了!荷兰海军护卫舰穿越台湾海峡,被两岸当渔船,直接无视

域观天下
2024-06-03 10:13:51
徐辉少将喊话泽连斯基:到底在为什么而战?

徐辉少将喊话泽连斯基:到底在为什么而战?

观察者网
2024-06-03 07:48:06
皇马赢麻了!2天才包揽欧冠官方MVP+最佳新秀,4将入选赛季最佳阵

皇马赢麻了!2天才包揽欧冠官方MVP+最佳新秀,4将入选赛季最佳阵

我爱英超
2024-06-03 19:17:44
逾7900人应聘宁夏煤业井下操作工,最低学历要求大学专科

逾7900人应聘宁夏煤业井下操作工,最低学历要求大学专科

澎湃新闻
2024-06-03 09:22:28
大妈突然抢夺公交车方向盘吓坏一车人 湖北咸宁警方:正在处理

大妈突然抢夺公交车方向盘吓坏一车人 湖北咸宁警方:正在处理

奔流新闻
2024-06-03 19:32:05
公安部:严厉打击整治“换钱党”及相关违法犯罪

公安部:严厉打击整治“换钱党”及相关违法犯罪

中国日报网
2024-06-03 15:25:02
50岁警察中15刀身亡,凶手曝光,追悼会照片流出,遗像爆大量隐情

50岁警察中15刀身亡,凶手曝光,追悼会照片流出,遗像爆大量隐情

温柔看世界
2024-06-03 15:30:46
国防大学将军喊话泽连斯基:要考虑乌克兰人民的价值……

国防大学将军喊话泽连斯基:要考虑乌克兰人民的价值……

吃瓜体
2024-06-02 20:40:34
王毅外长的真实身份曝光

王毅外长的真实身份曝光

星辰故事屋
2024-06-03 19:08:18
2024-06-03 22:46:44
景联文科技
景联文科技
做AI行业客户的数据参谋
261文章数 0关注度
往期回顾 全部

科技要闻

特斯拉回应单踏板模式可能被禁止:暂无影响

头条要闻

武汉一警察身中15刀牺牲细节:怕误伤嫌犯母亲未开枪

头条要闻

武汉一警察身中15刀牺牲细节:怕误伤嫌犯母亲未开枪

体育要闻

万人空巷!皇马举行欧冠夺冠庆典

娱乐要闻

混战升级!编剧赵冬苓力挺王阳遭围攻

财经要闻

接班100天,宗馥莉急了

汽车要闻

搭载华为HiCAR 传祺M6 MAX售14.58万元

态度原创

本地
教育
健康
亲子
公开课

本地新闻

食味印象|歙县限定!枇杷味儿的清甜初夏

教育要闻

忻州市和平小学:汇演庆“六一” 德育展风采

晚餐不吃or吃七分饱,哪种更减肥?

亲子要闻

孩子爱出汗出汗异常多,还以为是代谢比较好吗?

公开课

近视只是视力差?小心并发症

无障碍浏览 进入关怀版