网易首页 > 网易号 > 正文 申请入驻

AI观察|AI赋能科学发现:数据壁垒是关键痛点

0
分享至

来源:市场资讯

(来源:澎湃新闻)

人工智能与科学研究正在深度融合,深刻塑造科学的未来。

去年11月,美国总统特朗普签署行政命令,启动全新国家计划“创世纪计划”,旨在整合美国超级计算机和独特数据资产,利用人工智能变革科学研究方式、加速科学发现。英国去年11月发布的AI for Science战略将采取15项具体行动,旨在巩固英国在人工智能推动科学突破领域的全球领导者地位。

日前,多位青年科学家在上海科学智能研究院的一场AI for Science座谈会上不约而同提到,数据壁垒是AI for Science的关键痛点之一。AI不仅需要大量数据,还需要差异化的数据。没有数据“下锅”,就难以炼出好模型。AI for Science也不应止步于科学发现,而是选择兼具产业基础、技术优势和数据积累的领域先行先试,探索从研究到应用的市场闭环。

没有数据“下锅”,就难以炼出好模型

新能源汽车已成为我国经济发展的重要引擎,锂电池是当前的主流技术。固态电池是以固体电解质替代传统液态或凝胶电解液的二次电池体系,具有高能量、高安全性优势。固态电池上车是下一代电池的突破方向之一。

上海交通大学副教授、未来电池研究中心执行主任万佳雨从事固态电解质开发,他直言,尽管当前新材料层出不穷,但在固态电池领域,真正有用的材料不过十几类,按照大类来算仅有三类。“巧妇难为无米之炊,在模型训练中,如果没有数据 ‘下锅’,就难以训出一个好模型。”

在生物领域,蛋白质是生物制造的底层材料。过去,开发一款成功的蛋白质产品高度依赖科学家经验,过程漫长且试错成本高昂,成功率偏低。由于蛋白质研发设计技术门槛高,导致蛋白质研发供给不足,优质蛋白产品国际垄断严重,尤其是我国70%的工业酶依赖进口。利用AI高效设计蛋白质,关键在于攻克蛋白质功能预测,而数据是重中之重。

“AI需要数据,不仅数据量要大,而且数据的差异化也要大。”上海交通大学特聘教授、天鹜科技首席科学家洪亮团队开发了AI蛋白质设计平台Venus,他们让大模型学习高温、高压、高酸、高碱等极端工况下的蛋白质功能,辅助设计蛋白质,并以此开发了全球首款由大模型设计且实现工业化生产的蛋白质。

“这套策略做得好,完全依赖于底层数据的规模和质量。”为了解决数据问题,洪亮团队组建了全球最大的蛋白质数据库,收集了150亿条蛋白质序列,其中67亿条私有数据中,既有来自马里亚纳海沟的深海蛋白数据,也有中国大西北的盐湖蛋白数据。

“我们在数据层面遇到的核心痛点并非数据获取难,而在于高度非标准化。”洪亮表示,各方提供的数据格式各异,缺乏统一规范。为了清洗每一条序列并标准化标注,团队为65亿条蛋白质数据打上环境标签,才将原始的“杂乱”数据转化为可用的研究数据。

协同合作打破数据壁垒,探索市场闭环

数据采集、专业的数据标注与数据共享是推进AI for Science不可或缺的关键要素。

“许多科学领域的专业数据并不公开,缺少团队投入资源,去完成那些繁琐的数据加工工作,但AI for Science的数据一定要共享。”上海科学智能研究院副院长程远介绍,上海科学智能研究院旗下星河启智科学智能开放平台的数据广场建成超4万个高质量科学数据集,数据总量达12PB。

上海科学智能研究院的经验是构建多梯度的人才体系:20多位专职数据工程师从事数据加工和批量化处理,200多位在校学生和雇佣人员专职从事数据标注,1000多位众包人员承担数据校验和初级标注。除了丰富的科学语料资源和海量数据储备,平台的数据加工工具确保数据质量和科研可用性,明晰的数据权属机制推动数据合规生产和开放共享。“我们与高校、企业合作,加工和开放了16个领域的专业数据。他们既是平台使用者,也是建设者,贡献了数据和新模型。”

去年9月,上海人工智能实验室联合合肥实验室、临港实验室等12家国家实验室成立上海科学智能战略科技力量联盟,同时吸引众多高校和科研机构加入,共同梳理联盟体系内的各学科数据,打破数据壁垒。

上海人工智能实验室青年科学家、科学智能中心负责人白磊认为,要推动AI for Science的实质进展,首先必须清晰界定AI特别是AGI(通用人工智能)在科学领域的能力表现,系统解析不同学科和科研流程对AI能力的差异化需求,摒弃“胡子眉毛一把抓”。与此同时,AI for Science在模型训练阶段投入巨大,海量数据整合与算力支撑必然要求集结更广泛的力量协同攻关,加强合作。

AI的赋能也不应止步于科学发现。上海大学材料基因组工程研究院副教授高兆和表示,AI for Science要从科学研究落地工程,实现从研究到产业的贯通,否则任何技术突破都只是昙花一现。

在洪亮看来,AI for Science的发展有其客观规律,不同学科的商业化程度、数据积累和技术能力不同,应当选择兼具产业基础、技术优势和数据积累的领域先行先试,建立以智能体为核心的科研生态,探索从研究到应用的市场闭环。AI for Science的可持续发展必然依托于强大的生态体系,要通过生态链接,有效承接技术与需求,释放AI设计能力。在这一过程中,政府的角色是引导、搭台、共建,待模式成熟后逐步有序退出。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
回顾许家印被抓捕现场,奋力反抗,怒吼不已,被抓捕人员抬出去

回顾许家印被抓捕现场,奋力反抗,怒吼不已,被抓捕人员抬出去

干史人
2026-01-08 22:47:00
00后新晋女神——神村彩月!天赋异禀,未来可期!

00后新晋女神——神村彩月!天赋异禀,未来可期!

碧波万览
2026-01-10 00:24:45
65岁大爷半月换掉5保姆,儿子让女友扮保姆探真相,发现个大秘密

65岁大爷半月换掉5保姆,儿子让女友扮保姆探真相,发现个大秘密

林林故事揭秘
2025-04-10 20:40:12
傻瓜式教程:如何部署7×24替你用电脑干活的ClawdBot

傻瓜式教程:如何部署7×24替你用电脑干活的ClawdBot

AI先锋官
2026-01-27 07:09:43
100多位情妇,包养费上亿元,9女同床却落得个凄凉下场、人财两空

100多位情妇,包养费上亿元,9女同床却落得个凄凉下场、人财两空

阅微札记
2026-01-26 22:46:51
石家庄一社区过年分红每人发1万多元和半只猪,街道办:每年都会发放

石家庄一社区过年分红每人发1万多元和半只猪,街道办:每年都会发放

极目新闻
2026-01-27 20:07:15
航班大量取消!超市货架拿空!不少中国网友发文称滞留日本,“简直是灾难”

航班大量取消!超市货架拿空!不少中国网友发文称滞留日本,“简直是灾难”

上观新闻
2026-01-27 11:19:17
人民日报钟声:必须遏制日本推进“新型军国主义”

人民日报钟声:必须遏制日本推进“新型军国主义”

上观新闻
2026-01-27 06:39:06
知情人士:俄乌和平协议签署已成乌获美安全保障先决条件

知情人士:俄乌和平协议签署已成乌获美安全保障先决条件

界面新闻
2026-01-28 07:13:51
国民党高层将访陆,郑丽文公布交流议题,台媒:陆高层会亲自迎接

国民党高层将访陆,郑丽文公布交流议题,台媒:陆高层会亲自迎接

沧海旅行家
2026-01-27 15:09:58
法媒:巴黎圣日耳曼已与恩里克谈续约,将此视为绝对的优先事项

法媒:巴黎圣日耳曼已与恩里克谈续约,将此视为绝对的优先事项

天光破云来
2026-01-28 07:38:02
1996年, 施瓦辛格在家中无事,和35岁200斤女佣发生不当关系

1996年, 施瓦辛格在家中无事,和35岁200斤女佣发生不当关系

南权先生
2026-01-20 15:49:53
电力超级周期爆发,真正的机会不在发电端?

电力超级周期爆发,真正的机会不在发电端?

华尔街见闻官方
2026-01-27 20:37:54
回旋镖扎自己身上是啥体验?网友:有仇当天就报,心情爽极了

回旋镖扎自己身上是啥体验?网友:有仇当天就报,心情爽极了

带你感受人间冷暖
2026-01-26 00:05:20
不管你信不信,男性过了61岁后,基本都有这7个现状,要坦然接受

不管你信不信,男性过了61岁后,基本都有这7个现状,要坦然接受

健康之光
2026-01-11 12:40:02
郭晶晶代言出事不到一周,令人担心的事发生,霍启刚做法让人意外

郭晶晶代言出事不到一周,令人担心的事发生,霍启刚做法让人意外

清衣渡a
2026-01-28 02:59:32
一纸十年长约,撬动亚洲电竞的未来

一纸十年长约,撬动亚洲电竞的未来

体育产业生态圈
2026-01-26 14:44:40
“妖镍”疯涨!这家“收废品”的企业,要起飞了?

“妖镍”疯涨!这家“收废品”的企业,要起飞了?

包不同
2026-01-28 00:09:54
为什么去非洲的中国人不愿回来?看完网友的分享,太真实了!

为什么去非洲的中国人不愿回来?看完网友的分享,太真实了!

另子维爱读史
2026-01-18 20:06:34
违反“限高令”25次乘机出国高消费,被执行人因拒执罪入刑

违反“限高令”25次乘机出国高消费,被执行人因拒执罪入刑

南方都市报
2026-01-26 11:17:15
2026-01-28 08:11:01
新浪财经 incentive-icons
新浪财经
新浪财经是一家创建于1999年8月的财经平台
2057559文章数 5300关注度
往期回顾 全部

科技要闻

Anthropic将融资200亿美元、估值3500亿美元

头条要闻

特朗普被指投下"第二次关税炸弹" 引发韩国强烈不安

头条要闻

特朗普被指投下"第二次关税炸弹" 引发韩国强烈不安

体育要闻

冒充职业球员,比赛规则还和对手现学?

娱乐要闻

张雨绮风波持续发酵,曝多个商务被取消

财经要闻

多地对垄断行业"近亲繁殖"出手了

汽车要闻

标配华为乾崑ADS 4/鸿蒙座舱5 华境S体验车下线

态度原创

本地
数码
旅游
时尚
公开课

本地新闻

云游中国|拨开云雾,巫山每帧都是航拍大片

数码要闻

苹果发布全新AirTag:249元起,覆盖范围更广/可查找性提升

旅游要闻

缙云·巫山时序丨刘红梅:河旁古村

这些韩系穿搭最适合普通人!多穿深色、衣服基础,简洁耐看

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版