网易首页 > 网易号 > 正文 申请入驻

让大湾区成为数据安全使用典范

0
分享至


香港科技大学(广州)信息枢纽院长、数据科学与分析学域讲座教授、联合实验室专家陈雷

“在大模型训练过程中,数据质量是最重要的一环”……香港科技大学(广州)信息枢纽院长、数据科学与分析学域讲座教授、联合实验室专家陈雷接受南都访谈时表示,人工智能发展到现在,最重要的是数据问题,期待粤港澳大湾区生成式人工智能安全发展联合实验室(简称“联合实验室”)把各高校研究力量整合起来,从政策、制度层面引导正确使用数据。

数据质量

  要通过联合实验室整合数据

南方都市报(以下简称“南都”):您是世界数据科学与分析领域的领军学者,能否结合数据领域深入研究,谈谈对粤港澳大湾区生成式人工智能安全发展联合实验室发挥自身优势,更好服务人工智能安全发展的期望?

陈雷:粤港澳大湾区制造业很强,要把人工智能运用到传统行业,数据非常重要。通过实验室联合大湾区各类高校,汇聚所有数据,做成大数据平台,供大家使用,做相应大模型测试。或者由联合实验室推出数据测试平台,让各类大模型通过平台测试性能,找出不足,加以改进。

南都:如何确保数据质量,联合实验室能做些什么?

陈雷:数据质量是全世界都想解决的问题,首要的问题是获取到的数据是不是有用?而且数据量要大,量不大就没有所谓数据质量。

数据质量包括无监督、有监督。无监督的数据质量就是通过无监督的机器学习,发现一些质量偏差较大的数据,或者叫异常数据分析。有监督的数据质量一般需要找专家或专业人士对数据打标签,然后用机器学习的方法找出那些较差的数据。我觉得联合实验室可以尝试新的方法,特别是从工业界获取合作项目,整合大湾区人工智能人才以及研究团队,做一些能落地产品或者服务累积高质量数据。期待联合实验室发挥纽带作用,把各高校研究力量整合起来。单打独斗已是过去式,一个人强没用,一定通过联合实验室整合数据。

数据关联

  智能体要落地首先得涉及数据关联

南都:在粤港澳三地制度差异背景下,在推动数据跨境流动过程中,您对建立大湾区数据安全、人工智能安全协同治理体系有哪些建议?

陈雷:数据安全是一个非常难的问题,既要把数据整合起来、用起来,又要保证数据安全,里面有很多技术方法手段,例如同态加密、隐私计算等,使用加密数据做相应AI训练。

举例而言,大湾区有很多好医院,要做数据共享,才能做更好病理诊断医疗诊断。如果把病人名字、年龄、性别隐藏,数据是不是就没问题了,可以安全使用?这是误区,很多时候通过病人其他信息还是可以转换映射病人是谁。但是,假如隐去年龄、性别这些信息,可能对根据年龄和性别对病情诊断又失去价值。这是有意思的问题,建议联合实验室可以研究怎么建立数据安全的保护机制,不仅是通过技术手段解决,还需要从政策、制度层面,引导正确使用数据,签订相应数据共享、保密协议。

南都:在数据驱动跨学科研究方面,您曾带领团队为港科大(广州)实现许多第一的突破。如何通过数据驱动大模型,赋能产业,构建良性循环协同?

陈雷:大模型赋能产业,最重要的是真正用起来。大模型的文字处理能力特别高,以保险业为例,假如出了一个理赔案,原来保险员要查所有文件、规章,通过匹配才知道要赔多少、谁的责任,其实这些可以使用大模型,通过大模型文件处理能力来操作。

大模型重要应用就是智能体,垂直运用到各行各业。但怎么让人接受、让人用起来,这是最大的问题。假如你休假,会让智能体帮忙订酒店、订机票,预订所有活动吗?我发现主要还是手动抢便宜机票、便宜酒店,以及符合家人出行习惯的活动。为什么智能体做不到这点,技术难题就是智能体之间没有协同,数据没有串通起来。要智能体垂直应用落地,首先要设计好数据直接的互联,同时不要贪大贪多,要让大家体会到具体使用的好处。

  数据安全

  让大湾区成数据安全使用典范

南都:联合实验室确实可以在AI人才培养发挥资源整合作用。展望未来,您对实验室建设运行又有哪些期待?

陈雷:希望联合实验室成立更多联盟,通过签订协议,助力数据安全使用。让参与者获取实实在在的好处,达到共赢,他们自然而然就会把数据安全使用起来,更加注重数据安全、隐私保护。积累安全的数据越来越多,通过开放共享,让更多企业使用,实现良性循环,让粤港澳大湾区成为数据安全使用的典范。

南都:刚才您谈的主要是数据安全,在人工智能安全发展方面,实验室能发挥什么作用?

陈雷:大模型训练的时候,需要很多数据,肯定会涉及很多商业或者个人隐私信息。这样,我们就要设计模型的保护机制,对于一些敏感问题,我们怎么保证大模型回答的正确性。实际上,大模型面临很多网络攻击新风险,数据投毒危害值得警惕。我们需要想办法保证大模型安全的输出,而不是输出内容失当或者不可控的东西,这也是我们经常讨论研究的模型安全问题,希望联合实验室联合大湾区众多高校,在这方面多做研究,起到枢纽作用,在赋予AI更多能力同时,将更多精力投入在AI安全之上,确保大模型可信、可靠、可控。

  聚焦

  联合实验室能发挥哪些独特作用

香港科技大学(广州)信息枢纽院长、数据科学与分析学域讲座教授陈雷,主要研究数据驱动的人工智能、知识图谱、区块链、数据隐私、众包、空间和时间数据库,以及对大型图形和概率数据库的查询优化。

“人工智能发展到现在,最重要的不是算力、算法问题,而是数据问题,期待粤港澳大湾区生成式人工智能安全发展联合实验室与大湾区众多高校合作,在数据方面发力,建设大数据平台、数据测试平台,让各类大模型通过平台测试性能,找出不足,加以改进。”

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
安东尼:全联盟都很讨厌杜兰特的勇士,当时大家都希望保罗在18年夺冠

安东尼:全联盟都很讨厌杜兰特的勇士,当时大家都希望保罗在18年夺冠

懂球帝
2026-01-13 12:52:12
台退役上校呼吁:只要大陆答应2个条件,台湾随时可以和平统一!

台退役上校呼吁:只要大陆答应2个条件,台湾随时可以和平统一!

科普100克克
2026-01-09 10:38:43
廉价版特斯拉Model Y现身国内官网!

廉价版特斯拉Model Y现身国内官网!

快科技
2026-01-13 18:04:08
你见过最牛的作假手段是什么?网友:双胞胎就很多这种情况

你见过最牛的作假手段是什么?网友:双胞胎就很多这种情况

带你感受人间冷暖
2025-12-16 00:05:16
1959 年,特赦后的邱行湘打算去做搬运工糊口,周总理了解情况后告诉他:“你是国家干部啊!”

1959 年,特赦后的邱行湘打算去做搬运工糊口,周总理了解情况后告诉他:“你是国家干部啊!”

源溯历史
2025-12-21 15:01:27
你们闻过最臭的东西是什么?网友:妇科病的味道吧

你们闻过最臭的东西是什么?网友:妇科病的味道吧

带你感受人间冷暖
2025-09-28 00:15:07
CCTV5+直播!榜首大战上演,卫冕冠军将复仇,吴梦洁是关键

CCTV5+直播!榜首大战上演,卫冕冠军将复仇,吴梦洁是关键

跑者排球视角
2026-01-14 07:02:41
遭遇咸猪手应该怎么办?网友:被姐夫手伸进衣服里摸了3次,咋办

遭遇咸猪手应该怎么办?网友:被姐夫手伸进衣服里摸了3次,咋办

解读热点事件
2025-12-02 00:05:05
开车撞人致死却拖欠赔偿金10年 唐山“教科书式老赖”送给女儿的40多万被法院判决“赠与无效”

开车撞人致死却拖欠赔偿金10年 唐山“教科书式老赖”送给女儿的40多万被法院判决“赠与无效”

封面新闻
2026-01-12 22:49:03
我连夜啃完马斯克这173分钟视频,很震撼

我连夜啃完马斯克这173分钟视频,很震撼

贩财局
2026-01-11 18:19:53
全市集中整治!西安公安交警查获145例!

全市集中整治!西安公安交警查获145例!

环球网资讯
2026-01-13 17:02:14
二战苏联俘虏了8万名日本女兵,她们的命运后来咋样了?

二战苏联俘虏了8万名日本女兵,她们的命运后来咋样了?

小熊侃史
2026-01-13 07:15:08
破案了!上海男篮输给深圳男篮原因找到,赛后郑永刚点评一针见血

破案了!上海男篮输给深圳男篮原因找到,赛后郑永刚点评一针见血

郭夷包工头
2026-01-14 08:01:30
中国偏偏不让出港口,19国军队堵门,导弹都架好了,倒逼中方让步

中国偏偏不让出港口,19国军队堵门,导弹都架好了,倒逼中方让步

一个有灵魂的作者
2025-07-26 08:38:25
斯诺克最新形势:决出6席8强,赵心童再战希金斯,丁俊晖迎首秀!

斯诺克最新形势:决出6席8强,赵心童再战希金斯,丁俊晖迎首秀!

刘姚尧的文字城堡
2026-01-14 08:05:54
特朗普举着孩子照片,对哭泣的母亲承诺:我相信中国会执行死刑的

特朗普举着孩子照片,对哭泣的母亲承诺:我相信中国会执行死刑的

博览历史
2025-07-21 17:59:30
东契奇42+7+8湖人不敌国王3连败,勒布朗22分德罗赞32+6

东契奇42+7+8湖人不敌国王3连败,勒布朗22分德罗赞32+6

湖人崛起
2026-01-13 13:24:00
闫学晶认怂仅1天,再传来噩耗!这下麻烦大了,赵本山出手也难救

闫学晶认怂仅1天,再传来噩耗!这下麻烦大了,赵本山出手也难救

翰飞观事
2026-01-12 14:22:27
热点城市聚焦:崇明地铁即将通车,上海16区仅剩此地“地铁荒”!

热点城市聚焦:崇明地铁即将通车,上海16区仅剩此地“地铁荒”!

王姐懒人家常菜
2026-01-13 15:30:51
38万预算,7座蔚来ES8和6座问界M8怎么选?看完这几点再决定!

38万预算,7座蔚来ES8和6座问界M8怎么选?看完这几点再决定!

蓝色海边
2026-01-14 08:54:03
2026-01-14 10:43:00
南方都市报 incentive-icons
南方都市报
换一种方式,南都在现场。
592899文章数 3586677关注度
往期回顾 全部

科技要闻

美国批准英伟达H200卖给中国,但有条件

头条要闻

李在明谈中日韩三国合作重要性 高市早苗一句不提中国

头条要闻

李在明谈中日韩三国合作重要性 高市早苗一句不提中国

体育要闻

牛津学霸买下儿时主队,让它成为英超黑马

娱乐要闻

何晴去世30天,许亚军终于发声

财经要闻

"死了么"App爆火:流量来了 困境未解

汽车要闻

限时9.99万元起 2026款启辰大V DD-i虎鲸上市

态度原创

旅游
教育
艺术
时尚
公开课

旅游要闻

新场景新消费丨来荣成打卡地标美食+民宿 宝藏小城配套“上新”啦!

教育要闻

跟大鹏老师学将军饮马,通熟易懂!

艺术要闻

八大山人『山水花鸟册』

【年度爱用】她们2025年买得最值的,是这些

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版