网易首页 > 新闻中心 > 新闻 > 正文

阿里妈妈宣布开源两项AI技术,大幅提升数据的保护和使用效率

0
分享至

9月15日,阿里妈妈宣布同时开源两项AI技术:曲率空间学习框架和联邦学习解决方案。两项最新技术成果的开源,将助力业界提高数据隐私保护能力,预计可降低80%的存储消耗量和提升15%的用户请求匹配精准度,上述技术也可应用于互联网行业之外的各个科研计算领域。

据了解,曲率空间学习框架(Curvature Learning Framework,简称CLF)是中国首个经过工业级场景验证的曲率空间深度学习框架;联邦学习解决方案(Elastic Federated Learning Solution,简称EFLS),是百亿级工业场景跨企业合作的联邦学习解决方案。

用户即日起可在全球最大开源网站GitHub搜索“Curvature-Learning-Framework”,9月30日以后搜索“Elastic-Federated-Learning-Solution”,查看两个项目的开源文件。

“AI技术是新一代生产力。在基于庞大的工业级场景应用成熟后,我们选择向社会开放这些技术能力,以最大化共享AI技术红利,共同进步。”阿里妈妈CTO郑波表示。

曲率空间学习框架开源:AI换轨,坐上曲率飞船

曲率是一个衡量空间弯曲程度的量,曲率越接近零,空间越平坦。在科幻小说《三体》中,人类正是利用空间曲率的变化建造出曲率飞船。

AI所需的海量数据与计算往往基于曲率为零的欧氏空间,这潜在制约了表达能力。阿里妈妈技术团队发现,曲率空间能更精准的建模图数据结构,此次开源的曲率空间学习框架,包含流形、算子、模型及黎曼优化器整套深度学习流程,用户可便捷的将模型迁移到曲率空间中,从而给AI的发展打开一条新通路。

想象一下,使用曲率空间建模就像“吹起一个气球”。假设一个干瘪的气球表面上有十亿个节点,这会是非常致密的状态。随着气球逐渐充气变大,气球表面越来越“弯曲”,节点之间就分的越开,构成的形状也越立体,我们就能越好的观察这些节点并进行区分。

曲率空间正如一个膨胀的气球表面,相对于同样大小的欧氏空间,它能容纳的数据更多,而且对树、环等几何特性展现的更全面精准。基于图数据Cora的实验证明,替换欧氏空间为曲率空间,模型能提升约8%的预测精度。

阿里妈妈技术人士表示,该技术已经在阿里妈妈业务中展现出很高的应用潜力。基于淘宝搜索广告场景,曲率空间能精准建模十亿级商家与用户的交互行为,利用空间曲率变化实现数据的“定向放大”与“精准分割”。系统全量上线后,存储消耗量降低80%,用户侧请求匹配精准度相对提升15%。

该技术有望广泛应用到其他行业,引领新一轮的AI落地浪潮。业内专家表示,曲率空间可以建模地球表面的云层运动轨迹,航空航海路线等,也能表征物流运输图、资源流动图等。从更及时的天气预报、更精准的地图导航,到更高效的物流运输、更公平的社会资源分配,此项新技术能切实改善人们的生活。

联邦学习解决方案开源:兼收并蓄,开放共建

联邦学习是2016年由谷歌提出,在保护终端隐私的前提下进行机器学习,帮助广告主实现跨公司多端投放的解决方案。通俗一点讲,联邦学习就像几位老师傅共同训练一个徒弟,老师傅们各有所长,却互相防备不能共享,而徒弟则兼收并蓄,融会贯通,集合各家所长,终学有所成。

据了解,阿里妈妈此次开源的联邦学习解决方案,更加关注隐私保护和加密计算,并在此基础上建立APP孤岛的信息链接,构建机器学习模型,在高并发、加密性、易用性和产品化等方面提供更好支持,方便多方在超大规模稀疏场景下进行联邦学习的合作与实践。

具体而言,联邦学习解决方案具备以下特点:

1. 大规模高可用:云原生实现方案支持百亿规模数据求交;多种验证方式保证最终结果的完整性和正确性;精简的训练交互协议与高效的底层实现,保证分布式训练的高吞吐;精细的状态恢复与模型校验,确保分布式容灾的正确性。

2.加密保护隐私:通过数据安全与计算安全两种手段以保障用户隐私,支持多种隐私保护方案以提供安全和性能的最佳平衡。

3.更强大更便捷:首次开源了基于水平聚合、层次聚合的两种模型,并通过可视化web界面方便任务流程的开发、配对、调度和管理,极大地提升迭代效率。

依托于联邦学习解决方案,阿里妈妈Unidesk产品已助力珀莱雅、卡姿兰、薇诺娜、花西子、修正等多个企业实现品牌和业务双丰收。据了解,花西子采用Unidesk产品以后,经营效果提升明显,短短2个月时间,品牌ROI提升15%,且放量也在逐步提高。

未来,该技术可以扩展到金融、医疗共建等场景,普适性较高。

将开源进行到底

此次开源,延续了阿里妈妈“将开源进行到底”的一贯做法。从2015年开始,阿里妈妈技术团队将大规模深度学习、图学习、强化学习等多项AI技术深度应用到业务,引领了AI在互联网广告领域的探索和大规模应用,并沉淀出多个业内领先的AI工程系统。

2018年11月,阿里妈妈对外开源了业界首个面向高维稀疏场景的大规模工业级训练引擎XDL,并同时开源包含深度兴趣网络(DIN)、深度兴趣进化网络(DIEN)、深度树匹配(TDM)在内的多个工业级创新算法。在GitHub上,XDL项目开源一个月内所获星赞数超过1000个,到现在已有4000多星赞,近1000次复制使用。

2019年1月,阿里妈妈的大规模图深度学习框架Euler正式对外开源,在工业界引起巨大反响的同时,也引起学术界关注。2021年4月,Euler2.0发布,通用性和灵活性得到进一步提升。在GitHub网站上,Euler项目现在已经有超过2500个星赞和500次复制使用。

相关推荐
热点推荐
见识了中国汽车最严重的腐败

见识了中国汽车最严重的腐败

后视镜里de未来
2024-04-19 18:37:11
4月19日世界杯4强全部产生!国乒3人抗日,张本兄妹晋级剧情雷同

4月19日世界杯4强全部产生!国乒3人抗日,张本兄妹晋级剧情雷同

黄轩理睬
2024-04-19 13:09:57
华为一旦突破芯片技术,就可以横扫全球高科技公司,事实是什么?

华为一旦突破芯片技术,就可以横扫全球高科技公司,事实是什么?

创作者朱海平
2024-04-19 13:04:36
若不能收割中国,战争就是美国最后底牌,幻想和畏惧都是灾难

若不能收割中国,战争就是美国最后底牌,幻想和畏惧都是灾难

兵国大事
2024-04-19 00:10:03
马树山事件之后:从此再无马树山!

马树山事件之后:从此再无马树山!

剑鸣涛声
2024-04-19 14:14:34
国家发改委,重磅发声!

国家发改委,重磅发声!

中国基金报
2024-04-17 17:54:54
演员蒙嘉慧隐居日本农村,劈柴动作熟练小腹隆起,未见老公郑伊健

演员蒙嘉慧隐居日本农村,劈柴动作熟练小腹隆起,未见老公郑伊健

鑫鑫说说
2024-04-18 16:18:59
苏瑞·克鲁斯18岁,正式断绝与阿汤哥的联系,“父亲早已不存在”

苏瑞·克鲁斯18岁,正式断绝与阿汤哥的联系,“父亲早已不存在”

译言
2024-04-19 09:35:23
四川省抗击新冠肺炎疫情先进个人廖锦,今日被双开!

四川省抗击新冠肺炎疫情先进个人廖锦,今日被双开!

小豆豆赛事
2024-04-19 17:42:51
中央巡视组“内鬼”落马:知法犯法,敛财4.6亿元,刚退休就被查

中央巡视组“内鬼”落马:知法犯法,敛财4.6亿元,刚退休就被查

天闻地知
2024-04-19 10:58:42
普京透心凉!除了美国的610亿美元,乌克兰还将收到420亿美元援助

普京透心凉!除了美国的610亿美元,乌克兰还将收到420亿美元援助

娱宙观
2024-04-19 11:45:37
61岁阿姨到上海这家医院看中医,一次花了近24万元!不给病历不知药名,让人心惊肉跳

61岁阿姨到上海这家医院看中医,一次花了近24万元!不给病历不知药名,让人心惊肉跳

新民晚报
2024-04-19 16:08:37
开战了,以色列精确打击伊朗军事基地,伊朗宣称国家处于紧急状态

开战了,以色列精确打击伊朗军事基地,伊朗宣称国家处于紧急状态

爱吃鱼的哆啦A梦
2024-04-19 11:45:09
周迅举报风波升级!女星姚晨下场吃瓜力挺,被发现后秒删评论

周迅举报风波升级!女星姚晨下场吃瓜力挺,被发现后秒删评论

萌神木木
2024-04-18 22:00:03
男子偷看隔壁寡妇洗澡,正看得起劲时,寡妇突然站起身来!

男子偷看隔壁寡妇洗澡,正看得起劲时,寡妇突然站起身来!

天保影视V3
2024-04-18 06:10:03
陈自瑶好漂亮

陈自瑶好漂亮

娱乐圈酸柠檬
2024-04-04 22:19:37
秦岚单看很美,和江疏影在一起还是被比下去了,江又高又白脖子长

秦岚单看很美,和江疏影在一起还是被比下去了,江又高又白脖子长

娱乐圈酸柠檬
2024-04-19 16:59:00
江青拍的照片,你见过几张?

江青拍的照片,你见过几张?

国际艺术大观
2024-04-19 00:06:33
太惨了!中国中免见4年新低,万科见9年新低,爱尔眼科见14年新低

太惨了!中国中免见4年新低,万科见9年新低,爱尔眼科见14年新低

惜别的海岸
2024-04-19 17:24:49
为帮哥哥还债,她16岁辍学打工,陪伴老板24年后,老板分了她30亿

为帮哥哥还债,她16岁辍学打工,陪伴老板24年后,老板分了她30亿

吃鱼思故渊
2024-04-18 23:27:54
2024-04-19 21:04:49

专题推荐

永远跟党走

无障碍浏览 进入关怀版