网易首页 > 网易号 > 正文 申请入驻

网易数帆、云音乐、Intel、有赞最新大数据实践(PPT下载+视频回放)

0
分享至

6月19日,由网易数帆、Intel联合举办的网易数帆技术沙龙大数据专场在杭州网易园区顺利举办。

网易数帆大数据专家、Apache Spark Committer姚琴,有赞基础架构组OLAP负责人陈琦,Intel资深软件开发工程经理、Apache Hive Committer徐铖,网易云音乐数据专家雷剑波,以及网易数帆大数据产品专家顾平等五位专家,分别就Serverless Spark、ClickHouse、Spark/Flink加速、数据仓库和数据产品等话题分享了各自团队的最新实践。

一、【Kyuubi:开源企业级Serverless Spark框架】

网易数帆大数据专家、Apache Spark Committer姚琴分享了数帆开源项目Kyuubi的研发初衷、设计要点及其在网易的实践。Kyuubi 是一个遵循 HiveSever2 的 RPC 实现的分布式 JDBC 服务,在 Spark 赋予多租户能力后,可以让它成为一个理想的 Hive QL迁移 Spark SQL的平台,其次它将整个 SQL 的Compiler(编译优化) 和 Runtime(执行) 全部交由 Spark 实现,可以获得非常卓著的性能。在这个框架之下,网易数帆整合 Kyuubi 和 Spark 的一些高级特性,开始了 Serverless Spark(Spark as a service)之旅。

由于 Kyuubi 封装 Spark 高阶 API,通过C / S 架构提供,用户对 Spark 相关的概念和框架“无感知”,更加专注于自己的业务和数据本身。这可以满足更多人更多业务对大数据的直接需求。

在网易内部,Kyuubi已经帮助网易传媒业务完成 Hive QL 任务至 Spark SQL的平滑迁移,在完成计算资源资源节省50%的前提下,总体时耗同步缩减70%,综合性能提效727%。此外,团队还正在帮助业务线实施 Spark 作业从 YARN 集群上迁移到 Kubernetes 的工作。

视频回放:

二、【ClickHouse在有赞的使用和优化】

有赞基础架构组OLAP负责人陈琦从三个方面介绍了ClickHouse在有赞的使用和优化:1)ClickHouse在有赞的发展,平台化建设,应用场景,比如DMP,SCRM,CDP等场景的落地和优化。2)千亿级别数据量的离线读写分离,使用离线写入K8s临时构建集群来实现离线数据的读写分离,从而解决写多读少的业务发展问题。3)自研新数据库的探索POC,尝试去融合Doris和ClickHouse,来解决双方的痛点。

陈琦介绍,ClickHouse 不太像一个传统意义上的分布式数据库,整体比较 “手动档”,很多地方都需要用户自己去设计一个流程去完善,比如写入,物化视图等;同时,ClickHouse 也没有自动 Rebalance 的能力,导致扩容缩容运维特别复杂。相比之下,Apache Doris 更像一个分布式数据库,也解决了部分痛点,比如能够自动平衡,支持Shuffle Join 等,但目前为止其单表性能、成熟度及稳定性还不如 ClickHouse。

于是,有赞尝试利用高性能的 ClickHouse 算子实现替换基于 Impala 的 Apache Doris,在未来打造出更好的分布式 OLAP 数据库。从 POC 实现效果来看,该方案是可行性的。

视频回放:

三、【利用Intel Optane PMEM技术加速大数据分析】

Intel软件开发工程经理、Apache Hive Committer徐铖分享了如何使用Intel开源项目Optimized Analytics Package (OAP)加速Spark、Flink的性能,介绍了现有Spark框架在内存管理、Shuffle实现等层面性能有进一步提升的空间。以及如何更好利用新硬件,比如利用Intel Optane PMEM(持久化内存)技术,发挥Optane的持久特性、原地擦写、字节寻址和低延迟等独特价值上,Spark有诸多进一步优化的功能点。

徐铖重点解读了OAP Analytic Cache特性,包括利用Arrow中高性能模块、Spark/Flink的cache awareness、Disaggregated cache、Filter/Project/Aggregation下放和高性能压缩加速器QAT支持等。以Spark cache awareness为例,OAP扩展了现有Spark data source scan能够识别已缓存的热数据块,利用cache location provider来提供调度层面的cache

awareness,并针对不同的使用场景支持了多种cache location provider。

视频回放:

四、【网易云音乐数仓建设之路】

网易云音乐数据专家雷剑波介绍,网易云音乐正在通过规范化、共享化、自助化的统一数仓体系,降低数据使用门槛,提升决策利用效果,并实现数据驱动业务增长。他从流量数据治理和数据资产沉淀两个方面,分享了网易云音乐应对挑战的实践和思考,以及取得的成果。

在流量数据治理方面,埋点是一个巨大的痛点,具体包括埋点格式差异较大,埋点前环节缺乏规范、需求评审,客户端埋点实现无较好的技术设计、工程规范,多数聚合流量需重新提JIRA单等,网易云音乐通过事前建立埋点规范、事中重造埋点流程、事后推动灰度稽核等措施实现治理。在这个过程中,网易云音乐通过与网易数帆共建了easyTracker埋点管理平台、easyFetch自助取数平台等系统,来保证埋点的规范化和流量数据服务自助化。

视频回放:

五、【网易数据产品实践】

网易数帆大数据产品专家顾平分享了网易严选数据产品实践——他从0到1构建了网易严选的数据产品体系和数据中台体系。网易严选业务正走向“数据中台支撑+数据产品驱动”的双引擎模式,释放数据价值以支持创新业务的探索,顾平结合网易严选的业务实践,分享覆盖营销和供应链的数据产品体系建设思路与步骤,并介绍作为支撑的数据中台及数据治理的相关经验。

支撑严选“品牌+平台”运营模式,严选数据产品覆盖数字化运营、数字化管理和数字化供应三个层面,包括了商品数据运营平台、营销数据运营平台、移动数据工作台、供应链数据运作平台四大数据产品。其中移动数据工作台是严选开发的第一个数据产品,该产品主要面向管理层的数据化管理,有助于自上而下推动数据产品体系成功建设。顾平表示,数据产品可以和业务系统相连接,提供异常监控诊断、决策建议,但如果没有数据中台的支撑,数据产品就无法实现。基于网易有数的能力,严选高效高质量地落地了数据体系建设。

视频回放:

通过技术专家的分享,参会者们对大数据前沿技术、热门开源项目的实践与应用有了更深刻的认识,大家还就分享内容及实际业务问题做了现场交流。未来,网易数帆还将继续为技术开发者们提供更多交流合作平台,推动行业技术发展。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
79岁佛爷连任后烧起第1把火:要求欧足联剥夺巴萨长达20年的冠军

79岁佛爷连任后烧起第1把火:要求欧足联剥夺巴萨长达20年的冠军

风过乡
2026-06-08 20:03:20
惨!纸包不住火,美国航母也不行

惨!纸包不住火,美国航母也不行

枢密院十号
2026-06-08 21:49:21
新华视点丨2026高考作文“上新”,折射语文教育哪些新趋势

新华视点丨2026高考作文“上新”,折射语文教育哪些新趋势

澎湃新闻
2026-06-08 02:34:09
泽连斯基宣布:由于俄方拒绝谈判,将对俄全境展开猛烈打击

泽连斯基宣布:由于俄方拒绝谈判,将对俄全境展开猛烈打击

史政先锋
2026-06-08 12:07:40
女子痴迷裸聊,情夫看她和网友的裸聊经过,2012年将她杀死并抛尸

女子痴迷裸聊,情夫看她和网友的裸聊经过,2012年将她杀死并抛尸

汉史趣闻
2026-06-06 14:50:38
泽连斯基给某人的公开信(全文)

泽连斯基给某人的公开信(全文)

金召点评
2026-06-08 14:00:34
2010年,俄罗斯超级富二代当街暴打普京女婿,被捕后几乎家破人亡

2010年,俄罗斯超级富二代当街暴打普京女婿,被捕后几乎家破人亡

禾所思
2024-10-22 15:23:53
王炸!涉及1.5万人搬迁、总投资772亿元,湖北世界级巨无霸超级工程来了!

王炸!涉及1.5万人搬迁、总投资772亿元,湖北世界级巨无霸超级工程来了!

越乔
2026-06-08 22:40:30
0-11!国乒 19 岁女单小将被张本美和打爆,粉丝无语提前离场

0-11!国乒 19 岁女单小将被张本美和打爆,粉丝无语提前离场

酷侃体坛
2026-06-08 21:25:54
化工专业真有这么恐怖?网传中南大化工33人走了3人,6人确诊癌症

化工专业真有这么恐怖?网传中南大化工33人走了3人,6人确诊癌症

慧翔百科
2026-06-08 11:28:13
连续一轮游!郑钦文伦敦站0-2输克里斯蒂安 跌至世界第158名

连续一轮游!郑钦文伦敦站0-2输克里斯蒂安 跌至世界第158名

醉卧浮生
2026-06-09 02:15:34
报复升级!有人公开煽动“搞垮中餐馆”:下巨额订单、永远别去取

报复升级!有人公开煽动“搞垮中餐馆”:下巨额订单、永远别去取

大洛杉矶LA
2026-06-08 07:16:19
演员杨雪回应结婚原因:恋爱期间,丈夫拿出全部存款替自己母亲还贷;其丈夫系知名美术指导,代表作有《大明王朝1566》《你好,李焕英》等

演员杨雪回应结婚原因:恋爱期间,丈夫拿出全部存款替自己母亲还贷;其丈夫系知名美术指导,代表作有《大明王朝1566》《你好,李焕英》等

台州交通广播
2026-06-08 21:17:47
女子向精神医生诉苦,两次“被精神病”收治累计161天,司法鉴定为完全民事行为能力人,仍难摘掉“精神病”帽子

女子向精神医生诉苦,两次“被精神病”收治累计161天,司法鉴定为完全民事行为能力人,仍难摘掉“精神病”帽子

大风新闻
2026-06-08 17:17:09
iPhone天气显示杭州临安下周气温53℃、48℃,官方通报:系该品牌手机天气APP自身数据错误所致,依据权威预报6月15日最高气温预报实为32℃

iPhone天气显示杭州临安下周气温53℃、48℃,官方通报:系该品牌手机天气APP自身数据错误所致,依据权威预报6月15日最高气温预报实为32℃

极目新闻
2026-06-08 11:02:22
这才是中方在这个节骨眼访问朝鲜的真正原因!

这才是中方在这个节骨眼访问朝鲜的真正原因!

李荣茂
2026-06-08 18:32:34
扬州回应“央视曝光回收料牙刷”:依法从严从快作出处理

扬州回应“央视曝光回收料牙刷”:依法从严从快作出处理

澎湃新闻
2026-06-08 10:24:26
菲律宾强震背后:中国态度变了,这才是大国该有的清醒

菲律宾强震背后:中国态度变了,这才是大国该有的清醒

阿振观点
2026-06-08 18:55:56
2026年,1270万毕业生,许多家庭的天塌了

2026年,1270万毕业生,许多家庭的天塌了

猫叔东山再起
2026-06-07 10:20:07
多所大学明确:不招复读生

多所大学明确:不招复读生

麦可思研究
2026-06-08 11:36:49
2026-06-09 04:48:49
网易云
网易云
赋能企业创新,共创云上世界
459文章数 5008关注度
往期回顾 全部

科技要闻

干掉聊天框,ChatGPT不只回答,还要办事

头条要闻

女主播拒绝男子追求被快递包裹炸伤 当事人最新发声

头条要闻

女主播拒绝男子追求被快递包裹炸伤 当事人最新发声

体育要闻

2026年世界杯?到底会是什么样?

娱乐要闻

越扒越有!奔跑吧文旅合作费近两千万

财经要闻

华润万家蜜薯被检查农药超标

汽车要闻

从真实事故场景出发 吉利银河星舰7 EV硬核安全“超纲”了

态度原创

艺术
手机
本地
公开课
军事航空

艺术要闻

定了!深圳最大高铁站,超130亿元!

手机要闻

苹果iOS 27“史诗级”更新,新增工作日(含调休)闹钟功能

本地新闻

用杨柳青年画的方式,打开天津

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

美媒:以色列窃听美伊谈判 美称不可接受

无障碍浏览 进入关怀版