网易首页 > 网易号 > 正文 申请入驻

网易数帆、云音乐、Intel、有赞最新大数据实践(PPT下载+视频回放)

0
分享至

6月19日,由网易数帆、Intel联合举办的网易数帆技术沙龙大数据专场在杭州网易园区顺利举办。

网易数帆大数据专家、Apache Spark Committer姚琴,有赞基础架构组OLAP负责人陈琦,Intel资深软件开发工程经理、Apache Hive Committer徐铖,网易云音乐数据专家雷剑波,以及网易数帆大数据产品专家顾平等五位专家,分别就Serverless Spark、ClickHouse、Spark/Flink加速、数据仓库和数据产品等话题分享了各自团队的最新实践。

一、【Kyuubi:开源企业级Serverless Spark框架】

网易数帆大数据专家、Apache Spark Committer姚琴分享了数帆开源项目Kyuubi的研发初衷、设计要点及其在网易的实践。Kyuubi 是一个遵循 HiveSever2 的 RPC 实现的分布式 JDBC 服务,在 Spark 赋予多租户能力后,可以让它成为一个理想的 Hive QL迁移 Spark SQL的平台,其次它将整个 SQL 的Compiler(编译优化) 和 Runtime(执行) 全部交由 Spark 实现,可以获得非常卓著的性能。在这个框架之下,网易数帆整合 Kyuubi 和 Spark 的一些高级特性,开始了 Serverless Spark(Spark as a service)之旅。

由于 Kyuubi 封装 Spark 高阶 API,通过C / S 架构提供,用户对 Spark 相关的概念和框架“无感知”,更加专注于自己的业务和数据本身。这可以满足更多人更多业务对大数据的直接需求。

在网易内部,Kyuubi已经帮助网易传媒业务完成 Hive QL 任务至 Spark SQL的平滑迁移,在完成计算资源资源节省50%的前提下,总体时耗同步缩减70%,综合性能提效727%。此外,团队还正在帮助业务线实施 Spark 作业从 YARN 集群上迁移到 Kubernetes 的工作。

视频回放:

二、【ClickHouse在有赞的使用和优化】

有赞基础架构组OLAP负责人陈琦从三个方面介绍了ClickHouse在有赞的使用和优化:1)ClickHouse在有赞的发展,平台化建设,应用场景,比如DMP,SCRM,CDP等场景的落地和优化。2)千亿级别数据量的离线读写分离,使用离线写入K8s临时构建集群来实现离线数据的读写分离,从而解决写多读少的业务发展问题。3)自研新数据库的探索POC,尝试去融合Doris和ClickHouse,来解决双方的痛点。

陈琦介绍,ClickHouse 不太像一个传统意义上的分布式数据库,整体比较 “手动档”,很多地方都需要用户自己去设计一个流程去完善,比如写入,物化视图等;同时,ClickHouse 也没有自动 Rebalance 的能力,导致扩容缩容运维特别复杂。相比之下,Apache Doris 更像一个分布式数据库,也解决了部分痛点,比如能够自动平衡,支持Shuffle Join 等,但目前为止其单表性能、成熟度及稳定性还不如 ClickHouse。

于是,有赞尝试利用高性能的 ClickHouse 算子实现替换基于 Impala 的 Apache Doris,在未来打造出更好的分布式 OLAP 数据库。从 POC 实现效果来看,该方案是可行性的。

视频回放:

三、【利用Intel Optane PMEM技术加速大数据分析】

Intel软件开发工程经理、Apache Hive Committer徐铖分享了如何使用Intel开源项目Optimized Analytics Package (OAP)加速Spark、Flink的性能,介绍了现有Spark框架在内存管理、Shuffle实现等层面性能有进一步提升的空间。以及如何更好利用新硬件,比如利用Intel Optane PMEM(持久化内存)技术,发挥Optane的持久特性、原地擦写、字节寻址和低延迟等独特价值上,Spark有诸多进一步优化的功能点。

徐铖重点解读了OAP Analytic Cache特性,包括利用Arrow中高性能模块、Spark/Flink的cache awareness、Disaggregated cache、Filter/Project/Aggregation下放和高性能压缩加速器QAT支持等。以Spark cache awareness为例,OAP扩展了现有Spark data source scan能够识别已缓存的热数据块,利用cache location provider来提供调度层面的cache

awareness,并针对不同的使用场景支持了多种cache location provider。

视频回放:

四、【网易云音乐数仓建设之路】

网易云音乐数据专家雷剑波介绍,网易云音乐正在通过规范化、共享化、自助化的统一数仓体系,降低数据使用门槛,提升决策利用效果,并实现数据驱动业务增长。他从流量数据治理和数据资产沉淀两个方面,分享了网易云音乐应对挑战的实践和思考,以及取得的成果。

在流量数据治理方面,埋点是一个巨大的痛点,具体包括埋点格式差异较大,埋点前环节缺乏规范、需求评审,客户端埋点实现无较好的技术设计、工程规范,多数聚合流量需重新提JIRA单等,网易云音乐通过事前建立埋点规范、事中重造埋点流程、事后推动灰度稽核等措施实现治理。在这个过程中,网易云音乐通过与网易数帆共建了easyTracker埋点管理平台、easyFetch自助取数平台等系统,来保证埋点的规范化和流量数据服务自助化。

视频回放:

五、【网易数据产品实践】

网易数帆大数据产品专家顾平分享了网易严选数据产品实践——他从0到1构建了网易严选的数据产品体系和数据中台体系。网易严选业务正走向“数据中台支撑+数据产品驱动”的双引擎模式,释放数据价值以支持创新业务的探索,顾平结合网易严选的业务实践,分享覆盖营销和供应链的数据产品体系建设思路与步骤,并介绍作为支撑的数据中台及数据治理的相关经验。

支撑严选“品牌+平台”运营模式,严选数据产品覆盖数字化运营、数字化管理和数字化供应三个层面,包括了商品数据运营平台、营销数据运营平台、移动数据工作台、供应链数据运作平台四大数据产品。其中移动数据工作台是严选开发的第一个数据产品,该产品主要面向管理层的数据化管理,有助于自上而下推动数据产品体系成功建设。顾平表示,数据产品可以和业务系统相连接,提供异常监控诊断、决策建议,但如果没有数据中台的支撑,数据产品就无法实现。基于网易有数的能力,严选高效高质量地落地了数据体系建设。

视频回放:

通过技术专家的分享,参会者们对大数据前沿技术、热门开源项目的实践与应用有了更深刻的认识,大家还就分享内容及实际业务问题做了现场交流。未来,网易数帆还将继续为技术开发者们提供更多交流合作平台,推动行业技术发展。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
庄则栋走了,穆铁柱走了,聂卫平走了,体育界4大脊梁就剩他了

庄则栋走了,穆铁柱走了,聂卫平走了,体育界4大脊梁就剩他了

珺瑶婉史
2026-02-05 19:25:06
退休港警100万北上安家!在香港买不起厕所,却在内地住进豪宅......

退休港警100万北上安家!在香港买不起厕所,却在内地住进豪宅......

港漂圈
2026-02-05 19:20:24
具俊晔公开大S死因!去机场时心脏骤停,医生称大S猝死与怀孕有关

具俊晔公开大S死因!去机场时心脏骤停,医生称大S猝死与怀孕有关

不八卦掌门人
2026-02-04 10:40:09
穆里尼奥打造最强阵容,本菲卡双线争锋

穆里尼奥打造最强阵容,本菲卡双线争锋

赵或是个热血青年
2026-02-06 00:41:09
中国500强最新排名来了!台积电第一 小米首次超越华为 但都输给了拼多多

中国500强最新排名来了!台积电第一 小米首次超越华为 但都输给了拼多多

快科技
2026-02-05 15:37:11
假“惠民保”骗局曝光:涉案7100万遍及30省,这些套路需警惕

假“惠民保”骗局曝光:涉案7100万遍及30省,这些套路需警惕

环球网资讯
2026-02-05 16:52:06
有多少水和多少泥。张兰中午发视频一语双关,暗示了S妈的结局!

有多少水和多少泥。张兰中午发视频一语双关,暗示了S妈的结局!

噶噶香的晚餐
2026-02-05 09:14:00
详解雄鹿正式通知留下字母哥:谈判延期到休赛期 面临多种可能性

详解雄鹿正式通知留下字母哥:谈判延期到休赛期 面临多种可能性

醉卧浮生
2026-02-06 01:30:24
凌晨2点半,中国米兰冬奥会首秀!3人打头阵:苏翊鸣冲卫冕+首金

凌晨2点半,中国米兰冬奥会首秀!3人打头阵:苏翊鸣冲卫冕+首金

念洲
2026-02-05 13:04:17
萨巴蒂尼:齐沃的能力已得到证明,他未来5年都将是国米主帅

萨巴蒂尼:齐沃的能力已得到证明,他未来5年都将是国米主帅

懂球帝
2026-02-06 00:51:06
小米公司正式回应SU7车辆起火事件

小米公司正式回应SU7车辆起火事件

圆维度
2026-02-05 12:26:06
最惨一代,中年危机遭遇大规模失业潮

最惨一代,中年危机遭遇大规模失业潮

诗词中国
2026-02-04 20:58:36
3年大合同+全家迁居!张本智和官宣震撼抉择,日本队慌了

3年大合同+全家迁居!张本智和官宣震撼抉择,日本队慌了

卿子书
2026-02-02 08:59:31
比特币跌破7万美元,贝森特称美国无意救助,本次暴跌有何不同?

比特币跌破7万美元,贝森特称美国无意救助,本次暴跌有何不同?

闻号说经济
2026-02-05 22:39:03
美芯片价格暴跌90%!美媒破防:责任在中国,因为中国不买了!

美芯片价格暴跌90%!美媒破防:责任在中国,因为中国不买了!

百态人间
2026-02-03 15:34:15
美国大使威胁:若加拿大不推进采购88架F-35战机 美军战机将更频繁进入加领空

美国大使威胁:若加拿大不推进采购88架F-35战机 美军战机将更频繁进入加领空

财联社
2026-01-27 22:04:25
憋大招!得分狂人+选秀权,换快船巨塔,步行者,这是要拆队啊?

憋大招!得分狂人+选秀权,换快船巨塔,步行者,这是要拆队啊?

球童无忌
2026-02-05 22:29:48
特朗普计划落空?黄仁勋失望承认,没有一家中国客户下单H200芯片

特朗普计划落空?黄仁勋失望承认,没有一家中国客户下单H200芯片

大卫聊科技
2026-02-04 14:01:58
最高温下降超12℃!云南多地迎雨雪天气

最高温下降超12℃!云南多地迎雨雪天气

8099999街头巷尾
2026-02-05 21:39:03
1900万粉丝军事大V“听风的蚕”遭平台重锤,违规细节曝光!

1900万粉丝军事大V“听风的蚕”遭平台重锤,违规细节曝光!

水泥土的搞笑
2026-02-05 07:23:53
2026-02-06 03:39:00
网易云
网易云
赋能企业创新,共创云上世界
459文章数 5007关注度
往期回顾 全部

科技要闻

美团买下叮咚买菜,防御还是进击?

头条要闻

与爱泼斯坦共舞嬉笑的神秘红衣女子身份披露

头条要闻

与爱泼斯坦共舞嬉笑的神秘红衣女子身份披露

体育要闻

奇才:我学生……独行侠:成交!

娱乐要闻

微博之夜卷入座位风波!杨幂超话沦陷

财经要闻

中美"只会有好消息" 经济冷暖看房价

汽车要闻

李想为全新L9预热 all in AI造更好的车

态度原创

游戏
房产
健康
旅游
本地

《无主之地4》现已通过Steam Deck验证

房产要闻

新春三亚置业,看过这个热盘再说!

耳石症分类型,症状大不同

旅游要闻

刷屏全网!重庆龚滩古镇苗王迎春巡游,千年古镇藏着最浓中国年

本地新闻

围观了北京第一届黑色羽绒服大赛,我笑疯了

无障碍浏览 进入关怀版