我们现在生活在一个由数据驱动的世界中,每天收集和存储大量的信息。组织生成的数据越多,有效访问和分析数据的能力就越重要。
不幸的是,数据分析被认为是当今许多公司的薄弱环节。这主要是因为在执行无效分析时选择了错误的数据存储系统类型。
改进分析的一种方法是收购企业级数据仓库。这就是数据仓库中的 OLAP 的用武之地。
☌ 什么是 OLAP?
在线分析处理,简称 OLAP,是一种计算方法,允许用户有选择地获取和查询信息,以便从不同的角度进行研究。OLAP BI(商业智能)查询通常有助于分析趋势、财务报告、销售预测和其他规划活动。
☌ OLAP 系统如何工作?
为了便于数据分析,OLAP 系统从多个来源收集信息并将这些信息存储在数据仓库中。然后,它会将数据清理并组织到数据立方体中。
每个 OLAP 多维数据集都包含按维度分类的数据,如地理销售区域、客户和时间段。然后用客户名称和国家/地区等详细信息填充这些维度,并根据层次结构进行组织。
执行所有这些操作后,数据分析人员可以执行四种类型的 OLAP 分析操作:
- Roll-up:也称为整合或聚合,它可以通过两种方式执行操作:通过减少维度或通过提升概念层次结构。
- Drill-down:向下钻取方法与汇总过程相反,它将信息分成更小的部分。
- Slice and dice:在 Slice 中,分析师可以采取单一级别的信息进行显示。在 dice 中,分析师可以从多个维度中选择数据供他们评估。
- Pivot:在 Pivot 中,分析师旋转数据轴以获得对正在研究的信息的新观点。
☌ OLAP 系统有哪些类型?
OLAP 等级结构从 OLAP 开始,然后是另外三种类型。这些是ROLAP、MOLAP和HOLAP。
- ROLAP
Relational OLAP(ROLAP)是一种扩展的 RDBMS,它处理可以在关系数据库中找到的信息。所有事实和维度表都作为关系表保存,同时还允许进行多维数据分析。
ROLAP 的两个主要优点是它在处理大数据方面效率很高,并且具有可扩展性。它的主要缺点是需要更多的资源来执行,并且此 OLAP 系统的查询性能比其他系统慢。
- MOLAP
Multidimensional OLAP(MOLAP)是一种经典的 OLAP 方法,它利用多维数据集促进数据分析。使用 MOLAP,用户可以从不同方面查看其数据。
MOLAP 的主要优点是其快速的查询性能、较小的数据量以及自动计算更高级别数据的能力。至于缺点,它比 ROLAP 的可扩展性更差,而且这种方法本身以引入数据冗余而闻名。
- HOLAP
Hybrid OLAP(HOLAP)是 ROLAP 和 MOLAP 的组合。它允许快速计算 MOLAP,同时结合了 ROLAP 的高可扩展性。
使用 HOLAP 的主要好处是它有助于提高磁盘空间经济性,同时利用立方体技术,促进所有数据类型的更快性能。HOLAP 的主要缺点是,它是使用最复杂的类型,因为它同时支持 ROLAP 和 MOLAP。
☌ OLAP vs OLTP
OLAP 代表在线分析处理,与 OLTP 不同。
OLTP 能够遵循三层架构来支持面向交易的应用程序。OLTP 最常见的用途是管理组织内发生的日常交易,数据处理是其主要目标。
例子:假设有一对夫妇在他们的银行使用联名账户。有一天,两人决定同时在不同的自动取款机取款。无论两人谁先完成认证过程,都能得到他们想要的钱。在这种情况下,OLTP 系统确保取款金额不超过银行当前金额。
现在正在使用的其他一些 OLTP 系统的例子可以在下面找到:
- 网上银行
- 订单条目
- 在购物车中添加物品
- 发送短信
- 在线预订机票
这里的关键是 OLTP 系统专为交易优势而设计,而不是为数据分析而设计。
为了更好地了解 OLTP 与 OLAP 的区别,让我们来看看下面的表。
☌ 数据仓库中的OLAP用例
OLAP 在满足组织的分析需求方面发挥着至关重要的作用。以下是 OLAP 在各个领域的使用案例。
- 市场营销:当 OLAP 用于营销时,它使营销分析师能够更多地了解他们的客户、哪些产品是有价值的、区域和季节性趋势等等。
- 医疗保健:医疗保健数据仓库使用 OLAP 可用于预测健康风险和结果、与保险公司共享信息并生成报告。
- 金融服务:公司首席财务官可以利用 OLAP 多维数据集为他们提供将数据转换为所需信息的方法,同时允许他们轻松生成定制财务报告。
☌ OLAP 的优势
以下是在数据仓库中使用 OLAP 的好处:
- 高速数据处理:OLAP 以其快速的查询执行速度而闻名。设计良好的数据集通常可以在几秒钟内处理用户查询。
- 多维数据表示:此能力允许用户从不同的角度或切片查看数据。
- 平坦学习曲线:OLAP 供应商通常为客户提供广泛的教程和文档。他们通常也有一个专业团队,随时准备处理可能出现的任何问题。
- 汇总和详细数据:OLAP 的另一个主要优点是向用户提供的信息是汇总的,非常详细。这意味着这些表格具有多个维度,使任何人都可以轻松浏览海量数据。
☌ 结论
如你所见,OLAP 在数据仓库中起着至关重要的作用,因为它可以帮助确保向用户提供的数据得到快速处理,从多个角度提供,并且详细无序。除此之外,它还有一个平坦的学习曲线,因为大多数供应商都提供了关于如何入门的深入教程。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.