开源Apache Cassandra项目的维护者今天宣布了一个更新,在扩展操作中可以将数据流速度提高5倍,同时提供高达25%的读写吞吐量。为企业IT组织提供Cassandra实例的DataStax软件工程师Ekaterina Dimitrova说,Apache Cassandra数据库的4.0版本也经过了优化,可以在云和Kubernetes集群上部署。
其他增加的功能包括保持数据副本同步的能力,以优化增量修复,审计日志跟踪用户访问和活动,对工作负载性能的影响最小,更简单的配置设置,增强的压缩,以及通过减少清理内存的垃圾收集器的暂停时间而实现的改进延迟。
另外,Apache Cassandra项目的维护者今天宣布,他们现在改为每年发布一次,每个主要的版本支持三年。
最新版本的Apache Cassandra数据库已经开发了三年多。Dimitrova说:我们的目标是通过提供一个高度稳定的升级来简化迁移过程,而不是一个可能被视为正在进行的工作的平台。这版本已经修复了1000多个漏洞,”
作为这项工作的一部分,Apache Cassandra社区在项目的测试和质量保证阶段部署了几个测试和质量保证项目和方法,使维护人员和贡献者能够生成可重复的现实生活工作负载,无需暂停工作负载就可以进行测试。
作为一种NoSQL数据库,Apache Cassandra作为关系数据库的替代品获得了广泛的关注,因为关系数据库的设计目的不是为了处理大量非结构化数据。Cassandra最初是由Facebook开发的,它基于宽列存储,可以高效处理每秒数千次写操作的大量非结构化数据,而且不会出现单点故障。Facebook在2009年将该数据库捐赠给了Apache软件基金会。
目前使用Cassandra的机构包括苹果公司,该公司已经部署了超过16万个实例,在1000多个集群上存储了超过100PB的数据;Netflix公司也部署了超过1万个实例,在100多个集群上存储了6PB的数据,每天处理超过1万亿次请求。同样,彭博社每天为跨越1700多个Cassandra节点的近1PB的数据集提供超过200亿个请求。
其他采用Apache Cassandra的组织包括Activision、Backblaze、BazaarVoice、百思买、CERN、Constant Contact、康卡斯特、DoorDash、eBay、富达、Hulu、荷兰国际集团、Instagram、Intuit、梅西百货、麦格理银行、麦当劳、纽约时报、Monzo、Outbrain、培生教育、Sky、Spotify、塔吉特、优步、沃尔玛和Yelp。
Cassandra的拥护者继续面临的挑战是部署和管理一个Cassandra数据库需要大量的专业知识。在许多情况下,应用程序只有在空间不足时才会离开开源文档数据库。开发人员并不总是知道他们的应用程序有一天可能需要扩展到什么程度。它们中的许多都可以配置文档数据库,而不需要数据库管理员(DBA)的任何干预。
然而,最终可能需要一个能够扩展到处理PB级非结构化数据的数据库。好消息是,在一个组织第一次遇到这个问题后,它更有可能将某种程度的Cassandra专业知识用于下一个需要重构的应用程序,使其运行在一个为扩展而设计的数据库上。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.