在构建任何软件应用程序时,选择合适的数据库至关重要。所有数据库在性能方面都有不同的优势和劣势,因此,为您的特定用例和数据模型决定哪个数据库具有最多的优势和最少的缺点是一项重要的决定。下面您将找到 ClickHouse 和 Mimir 的关键概念、架构、功能、用例和定价模型的概述,以便您可以快速了解它们之间的比较。

本文的主要目的是比较 ClickHouse 和 Mimir 在涉及时间序列数据的工作负载中的表现,而不是所有可能的用例。时间序列数据通常在数据库性能方面提出了独特的挑战。这是由于写入的数据量很大以及访问该数据的查询模式。本文并非旨在说明哪个数据库更好;它只是提供了每个数据库的概述,以便您可以做出明智的决定。

ClickHouse 与 Mimir 分解


 
数据库模型

列式数据库

时间序列数据库

架构

ClickHouse 可以部署在本地、云端或作为托管服务。

Grafana Mimir 是一个时间序列数据库,专为高性能、实时监控和分析而设计。它具有分布式架构,允许跨多个节点进行水平扩展,以处理大量数据和查询。由于它是开源的,因此可以本地部署,也可以作为 Grafana 托管的托管解决方案部署

许可证

Apache 2.0

APGL 3.0

用例

实时分析、大数据处理、事件日志记录、监控、IoT、数据仓库

监控、可观测性、IoT

可扩展性

水平可扩展,支持分布式查询处理和并行执行

水平可扩展

正在寻找最有效的方式来开始?

无论您是在寻找成本节省、更低的 管理开销还是开源,InfluxDB 都能提供帮助。

ClickHouse 概述

ClickHouse 是一个开源列式数据库管理系统,专为高性能在线分析处理 (OLAP) 任务而设计。它由俄罗斯领先的科技公司 Yandex 开发。ClickHouse 以其实时处理大量数据的能力而闻名,可提供快速的查询性能和实时分析。其列式存储架构实现了高效的数据压缩和更快的查询执行,使其适用于大规模数据分析和商业智能应用程序。

Mimir 概述

Grafana Mimir 是一个开源软件项目,为 Prometheus 提供可扩展的长期存储解决方案。Grafana Mimir 于 2022 年在 Grafana Labs 启动并宣布,旨在成为最可扩展和高性能的开源指标时间序列数据库。该项目融合了 Grafana Labs 工程师在以大规模运行 Grafana Enterprise Metrics 和 Grafana Cloud Metrics 时获得的知识和经验。


ClickHouse 用于时间序列数据

ClickHouse 可以有效地用于存储和分析时间序列数据,尽管它没有针对处理时间序列数据进行显式优化。虽然 ClickHouse 一旦摄取就可以非常快速地查询时间序列数据,但它往往难以应对需要以较小批量摄取数据的高写入场景,以便可以实时分析数据。

Mimir 用于时间序列数据

Grafana Mimir 非常适合处理时间序列数据,使其成为涉及指标存储和分析的场景的合适选择。它为 Prometheus(一种流行的开源监控和警报系统)提供长期存储功能。借助 Grafana Mimir,用户可以存储和查询较长时间的时间序列指标,从而进行历史分析和趋势检测。它对于需要可扩展和高性能的时间序列数据存储以进行指标监控和可观测性目的的应用程序尤其有用。


ClickHouse 关键概念

  • 列式存储:ClickHouse 以列式格式存储数据,这意味着每列的数据单独存储。这实现了高效的压缩和更快的查询执行,因为在查询执行期间仅读取所需的列。
  • 分布式处理:ClickHouse 支持分布式处理,允许跨集群中的多个节点执行查询,从而提高查询性能和可扩展性。
  • 数据复制:ClickHouse 提供数据复制,确保在硬件故障或节点中断的情况下数据的可用性和容错能力。
  • 物化视图:ClickHouse 支持物化视图,这些视图是预先计算的查询结果,存储为表。物化视图可以显着提高查询性能,因为它们允许通过避免重新计算每个查询的结果来更快地检索数据。

Mimir 关键概念

  • 指标:在 Grafana Mimir 中,指标表示随时间跟踪的度量或观察结果。它们可以包括各种类型的数据,例如系统指标、应用程序性能指标或传感器数据。
  • 长期存储:Grafana Mimir 提供专门为长期保留时间序列数据而量身定制的存储解决方案,允许用户存储和查询较长时间的历史指标。
  • 微服务:Grafana Mimir 采用基于微服务的架构,其中系统由多个水平可扩展的微服务组成,这些微服务可以独立并行运行。


ClickHouse 架构

ClickHouse 的架构旨在支持对大型数据集进行高性能分析。ClickHouse 以列式格式存储数据。这实现了高效的数据压缩和更快的查询执行,因为在查询执行期间仅读取所需的列。ClickHouse 还支持分布式处理,这允许跨集群中的多个节点执行查询。ClickHouse 使用 MergeTree 存储引擎作为其主要表引擎。MergeTree 专为高性能 OLAP 任务而设计,并支持数据复制、数据分区和索引。

Mimir 架构

Grafana Mimir 采用基于微服务的架构,其中系统包含多个水平可扩展的微服务。这些微服务可以独立并行运行,从而实现工作负载的有效分配和可扩展性。Grafana Mimir 的组件被编译成单个二进制文件,提供统一且有凝聚力的系统。该架构旨在实现高可用性和多租户,使多个用户和应用程序能够同时使用数据库。这种分布式架构确保了处理大规模指标存储和检索场景时的可扩展性和弹性。

免费时间序列数据库指南

获取对备选方案和选择您的数据库的关键要求的全面审查。

ClickHouse 功能

实时分析

ClickHouse 专为实时分析而设计,可以低延迟处理大量数据,提供快速的查询性能和实时洞察。

数据压缩

ClickHouse 的列式存储格式实现了高效的数据压缩,减少了存储需求并提高了查询性能。

物化视图

ClickHouse 支持物化视图,这可以通过预先计算并将查询结果存储为表来显着提高查询性能。

Mimir 功能

可扩展性

Grafana Mimir 旨在水平扩展,使系统能够处理不断增长的数据量和不断增加的工作负载。其水平可扩展的微服务架构允许无缝扩展和改进的性能。

高可用性

Grafana Mimir 通过确保冗余和容错能力来提供高可用性。它允许跨多个节点复制和分发数据,确保数据的持久性和存储指标的持续可用性。

长期存储

Grafana Mimir 为时间序列指标的长期存储提供专用解决方案。它提供高效的存储和检索机制,允许用户保留和分析较长时间的历史指标数据。


ClickHouse 用例

大规模数据分析

ClickHouse 的高性能查询引擎和列式存储格式使其适用于大规模数据分析和商业智能应用程序。

实时报告

ClickHouse 的实时分析功能使组织能够生成实时报告和仪表板,为决策提供最新的洞察。

日志和事件数据分析

ClickHouse 实时处理大量数据的能力使其成为日志和事件数据分析的合适选择,例如分析 Web 服务器日志或应用程序事件。

Mimir 用例

指标监控和可观测性

Grafana Mimir 非常适合监控和可观测性用例。它支持时间序列指标的存储和分析,允许用户实时监控其系统和应用程序的性能、健康状况和行为。

长期指标存储

Grafana Mimir 专注于提供可扩展的长期存储,非常适合需要保留和分析较长时间的历史指标数据的应用程序。它允许用户存储和查询 Prometheus 生成的大量时间序列数据。

趋势和异常检测

通过使用 Mimir 存储长期历史数据,它可以用于检测指标中的趋势,还可以用于将当前指标与历史数据进行比较,以检测异常值和异常情况


ClickHouse 定价模型

ClickHouse 是一个开源数据库,可以部署在您自己的硬件上。ClickHouse 的开发者最近还创建了 ClickHouse Cloud,这是一种用于部署 ClickHouse 的托管服务。

Mimir 定价模型

Grafana Mimir 是一个开源项目,这意味着它可以免费使用,并且不需要任何许可费用。用户可以下载源代码并在自己的基础设施上部署 Grafana Mimir,而不会产生直接成本。但是,重要的是要考虑与托管和维护数据库基础设施相关的运营成本。