在构建任何软件应用程序时,选择合适的数据库至关重要。所有数据库在性能方面都有不同的优势和劣势,因此,针对您的特定用例和数据模型,决定哪个数据库的优点最多、缺点最少是一项重要的决策。下面,您将找到 Amazon Timestream for LiveAnalytics 和 ClickHouse 的关键概念、架构、功能、用例和定价模型的概述,以便您可以快速了解它们之间的比较。

本文的主要目的是比较 Amazon Timestream for LiveAnalytics 和 ClickHouse 在涉及时间序列数据的工作负载方面的性能,而不是针对所有可能的用例。时间序列数据通常在数据库性能方面提出独特的挑战。这是因为要写入大量数据以及访问这些数据的查询模式。本文并非旨在说明哪个数据库更好;它只是提供了每个数据库的概述,以便您可以做出明智的决定。

Amazon Timestream for LiveAnalytics 与 ClickHouse 对比细分


 
数据库模型

时间序列数据库

列式数据库

架构

Timestream 是一种完全托管的无服务器时间序列数据库服务,仅在 AWS 上可用。

ClickHouse 可以部署在本地、云端或作为托管服务。

许可证

闭源

Apache 2.0

用例

物联网、DevOps、时间序列分析

实时分析、大数据处理、事件日志记录、监控、物联网、数据仓库

可扩展性

无服务器且自动可扩展,无需人工干预即可处理摄取、存储和查询工作负载

水平可扩展,支持分布式查询处理和并行执行

正在寻找最有效的入门方式?

无论您是在寻求节省成本、降低管理开销还是开源,InfluxDB 都能为您提供帮助。

Amazon Timestream for LiveAnalytics 概览

Timestream for LiveAnalytics 是 AWS 开发的完全托管的无服务器时间序列数据库服务。Amazon Timestream for LiveAnalytics 于 2020 年推出,专门用于处理时间序列数据,使其成为物联网、监控和分析应用程序的理想选择,这些应用程序需要高摄取率、高效存储和快速查询功能。作为 AWS 生态系统的一部分,Timestream for LiveAnalytics 可以轻松地与其他 AWS 服务集成,从而简化在云中构建和部署时间序列应用程序的过程。AWS 还提供 Timestream for InfluxDB,它是 InfluxDB 的托管版本,与 InfluxDB 2.x API 兼容,并与 InfluxData 合作发布

ClickHouse 概览

ClickHouse 是一个开源列式数据库管理系统,专为高性能在线分析处理 (OLAP) 任务而设计。它由俄罗斯领先的科技公司 Yandex 开发。ClickHouse 以其实时处理大量数据的能力而闻名,可提供快速的查询性能和实时分析。其列式存储架构可实现高效的数据压缩和更快的查询执行,使其适用于大规模数据分析和商业智能应用程序。


Amazon Timestream for LiveAnalytics 用于时间序列数据

Amazon Timestream for LiveAnalytics 专为处理时间序列数据而设计,使其成为需要高摄取率和高效存储的各种应用程序的理想选择。其双层存储架构,包括内存存储和磁性存储,允许用户根据数据年龄和访问模式管理数据保留并优化存储成本。此外,Timestream 支持类 SQL 查询并与流行的分析工具集成,使用户可以轻松地从其时间序列数据中获得见解。

ClickHouse 用于时间序列数据

ClickHouse 可以有效地用于存储和分析时间序列数据,尽管它没有明确针对时间序列数据进行优化。虽然 ClickHouse 一旦摄取就可以非常快速地查询时间序列数据,但它往往难以应对需要以较小批量摄取数据以便实时分析的极高写入场景。


Amazon Timestream for LiveAnalytics 关键概念

  • 内存存储:在 Amazon Timestream for LiveAnalytics 中,内存存储是一个组件,用于在内存中存储最近的、可变的时间序列数据,以便进行快速查询和分析。
  • 磁性存储:Amazon Timestream for LiveAnalytics 中的磁性存储负责在磁盘上存储历史的、不可变的时间序列数据,以实现经济高效的长期存储。
  • 生存时间 (TTL):Amazon Timestream for LiveAnalytics 允许用户在其时间序列数据上设置 TTL,这决定了数据在内存存储中保留多长时间,然后才会被移动到磁性存储或删除。

ClickHouse 关键概念

  • 列式存储:ClickHouse 以列式格式存储数据,这意味着每列的数据都单独存储。这可以实现高效的压缩和更快的查询执行,因为在查询执行期间仅读取所需的列。
  • 分布式处理:ClickHouse 支持分布式处理,允许跨集群中的多个节点执行查询,从而提高查询性能和可扩展性。
  • 数据复制:ClickHouse 提供数据复制,以确保在发生硬件故障或节点中断时数据的可用性和容错能力。
  • 物化视图:ClickHouse 支持物化视图,即预先计算的查询结果,以表的形式存储。物化视图可以显着提高查询性能,因为它们允许通过避免重新计算每个查询的结果来更快地检索数据。


Amazon Timestream for LiveAnalytics 架构

Amazon Timestream for LiveAnalytics 构建在无服务器分布式架构之上,该架构支持类 SQL 查询功能。其数据模型专为时间序列数据量身定制,使用带时间戳的记录和灵活的架构,可以适应不同的数据粒度和维度。Timestream 架构的核心组件包括内存存储和磁性存储,它们共同管理数据保留、存储和查询。内存存储针对最近数据的快速查询进行了优化,而磁性存储则为历史数据提供了经济高效的长期存储。

ClickHouse 架构

ClickHouse 的架构旨在支持对大型数据集进行高性能分析。ClickHouse 以列式格式存储数据。这可以实现高效的数据压缩和更快的查询执行,因为在查询执行期间仅读取所需的列。ClickHouse 还支持分布式处理,这允许跨集群中的多个节点执行查询。ClickHouse 使用 MergeTree 存储引擎作为其主要表引擎。MergeTree 专为高性能 OLAP 任务而设计,并支持数据复制、数据分区和索引。

免费时间序列数据库指南

获取对替代方案和选择数据库的关键要求的全面回顾。

Amazon Timestream for LiveAnalytics 功能

无服务器架构

Amazon Timestream for LiveAnalytics 无服务器架构消除了用户管理或预置基础设施的需求,从而易于扩展并降低运营开销。

双层存储

Timestream 的双层存储架构,包括内存存储和磁性存储,可根据数据年龄和访问模式自动管理数据保留并优化存储成本。

类 SQL 查询

Amazon Timestream for LiveAnalytics 支持类 SQL 查询并与流行的分析工具集成,使用户可以轻松地从其时间序列数据中获得见解。

Timestream for InfluxDB

对于需要亚实时查询且延迟低至毫秒级的工作负载,AWS 建议使用 Timestream for InfluxDB 而不是 LiveAnalytics。Timestream for InfluxDB 还为希望使用 AWS 托管服务而无需更新代码的用户提供与 InfluxDB API 的兼容性。

ClickHouse 功能

实时分析

ClickHouse 专为实时分析而设计,可以低延迟处理大量数据,从而提供快速的查询性能和实时见解。

数据压缩

ClickHouse 的列式存储格式可实现高效的数据压缩,从而减少存储需求并提高查询性能。

物化视图

ClickHouse 支持物化视图,这可以通过预先计算并将查询结果存储为表来显着提高查询性能。


Amazon Timestream for LiveAnalytics 用例

物联网应用

Amazon Timestream for LiveAnalytics 对高摄取率和高效存储的支持使其成为监控和分析来自物联网设备(如传感器和智能家电)的数据的理想选择。

DevOps

LiveAnalytics 可用于常规 DevOps 工作负载,例如监控应用程序运行状况和利用率。对于需要延迟尽可能低的实时监控的用例,AWS 建议使用 Timestream for InfluxDB。

分析

Amazon Timestream for LiveAnalytics 可用于跟踪分析数据,例如 Web 和应用程序数据。内置的时间序列分析功能随后可用于聚合和分析数据,以获得有价值的见解,并提高开发人员的工作效率。

ClickHouse 用例

大规模数据分析

ClickHouse 的高性能查询引擎和列式存储格式使其适用于大规模数据分析和商业智能应用程序。

实时报告

ClickHouse 的实时分析功能使组织能够生成实时报告和仪表板,为决策提供最新的见解。

日志和事件数据分析

ClickHouse 实时处理大量数据的能力使其成为日志和事件数据分析的合适选择,例如分析 Web 服务器日志或应用程序事件。


Amazon Timestream for LiveAnalytics 定价模型

Amazon Timestream for LiveAnalytics 提供按需付费定价模型,该模型基于数据摄取、存储和查询执行。摄取成本由摄取到 Timestream 中的数据量决定,而存储成本基于存储在内存存储和磁性存储中的数据量。查询执行成本根据查询执行期间扫描和处理的数据量计算。Timestream 还为用户提供免费套餐,以便他们探索服务并构建概念验证应用程序,而无需产生费用。

ClickHouse 定价模型

ClickHouse 是一个开源数据库,可以部署在您自己的硬件上。ClickHouse 的开发人员最近还创建了 ClickHouse Cloud,这是一个用于部署 ClickHouse 的托管服务。