在构建任何软件应用程序时,选择合适的数据库至关重要。所有数据库在性能方面都有不同的优势和劣势,因此,确定哪种数据库对于您的特定用例和数据模型具有最大的优势和最小的缺点是一个重要的决定。下面您将找到 PostgreSQL 和 OpenTSDB 的关键概念、架构、功能、用例和定价模型的概述,以便您可以快速了解它们之间的比较。

本文的主要目的是比较 PostgreSQL 和 OpenTSDB 在涉及时间序列数据的工作负载中的性能,而不是所有可能的用例。时间序列数据通常在数据库性能方面提出了独特的挑战。这是由于大量数据被写入以及访问该数据的查询模式。本文并非旨在说明哪个数据库更好;它只是提供了每个数据库的概述,以便您可以做出明智的决定。

PostgreSQL 与 OpenTSDB 对比


 
数据库模型

关系数据库

时间序列数据库

架构

PostgreSQL 可以部署在各种平台上,例如本地部署、虚拟机或托管云服务,如 Amazon RDS、Google Cloud SQL 或 Azure Database for PostgreSQL。

OpenTSDB 可以部署在本地或云端,HBase 在分布式节点集群上运行。

许可证

PostgreSQL 许可证(类似于 MIT 或 BSD)

GNU LGPLv2.1

用例

Web 应用程序、地理空间数据、商业智能、分析、内容管理系统、金融应用程序、科学应用程序

监控、可观测性、物联网、日志数据存储

可扩展性

支持垂直扩展,通过分区、分片和使用可用工具的复制实现水平扩展

使用 HBase 作为其存储后端,在多个节点上进行水平扩展

正在寻找最有效的入门方式?

无论您是在寻求成本节省、更低的管理开销还是开源,InfluxDB 都能提供帮助。

PostgreSQL 概述

PostgreSQL,也称为 Postgres,是一个开源关系数据库管理系统,于 1996 年首次发布。它长期以来一直是一个健壮、可靠且功能丰富的数据库系统,广泛应用于各个行业和应用程序。PostgreSQL 以其对 SQL 标准的遵守和可扩展性而闻名,这允许用户定义自己的数据类型、运算符和函数。它由专门的贡献者社区开发和维护,可在包括 Windows、Linux 和 macOS 在内的多个平台上使用。

OpenTSDB 概述

OpenTSDB(开放时间序列数据库)是一个开源、分布式且可扩展的时间序列数据库,构建于 Apache HBase(NoSQL 数据库)之上。OpenTSDB 旨在解决对存储和处理来自各种来源(如物联网设备、传感器和监控系统)生成的大量时间序列数据的日益增长的需求。它最初由 StumbleUpon 于 2010 年开发,后来成为一个独立的项目,拥有活跃的贡献者社区。


PostgreSQL 用于时间序列数据

PostgreSQL 可以用于时间序列数据存储和分析,尽管它并非专门为此用例而设计。凭借其丰富的数据类型、索引选项和窗口函数支持,PostgreSQL 可以处理时间序列数据。但是,在数据压缩、写入吞吐量和查询速度等方面,Postgres 不会像专门的时间序列数据库那样针对时间序列数据进行优化。PostgreSQL 还缺少许多对于处理时间序列数据有用的功能,如降采样、保留策略和用于时间序列数据分析的自定义 SQL 函数。

OpenTSDB 用于时间序列数据

OpenTSDB 专为时间序列数据存储和分析而设计,使其成为管理大规模时间序列数据集的理想选择。其架构实现了高写入和查询性能,并且可以以最少的资源消耗处理每秒数百万个数据点。OpenTSDB 灵活的查询功能允许用户有效地对时间序列数据执行复杂分析。


PostgreSQL 关键概念

  • MVCC:多版本并发控制是 PostgreSQL 使用的一种技术,允许并发执行多个事务,而不会发生冲突或锁定。
  • WAL:预写式日志是一种确保数据持久性的方法,通过在将更改写入主数据文件之前将其记录到日志中。
  • TOAST:超尺寸属性存储技术是一种将大型数据值存储在单独表中的机制,以减少主表的磁盘空间消耗。

OpenTSDB 关键概念

  • 数据点:时间中的单个测量值,由时间戳、指标、值和关联的标签组成。
  • 指标:一个命名值,表示系统的特定方面,如 CPU 使用率或温度。
  • 标签:与数据点关联的键值对,提供元数据并帮助对数据进行分类和查询。


PostgreSQL 架构

PostgreSQL 是一个客户端-服务器关系数据库系统,使用 SQL 语言进行查询和操作。它采用基于进程的架构,每个与数据库的连接都由单独的服务器进程处理。这种架构提供了不同用户和会话之间的隔离。PostgreSQL 支持 ACID 事务,并使用 MVCC、WAL 和其他技术的组合来确保数据一致性、持久性和性能。它还支持各种扩展和外部模块来增强其功能。

OpenTSDB 架构

OpenTSDB 构建于 Apache HBase(一个分布式且可扩展的 NoSQL 数据库)之上,并依赖其架构进行数据存储和管理。OpenTSDB 将时间序列数据存储在 HBase 表中,数据点按指标、时间戳和标签组织。数据库使用无模式数据模型,这允许在添加新指标和标签时具有灵活性。OpenTSDB 架构还支持通过在多个 HBase 节点之间分配数据来实现水平扩展。

免费时间序列数据库指南

获取对备选方案和选择关键要求的全面审查。

PostgreSQL 功能

可扩展性

PostgreSQL 允许用户定义自定义数据类型、运算符和函数,使其高度适应特定的应用程序需求。

PostgreSQL 内置了对全文搜索的支持,使用户能够执行复杂的基于文本的查询和分析。

地理空间支持

借助 PostGIS 扩展,PostgreSQL 可以存储和操作地理空间数据,使其适用于 GIS 应用程序。

OpenTSDB 功能

可扩展性

OpenTSDB 的分布式架构允许水平扩展,确保数据库可以处理不断增长的时间序列数据量。

数据压缩

OpenTSDB 使用各种压缩技术来减少时间序列数据的存储占用空间。

支持时间序列的查询语言

OpenTSDB 具有灵活的查询语言,支持聚合、降采样、过滤和其他操作,用于分析时间序列数据。


PostgreSQL 用例

企业应用程序

PostgreSQL 因其可靠性、性能和功能集而成为大型企业应用程序的热门选择。

GIS 应用程序

借助 PostGIS 扩展,PostgreSQL 可用于存储和分析地图绘制、路由和地理编码等应用程序中的地理空间数据。

OLTP 工作负载

作为关系数据库,PostgreSQL 非常适合几乎任何涉及事务性工作负载的应用程序。

OpenTSDB 用例

监控和警报

OpenTSDB 非常适合大规模监控和警报系统,这些系统从各种来源生成大量时间序列数据。

物联网数据存储

OpenTSDB 可以存储和分析物联网设备(如传感器和智能家电)生成的时间序列数据,从而实现实时洞察和分析。

性能分析

OpenTSDB 灵活的查询功能使其成为分析系统和应用程序性能指标随时间变化的理想选择。


PostgreSQL 定价模型

PostgreSQL 是开源软件,其使用不收取任何许可费。但是,在部署自托管 PostgreSQL 服务器时,可能会产生硬件、托管和运营费用。一些基于云的托管 PostgreSQL 服务,如 Amazon RDS、Google Cloud SQL 和 Azure Database for PostgreSQL,根据存储、计算资源和支持等因素提供不同的定价模型。

OpenTSDB 定价模型

OpenTSDB 是开源软件,这意味着它可以免费使用,无需任何许可费。但是,运行 OpenTSDB 的成本取决于支持底层 HBase 数据库所需的基础设施,如云服务或本地硬件。