在构建任何软件应用程序时,选择合适的数据库至关重要。所有数据库在性能方面都有不同的优势和劣势,因此,为您的特定用例和数据模型决定哪个数据库的优势最多,劣势最少是一个重要的决定。下面您将找到 AWS DynamoDB 和 PostgreSQL 的关键概念、架构、功能、用例和定价模型的概述,以便您可以快速了解它们之间的比较。

本文的主要目的是比较 AWS DynamoDB 和 PostgreSQL 在涉及时间序列数据的工作负载中的性能,而不是所有可能的用例。时间序列数据通常在数据库性能方面提出了独特的挑战。这是由于正在写入的大量数据以及访问这些数据的查询模式造成的。本文无意说明哪个数据库更好;它只是提供了每个数据库的概述,以便您可以做出明智的决定。

AWS DynamoDB 与 PostgreSQL 细分


 
数据库模型

键值和文档存储

关系数据库

架构

DynamoDB 是由 Amazon Web Services (AWS) 提供的完全托管的无服务器 NoSQL 数据库。它为高性能用例提供个位数毫秒级的延迟,并支持键值和文档数据模型。数据在 AWS 区域内的多个可用区进行分区和复制,DynamoDB 支持读取操作的最终一致性或强一致性

PostgreSQL 可以部署在各种平台上,例如本地部署、虚拟机或托管云服务(如 Amazon RDS、Google Cloud SQL 或 Azure Database for PostgreSQL)。

许可证

闭源

PostgreSQL 许可证(类似于 MIT 或 BSD)

用例

无服务器 Web 应用程序、实时竞价平台、游戏排行榜、物联网数据管理、高速数据处理

Web 应用程序、地理空间数据、商业智能、分析、内容管理系统、金融应用程序、科学应用程序

可扩展性

自动扩展以处理大量的读取和写入吞吐量,支持按需容量和自动扩展,用于多区域复制的全局表

支持垂直扩展,通过分区、分片和使用可用工具进行复制来实现水平扩展

正在寻找最有效率的入门方式?

无论您是寻求节省成本、降低管理开销还是开源,InfluxDB 都能帮助您。

AWS DynamoDB 概述

Amazon DynamoDB 是由 AWS 提供的托管 NoSQL 数据库服务。它于 2012 年首次推出,旨在提供低延迟、高吞吐量的性能。DynamoDB 构建于 2007 年 Amazon 工程师发布的 Dynamo 论文的原则之上,旨在提供高度可用、可扩展且分布式的键值存储。

PostgreSQL 概述

PostgreSQL,也称为 Postgres,是一个开源关系数据库管理系统,于 1996 年首次发布。它作为强大、可靠且功能丰富的数据库系统拥有悠久的历史,广泛应用于各个行业和应用程序。PostgreSQL 以其对 SQL 标准的遵守和可扩展性而闻名,这允许用户定义自己的数据类型、运算符和函数。它由专职的贡献者社区开发和维护,并在多个平台(包括 Windows、Linux 和 macOS)上可用。


AWS DynamoDB 用于时间序列数据

DynamoDB 可以与时间序列数据一起使用,尽管与专门的时间序列数据库相比,它可能不是最优化的解决方案。要在 DynamoDB 中存储时间序列数据,您可以使用复合主键,其中分区键用于实体标识符,排序键用于时间戳。这使您可以有效地查询特定实体和时间范围内的数据。但是,DynamoDB 在处理时间序列数据时的主要弱点是它缺乏对数据聚合和降采样的内置支持,而这些是时间序列分析的常见要求。您可能需要在应用程序中执行这些操作,或使用 AWS Lambda 等附加服务来处理数据。

PostgreSQL 用于时间序列数据

PostgreSQL 可用于时间序列数据存储和分析,尽管它并非专门为此用例而设计。凭借其丰富的数据类型、索引选项和窗口函数支持,PostgreSQL 可以处理时间序列数据。但是,在数据压缩、写入吞吐量和查询速度等方面,Postgres 不会像专门的时间序列数据库那样针对时间序列数据进行优化。PostgreSQL 还缺少许多对于处理时间序列数据有用的功能,例如降采样、保留策略以及用于时间序列数据分析的自定义 SQL 函数。


AWS DynamoDB 关键概念

DynamoDB 特有的一些关键术语和概念包括

  • :在 DynamoDB 中,数据存储在表中,表是项目的容器。每个表都有一个主键,用于唯一标识表中的每个项目。
  • 项目:项目是 DynamoDB 表中的单个记录,它们由一个或多个属性组成。
  • 属性:属性是构成表中项目的键值对。DynamoDB 支持标量、文档和集合数据类型的属性。
  • 主键:主键唯一标识表中的每个项目,它可以是单属性分区键或复合分区-排序键。

PostgreSQL 关键概念

  • MVCC:多版本并发控制是 PostgreSQL 使用的一种技术,允许多个事务并发执行,而不会发生冲突或锁定。
  • WAL:预写式日志是一种用于确保数据持久性的方法,通过在将更改写入主数据文件之前将其记录到日志中。
  • TOAST:超大属性存储技术是一种用于将大型数据值存储在单独的表中的机制,以减少主表的磁盘空间消耗。


AWS DynamoDB 架构

DynamoDB 是一个 NoSQL 数据库,它使用键值存储和文档数据模型。它旨在通过自动跨多个服务器分区数据并使用复制来确保容错能力,从而提供高可用性、持久性和可扩展性。DynamoDB 的一些主要组件包括

  • 分区:DynamoDB 根据分区键自动分区数据,这确保数据均匀分布在多个存储节点上。
  • 复制:DynamoDB 在 AWS 区域内的多个可用区之间复制数据,从而提供高可用性和持久性。
  • 一致性:DynamoDB 提供两种一致性模型:最终一致性和强一致性,允许您为应用程序选择适当的一致性级别。

PostgreSQL 架构

PostgreSQL 是一个客户端-服务器关系数据库系统,它使用 SQL 语言进行查询和操作。它采用基于进程的架构,每个与数据库的连接都由单独的服务器进程处理。此架构在不同用户和会话之间提供隔离。PostgreSQL 支持 ACID 事务,并使用 MVCC、WAL 和其他技术的组合来确保数据一致性、持久性和性能。它还支持各种扩展和外部模块,以增强其功能。

免费时间序列数据库指南

获取对替代方案和选择关键要求的全面审查。

AWS DynamoDB 功能

自动扩展

DynamoDB 可以根据工作负载自动扩展其读取和写入容量,使您能够在不过度配置资源的情况下保持一致的性能。

备份和恢复

DynamoDB 提供对时间点恢复的内置支持,使您能够将表恢复到过去 35 天内的先前状态。

全局表

DynamoDB 全局表使您能够跨多个 AWS 区域复制表,从而为全局应用程序提供低延迟访问和数据冗余。

DynamoDB 流捕获表中的项目级修改,可用于触发 AWS Lambda 函数以进行实时处理或与其他 AWS 服务同步数据。

PostgreSQL 功能

可扩展性

PostgreSQL 允许用户定义自定义数据类型、运算符和函数,使其高度适应特定的应用程序需求。

PostgreSQL 内置了对全文搜索的支持,使用户能够执行复杂的基于文本的查询和分析。

地理空间支持

借助 PostGIS 扩展,PostgreSQL 可以存储和操作地理空间数据,使其适用于 GIS 应用程序。


AWS DynamoDB 用例

会话管理

DynamoDB 可用于存储 Web 应用程序的会话数据,从而提供对会话信息的快速且可扩展的访问。

游戏

DynamoDB 可用于存储在线游戏的角色数据、游戏状态和其他游戏相关信息,从而提供低延迟和高吞吐量的性能。

物联网

DynamoDB 可用于存储和处理来自物联网设备的传感器数据,从而实现设备数据的实时监控和分析。

PostgreSQL 用例

企业应用程序

PostgreSQL 因其可靠性、性能和功能集而成为大型企业应用程序的热门选择。

GIS 应用程序

借助 PostGIS 扩展,PostgreSQL 可用于存储和分析地图绘制、路由和地理编码等应用程序中的地理空间数据。

OLTP 工作负载

作为关系数据库,PostgreSQL 非常适合几乎所有涉及事务性工作负载的应用程序。


AWS DynamoDB 定价模型

DynamoDB 提供两种定价选项:预置容量和按需容量。使用预置容量,您可以指定应用程序预期需要的每秒读取和写入次数,并根据预置容量的量收费。此定价模型适用于具有可预测流量或逐渐增加流量的应用程序。您可以使用自动扩展根据指定的利用率自动调整表的容量,从而确保应用程序性能,同时降低成本。

另一方面,使用按需容量,您可以为应用程序在表上执行的数据读取和写入按请求付费。您无需指定应用程序预期执行多少读取和写入吞吐量,因为 DynamoDB 会在工作负载增加或减少时立即适应您的工作负载。此定价模型适用于具有波动或不可预测流量模式的应用程序。

PostgreSQL 定价模型

PostgreSQL 是开源软件,其使用不收取许可费。但是,当部署自我管理的 PostgreSQL 服务器时,可能会产生硬件、托管和运营费用。多种基于云的托管 PostgreSQL 服务(如 Amazon RDS、Google Cloud SQL 和 Azure Database for PostgreSQL)根据存储、计算资源和支持等因素提供不同的定价模型。