在构建任何软件应用程序时,选择合适的数据库至关重要。所有数据库在性能方面都有不同的优势和劣势,因此,针对您的特定用例和数据模型,决定哪个数据库的优势最多、缺点最少,是一个重要的决定。下面,您将找到 AWS DynamoDB 和 Rockset 的关键概念、架构、特性、用例和定价模型的概述,以便您可以快速了解它们之间的比较。

本文的主要目的是比较 AWS DynamoDB 和 Rockset 在涉及时序数据的工作负载方面的性能,而不是所有可能的用例。时序数据通常在数据库性能方面提出了独特的挑战。这是因为写入的数据量很大,而且访问这些数据的查询模式也很复杂。本文无意说明哪个数据库更好;它只是提供了每个数据库的概述,以便您可以做出明智的决定。

AWS DynamoDB 与 Rockset 细分


 
数据库模型

键值和文档存储

实时数据库

架构

DynamoDB 是 Amazon Web Services (AWS) 提供的完全托管的无服务器 NoSQL 数据库。它在高性能用例中使用个位数毫秒延迟,并支持键值和文档数据模型。数据在 AWS 区域内的多个可用区之间进行分区和复制,并且 DynamoDB 支持读取操作的最终一致性或强一致性

Rockset 是一款为现代云应用程序构建的实时分析数据库,旨在使开发人员能够创建实时、事件驱动的应用程序,并以低延迟在结构化、半结构化和非结构化数据上运行复杂查询。Rockset 使用云原生、分布式架构,将存储和计算分离,从而实现水平可扩展性和高效的资源利用率。数据由分布式、自动扩展的查询处理节点集自动索引和提供服务。

许可

闭源

闭源

使用案例

无服务器 Web 应用程序、实时竞价平台、游戏排行榜、物联网数据管理、高速数据处理

实时分析、事件驱动的应用程序、搜索和聚合、个性化用户体验、物联网数据分析

可扩展性

自动扩展以处理大量的读取和写入吞吐量,支持按需容量和自动扩展,用于多区域复制的全局表

通过分布式存储和计算实现水平扩展

正在寻找最有效的入门方式?

无论您是寻求成本节省、更低的管理开销还是开源,InfluxDB 都能提供帮助。

AWS DynamoDB 概述

Amazon DynamoDB 是 AWS 提供的托管 NoSQL 数据库服务。它于 2012 年首次推出,旨在提供低延迟、高吞吐量的性能。DynamoDB 基于 Amazon 工程师于 2007 年发布的 Dynamo 论文的原则构建,旨在提供高度可用、可扩展且分布式的键值存储。

Rockset 概述

Rockset 是一款实时索引数据库,专为快速高效地查询结构化和半结构化数据而设计。Rockset 由前 Facebook 工程师于 2016 年创立,旨在提供一种无服务器搜索和分析解决方案,使用户能够构建强大的应用程序和数据驱动的产品,而无需传统数据库管理的复杂性。


AWS DynamoDB 用于时序数据

DynamoDB 可以与时序数据一起使用,尽管与专门的时序数据库相比,它可能不是最优化的解决方案。要在 DynamoDB 中存储时序数据,您可以使用复合主键,其中分区键用于实体标识符,排序键用于时间戳。这使您可以有效地查询特定实体和时间范围内的数据。但是,DynamoDB 在处理时序数据时的主要缺点是缺乏对数据聚合和降采样的内置支持,而这些是时序分析的常见要求。您可能需要在应用程序中执行这些操作,或使用 AWS Lambda 等其他服务来处理数据。

Rockset 用于时序数据

Rockset 的实时索引和低延迟查询功能使其成为时序数据分析的绝佳选择。它的无模式摄取和对复杂数据类型的支持使处理时序数据变得毫不费力,而其 Converged Index 确保了对历史和实时数据的高效查询。Rockset 特别适合需要实时分析的应用程序,例如物联网监控和异常检测。


AWS DynamoDB 关键概念

一些特定于 DynamoDB 的关键术语和概念包括

  • :在 DynamoDB 中,数据存储在表中,表是项目的容器。每个表都有一个主键,用于唯一标识表中的每个项目。
  • 项目:项目是 DynamoDB 表中的单个记录,由一个或多个属性组成。
  • 属性:属性是键值对,构成表中的项目。DynamoDB 支持属性的标量、文档和集合数据类型。
  • 主键:主键唯一标识表中的每个项目,它可以是单属性分区键,也可以是复合分区-排序键。

Rockset 关键概念

  • 融合索引:Rockset 使用一种独特的索引方法,该方法结合了倒排索引和列式索引,使数据库能够针对搜索和分析用例进行优化。
  • 无模式摄取:Rockset 在摄取时自动推断模式,从而可以轻松处理 JSON 等半结构化数据格式。
  • 虚拟实例:Rockset 使用虚拟实例的概念为不同的工作负载提供隔离和资源分配,从而确保可预测的性能。


AWS DynamoDB 架构

DynamoDB 是一种 NoSQL 数据库,它使用键值存储和文档数据模型。它旨在通过在多台服务器之间自动分区数据并使用复制来确保容错能力,从而提供高可用性、持久性和可扩展性。DynamoDB 的一些主要组件包括

  • 分区:DynamoDB 根据分区键自动分区数据,这确保数据均匀分布在多个存储节点上。
  • 复制:DynamoDB 跨 AWS 区域内的多个可用区复制数据,从而提供高可用性和持久性。
  • 一致性:DynamoDB 提供两种一致性模型:最终一致性和强一致性,允许您为应用程序选择适当的一致性级别。

Rockset 架构

Rockset 使用云原生、无服务器架构,该架构构建在分布式、共享无系统之上。它是一种 NoSQL 数据库,与传统关系数据库相比,它具有更大的灵活性和可扩展性。Rockset 架构的核心组件包括摄取服务、存储服务和查询服务。摄取服务负责从各种来源摄取数据,而存储服务维护 Converged Index。查询服务处理查询并提供 API,供开发人员与数据库交互。

免费时序数据库指南

获取关于备选方案和选择关键要求的全面回顾。

AWS DynamoDB 功能特性

自动扩展

DynamoDB 可以根据工作负载自动扩展其读取和写入容量,使您能够在不过度配置资源的情况下保持一致的性能。

备份和恢复

DynamoDB 提供对时间点恢复的内置支持,使您能够将表恢复到过去 35 天内的先前状态。

全局表

DynamoDB 全局表使您能够跨多个 AWS 区域复制表,为全球应用程序提供低延迟访问和数据冗余。

DynamoDB Streams 捕获表中项目级别的修改,可用于触发 AWS Lambda 函数进行实时处理,或与其他 AWS 服务同步数据。

Rockset 功能特性

无服务器扩展

Rockset 根据工作负载自动扩展资源,这意味着用户无需管理任何基础设施或容量规划。### 全文搜索 Rockset 的 Converged Index 支持全文搜索,使其成为需要高级搜索功能的应用程序的理想选择。 ### 与 BI 工具集成 Rockset 提供与流行的商业智能 (BI) 工具(如 Tableau、Looker 和 Redash)的本机集成,使用户无需任何额外设置即可可视化和分析其数据。


AWS DynamoDB 用例

会话管理

DynamoDB 可用于存储 Web 应用程序的会话数据,从而提供对会话信息的快速且可扩展的访问。

游戏

DynamoDB 可用于存储在线游戏中的玩家数据、游戏状态和其他游戏相关信息,从而提供低延迟和高吞吐量的性能。

物联网

DynamoDB 可用于存储和处理来自物联网设备的传感器数据,从而实现对设备数据的实时监控和分析。

Rockset 用例

实时分析

Rockset 的低延迟查询和实时摄取功能使其成为构建实时分析仪表板的理想选择,适用于物联网监控、社交媒体分析和日志分析等应用。

凭借其 Converged Index 和对高级搜索功能的支持,Rockset 是构建全文搜索应用程序(如产品目录或文档搜索系统)的绝佳选择。

机器学习

Rockset 实时摄取和查询大规模半结构化数据的能力使其成为机器学习应用程序的合适选择。


AWS DynamoDB 定价模型

DynamoDB 提供两种定价选项:预置容量和按需容量。使用预置容量,您可以指定应用程序每秒预计需要的读取和写入次数,并根据预置容量的量收费。这种定价模型适用于具有可预测流量或逐渐增加流量的应用程序。您可以使用自动扩展根据指定的利用率自动调整表的容量,从而在确保应用程序性能的同时降低成本。

另一方面,使用按需容量,您需要为应用程序在表上执行的数据读取和写入按请求付费。您无需指定应用程序预计执行多少读取和写入吞吐量,因为 DynamoDB 会在工作负载增加或减少时立即适应。这种定价模型适用于具有波动或不可预测流量模式的应用程序。

Rockset 定价模型

Rockset 提供基于使用量的定价模型,该模型根据客户摄取的数据量、虚拟实例的数量以及执行的查询量向客户收费。定价模型旨在透明且灵活,使用户只需为其消耗的资源付费。Rockset 还提供具有有限资源的免费层级,供开发人员探索该平台。用户可以根据自己的需求在按需实例和预留实例之间进行选择。