InfluxDB 3.0 与 ADX

导航至

在过去几年中,时间序列是世界上增长最快的数据库类别之一。随着越来越多的组织意识到时间序列数据对其运营的重要性,更多的数据库选项进入市场。InfluxDB 多年来一直是领先的时间序列数据库,随着 InfluxDB 3.0 的发布,它仍然处于时间序列领域的前沿。因此,考虑到这一点,让我们看看 InfluxDB 3.0 如何与竞争对手,特别是 Microsoft Azure Data Explorer (ADX) 相比。

架构

InfluxDB 和 ADX 都是旨在处理大型时间序列工作负载和无限基数数据的列式数据库。但这几乎是相似之处的终点。

InfluxDB 为用户和组织提供了管理其时间序列数据的极大灵活性。首先,InfluxDB 专为时间序列数据而构建。它提供完全托管的云服务和自托管的本地解决方案。InfluxDB Cloud 提供弹性、多租户服务和专用单租户服务。InfluxDB Cloud 在 AWS、Azure 和 GCP 中交付,使组织能够使用最适合其需求的提供商,而不会影响性能。这为组织如何使用云提供了很大的灵活性。InfluxDB 还为本地、私有云和 边缘 部署提供 企业版 和开源版本。

ADX 不是专门构建的时间序列数据库;相反,它是一个支持时间序列工作负载的关系数据库。ADX 仅作为托管云解决方案提供,因此它不支持具有数据安全或驻留策略的组织,这些策略要求(或偏好)本地解决方案。同样,ADX 仅在 Azure 云上可用。虽然这使其成为对 Azure 商店有吸引力的解决方案,但绑定到其他云提供商的组织需要要么投资开发将数据导出到 Azure 的方法,要么选择不同的解决方案。

功能

InfluxDB 和 ADX 都提供一系列功能来促进开发。两者都专为 OLAP 工作负载而设计,并且可以实时或批量处理数据。两者都为用户提供 API 访问和客户端库来处理数据,尽管它们不一定在相同的语言中提供可比较的 API 选项或库。两者都支持写入时模式和显式数据模式。

许多 InfluxDB 功能优先考虑易用性。它具有单个 API,开发人员可以在整个产品套件中使用。这增强了可扩展性,因为用户可以启动新实例并使用他们已有的脚本来使其快速投入生产。InfluxDB 支持 SQL 和 InfluxQL 用于查询数据。SQL 是世界上最常用的语言之一,减少了摩擦并加速了应用程序开发。InfluxQL 是一种类似 SQL 的语言,具有添加的基于时间的功能。InfluxDB 3.0 构建在开源 Apache Arrow 生态系统之上,并将数据持久化为开源 Apache Parquet 文件格式。这提高了 InfluxDB 的互操作性,使其易于与其他基于 Arrow 的生态系统集成。InfluxDB 3.0 使用 Apache Arrow Flight SQL 与大量不断增长的第三方工具(如 Grafana 和 Apache SuperSet)进行通信以进行可视化。

ADX 的功能严重依赖于 Microsoft 生态系统。ADX 提供 RESTful API 并与 MS-TDS 集成。这允许用户使用 T-SQL 查询数据,并提供与 SQL Server Management Studio 的互操作性。但是,该数据库不支持常规 SQL。相反,它提供了一种专有的查询语言 KQL 用于数据处理和分析。虽然 ADX 可以摄取 Apache Parquet 文件,但它并未针对与其他 Parquet 友好的解决方案的互操作性进行优化,从而限制了数据的可扩展性。ADX 确实具有内置的数据可视化功能,并且可以与 Power BI 等工具集成。

性能

这两个数据库都可以处理大型 OLAP 时间序列数据工作负载。

InfluxDB 3.0 分离了计算和存储,以最大限度地提高性能并降低成本。它使用列式内存“热”存储层来缓存最近的数据,以实现实时、亚秒级查询,并将 Parquet 文件持久化到对象存储(“冷”存储层)。Parquet 具有极高的数据压缩比,这允许用户使用更少的空间保存更多高保真数据,从而节省存储成本。

ADX 结合了计算和存储,并且不允许沿着这些向量独立扩展。这意味着用户最终可能会为他们不需要的资源付费。

结论

由于 InfluxDB 和 ADX 有几个关键的相似之处,因此在两种解决方案之间进行权衡的组织应关注他们希望从数据中获得多少价值,以及与他们当前的工具集和技术专长部署的简易程度。InfluxDB 通过其部署选项、功能、灵活性和互操作性,使组织能够最大限度地发挥其时间序列数据的价值。虽然 ADX 对于致力于 Microsoft 生态系统的组织来说是一个可行的选择,但 InfluxDB 可以与相同的 Microsoft 服务以及 Microsoft 以外的许多其他服务集成,这一事实可能会将天平倾向于 InfluxDB 作为面向未来的解决方案。