InfluxDB集群、高可用性和货币化更新

导航至

警告!请注意,此博客已超过1年,请查看InfluxDB集群的最新信息,并了解更多关于InfluxDB企业版的内容。

更新:自我写此文章以来,我们已经实现了所承诺的事项。

  • 我们继续改进开源平台,为InfluxDB增加了88个新特性和133个错误修复,包括性能增强和所有新的查询功能,如Holt-Winters、移动平均以及终止长时间运行的查询。
  • 我们创建了influx-relay,作为高可用性设置下的纯开源选项。
  • 我们于4月19日在InfluxDB Cloud上发布了InfluxDB集群的托管服务。
  • 9月8日,我们推出了本地InfluxDB企业版

 

“InfluxData是如何赚钱的?”这是我开发InfluxDB项目并围绕它建立InfluxData公司期间多次被问及的问题。目前,我们有我们的云服务,即InfluxDB的托管平台,并提供支持服务以及SLA和专业技术服务。

在过去几个月里,我们与其他开源供应商进行了交谈,并研究了不同的开源货币化模式。从我们的讨论中,我们了解到,仅支持并不能确保我们继续保持所有内容开源。似乎尽管持续对开源项目做出重大贡献,但客户最终会随着其基础设施的成熟而放弃支持,并寻求降低运营成本。

我们还考虑了为生产任务如管理和监控等构建闭源工具。我们发现这些工具的货币化效果不佳,并容易受到其他监控供应商和托管公司的威胁。托管提供商尤其是一个严重的生存威胁,因为他们可以提供我们开源软件的完全托管解决方案,消除客户购买生产工具、支持或云服务的需求。我们过去6个月看到AWS在其平台上推出托管Elasticsearch,就可以证明这一点。时间将告诉我们Elastic从产品角度如何回应,但无疑亚马逊将继续改进和积极货币化其服务。

虽然我们致力于开源,但我们也不能忽视商业的实际情况。我们需要有能力支付开发者,以便继续推进 InfluxDB 项目。因此,我们决定将未来的集群功能作为闭源软件来构建。未来版本的开放源码 InfluxDB 将专注于提供作为独立服务器使用的最佳体验和性能。集群和高可用性功能将作为我们即将推出的 Influx Enterprise 提供的一部分,将在接下来的几个月内提供。

我知道这会对一些用户和粉丝来说是个惊喜。在过去的 2.5 年里,我们一直在公开开发 InfluxDB,并且在这段时间里进行了多次集群迭代。然而,我们认为,对于 InfluxDB 社区和支持它的公司来说,最好的前进道路是更早、更积极地商业化,以确保我们能够继续为开源的 InfluxDB 做出伟大的贡献。对于那些期待我们最先进的集群作为免费开源软件的用户,我对此表示歉意。

下周,我们将为 0.11.0 版本发布第一个候选版本。虽然这个版本在查询引擎和集群代码库方面有显著的改进,但这是最后一个包含集群功能的开源版本。4 月份,我们将发布 0.12.0 版本,这将是一个完全开源的版本,拥有许多新功能,但将专注于独立 InfluxDB 服务器。这两个版本都将替代当前的稳定版本 0.10.3。

对于寻找免费开源选项的用户,我们将发布开源 InfluxDB Relay 项目,并附带一个 着陆页,说明如何使用纯开源和订阅选项在 0.12.0 版本及以后实现高可用性。从那时起,我们的集群工作将集中在闭源 Influx Enterprise 提供方案上。

我们的目标是通过这种划分,在免费的开源软件和可销售的闭源软件之间划出一条清晰的界限。我们的意图是通过开源服务大多数用户基础,同时从占比较小、运营规模较大的企业用户中获利。

这并非轻易做出的决定。我们分析了当前的用户基础,在全球数千个使用 InfluxDB 的组织和用户中,不到一半的百分之一正在运行活跃的集群。这是可以预料的,因为我们一直告诉社区,集群尚未准备好投入生产,仅用于测试目的。

然而,全球仍有数千个组织在使用 InfluxDB 并从中获得实际价值,而没有使用集群。我们创建的开源产品价值将在接下来的几个月和几年里随着每个版本的发布而增加,因为我们将在 TSM 存储引擎、我们的新查询引擎和扩展查询功能中提供开源代码的改进。

关于我们是否在发布功能不全的软件的问题确实出现了。我交谈的几个人认为集群是任何开源数据库的“基本筹码”。从我们的当前用户基础来看,我认为情况并非如此。当然,像 Cassandra 和 Riak 这样的数据库也提供免费开源的集群,但这些数据库在分布式、集群环境中之外几乎没有用途。

InfluxDB 在没有集群的情况下,作为独立服务器用于时间序列用例仍然很有吸引力。我们有用户在单个服务器上运行,每天处理超过 10 亿个值,我们预计随着时间的推移,在开源平台上增加该吞吐量。今天,有数千个独立 InfluxDB 服务器在生产环境中运行。展望即将推出的功能,我们预计这个数字将显著增加。

以下是在接下来的 6 个月内将在开源 InfluxDB 中直接开发的某些内容的预览

  • 改进的查询引擎,性能显著提升,修复了许多导致内存耗尽的查询(OOM错误)
  • 许多更多的查询功能,如移动平均、基于时间的连接、直方图、跨系列转换等
  • 查询管理和功能,用于终止长时间运行或行为异常的查询
  • 单个服务器支持数十亿临时系列。这是一个磁盘和内存中的测量和标签索引
  • 地理空间查询

我们将继续在MIT许可证下公开开发独立的InfluxDB代码,就像过去两年一样。我们的目标是建立世界上最好的开源时间序列数据库。

在接下来的几个月内,我们将通过Influx Cloud(我们的托管主机产品)和Influx Enterprise(我们的本地产品)为我们的现有和未来客户提供集群和高可用性。对于本地部署,我们的目标是提供高可用性集群解决方案,其中包括开发者支持。

Influx Enterprise和它提供的集群将在我们提供本地二进制文件之前通过我们的Influx Cloud产品部署。这将使我们能够快速迭代集群解决方案,并在我们掌控的环境中每天进行多次部署。对于我们的云客户,这意味着他们将获得最快速的错误修复,而我们的未来本地客户将获得经过生产使用验证的二进制文件。

如果您有任何评论、问题或疑虑,请随时通过电子邮件直接联系我:[email protected]。我们致力于该项目的长期发展,并致力于提供吸引人的免费、开源软件,我们将继续改进它。