企业真的可以大规模自托管吗?

导航至

本文最初发表于 The New Stack,并经许可在此转载。

自托管对许多公司来说是有效的。但何时应该放手并尝试更简单的方式呢?

天下没有免费的午餐,或者在这个例子中,没有免费的软件。这是一个神话。亚马逊网络服务公司 (Amazon Web Services) 安全副总裁、原始域名系统 (DNS) 创建者保罗·维克西 (Paul Vixie) 在 2022 年欧洲开源峰会 (Open Source Summit Europe 2022) 上就此主题发表了引人入胜的演讲。他的演讲包括一份针对免费软件消费者的全面“注意事项”清单。维克西的议程包括劳动密集型且通常成本高昂的工程工作,范围从小型例行升级到本地维护孤立的依赖项。

如果要用一句话概括“注意事项”,那就是工程师始终在工作、监控、观察并随时准备采取行动。这位“随时准备采取行动”的工程师必须具备高水平的专业知识,以便他们能够处理任何突发情况。免费软件本身并没有什么不好,而且它确实有效。识别选择软件的隐性成本也适用于自托管数据库的决策。自托管对许多公司来说是有效的。但何时应该放手并尝试更简单的方式呢?

什么是自托管数据库?

自托管数据库有多种形式。本地托管的开源数据库是最明显的例子。然而,许多商业数据库产品都有分层软件包,其中包括自管理选项。本地部署托管具有优点和缺点:安全风险低,能够直接在数据旁边工作以及完全控制数据库是一些优点。当然,还存在扩展问题。自托管为任何业务或开发团队带来了挑战,这些业务或开发团队的流量不稳定或不可靠,因为按需扩展是不可能的。数据库工程师必须始终考虑本地服务器的最高流量,否则可能会在流量高峰时发生中断。

对于希望自托管并按需扩展的企业来说,在云中自托管是另一种选择。此选项允许流量不稳定或不太可预测的企业根据自身需求进行扩展。在云中自托管时,云提供商会在传统部署模型中的虚拟机上安装和托管其数据库。当您在云中托管商业数据库时,对云和数据库的支持是极少的,因为自托管始终意味着您的工程资源负责该项目。这延伸到停机等紧急情况,甚至安全漏洞。

技能差距

有许多经验丰富的专业人员可以在本地和云端大规模管理数据库。数十年来,SQL 数据库一直是事实上的数据库。现在,随着更多专为从其存储的数据点中获取最大价值而构建的数据库的兴起,市场正在发生转变。在社区内获得立足之地的较新数据库类型是列式数据库搜索引擎数据库图形数据库时间序列数据库。现在,熟悉这些技术的开发人员可以选择他们想要利用自己的专业知识做什么。

时间序列数据

Gradient Flow 预计,从 2020 年到 2027 年,全球时间序列分析软件市场将以 11.5% 的复合年增长率增长。时间序列数据是一个庞大的类别,包括任何带有时间戳的数据。企业通过消费者物联网 (IoT工业物联网和工厂设备等项目从物理世界收集时间序列数据。源自在线来源的时间序列数据包括可观测性指标、日志、跟踪、安全监控和 DevOps 性能监控。时间序列数据为实时仪表板、决策以及严重影响许多人工智能应用统计和机器学习模型提供支持。

弥合技能差距

InfluxDB 3.0 是一种专用时间序列数据库,可在单个数据存储中摄取、存储和分析所有类型的时间序列数据,包括指标、事件和跟踪。它构建在 Apache Arrow 之上,并针对规模和性能进行了优化,从而实现实时查询响应。InfluxDB 具有原生 SQL 支持以及与数据科学工具的开源可扩展性和互操作性。

InfluxDB Cloud Dedicated 是 InfluxDB 的完全托管的单租户实例,专为需要隐私和定制但又不想面临自托管挑战的客户而创建。专用基础设施具有弹性和可扩展性,并具有内置的多层数据持久性,数据复制量为 2 倍。托管服务意味着全天候支持、自动补丁和版本更新。更高程度的定制也是 InfluxDB Cloud Dedicated 的一个特点。客户选择最适合其数据和工作负载的集群层,以用于其专用私有云资源。在许多可定制的特性中,增加的查询超时和内存缓存是其中两个。

结论

是否选择自管理或托管数据库,取决于每个组织。决策者和工程师必须在做出最佳决策之前深入了解组织的需求、流量模式、工程技能和资源以及数据特征。

要开始使用,请查看 InfluxDB Cloud Dedicated 的演示,联系我们的销售团队或立即注册您的免费云账户