公司真的能在大规模上自我托管吗?

导航到

本文最初发表在The New Stack,并经许可在此重发。

自我托管对许多公司来说都很有效。但何时应该放弃并尝试更简单的方法呢?

免费的午餐是不存在的,或者在这个例子中,免费的软件。这是一个神话。亚马逊网络服务安全副总裁、原始域名系统(DNS)的创造者保罗·维克斯在2022年欧洲开源峰会关于这个话题的精彩演讲中提到了这一点。他的演讲包括了一个关于免费软件消费者的“该做和不该做”的详细清单。维克斯的清单包括了一些劳动密集型、往往昂贵的工程工作,涵盖了从小型常规升级到本地维护孤立依赖项的各个方面。

总结“应该做和不应该做”的内容,工程师们始终在行动、监控、观察并准备采取行动。这种“准备行动”的工程师必须具备高级专业知识,以便能够处理任何出现的问题。免费软件并非天生就不好,而且确实有效。选择软件时识别隐藏的成本也适用于选择自行托管数据库的决定。自行托管对许多公司来说是有效的。但何时应该放手,尝试更简单的方法呢?

什么是自行托管的数据库?

自行托管的数据库有多种形式。本地托管的开源数据库是最明显的例子。然而,许多商业数据库产品都有分级的套餐,包括自行管理选项。本地托管具有优缺点:低安全风险、可以直接与数据一起工作以及完全控制数据库是一些优点。当然,也存在扩展问题。自行托管为任何具有波动或不稳定流量的公司或开发团队创造了挑战,因为按需扩展是不可能的。数据库工程师必须始终考虑到本地服务器上最高的流量量,否则在流量激增的情况下可能会发生故障。

对于想要自行托管并按需扩展的企业,云中自行托管是另一种选择。这种选项允许具有波动或不稳定流量的企业根据其需求进行扩展。在云中自行托管时,云服务提供商将在传统的部署模式下在虚拟机上安装和托管其数据库。当您在云中托管商业数据库时,云和数据库的支持是有限的,因为自行托管始终意味着您的工程资源主导项目。这包括紧急情况,如故障和甚至安全漏洞。

技能差距

有许多经验丰富的专业人士,他们在本地和云中管理大型数据库。SQL数据库是几十年的默认数据库。现在,随着更多旨在从存储的数据点中提取最大价值的目的性数据库的兴起,市场正在转变。在社区中获得立足点的较新型数据库包括列式数据库搜索引擎数据库图数据库时间序列数据库。现在熟悉这些技术的开发者可以根据自己的专业知识选择要做什么。

时间序列数据

Gradient Flow预计,从2020年到2027年,时间序列分析软件的全球市场将以11.5%的复合年增长率增长。时间序列数据是一个庞大的类别,包括任何带时间戳的数据。企业通过诸如消费者物联网(IoT工业物联网和工厂设备等方式从物理世界收集时间序列数据。来自在线来源的时间序列数据包括可观察性指标、日志、跟踪、安全监控和DevOps性能监控。时间序列数据为实时仪表板、决策以及影响许多人工智能应用的统计和机器学习模型提供动力。

弥合技能差距

InfluxDB 3.0 是一款专为时序数据设计的数据库,可以摄取、存储和分析单个数据存储中所有类型的时序数据,包括指标、事件和跟踪。它基于 Apache Arrow 构建,并针对可扩展性和性能进行了优化,允许实时查询响应。InfluxDB 具有原生 SQL 支持,以及与数据科学工具的开源可扩展性和互操作性。

InfluxDB Cloud Dedicated 是一种完全托管的单租户 InfluxDB 实例,专为那些需要隐私和定制但不想自行托管服务的客户而创建。专用基础设施具有弹性且可扩展,内置多层数据持久性,具有 2 倍数据复制。管理服务意味着全天候支持、自动补丁和版本更新。更高程度的定制也是 InfluxDB Cloud Dedicated 的一个特点。客户可以选择最适合其数据和负载的集群层,以用于其专用私有云资源。在众多可定制特性中,增加查询超时和内存缓存是其中两个。

结论

每个组织都有权决定是自行管理还是选择托管数据库。决策者和工程师在做出最佳决定之前,必须深入了解组织的需求、流量模式、工程技能和资源以及数据的特点。

要开始使用,请查看 InfluxDB Cloud Dedicated 的演示,联系我们的 销售团队 或今天注册您的 免费云账户