应用性能监控 (APM)
APM 帮助您在持续集成和交付的动态应用环境中,通过响应迅速的应用程序来维持完美的用户体验。
立即开始
为什么要监控您的应用程序性能?
应用性能监控 (APM) 是对软件应用程序的性能和可用性进行监控和管理。APM 旨在检测和诊断复杂的应用程序性能问题,从而为最终用户提供高质量的体验并维持预期的服务水平。
为什么选择 InfluxDB 用于 APM?
根据最近的一项研究,在应用程序的用户体验上每投入 1 美元,将获得约 100 美元的回报——换句话说,投资回报率约为 9,900%。不仅如此,如果加载时间过长或使用体验不佳,约 39% 的用户将停止使用。所有这些都充分说明了应用程序性能监控的重要性——即使您的应用程序能够实现您所说的功能,但如果它难以使用或操作繁琐,人们仍然会不愿使用它(如果他们选择使用的话)。
同时,您还必须将这一理念与我们现在所处的快节奏数字经济相平衡——在这个经济中,复杂性是既定的,而响应迅速的应用程序不再是建议,而是必需品。为了向用户提供尽可能最佳的体验,企业必须能够全面了解其整个应用程序。
卓越的最终用户体验建立在坚实的时间序列数据基础上。这是因为性能指标会随时间变化,并且在实时全栈监控和事务观察的背景下进行检查时,性能指标会更具可操作性。
获取深入洞察以进行早期检测
尽早检测异常情况,以帮助预测服务中断。利用这些洞察快速诊断和识别根本原因,从而缩短修复和恢复时间。
监控和优化用户体验
可以通过合成或真实用户流量来监控用户体验,以保持体验的一致性和最佳性,从而转化为更高的转化率和留存率。
自动化工作流程和配置
与自动修复集成的智能触发器减轻了 IT 运维团队的负担,并帮助他们专注于有问题的服务和潜在的断点,以免它们影响用户体验。
APM 实施方法
应用性能监控可以使用多种方法来实现:合成事务监控、真实用户监控和分布式追踪。所有这三种方法都旨在实现最重要的目标:保持出色的用户体验。
合成事务监控 (STM)
合成事务通过预定的用例(模拟用户流量和负载)以编程方式监控用户体验。STM 是一种经济高效且主动的方式来监控应用程序,并且在过渡期、升级、更新和新功能期间非常有用,这些情况风险最高且容易出错。
真实用户监控 (RUM)
RUM 从用户的角度提供视图。它揭示了真实情况——真实用户在做他们的事情。RUM 考虑了最终用户体验的每一个促成因素——从服务延迟和带宽瓶颈到客户端界面(例如,移动设备)的限制。
分布式追踪监控
在分布式应用程序中,一个事务可以跨越多个边界:进程、容器、主机、域和位置。维护事务执行中因果相关事件的性能可见性对于保护关键业务工作流程是必要的。分布式追踪监控能够检测和抢先修复执行路径中任何部分的瓶颈。在出现问题时,它是诊断降级或问题根源的重要工具。
什么是 APM?
APM 监控和各种应用程序性能监控工具可用于同时完成各种不同的事情。企业可以使用一些应用程序性能监控软件来更好地了解其企业,始终确保一切都符合性能标准。这些工具可用于收集和分析数据,以帮助他们识别错误和潜在问题,所有这些都是为了通过密切和实时监控所有 IT 资源来提供卓越的用户体验。
在其他情况下,应用程序性能监控开源工具用于深入了解应用程序本身。它们对于开发团队了解人们如何与其软件交互,以及他们可能遇到的问题或可能需要解决的疑虑非常有用。这些见解有助于做出更好、更明智的决策。
这些类型的工具可用于识别大量场景,例如
- 确定您的应用程序或其他资产是否按预期运行
- 向重要的团队成员发出问题警报,并提供必要的数据以找到问题的根源
- 帮助团队了解这些问题可能对其业务产生的影响
- 调整应用程序环境以修复今天出现的类似问题,防止它们在明天再次发生
换句话说,APM 监控完全关于上下文。如果您不仅知道出了问题,还知道出了什么问题以及何时出的问题,您就可以追溯到问题发生的根本原因。到那时,您就掌握了修复问题所需的一切,从而可以恢复正常运行。
APM 适用于哪些人?
从应用性能监控中获益匪浅的两个主要行业群体是负责维护大型环境健康的 IT 专业人员,以及创建最终用户应用程序的任何开发团队。
对于前一组人来说,APM 监控是保证一切正常运行的宝贵方法——保证人们能够访问执行工作所需的 IT 资源和更大的环境。后一组人使用 APM 监控来帮助确保他们拥有:A) 尽可能最好的应用程序;B) 功能尽可能少问题的应用程序,以帮助创建引人入胜的用户体验。
实际上,任何处理用户体验的专业人员都可以从正确的应用程序性能监控工具提供的洞察和分析中获益。
InfluxDB 用于应用性能监控
APM 可以使用 InfluxData 的平台 InfluxDB 来执行。InfluxDB 是一个专门构建的时间序列数据库、实时分析引擎和可视化面板。它是一个中心平台,所有指标、事件、日志和追踪数据都可以在其中集成和集中监控。
使用 InfluxDB 进行应用性能监控的实施方案包括
- 优化电子商务领域的最终用户体验和购买交易(Wayfair 案例研究,以及 Web Shop Fly 网络研讨会 和 应用性能监控 博客)
- 在线博彩和游戏平台中的交易在线监控(Playtech 案例研究)
- 通过最终用户模拟实时监控网站可用性和性能(xOps 解决方案)
- 云环境中集群备份事务的观察 (InfluxData 站点可靠性实施)
- 根本原因识别,以改进网络监控、APM 和可见性(Riverbed)
阅读更多关于 InfluxDB 社区提供的应用程序监控实施方案
Telegraf Zipkin 插件: Zipkin 追踪数据可以通过 Telegraf 收集并发送到 InfluxDB。
Jaeger InfluxDB 插件: gRPC 客户端插件用于收集追踪数据并将其发送到 InfluxDB。
合成事务监控: xSum 模拟用户在网站或 Web 应用程序中的旅程,确保事务无错误地发生。所有数据都存储在 InfluxDB 中。
负载测试: Flood.io 是一个分布式负载测试平台,支持使用 JMeter、Gatling 和 Selenium 等开源工具进行测试。该平台从其客户进行的测试中收集和聚合实时数据到 InfluxDB Cloud 中。
“我们最近引入了 InfluxDB 作为我们一流的时间序列数据库系统,我们有机会直接与 InfluxData 合作,以确保我们走上了一条可扩展、稳健且符合其平台未来发展方向的道路。”
Mike BellWayfair 工程师
开放数据标准驱动性能和互操作性
InfluxDB 3 是用 Rust 和 FDAP 堆栈(Flight、DataFusion、Arrow 和 Parquet)构建的,利用 Apache 支持的技术来高效地摄取、存储和分析任何规模的时间序列数据。
F
Flight 用于高效的列式数据传输

D
DataFusion 用于高性能查询
A
Arrow 用于优化的内存列式分析

P
Parquet 用于高压缩存储

















