InfluxDB如何帮助零售组织为网络五天周末做准备

导航至

从感恩节到网络星期一的五天期间被称为网络五天周末(也称为网络5)。据《福布斯》估计,2018年感恩节当天,人们在感恩节当天花费了37亿美元。他们估计整个周末有超过1.65亿人购物。这是同比增长16.5%。在网络星期五,人们在网络上花费了62亿美元,同比增长23.6%。在线零售已成为一个竞争激烈的领域,组织必须确保他们尽一切可能获得客户并使他们回访。实时检测和修复问题会影响公司的底线。

网站性能和页面加载时间的重要性

据BBC报道,许多客户在页面加载超过三秒之前就会变得不耐烦,并考虑转移到另一家零售商。据2019年的一项研究显示,如果页面加载时间超过三秒,53%的访客将会离开。页面加载时间相差半秒,可能使在线零售商的销售额相差10%。

由于连接速度,近年来零售网站的速度有所下降。像谷歌、Facebook和Twitter这样的第三方连接器由于聊天和其他功能可能会减慢网站速度。在某些地区的某些地区,延迟更为严重。如果网站源自美国,澳大利亚的平均加载时间可能会更长。

电子商务网站依赖快速的加载时间来维持或提高其搜索引擎排名、网站流量和投资回报率。减少网站加载时间可以增加潜在客户通过搜索引擎找到他们的可能性。虽然谷歌没有分享他们如何创建搜索排名,但他们已经警告网站所有者,如果他们的网站加载速度慢。正如谷歌工程师菲利普·沃尔顿所说,“在网络上,一个好的第一印象可以决定某人是否会成为忠实用户,或者他们是否会离开并再也不回来”。

零售组织转向InfluxDB

全球的零售公司都依赖InfluxDB为他们提供更好的实时分析和数据洞察。英国最大的零售商之一使用InfluxDB监控其店铺内700多个终端。该零售商使用时间戳数据来改善其在线客户体验,并实现更好的事件警报和管理。通过使用InfluxDB,这家欧洲零售商正在不断改进其内部运营。世界上最大的食品和饮料公司之一使用InfluxDB来监控其高端咖啡和浓缩咖啡品牌的电子商务网站。该公司使用InfluxDB收集网站流量数据,以监控和改进其网站性能。

Wayfair是“最大的家居装饰和家具在线零售商之一。”他们总部位于马萨诸塞州波士顿,在北美和欧洲运营,拥有超过10,900名员工。他们有数百个应用程序将数据中心的数据发送到InfluxDB。InfluxData的平台已成为Wayfair的Cyber Five Weekend监控和警报系统的一个关键组成部分。

Cyber 5在Wayfair

Wayfair的品牌包括Wayfair、Joss & Main、ALLMODERN、Birch Lane和Perigold。他们提供的家居装饰、装饰、家居改善和家庭用品产品的种类超过1400万种。2018年9月,他们报告称,在过去12个月内,他们创造了62亿美元的净收入。

根据Nirag Shah的说法,Wayfair的首席执行官和联合创始人,“我们注意到假日购物的整体节奏正在改变,在线购物在整个假日周末成为明显的领导者,推动了超常增长。随着从实体店向在线购物的转变持续加速,Wayfair正在在家居用品类别中占据领先的市场份额。”

2018年,Wayfair估计每15秒就有客户购买水龙头或盥洗盆,每10秒就有圣诞树,每9秒就有沙发,每6秒就有床垫,每5秒就有吧凳,每1.5秒就有地毯。大多数客户购买了如配饰、床单和家具等小商品。2018年,运输的最重物品是一个3000磅的木屋。Wayfair报告称,“在感恩节当天至网络星期一的五天高峰购物期间,直接零售毛销售额同比增长了58%,定义为订单收入”。五天中最高的峰值是网络星期一。

随着越来越多的零售公司加强其电商业务,客户的购买模式正在演变。通过假日促销和限时抢购,Wayfair正在看到市场变化。2018年,Shah表示:“我们预计美元将继续在线转移,并且我们已做好准备,在黑色星期五和周末捕捉这一增长。”

Wayfair的IT基础设施

Wayfair的团队拥有八个数据中心。其中三个位于波士顿、西雅图和爱尔兰。此外,他们还拥有几个与谷歌云合作的云数据中心。这为团队提供了完整的冗余。他们使用DNS来控制服务名称集。这有助于确定哪些后端集群处于活动状态,哪些处于待机模式。Wayfair使用多阶段Kafka管道从本地数据中心拉取指标数据,其中数据被收集到中央位置以供InfluxDB(专为时间序列数据库定制的数据库)摄取。

在过去十年中,Wayfair一直在改进其软件开发和数据中心运营。由于美国感恩节假期一周业务量的极端激增,Wayfair知道它需要加强其基础设施以处理更高的数据量。他们还需要更好地分析和了解他们的数据。他们在波士顿和柏林设有两个Wayfair运营中心(WOC)。在这两个WOC之间,他们提供24x7的覆盖。他们不断根据重要参数分析他们的IT基础设施。

为了确保最佳的客户体验,他们在整个购买过程中跟踪客户活动。他们有事件跟踪器、计时器和其他来自超过2,000台虚拟机(运行数百个应用程序)的指标。他们的数据被其开发者、内部警报引擎和其他利益相关者使用。他们与市场团队合作,了解何时发送电子邮件通信。了解何时安排活动,有助于他们了解何时会有网站流量高峰。

Wayfair数据中心之一的数据管道示例

以下图表显示了Wayfair数据管道中涉及的步骤。

InfluxDB retail - Wayfair IT infrastructure

前四个步骤发生在应用程序所在的本地域数据中心。所有这些组件都位于每个数据中心本地

  • 指标负载均衡器(Metric LB):允许团队发送指标,无需等待交付确认。Wayfair需要确保指标被正确收集且不会丢失。
  • Curate:使用Telegraf删除坏标签或阻止坏指标。
  • Buffer:使用Telegraf保留指标数据并将尽可能多的数据写入Kafka。
  • Ship:使用Telegraf将数据发送到Kafka。

在最后两个步骤中,数据从八个数据中心整合到一个单独的Kafka集群中——而不是分散在不同的集群中。

Wayfair的生产后端

以下图表显示了Wayfair主要生产系统的后端

Wayfair - production backend architecture

后端的数据流如下

  • Mirrormaker从其本地数据管道(即图1)中提取数据,并将数据整合到更大的Kafka集群中。
  • 数据被摄取到针对内容类型特定的集群中。
  • Tremor是Wayfair构建的应用程序,用于从Kafka中提取数据并将其写入InfluxDB。Tremor将在2020年与开源社区共享。
  • Wayfair使用集群来分割他们的流量数据,例如“Gen”代表通用,“SF”代表店面,“Mon”代表监控。
  • 每个集群都运行Chronograf
  • 对于Wayfair来说,高可用性(HA)非常重要,因此他们在每个集群中使用HA代理。

Wayfair使用InfluxDB进行真实用户监控(RUM)

Wayfair的店面工程团队重视精确的性能监控。他们不断部署代码更改,这直接影响着他们的面向客户的网站。每次代码更改都有可能对性能产生积极或消极的影响。了解页面加载时间有助于捕捉回归,找到加速系统的机会,并确定改进是否在现实中取得了效果。

他们的团队对所有网络性能指标都感兴趣,包括:服务器端、合成测试和真实用户监控(RUM)。服务器端指标很容易构建,但无法捕捉到客户端发生的问题。合成用户监控只能根据预定的规范提供关于客户端性能的信息。合成测试仅限于特定的URL和人工测试环境。

RUM使用JavaScript和API记录客户体验到的加载时间。通过跟踪真实用户,Wayfair能够发现通常对他们的系统不可见的问题。随着他们的网站变得越来越复杂(由于来自第三方服务器和网络的大量资源、图像、字体和脚本),这一点越来越重要。Wayfair客户的网络条件,如延迟和带宽,可能导致在线体验出现意外。

Wayfair每天在八个网站上收集5000万个RUM数据点,涵盖数百种页面类型和数千种设备。这些设备包括手机、平板电脑和电脑。在“网络五日周末”,Wayfair知道他们需要在最高峰时段处理典型流量的3-5倍。InfluxDB提高了他们对数据的可见性,并帮助改善了客户体验。他们的平台可扩展,能够满足未来的需求。

大约八年前,Wayfair开始使用Graphite作为他们的时间序列数据库。他们使用该工具进行图表和警报。随着时间的推移,他们通过添加更多验证和功能来增强系统。他们增加了按网络浏览器拆分指标的功能。他们的RUM仪表板在定位问题时变得很有用。然而,他们的系统存在一些怪癖,使得数据分析变得困难。正如Hagan所指出的,“由于值的范围和异常值广泛,RUM特别难以衡量和可视化。”异常值严重扭曲了他们的数据,他们发现Graphite容易受到这些问题的影响。在InfluxDB之前,Wayfair的数据管道包括使用UDP在数据中心之间推送数据。虽然速度快,但它缺少一些期望的组件。

Wayfair从2016年开始评估InfluxDB,最终将其切换为InfluxDB Enterprise作为他们的时间序列平台。他们选择了InfluxData的本地化产品,因为他们想要管理自己的虚拟机和大量集群。他们重视它不受Graphite相同问题的影响。InfluxDB使用真正的中位数计算器;因此,他们的数据不受扭曲。Wayfair的团队直接与InfluxData的团队合作,确保他们最有效地使用专门构建的时间序列数据库。他们发现InfluxDB的模式设置需要一段时间,但更强大、更灵活。使用InfluxDB和Grafana,Wayfair能够创建定制的仪表板。

改善客户体验对Wayfair的团队来说非常重要。了解客户如何以及何时与他们在线商店互动对于他们的底线至关重要。他们开始使用一个新的指标进行监控:交互时间(TTI)。使用API,他们能够确定网站何时准备好快速响应用户请求。他们还在考虑使用Walton的首次输入延迟测量,这是一个衡量网站交互性的指标。

Wayfair已成为InfluxData的战略客户。作为InfluxDB社区的活跃成员,他们已经贡献了Telegraf插件。想了解更多关于Wayfair如何使用InfluxData平台的详情,请查看完整故事

如果您想分享您的InfluxDB故事,请点击这里