什么是时间序列数据?为什么你应该关注它?

导航到

像许多人一样,我的一生大多数时间都没有听说过“时间序列”这个词。直到我在一家构建时间序列平台的公司面试时,我才意识到我需要去谷歌搜索一下。我希望我能说搜索时间序列很容易,我走进面试时能说,“时间序列数据是按时间顺序索引的一系列数据点。”然后我和面试官一边喝茶一边谈论时间。

直到他们雇佣了我(因为他们人很好,我承诺我可以学习)之后,我才开始理解这个概念,现在我认为时间序列是一个强大的类别,值得有更好的网络搜索结果。如果你现在想知道我是否试图向你推销你需要一个时间序列数据库,我会说,“经过我们一起经历的一切?”

我想告诉你时间序列存在的原因以及它如何帮助——你自己决定是否需要它。

从客观上来说,时间序列数据按时间顺序排列是有道理的;在人类世界中,我们基本上将时间视为一个线性概念。但在工程中,我们经常计划异步行为,不可预测的意外事件,假设事件将按照任何特定顺序发生可能是危险的。

然而,时间序列数据独特之处在于它具有自然的时间顺序。如果我在六个月前对你说这句话,我可能只会盯着你看。毕竟,并不是所有事件都存在于时间之外。

但有些事件,时间并不相关,这是关键。时间序列数据并不仅仅是关于按时间顺序发生的事情——它是关于当你将时间作为一个轴时,其值增加的事件。

为什么?

如果您阅读过关于时间序列数据的文章,您就会知道,虽然它可以是一个高度抽象的概念,但它也出现在众多不同行业中。时间序列数据适用于大型数据集,其中单个数据点并不提供太多价值。一颗流星是一个不可预测的迪士尼时刻,但流星雨是一个可以预测的事件,具有预期的持续时间和单一的辐射点。

不是时间序列:

<figcaption> 当然,它们有关联,但时间不是因素。</figcaption>

 

时间序列:

<figcaption> 棉花糖消费事件在均衡饮食中很重要。</figcaption>

预测是时间序列数据的主要应用之一。它影响着金融世界的风险分析,气象学中所有类型的预测以及机器学习算法。

另一个普遍的应用案例是信号和/或异常检测。时间序列数据可用于区分模式,以找到相关信息,消除噪声,并发现可能表明恶意行为或服务器房间的混乱的意外模式。

<figcaption> 公平地说,是鸽子开始的。</figcaption>

当然,它还广泛应用于物联网系统,以管理来自数百万设备定期产生的海量数据。它用于DevOps来跟踪系统健康和趋势。

时间序列数据以可衡量、可证明、向老板展示的方式跟踪时间的变化。时间序列数据被科学家、工程师、发明家和像我这样的初学者所使用。

我希望您开始了解我正在学习的时间序列数据:具体的指标可以帮助您完成工作。我可以使用时间序列数据来监控我的数据库,跟踪服务器启停时间,查看网站流量,并检查节点机器人。

我很乐意听听您如何使用时间序列数据,或者您是否对此还有保留。您随时可以发推文给我(@thekatertot)或给我发邮件至[email protected]

特写艺术由Katy Farmer创作。