什么是时间序列数据?为什么你应该关注它?

导航至

和许多人一样,我一生中的大部分时间都没有听说过“时间序列”这个词。直到我在一家构建时间序列平台的公司面试时,我才意识到我需要谷歌一下。我希望我可以轻松搜索到时间序列,并且在面试时能够说:“时间序列数据是按时间顺序索引的一系列数据点。” 然后我的面试官和我碰杯,一边喝茶一边谈论时间。

直到他们雇用了我(因为他们很友善,而且我保证我可以学习),我才开始理解这个概念,现在我认为时间序列是一个强大的类别,值得更好的互联网搜索结果。如果您现在想知道我是否要试图向您推销您需要一个时间序列数据库,我会说:“经历了这么多,我们还是朋友吗?”

我想告诉你时间序列存在的原因以及它如何提供帮助——您来决定是否需要它。

客观地说,时间序列数据按时间顺序排列是有道理的;在人类世界中,我们基本上将时间视为线性概念。但在工程领域,我们经常计划异步行为、无法预测的意外和最终事件,假设事件会以任何特定顺序发生可能是危险的。

然而,时间序列数据的独特之处在于它具有自然的时间顺序。如果六个月前你对我说这句话,我会茫然地盯着你看。毕竟,事件不可能存在于时间之外。

但是,有些事件与时间无关,这是关键。时间序列数据不仅仅是关于按时间顺序发生的事情——而是关于当您将时间作为轴添加时,其价值会增加的事件。

为什么?

如果您一直在阅读有关时间序列数据的内容,您就会知道,虽然它可以被呈现为一个高度抽象的概念,但它也出现在许多不同的行业中。时间序列数据适用于大型数据集,其中单个数据点没有太多价值。一颗流星只是一个不可预测的迪士尼时刻,但流星雨是一个可预测的事件,它具有预期的持续时间和单一的辐射点。

非时间序列:

<figcaption> 当然,它们是相关的,但时间不是一个因素。</figcaption>

 

时间序列:

<figcaption> 棉花糖消费事件在均衡饮食中非常重要</figcaption>

预测是时间序列数据的主要用例之一。它影响金融世界的风险分析、气象学和机器学习算法中的各种类型的预测。

另一个常见的用例是信号和/或异常检测。时间序列数据可用于区分模式以查找相关信息、消除噪声并查找可能预示服务器机房中恶意行为或混乱的意外模式。

<figcaption> 公平地说,是鸽子先动手的。</figcaption>

当然,它也被用于物联网系统,以管理来自数百万台设备定期产生的海量数据。它在DevOps中用于跟踪系统健康状况和趋势。

时间序列数据以可衡量、可证明、可向老板展示的方式跟踪随时间的变化。时间序列数据被科学家、工程师、修补匠和像我这样的初学者使用。

我希望您开始了解我正在学习的时间序列数据:具体的指标可以帮助您完成工作,这很有价值。我可以使用时间序列数据来监控我的数据库、跟踪服务器的启动/停机时间、查看网站流量以及检查节点机器人。

我很想听听您如何使用时间序列数据,或者您是否仍然对整个事情有所保留。您可以随时在 Twitter 上发推文给我 (@thekatertot) 或发送电子邮件至 [email protected]

特色艺术作品由 Katy Farmer 创作。