面向数据科学 | 使用 InfluxDB 和结构化流式处理实时处理时间序列数据

导航至

出版物: 面向数据科学 标题: 使用 InfluxDB 和结构化流式处理实时处理时间序列数据 作者: Vibhor Nigam

摘要: 在由“面向数据科学”发布的这篇文章中,Vibhor Nigam 展示了如何将开源 InfluxDB 与 Spark 结构化流式处理结合使用,以实时处理、存储和可视化数据。本文详细介绍了如何设置 InfluxDB 的单节点实例,以及如何扩展 Spark 的 ForeachWriter 以使用它写入 InfluxDB。作者还讨论了开发人员在使用 InfluxDB 数据库时应牢记的事项。在他的结论中,他写道:“我发现 InfluxDB 在数据存储方面非常高效,而且非常易于使用。InfluxDB 的压缩算法非常强大,可以将数据压缩到几乎一半的大小。在我自己的数据中,我看到压缩导致数据大小从大约 67GB 减少到 35GB。”

阅读完整报道