Apache Arrow 于 2016 年由众多开源数据项目的开发者创立，旨在将数据库和数据科学社区聚集在一起，共同协作开发共享的计算技术。它包括一个与语言无关的软件框架，用于开发处理列式数据的数据分析应用程序。其标准化的面向列的内存格式能够表示平面和分层数据，以实现高效的分析操作并降低成本，并且是处理大型数据集时更有效的方法。列式数据表示可以产生更好的压缩，并且还可以加快某些查询的速度，因为编译器和 CPU 可以进行更多的并行计算。分析系统通常使用 Apache Arrow 来处理存储在 Apache Parquet 文件中的数据。

Arrow 项目分为 2 个部分

一组内存格式规范
关键编程语言的标准库

Apache Arrow 与 Apache Parquet、Apache Flight SQL、Apache Spark、NumPy、PySpark、pandas 和其他数据处理库协同工作，并包含 C、C++、C#、Go、Java、JavaScript、Julia、MATLAB、Python、R、Ruby 和 Rust 中的原生库。

How Apache Arrow deframents Data Access

Apache Arrow 如何消除数据访问碎片

Arrow 的优势

所有系统都使用相同的内存格式
跨系统通信没有开销
可互操作（数据交换）
可嵌入（在执行引擎、存储层等中）

掌控您的运营，并将存储成本降低 90%

免费开始使用运行概念验证

无需信用卡。

Apache Arrow

相关资源

免费 InfluxDB 培训

产品与解决方案

开发者

公司

Apache Arrow

相关资源

Jared Lander [Lander Analytics] | 在 R 中建模时间序列

InfluxDB IOx 技术讲座 - InfluxDB IOx 中的查询处理

InfluxDB IOx：查询引擎设计以及 Apache Arrow 中基于 Rust 的 DataFusion

免费 InfluxDB 培训

产品与解决方案

开发者

公司

注册 InfluxData 新闻邮件

关注我们