内容简介:Apache Arrow 0.9.0 发布了。Apache Arrow 是 Apache 基金会的顶级项目之一。它的目的是作为一个跨平台的数据层来加快大数据分析项目的运行速度。它包含一组规范的内存中的平面和分层数据表示,以及多种语言绑定以...
Apache Arrow 0.9.0 发布了。Apache Arrow 是 Apache 基金会的顶级项目之一。它的目的是作为一个跨平台的数据层来加快大数据分析项目的运行速度。它包含一组规范的内存中的平面和分层数据表示,以及多种语言绑定以进行结构操作。 它还提供低架构流式传输和批量消息传递,零拷贝进程间通信(IPC)和矢量化的内存分析库。
更新内容:
新特性和改进
ARROW-1021 - [Python] Add documentation about using pyarrow from other Cython and C++ projects
ARROW-1035 - [Python] Add ASV benchmarks for streaming columnar deserialization
ARROW-1394 - [Plasma] Add optional extension for allocating memory on GPUs
ARROW-1463 - [JAVA] Restructure ValueVector hierarchy to minimize compile-time generated code
ARROW-1579 - [Java] Add dockerized test setup to validate Spark integration
ARROW-1580 - [Python] Instructions for setting up nightly builds on Linux
ARROW-1623 - [C++] Add convenience method to construct Buffer from a string that owns its memory
ARROW-1632 - [Python] Permit categorical conversions in Table.to_pandas on a per-column basis
ARROW-1643 - [Python] Accept hdfs:// prefixes in parquet.read_table and attempt to connect to HDFS
ARROW-1705 - [Python] Create StructArray from sequence of dicts given a known data type
ARROW-1706 - [Python] StructArray.from_arrays should handle sequences that are coercible to arrays
ARROW-1712 - [C++] Add method to BinaryBuilder to reserve space for value data
ARROW-1757 - [C++] Add DictionaryArray::FromArrays alternate ctor that can check or sanitized “untrusted” indices
ARROW-1815 - [Java] Rename MapVector to StructVector
【声明】文章转载自:开源中国社区 [http://www.oschina.net]
以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网
猜你喜欢:- Apache Arrow 0.17.1 发布,内存数据交换格式
- Apache Arrow 1.0.0 发布,内存数据交换格式
- Apache Arrow 3.0.0 发布,内存数据交换格式
- Apache Arrow 4.0.0 发布,内存数据交换格式
- Apache Arrow 0.11.0 发布,内存数据交换格式
- Apache Arrow 0.11.0 发布,内存数据交换格式
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。