Apache Arrow 5.0.0 发布

栏目: 软件资讯 · 发布时间: 2个月前

来源: 开源中国社区

内容简介:Apache Arrow 是一个列式内存分析层,旨在加速大数据的分析。它包含了一套平面和分层数据的典型内存表示,以及用于结构化数据的多种语言绑定。目前支持的语言包括 C、C++、C#、Go、Java、JavaScript、Julia、MAT...

本文转载自:https://www.oschina.net/news/153053/apache-arrow-5-0-0-released,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有。

Apache Arrow 是一个列式内存分析层,旨在加速大数据的分析。它包含了一套平面和分层数据的典型内存表示,以及用于结构化数据的多种语言绑定。目前支持的语言包括 C、C++、C#、 GoJavaJavaScript 、Julia、MATLAB、 Python 、R、 Ruby 和 Rust。

Apache Arrow 5.0.0 正式发布,更新内容如下:

新功能和改进

  • ARROW-2665 - [Python/C++] 增加 index() 方法来查找 Python 标量的第一次出现;
  • ARROW-3014 - [C++] ORC 文件格式的最小写入器适配器;
  • ARROW-3316 - [R] 从 R data.frame 到 Arrow table / record batch 的多线程转换;
  • ARROW-5385 - [Go] 实现 EXTENSION 数据类型;
  • ARROW-5640 - [Go] 实现 Map 数组
  • ARROW-6513 - [CI] conda 环境文件 arrow/ci/conda_env_*.yml 的扩展名应该是.txt。
  • ARROW-7001 - [C++] 开发线程 API 以适应嵌套的并行性
  • ARROW-7114 - [JS][CI] NodeJS 在 Github Actions Windows 节点上构建失败;
  • ARROW-7252 - [Rust] [Parquet] 读取 UTF-8/JSON/ENUM 字段会导致大量的 vec 分配;
  • ARROW-7396 - [Format] 向 IANA 注册 Apache Arrow 格式的媒体类型;
  • ARROW-8421 - [Rust] [Parquet] 实现 parquet 写入器;
  • ARROW-8459 - [Dev][Archery] 使用最新的 cmake-format;
  • ARROW-8527 - [C++][CSV] 增加对 ReadOptions::skip_rows >= block_size 的支持;
  • ARROW-8655 - [C++][Dataset][Python][R] 为已发现的数据集保存分区信息;
  • ARROW-8676 - [Rust] 从 ARROW-300 创建 IPC RecordBatch 主体缓冲区压缩实现
  • ARROW-9054 - [C++] 增加 ScalarAggregateOptions
  • ARROW-9056 - [C++] 支持标量上的标量聚合
  • ARROW-9140 - [R] Zero-copy Arrow to R where possible
  • ARROW-9295 - [Archery] 在 lint 命令中支持 rust clippy
  • ARROW-9299 - [Python] 在 Python ORCFile 中暴露 ORC metadata()
  • ARROW-9313 - [Rust] 使用特征枚举
  • ARROW-9697 - [C++][Dataset] 数据集/扫描器的 num_rows 方法;
  • ARROW-10031 - [Java] 在 Archery 中支持 Java 基准测试
  • ARROW-10115 - [C++] CSV 空引号字符串被视为 NULL
  • ……

错误修复:

  • ARROW-6189 - [Rust] [Parquet] 普通编码的布尔列块限制为 2048 个值;
  • ARROW-6312 - [C++] 在 arrow.pc 包配置中声明所需的 Libs.private;
  • ARROW-7948 - [Go][集成] 十进制集成失败;
  • ARROW-9594 - [Python] DictionaryArray.to_numpy 不能正确地将空索引转换为空值;
  • ARROW-10910 - [Python]当对传统数据集的 read_table 给出 None 时出现分段故障;
  • ARROW-11146 - [CI][Python] conda-python-3.8-jpype Nightly 构建失败;
  • ARROW-11161 - [Python][C++] S3Filesystem: 文件 Content-Type 设置不正确;
  • ARROW-11633 - [CI][文档] 未找到 Maven 默认皮肤;
  • ARROW-11780 - [C++][Python] StructArray.from_arrays() 使 Python 解释器崩溃;
  • ARROW-11908 - [Rust]间歇性的 Flight 集成测试失败;
  • ARROW-12007 - [C++]加载 parquet 文件时返回 "无效的 UTF8 有效载荷" 错误;
  • ARROW-12055 - [R] is.na() 对 Arrow NaN 值的评估结果为 FALSE;
  • ARROW-12122 - [Python] 无法通过 pip 在 M1 mac 上安装;
  • ……

更多详情可查看:https://arrow.apache.org/release/5.0.0.html


以上所述就是小编给大家介绍的《Apache Arrow 5.0.0 发布》,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对 码农网 的支持!

关注码农网公众号

关注我们,获取更多IT资讯^_^


查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

Python灰帽子

Python灰帽子

[美] Justin Seitz / 丁赟卿 译、崔孝晨 审校 / 电子工业出版社 / 2011-3 / 39.00元

《Python灰帽子》是由知名安全机构Immunity Inc的资深黑帽Justin Seitz主笔撰写的一本关于编程语言Python如何被广泛应用于黑客与逆向工程领域的书籍。老牌黑客,同时也是Immunity Inc的创始人兼首席技术执行官(CTO)Dave Aitel为这本书担任了技术编辑一职。书中绝大部分篇幅着眼于黑客技术领域中的两大经久不衰的话题:逆向工程与漏洞挖掘,并向读者呈现了几乎每个......一起来看看 《Python灰帽子》 这本书的介绍吧!

随机密码生成器
随机密码生成器

多种字符组合密码

Markdown 在线编辑器
Markdown 在线编辑器

Markdown 在线编辑器

HEX HSV 转换工具
HEX HSV 转换工具

HEX HSV 互换工具