内容简介:Apache Arrow 1.0.0 现已发布。官方表示,此版本是 Apache Arrow 的第 18 个主要版本,标志着 columnar format 向二进制稳定性的过渡,以及 Arrow 软件库向语义版本控制的过渡。 Apache Arrow 是 Apache 基金会的...
Apache Arrow 1.0.0 现已发布。官方表示,此版本是 Apache Arrow 的第 18 个主要版本,标志着 columnar format 向二进制稳定性的过渡,以及 Arrow 软件库向语义版本控制的过渡。
Apache Arrow 是 Apache 基金会的顶级项目之一,目的是作为一个跨平台的数据层来加快大数据分析项目的运行速度。它包含一组规范的内存中的平面和分层数据表示,以及多种语言绑定以进行结构操作。 它还提供低架构流式传输和批量消息传递,零拷贝进程间通信(IPC)和矢量化的内存分析库。
columnar format 的一些更改内容如下:
- metadata 版本被更改为新版本 V5,表明 Union 类型的缓冲区布局发生了不兼容的更改。
- Dictionary indices 现在允许是无符号整数,而不是只有符号整数。由于 Java 支持不佳,仍然不鼓励使用UInt64。
- 添加了一个新的“Feature”枚举。
- 在 IPC 格式中增加了使用 LZ4 或 ZStandard 的可选缓冲区压缩。
- Decimal types 获得了一个可选的“bitWidth”字段,默认为 128。根据团队的说法,这将使它们将来支持其他 decimal widths,例如 32 位和 64 位。
- 有效性位图缓冲区已删除。
此外,该团队还扩展了集成测试,以测试扩展类型和嵌套词典;并更新了对 C ++、Java、 Python 、R、 Ruby 、C GLib 以及 Rust 的支持。
更多详细内容可查看官方发布说明:https://arrow.apache.org/blog/2020/07/24/1.0.0-release/
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
Perl语言编程
克里斯蒂安森 (Tom Christiansen) (作者)、Brian D Foy (作者)、Larry Wall (作者)、Jon Orwant (作者) / 苏金国 (译者)、吴爽 (译者) / 中国电力出版社 / 2014-9-1 / 148
从1991年第一版问世以来,《Perl语言编程》很快成为无可争议的Perl宝典,如今仍是这种高实用性语言的权威指南。Perl最初只是作为一个功能强大的文本处理工具,不过很快发展成为一种通用的编程语言,可以帮助成千上万的程序员、系统管理员,以及像你一样的技术爱好者轻松完成工作。 人们早已经翘首以待这本“大骆驼书”的更新,如今终于得偿所愿。在这一版中,三位颇有声望的Perl作者讲述了这种语言当前......一起来看看 《Perl语言编程》 这本书的介绍吧!