Apache Arrow 3.0.0 发布,内存数据交换格式

栏目: 软件资讯 · 发布时间: 5年前

内容简介:Apache Arrow 3.0.0 发布了,该版本包含 2.0.0 发布以来修复的 678 个问题。Apache Arrow 是 Apache 基金会的顶级项目之一,目的是作为一个跨平台的数据层来加快大数据分析项目的运行速度。它包含一组规范的内存中...

Apache Arrow 3.0.0 发布了,该版本包含 2.0.0 发布以来修复的 678 个问题。Apache Arrow 是 Apache 基金会的顶级项目之一,目的是作为一个跨平台的数据层来加快大数据分析项目的运行速度。它包含一组规范的内存中的平面和分层数据表示,以及多种语言绑定以进行结构操作。 它还提供低架构流式传输和批量消息传递,零拷贝进程间通信(IPC)和矢量化的内存分析库。

部分更新内容

  • [Python] 将 Combine_chunks 方法添加到 ChunkedArray
  • [Rust] [Parquet] 修复 ArrowReader 在某些时间戳类型上失败的问题
  • [R] 修复文件不存在时,read_feather 会在 R 中导致段错误的问题
  • [Rust] 不再需要缓冲区的内存对齐
  • [R] 修复 Arrow 不会释放未使用的内存的问题
  • [Python] 支持 MapType 和 StructType 以增强 PySpark 集成
  • [Rust] 添加对十进制数据类型的支持
  • [C++][Parquet] 实现 parquet::FileMetaData::Equals
  • [Python] 从支持列表中删除 Python 3.5
  • [Python] 在 PyArrow 中公开 GetRecordBatchReader API
  • [R] 为算术内核添加绑定
  • [Rust] 将其他数组类型移动到其自己的模块中

详细内容请查看更新公告


以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网

查看所有标签

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

领域驱动设计

领域驱动设计

[美] Eric Evans / 赵俐、盛海艳、刘霞 / 人民邮电出版社 / 2016-6-1 / 69

本书是领域驱动设计方面的经典之作,修订版更是对之前出版的中文版进行了全面的修订和完善。 全书围绕着设计和开发实践,结合若干真实的项目案例,向读者阐述如何在真实的软件开发中应用领域驱动设计。书中给出了领域驱动设计的系统化方法,并将人们普遍接受的一些实践综合到一起,融入了作者的见解和经验,展现了一些可扩展的设计新实践、已验证过的技术以及便于应对复杂领域的软件项目开发的基本原则。一起来看看 《领域驱动设计》 这本书的介绍吧!

SHA 加密
SHA 加密

SHA 加密工具

Markdown 在线编辑器
Markdown 在线编辑器

Markdown 在线编辑器