Apache Kudu 1.10.0 发布,Hadoop 生态数据存储系统

栏目: 软件资讯 · 发布时间: 3个月前

来源: 开源中国社区

本文转载自:https://www.oschina.net/news/108171/kudu-1-10-0-released,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有。

Apache Kudu 1.10.0 发布了,Kudu 是一个支持结构化数据的开源存储引擎,具有低延迟随机读取与高效分析读取模式。它基于 Apache Hadoop 生态系设计,并支持与 Apache 软件基金会其它数据分析项目集成。

此版本带来的新特性包括:

  • Kudu 现在通过使用 Apache Spark 实现的作业支持完整和增量表备份。此外,它还支持通过使用 Apache Spark 实现的还原作业从完全备份和增量备份中还原表。
  • 现在可以将 Kudu 内部目录与 Apache Hive Metastore 同步,在 Kudu 创建、删除和更改表时自动更新 Hive Metastore 表条目。
  • Kudu 现在通过与 Apache Sentry 的集成支持本机细粒度授权。现在可以实施为 Kudu 表和列定义的访问控制策略,以及在可能存储 Kudu 表的 Hive 服务器和 数据库 上定义的策略。
  • Web UI 现在支持 SPNEGO,这是一种通过 HTTP 标头传递协商来保护使用 Kerberos 的 HTTP 请求的协议。
  • 列注释现在可以存储在 Kudu 表中,并且可以使用 AlterTable API 进行更新。
  • Java 扫描令牌构建器现在可以为每个 tablet 创建多个令牌。要使用此功能,请调用 setSplitSizeBytes() 以指定每个令牌应扫描的数据字节数。同样的API也可以在 Kudu 的 Spark 集成中使用,它可用于为每个被扫描的 tablet 生成多个 Spark 任务。
  • 实验性 Kudu Docker 图像现已在 Docker Hub 发布。
  • Kudu 现在有一个实验性的 Kubernetes StatefulSet 清单和 Helm 图表,可用于使用 Kubernetes 定义和提供 Kudu 集群。
  • kudu perf table_scan 扫描表并显示表的行数以及运行扫描所用的时间。
  • kudu table copy(kudu 表副本)将数据从一个表复制到另一个表,在同一个集群内或跨集群。注意,此实现适用于单个客户端,因此可能不适合大型表。
  • 现在可以逐个表地配置 Tablet 历史记录保留时间。

新版本还包含大量改进、bug 修复等等,更多详情可查看更新日志

下载地址:https://kudu.apache.org/releases/1.10.0


以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网

关注码农网公众号

关注我们,获取更多IT资讯^_^


为你推荐:

相关软件推荐:

查看所有标签

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

大数据系统构建

大数据系统构建

Nathan Marz、James Warren / 马延辉、向磊、魏东琦 / 机械工业出版社 / 2017-1 / 79.00

随着社交网络、网络分析和智能型电子商务的兴起,传统的数据库系统显然已无法满足海量数据的管理需求。 作为一种新的处理模式,大数据系统应运而生,它使用多台机器并行工作,能够对海量数据进行存储、处理、分析,进而帮助用户从中提取对优化流程、实现高增长率的有用信息,做更为精准有效的决策。 但不可忽略的是,它也引入了大多数开发者并不熟悉的、困扰传统架构的复杂性问题。 本书将教你充分利用集群硬件优势的La......一起来看看 《大数据系统构建》 这本书的介绍吧!

JSON 在线解析
JSON 在线解析

在线 JSON 格式化工具

RGB转16进制工具
RGB转16进制工具

RGB HEX 互转工具

HSV CMYK 转换工具
HSV CMYK 转换工具

HSV CMYK互换工具