Apache Kudu 1.10.0 发布，Hadoop 生态数据存储系统

栏目: 软件资讯 · 发布时间: 6年前

内容简介：Apache Kudu 1.10.0 发布了，Kudu 是一个支持结构化数据的开源存储引擎，具有低延迟随机读取与高效分析读取模式。它基于 Apache Hadoop 生态系设计，并支持与 Apache 软件基金会其它数据分析项目集成。此版本带来...

Apache Kudu 1.10.0 发布了，Kudu 是一个支持结构化数据的开源存储引擎，具有低延迟随机读取与高效分析读取模式。它基于 Apache Hadoop 生态系设计，并支持与 Apache 软件基金会其它数据分析项目集成。

此版本带来的新特性包括：

Kudu 现在通过使用 Apache Spark 实现的作业支持完整和增量表备份。此外，它还支持通过使用 Apache Spark 实现的还原作业从完全备份和增量备份中还原表。
现在可以将 Kudu 内部目录与 Apache Hive Metastore 同步，在 Kudu 创建、删除和更改表时自动更新 Hive Metastore 表条目。
Kudu 现在通过与 Apache Sentry 的集成支持本机细粒度授权。现在可以实施为 Kudu 表和列定义的访问控制策略，以及在可能存储 Kudu 表的 Hive 服务器和数据库上定义的策略。
Web UI 现在支持 SPNEGO，这是一种通过 HTTP 标头传递协商来保护使用 Kerberos 的 HTTP 请求的协议。
列注释现在可以存储在 Kudu 表中，并且可以使用 AlterTable API 进行更新。
Java 扫描令牌构建器现在可以为每个 tablet 创建多个令牌。要使用此功能，请调用 setSplitSizeBytes() 以指定每个令牌应扫描的数据字节数。同样的API也可以在 Kudu 的 Spark 集成中使用，它可用于为每个被扫描的 tablet 生成多个 Spark 任务。
实验性 Kudu Docker 图像现已在 Docker Hub 发布。
Kudu 现在有一个实验性的 Kubernetes StatefulSet 清单和 Helm 图表，可用于使用 Kubernetes 定义和提供 Kudu 集群。
kudu perf table_scan 扫描表并显示表的行数以及运行扫描所用的时间。
kudu table copy（kudu 表副本）将数据从一个表复制到另一个表，在同一个集群内或跨集群。注意，此实现适用于单个客户端，因此可能不适合大型表。
现在可以逐个表地配置 Tablet 历史记录保留时间。

新版本还包含大量改进、bug 修复等等，更多详情可查看更新日志。

下载地址：https://kudu.apache.org/releases/1.10.0

以上就是本文的全部内容，希望本文的内容对大家的学习或者工作能带来一定的帮助，也希望大家多多支持码农网

查看所有标签

本站部分资源来源于网络，本站转载出于传递更多信息之目的，版权归原作者或者来源机构所有，如转载稿涉及版权问题，请联系我们。

码农书籍

Python高效开发实战——Django、Tornado、Flask、Twisted（第2版）

刘长龙 / 电子工业出版社 / 2019-1 / 99

也许你听说过全栈工程师，他们善于设计系统架构，精通数据库建模、通用网络协议、后端并发处理、前端界面设计，在学术研究或工程项目上能独当一面。通过对Python 3及相关Web框架的学习和实践，你就可以成为这样的全能型人才。《Python高效开发实战——Django、Tornado、Flask、Twisted（第2版）》分为3篇：上篇是Python基础，带领初学者实践Python开发环境，掌握......一起来看看《Python高效开发实战——Django、Tornado、Flask、Twisted（第2版）》这本书的介绍吧!

码农工具

Apache Kudu 1.10.0 发布，Hadoop 生态数据存储系统

Python高效开发实战——Django、Tornado、Flask、Twisted（第2版）

RGB转16进制工具

XML、JSON 在线转换

RGB HSV 转换