内容简介:Apache Pig 0.11.0 发布,大规模数据分析
Apache Pig 0.11.0 发布了,该版本包含大量 bug 修复和很多新特性,例如 DateType、RANK、CUBE 和 ROLLUP 操作符,支持 Groovy UDFs,可插入式 reducer 估计逻辑,附加 UDF 特性等等。
Apache Pig 0.11.0 要求 Hadoop 0.20.X, 1.X, 0.23.X and 2.X。
Pig是一个基于 Hadoop 的大规模数据分析平台,它提供的SQL-LIKE语言叫Pig Latin,该语言的编译器会把类 SQL 的数据分析请求转换为一系列经过优化处理的MapReduce运算。Pig为复杂的海量数据并行计算提供了一个简单的操作和编程接口。
以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
数据分析技术白皮书
伍海凤、刘鹏、杨佳静、马师慧Sara、李博、Shirley Song、Zinc、李晓艳 / 2016-8-11 / 0
关于数据分析技术白皮书(Analytics Book 中文版),主要内容围绕: 1. 分析(Analytics):网站分析 & APP分析 2. 谷歌分析工具的原理、部署与使用 3. 开源网站分析工具的原理、部署与使用 4. Log日志分析原理 5. 网站分析的维度与指标定义 6. 如何炼成为一个互联网数据分析师 请访问书的数据分析技术白皮书官网“免费”阅......一起来看看 《数据分析技术白皮书》 这本书的介绍吧!