学习 StreamSets(一):初识 StreamSets

栏目: 编程工具 · 发布时间: 7年前

内容简介:由前 Cloudera 首席工程师和前 Informatica 首席产品在 2014 年创建。2016 年,同 Apache Spark、Tensorflow、ElasticSearch 等一同获得了当年 InfoWorld BOSSIE 2016 最佳开源大数据工具奖。其核心产品为 StreamSets Data Collector。

StreamSets 是一款图形化的数据集成工具。

由前 Cloudera 首席工程师和前 Informatica 首席产品在 2014 年创建。2016 年,同 Apache Spark、Tensorflow、ElasticSearch 等一同获得了当年 InfoWorld BOSSIE 2016 最佳开源大数据 工具 奖。

其核心产品为 StreamSets Data Collector。 GitHub 地址

StreamSets 数据连接器,分为源(Origin)和目标(Destination)两类。数据从源进入,经过转换,传输到目标,从而构建出一条数据管道(Pipeline)。 连接器地址

源连接器:

  • Kafka Consumer
  • Pulsar Consumer
  • HTTP
  • TCP / UDP
  • MySQL Binary Log
  • Oracle CDC Client
  • 等等……

目标连接器:

  • Kafka Producer
  • Pulsar Producer
  • Flume
  • ElasticSearch / Solar
  • Cassandra
  • HBase
  • MongoDB
  • Kudu
  • Redis
  • 等等……

StreamSets 提供了 Tar 包、Cloudera Parcel、RPM(Redhat / CentOS 包管理器)、 Docker 镜像安装方式。 下载地址

与 StreamSets 类似产品还包括: Apache NiFiLinkedIn Databus


以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网

查看所有标签

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

设计模式解析

设计模式解析

Alan Shalloway、James R.Trott / 徐言声 / 人民邮电出版社 / 2013-1 / 55.00元

《设计模式解析(第2版·修订版)》,本书首先概述了模式的基础知识,以及面向对象分析和设计在当代软件开发中的重要性,随后使用易懂的示例代码阐明了12个最常用的模式,使读者能够理解模式背后的基本原则和动机,理解为什么它们会这样运作。一起来看看 《设计模式解析》 这本书的介绍吧!

HTML 压缩/解压工具
HTML 压缩/解压工具

在线压缩/解压 HTML 代码

JSON 在线解析
JSON 在线解析

在线 JSON 格式化工具

正则表达式在线测试
正则表达式在线测试

正则表达式在线测试