内容简介:由前 Cloudera 首席工程师和前 Informatica 首席产品在 2014 年创建。2016 年,同 Apache Spark、Tensorflow、ElasticSearch 等一同获得了当年 InfoWorld BOSSIE 2016 最佳开源大数据工具奖。其核心产品为 StreamSets Data Collector。
StreamSets 是一款图形化的数据集成工具。
由前 Cloudera 首席工程师和前 Informatica 首席产品在 2014 年创建。2016 年,同 Apache Spark、Tensorflow、ElasticSearch 等一同获得了当年 InfoWorld BOSSIE 2016 最佳开源大数据 工具 奖。
其核心产品为 StreamSets Data Collector。 GitHub 地址
StreamSets 数据连接器,分为源(Origin)和目标(Destination)两类。数据从源进入,经过转换,传输到目标,从而构建出一条数据管道(Pipeline)。 连接器地址
源连接器:
- Kafka Consumer
- Pulsar Consumer
- HTTP
- TCP / UDP
- MySQL Binary Log
- Oracle CDC Client
- 等等……
目标连接器:
- Kafka Producer
- Pulsar Producer
- Flume
- ElasticSearch / Solar
- Cassandra
- HBase
- MongoDB
- Kudu
- Redis
- 等等……
StreamSets 提供了 Tar 包、Cloudera Parcel、RPM(Redhat / CentOS 包管理器)、 Docker 镜像安装方式。 下载地址
与 StreamSets 类似产品还包括: Apache NiFi 和 LinkedIn Databus 。
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网
猜你喜欢:本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
Code Reading
Diomidis Spinellis / Addison-Wesley Professional / 2003-06-06 / USD 64.99
This book is a unique and essential reference that focuses upon the reading and comprehension of existing software code. While code reading is an important task faced by the vast majority of students,......一起来看看 《Code Reading》 这本书的介绍吧!