开源大数据流水线系统 PiFlow V0.9 发布

栏目: 软件资讯 · 发布时间: 5年前

内容简介:PiFlow是一个基于分布式计算框架Spark开发的大数据流水线系统。该系统将数据的采集、清洗、计算、存储等各个环节封装成组件,以所见即所得方式进行流水线配置。简单易用,功能强大。本次版本更新如下特性: 增加可...

开源大数据流水线系统 PiFlow V0.9 发布

PiFlow是一个基于分布式计算框架Spark开发的大数据流水线系统。该系统将数据的采集、清洗、计算、存储等各个环节封装成组件,以所见即所得方式进行流水线配置。简单易用,功能强大。本次版本更新如下特性:

  1. 增加可视化分析功能,包括线性图、柱状图、饼状图、散点图;
  2. 增加可编程特性,无缝衔接上下游组件,按需在线开发和调试;
  3. 增加多语言特性,支持Scala、 PythonShell 等多种语言的编程;
  4. 增加Spark依赖jar包管理

Gitee地址: https://gitee.com/opensci/piflow
GitHub地址: https://github.com/cas-bigdatalab/piflow

1)可视化分析

开源大数据流水线系统 PiFlow V0.9 发布

开源大数据流水线系统 PiFlow V0.9 发布

开源大数据流水线系统 PiFlow V0.9 发布

开源大数据流水线系统 PiFlow V0.9 发布

开源大数据流水线系统 PiFlow V0.9 发布

2)可编程+多语言

开源大数据流水线系统 PiFlow V0.9 发布

开源大数据流水线系统 PiFlow V0.9 发布

3)Spark jar包管理

开源大数据流水线系统 PiFlow V0.9 发布


以上所述就是小编给大家介绍的《开源大数据流水线系统 PiFlow V0.9 发布》,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对 码农网 的支持!

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

数据结构(C语言版)

数据结构(C语言版)

严蔚敏、吴伟民 / 清华大学出版社 / 2012-5 / 29.00元

《数据结构》(C语言版)是为“数据结构”课程编写的教材,也可作为学习数据结构及其算法的C程序设计的参数教材。 本书的前半部分从抽象数据类型的角度讨论各种基本类型的数据结构及其应用;后半部分主要讨论查找和排序的各种实现方法及其综合分析比较。其内容和章节编排1992年4月出版的《数据结构》(第二版)基本一致,但在本书中更突出了抽象数据类型的概念。全书采用类C语言作为数据结构和算法的描述语言。 ......一起来看看 《数据结构(C语言版)》 这本书的介绍吧!

URL 编码/解码
URL 编码/解码

URL 编码/解码

正则表达式在线测试
正则表达式在线测试

正则表达式在线测试