内容简介:近日又陷入了分析数据的泥潭,一个搞工程的公司,居然有这么多要分析的数据,真的是按照我自己的工作顺序来总结吧。首先,导入数据。
近日又陷入了分析数据的泥潭,一个搞工程的公司,居然有这么多要分析的数据,真的是 大数据 时代饶过谁。最开始用excel做透视表和各种复杂函数,后来用过一段时间 Tableau Online,最近在用亿信华辰公司的 豌豆BI ,自己总结了一下Tableau和豌豆 BI 的优缺点。
按照我自己的工作顺序来总结吧。
首先,导入数据。
我手上的数据都是从各分公司上报过来的excel数据,通常首行有标题,然后有的表头是有合并单元格的
这种表格在导入的时候就比较麻烦,Tableau的话,要么在导入前把文件处理成首行为单行表头的样式,要么就要在导入后逐个去修改列名。后来试用的豌豆BI就灵活一些,可以手动设置表头行和数据起始行,设置好之后直接把表头行作为每列的列名,在数据导入这部分可以省事很多。
而且导入之后如果有空行或者小计行也可以直接处理,Tableau Online提供了一个可以处理的工具,但是经常加载不出来。
不过,Tableau Online在连接数据库这方面比较有优势,支持多种类型的数据库,包括一些云端数据库。
然后,进行 数据分析 。
Tableau Online可以设置的内容比较多,都是通过拖拽字段放到设置项上来实现的,对数据分析的规则有一定掌握的话,这个用起来还是比较灵活的,就是有时候设置项太多,想做个简单的调整要找好久,而且有时候行或者列上的字段会在设置之后丢失,有的设置明明勾选了但是又不生效。
豌豆BI的设置相对简单一些,可能不能实现太多复杂的效果,但是常用的统计图表的分析还是很好实现的,合计也可以多级展示,而且表格的样式比较符合我们的图表习惯。
豌豆BI多个图表可以在一个页面做好,多个图表上点击之后的数据筛选自动保持一致(联动效果),Tableau就需要一些设置才能实现。例如下图:左边饼图点击“正常”,右表的监管单位统计分析里就只统计了预警等级为“正常”的这部分数据。
有时候需要在已有指标的基础上,通过编辑计算公式得出一个新的指标,在Tableau和豌豆BI里都有这样的功能,支持的函数也差不多,但是Tableau在这里有个辅助功能,能检查这个公式整体是否能计算出结果来。
在数据预警这上面,豌豆BI可以直接设置预警条件和显示样式,tableau需要先设置一个计算字段,然后再拖到详细信息上设置颜色,相比之下豌豆BI的设置方式更为简单。
其他的分析功能差别不大,例如在Tableau里有创建组和创建数据桶,豌豆BI里有字符型自定义分组和数值型分段,Tableau里有筛选器,豌豆BI里有过滤条件。
最后,制作分析报告。
这部分在Tableau里面就深感不便了,做出来的仍然像是一个图表分析拼接的效果,豌豆BI的即席报告更有报告的感觉,而且可以导出成word文档,另外还可以制作幻灯片导出成PPT,不过这个我暂时还没用到,大概年底汇报才会用。另外还有一些在页面上辅助展示的工具,例如锚点工具、选项卡 工具 、筛选面板工具,不过这些工具导出时候就变成了静态图片,毕竟word里面也不支持这些工具的功能。
(自己做的报告不太好看,下图是豌豆BI自带的一个报告)
以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网
猜你喜欢:- 《铜豌豆 Linux》10.9.1 版本发布
- 《铜豌豆 Linux》10.9.2 版本发布
- 以豌豆荚为例,用 Scrapy 爬取分类多级页面
- 数据分析是什么,如何完善数据分析知识体系
- 大数据分析工程师入门(二十):数据分析方法
- 蚂蚁数据分析平台的演进及数据分析方法的应用
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
Spark技术内幕
张安站 / 机械工业出版社 / 2015-9-1
Spark是不断壮大的大数据分析解决方案家族中备受关注的新增成员。它不仅为分布式数据集的处理提供一个有效框架,而且以高效的方式处理分布式数据集。它支持实时处理、流处理和批处理,提供了AllinOne的统一解决方案,使得Spark极具竞争力。 本书以源码为基础,深入分析Spark内核的设计理念和架构实现,系统讲解各个核心模块的实现,为性能调优、二次开发和系统运维提供理论支持;本文最后以项目实战......一起来看看 《Spark技术内幕》 这本书的介绍吧!