内容简介:blink正在紧锣密鼓的与flink合并,作为flink开发者,大数据开发者,还是有必要测试一下的,经常有粉丝微信群里问浪尖会不会用blink,关于这点,我发过文章了:我的建议是等合并之后,测试稳定了再用。
blink正在紧锣密鼓的与flink合并,作为flink开发者,大数据开发者,还是有必要测试一下的,经常有粉丝微信群里问浪尖会不会用blink,关于这点,我发过文章了:
我的建议是等合并之后,测试稳定了再用。
那么今天也主要是测试调研一下blink。前面说了对于大数据框架, 除了要理解底层的原理之外,还要掌握如何分析查看性能瓶颈 ,blink除了从底层多处进行优化之外,还优化了flink的 web ui,而且都有了比较大的提升。
关于blink的官方优化点说明,大家可以查看flink 的github blink 分支,里面的readme.md文档。
https://github.com/apache/flink/tree/blink
首先,导入blink入idea
idea直接支持通过git上导入blink,方式是
跳出下面的窗口,在url栏输入flink的地址
然后就是等待了,,,
导入成功之后,在右下角切换分支到blink
然后就可以编译了,编译之前呢,需要注释掉pom.xml里代码风格检测的内容。 然后执行
mvn clean package -DskipTests
编译结束之后,会在build-target目录下生成blink的安装文件,然后你可以复制出来,仅仅想本地模式测试的话,可以直接,执行
bin/start-cluster.sh
启动完成之后,浏览器输入host:8081,即可登陆blink的web ui。
可以看到web ui的内容风格已经完全重构,而且细节非常丰富。
下面是官方给出的web 优化点:
我们在 Flink Runtime Web 的易用性与性能等多个方面进行了改进,从资源使用、作业调优、日志查询等维度新增了大量功能,使得用户可以更方便的对 Flink 作业进行运维。 资源使用:新增 Cluster、TaskManager 与 Job 三个级别的资源信息,资源的申请与使用情况一目了然。 作业调优:作业的拓扑关系及数据流向可以追溯至 Operator 级别,Vertex 增加 InQueue,OutQueue等多项指标,可以方便的追踪数据的反压、过滤及倾斜情况。 日志查询:TaskManager 和 JobManager 的日志功能得到大幅度加强,从Job、Vertex、SubTask 等多个维度都可以关联至对应日志,提供多日志文件访问入口,以及分页展示查询和日志高亮功能。 交互优化:对页面交互逻辑进行了整体优化,绝大部分关联信息在单个页面就可以完成查询和比对工作,减少了大量不必要的跳转。 性能提升:使用 Angular 7.0 进行了整体重构,页面运行性能有了一倍以上的提升。在大数据量情况下也不会发生页面假死或者卡顿情况。
日志管理
在这里浪尖主要想提的就是关于日志相关的监控,大家都知道flink日志只有taskmanager和jobmanager的,要是集群运行多任务的话就会导致日志分析很蛋疼,所以目前on yarn的情况都是单个任务。
blink的日志,给我们细分了文件,方便我们针对应用程序查看
运行两个简单的任务
bin/flink run examples/streaming/ bin/flink run examples/streaming/Kafka010Example.jar --input-topic test --output-topic boo --bootstrap.servers mt-mdh.local:9093 --groupid test
查看taskmanager的日志,可以看到 TaskManager 和 JobManager 的日志功能得到大幅度加强,从Job、Vertex、SubTask 等多个维度都可以关联至对应日志,提供多日志文件访问入口,以及分页展示查询和日志高亮功能。
当然这个日志文件名区分度还不是很高,主要要根据提交任务的主机,然后提交顺序来查找: 日志和程序之间的对应关系 ,但是已经大幅度提高了我们分析日志的能力了,因为原有的flink日志比较集中于taskmanager,那么就假如运行时间久,日志文件会越滚越大,运行任务多日志交叉,然后导致问题分析变的难度比较高。
好了,今天分析就到这,后面继续揭开blink 的神秘面纱。
2019年欢迎加入浪尖知识星球,与580位球友一起学习,今天继续flink教程~
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网
猜你喜欢:- 安盟信息解决智慧医院建设“痛点”
- 手写短命令工具 - 解决工作中的痛点
- Cabloy-CMS:动静结合,解决Hexo痛点问题
- “性能问题终结者”Olympic,解决用户痛点背后的秘密是......
- 用JWT技术解决IM系统Socket长连接的身份认证痛点
- 微软:人才稀缺正在阻碍机器学习的大规模运用,“机器教学”或可解决行业痛点
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
Web Data Mining
Bing Liu / Springer / 2011-6-26 / CAD 61.50
Web mining aims to discover useful information and knowledge from Web hyperlinks, page contents, and usage data. Although Web mining uses many conventional data mining techniques, it is not purely an ......一起来看看 《Web Data Mining》 这本书的介绍吧!