内容简介:blink正在紧锣密鼓的与flink合并,作为flink开发者,大数据开发者,还是有必要测试一下的,经常有粉丝微信群里问浪尖会不会用blink,关于这点,我发过文章了:我的建议是等合并之后,测试稳定了再用。
blink正在紧锣密鼓的与flink合并,作为flink开发者,大数据开发者,还是有必要测试一下的,经常有粉丝微信群里问浪尖会不会用blink,关于这点,我发过文章了:
我的建议是等合并之后,测试稳定了再用。
那么今天也主要是测试调研一下blink。前面说了对于大数据框架, 除了要理解底层的原理之外,还要掌握如何分析查看性能瓶颈 ,blink除了从底层多处进行优化之外,还优化了flink的 web ui,而且都有了比较大的提升。
关于blink的官方优化点说明,大家可以查看flink 的github blink 分支,里面的readme.md文档。
https://github.com/apache/flink/tree/blink
首先,导入blink入idea
idea直接支持通过git上导入blink,方式是
跳出下面的窗口,在url栏输入flink的地址
然后就是等待了,,,
导入成功之后,在右下角切换分支到blink
然后就可以编译了,编译之前呢,需要注释掉pom.xml里代码风格检测的内容。 然后执行
mvn clean package -DskipTests
编译结束之后,会在build-target目录下生成blink的安装文件,然后你可以复制出来,仅仅想本地模式测试的话,可以直接,执行
bin/start-cluster.sh
启动完成之后,浏览器输入host:8081,即可登陆blink的web ui。
可以看到web ui的内容风格已经完全重构,而且细节非常丰富。
下面是官方给出的web 优化点:
我们在 Flink Runtime Web 的易用性与性能等多个方面进行了改进,从资源使用、作业调优、日志查询等维度新增了大量功能,使得用户可以更方便的对 Flink 作业进行运维。 资源使用:新增 Cluster、TaskManager 与 Job 三个级别的资源信息,资源的申请与使用情况一目了然。 作业调优:作业的拓扑关系及数据流向可以追溯至 Operator 级别,Vertex 增加 InQueue,OutQueue等多项指标,可以方便的追踪数据的反压、过滤及倾斜情况。 日志查询:TaskManager 和 JobManager 的日志功能得到大幅度加强,从Job、Vertex、SubTask 等多个维度都可以关联至对应日志,提供多日志文件访问入口,以及分页展示查询和日志高亮功能。 交互优化:对页面交互逻辑进行了整体优化,绝大部分关联信息在单个页面就可以完成查询和比对工作,减少了大量不必要的跳转。 性能提升:使用 Angular 7.0 进行了整体重构,页面运行性能有了一倍以上的提升。在大数据量情况下也不会发生页面假死或者卡顿情况。
日志管理
在这里浪尖主要想提的就是关于日志相关的监控,大家都知道flink日志只有taskmanager和jobmanager的,要是集群运行多任务的话就会导致日志分析很蛋疼,所以目前on yarn的情况都是单个任务。
blink的日志,给我们细分了文件,方便我们针对应用程序查看
运行两个简单的任务
bin/flink run examples/streaming/ bin/flink run examples/streaming/Kafka010Example.jar --input-topic test --output-topic boo --bootstrap.servers mt-mdh.local:9093 --groupid test
查看taskmanager的日志,可以看到 TaskManager 和 JobManager 的日志功能得到大幅度加强,从Job、Vertex、SubTask 等多个维度都可以关联至对应日志,提供多日志文件访问入口,以及分页展示查询和日志高亮功能。
当然这个日志文件名区分度还不是很高,主要要根据提交任务的主机,然后提交顺序来查找: 日志和程序之间的对应关系 ,但是已经大幅度提高了我们分析日志的能力了,因为原有的flink日志比较集中于taskmanager,那么就假如运行时间久,日志文件会越滚越大,运行任务多日志交叉,然后导致问题分析变的难度比较高。
好了,今天分析就到这,后面继续揭开blink 的神秘面纱。
2019年欢迎加入浪尖知识星球,与580位球友一起学习,今天继续flink教程~
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网
猜你喜欢:- 安盟信息解决智慧医院建设“痛点”
- 手写短命令工具 - 解决工作中的痛点
- Cabloy-CMS:动静结合,解决Hexo痛点问题
- “性能问题终结者”Olympic,解决用户痛点背后的秘密是......
- 用JWT技术解决IM系统Socket长连接的身份认证痛点
- 微软:人才稀缺正在阻碍机器学习的大规模运用,“机器教学”或可解决行业痛点
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
深入浅出Node.js
朴灵 / 人民邮电出版社 / 2013-12-1 / CNY 69.00
本书从不同的视角介绍了 Node 内在的特点和结构。由首章Node 介绍为索引,涉及Node 的各个方面,主要内容包含模块机制的揭示、异步I/O 实现原理的展现、异步编程的探讨、内存控制的介绍、二进制数据Buffer 的细节、Node 中的网络编程基础、Node 中的Web 开发、进程间的消息传递、Node 测试以及通过Node 构建产品需要的注意事项。最后的附录介绍了Node 的安装、调试、编码......一起来看看 《深入浅出Node.js》 这本书的介绍吧!