内容简介:数据采集ETL工具 Elasticsearch-datatran v6.3.1 发布,Elasticsearch-datatran 由 bboss 开源的数据采集同步ETL工具,提供数据采集、数据处理清洗和数据入库功能。支持在Elasticsearch、关系数据库(mysql,oracle...
数据采集ETL工具 Elasticsearch-datatran v6.3.1 发布,Elasticsearch-datatran 由 bboss 开源的数据采集同步ETL工具,提供数据采集、数据处理清洗和数据入库功能。支持在Elasticsearch、关系数据库(mysql,oracle,db2,sqlserver、达梦等)、 Mongodb 、HBase、Hive、Kafka、文本文件、SFTP/FTP多种数据源之间进行海量数据同步;支持日志文件实时增量采集到kafka/elasticsearch/database。
Elasticsearch版本兼容性:支持各种Elasticsearch版本(1.x,2.x,5.x,6.x,7.x,+)之间相互数据迁移

6.3.1 功能改进
-
日志采集探针,属性maxBytes为0或者负数时忽略记录长度截取
-
日志采集探针,增加忽略条件匹配类型文件记录包含与排除条件匹配类型: REGEX_MATCH,REGEX_CONTAIN,STRING_CONTAIN, STRING_EQUALS,STRING_PREFIX,STRING_END; 使用案例:
config.addConfig(new FileConfig(logPath,//指定目录
fileName+".log",//指定文件名称,可以是正则表达式
startLabel)//指定多行记录的开头识别标记,正则表达式
.setCloseEOF(false)//已经结束的文件内容采集完毕后关闭文件对应的采集通道,后续不再监听对应文件的内容变化
.addField("tag",fileName.toLowerCase())//添加字段tag到记录中
.setEnableInode(true)
.setIncludeLines(levelArr, LineMatchType.STRING_CONTAIN)
3.默认采用异步机制保存增量同步数据状态,大幅提升数据同步效率,降低同步功耗,可以通过以下机制关闭异步机制:
importBuilder.setAsynFlushStatus(false);
bboss数据采集ETL案例大全
https://esdoc.bbossgroups.com/#/bboss-datasyn-demo
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网
猜你喜欢:本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
解放战争(上)(1945年8月—1948年9月)
王树增 / 人民文学出版社 / 2009-8 / 60.00
《解放战争》为王树增非虚构文学著述中规模最大的作品。武器简陋、兵力不足的军队对抗拥有现代武器装备的兵力庞大的军队,数量不多、面积有限的解放区最终扩展成为九百六十万平方公里的共和国,解放战争在短短四年时间里演绎的是人类历史上的战争传奇。国际风云,政治智慧,时事洞察,军事谋略,军队意志,作战才能,作品具有宏阔的视角和入微的体察,包含着惊心动魄的人生沉浮和变幻莫测的战场胜负,尽展中国历史上规模最大的一场......一起来看看 《解放战争(上)(1945年8月—1948年9月)》 这本书的介绍吧!