Apache Kafka 的日志收集代理 Logkafka
- 授权协议: MIT
- 开发语言: C/C++
- 操作系统: 跨平台
- 软件首页: https://github.com/Qihoo360/logkafka#users-of-logkafka
- 软件文档: https://github.com/Qihoo360/logkafka/blob/master/README.md
- 官方下载: https://github.com/Qihoo360/logkafka/archive/master.zip
软件介绍
logkafka是一个日志收集代理,可以按行收集日志文件并发送到kafka 0.8,每行为一条消息。
在生产环境部署之前请查看一下FAQ。
特性
通过zookeeper来管理日志收集相关配置
日志文件轮转
批量发送
压缩 (none, gzip, snappy)
与其他日志聚合&监控工具的区别
与flume, fluentd, logstash区别:
日志收集配置和状态的管理:
flume, fluentd, logstash需要在日志所在机器添加日志收集配置项,并在本地启动服务,用于管理日志配置项和状态。
logkafka将日志收集配置和收集状态保存在zookeeper节点中:logkafka监控相应的节点,当配置变动时,logkafka会自 动拉取最新的日志配置项;logkafka会将所收集文件内的当前偏移记录在本地文件中,并定期将收集的状态信息上传到zookeeper。
日志收集的顺序性
flume, fluentd, logstash的INPUT类型中都包含'tail'插件,但这些插件都是对扫描到的所有文件同时进行收集,不会考虑日志文件在时间上的顺序性。
logkafka会按时间顺序扫描新的文件。
文本上的算法——深入浅出自然语言处理
路彦雄 / 人民邮电出版社 / 2018-3-1 / 69.00元
本书结合作者多年学习和从事自然语言处理相关工作的经验,力图用生动形象的方式深入浅出地介绍自然语言处理的理论、方法和技术。本书抛弃掉繁琐的证明,提取出算法的核心,帮助读者尽快地掌握自然语言处理所必备的知识和技能。本书主要分两大部分。第一部分是理论篇,包含前3章内容,主要介绍一些基础的数学知识、优化理论知识和一些机器学习的相关知识。第二部分是应用篇,包含第4章到第8章,分别针对计算性能、文本处理的术语......一起来看看 《文本上的算法——深入浅出自然语言处理》 这本书的介绍吧!
