内容简介:有没有人注意到Kafka 昨天发了2.3.0?是的,我也是刷Twitter看到的,然后我就想要不把社区的Kafka universal connector的依赖升上去吧。反正这个connector从引入时跟踪的2.0.0以及最新的2.2.0都是我升级的。原本,以为升级会一如既往得顺利。不过,最终发现还是想当然了。不怎么关注Flink kafka connector内部实现的童鞋可能不清楚,自Kafka支持producer端事务以来,Flink就在0.11版本的connector提供了对该特性的支持,这样它就
有没有人注意到Kafka 昨天发了2.3.0?是的,我也是刷Twitter看到的,然后我就想要不把社区的Kafka universal connector的依赖升上去吧。反正这个connector从引入时跟踪的2.0.0以及最新的2.2.0都是我升级的。
原本,以为升级会一如既往得顺利。不过,最终发现还是想当然了。不怎么关注Flink kafka connector内部实现的童鞋可能不清楚,自Kafka支持producer端事务以来,Flink就在0.11版本的connector提供了对该特性的支持,这样它就可以在sink端针对Kafka提供Exactly-Once的语义。
但具体的实现,其实很“ugly”,而这个话题说来话长。Flink的2PC SinkFunction,里有个 initializeState
方法,最终会调用内部的 recoverAndCommitInternal
而它又间接调用的 recoverAndCommit
方法是需要最终的实现者override的。对应到Kafka producer的实现,就是 FlinkKafkaInternalProducer#resumeTransaction
方法。在恢复事务之前,它需要先拿到 KafkaProducer#transactionManager
这个实例字段,然后再拿这个实例字段内部的 nextSequence
字段(类型为 Map<TopicPartition,Integer>
),并调用 clear()
方法清空它后才能回置相关字段并恢复事务。是的,所有的这一切都是通过反射机制来实现的,包括获取 nextSequence
这个字段,因为这些操作Kafka produer没有公开,而也正是因为这个原因,Kafka也不会承诺它维持内部实现不变。
其实,在实现universal connector的时候,已经碰到过这个问题了,在Kafka client 2.0之前,这个字段名叫 sequenceNumbers
,后来才改叫 nextSequence
。这次升级问题同样出在这个字段上,升级PR对应的Travis抛出如下异常:
这次不是变量命名的问题,而是 TransactionManager
内部实现进行了较大的重构!相应的issue是:KAFKA-7736,它引入了两个内部类: TopicPartitionBookkeeper
以及 TopicPartitionEntry
,并把 nextSequence
放到了 TopicPartitionEntry
中去了。这还仅仅只是表面观察到的,还没来得及细看具体是否存在其他问题。
所以等不及要上Kafka 2.3.0的童鞋请先等等,更多进展请关注FLINK-12976!所以,搞个Flink容易么,还得跑到Kafka源码里去了解细节。所以你还不加个星球鼓励一下?
有问必答,问倒算我输!
以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网
猜你喜欢:- Chrome 76 稳定版发布:禁用 Flash、监听扩展等等
- 开源 Go, Py 项目找队友、顾问、贡献者、赞助等等
- 从 “等等” 到 “秒开” 再到 “直开”,是什么让闲鱼社区相见恨晚?
- GoFrame v1.12 发布,数据库驱动开发、日志滚动切分等等新特性
- 最全的常用正则表达式大全——包括校验数字、字符、一些特殊的需求等等
- 等等,谷歌这款新产品是传说中的 Fuchsia OS 设备?
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
RGB转16进制工具
RGB HEX 互转工具
RGB HSV 转换
RGB HSV 互转工具