如何实现业务校验智能化升级？

栏目: 数据库 · 发布时间: 7年前

内容简介：实时业务校验平台作为阿里集团老牌的业务审计系统，覆盖了集团绝大部分的业务对账场景，在线上问题及时发现以及减少集团资损上发挥着巨大作用，保障了各个系统的业务稳定性。本文主要介绍实时业务校验平台（以下简称 BCP: Business Check Platform）在智能化方面的创新和实践。一、需求背景随着业务规模的扩张，阿里集团内部的系统变得越来越复杂，在这种复杂的分布式系统架构下，难免会出现远程调用失败，消息发送失败，并发 bug 等等问题，这些问题最终会导致系统间的数据不一致，导致用户体验受损，用户利益受

编辑推荐:

本文来自于segmentfault.com，本文主要介绍实时业务校验平台在智能化方面的创新和实践，分别从需求背景，智能化，应用场景等方面介绍。

实时业务校验平台作为阿里集团老牌的业务审计系统，覆盖了集团绝大部分的业务对账场景，在线上问题及时发现以及减少集团资损上发挥着巨大作用，保障了各个系统的业务稳定性。本文主要介绍实时业务校验平台（以下简称 BCP: Business Check Platform）在智能化方面的创新和实践。

一、需求背景

随着业务规模的扩张，阿里集团内部的系统变得越来越复杂，在这种复杂的分布式系统架构下，难免会出现远程调用失败，消息发送失败，并发 bug 等等问题，这些问题最终会导致系统间的数据不一致，导致用户体验受损，用户利益受损，对平台来说就是产生资损。意识好的或者是出过问题的系统，可能会去配置一些校验任务，比如每隔 1 小时，去跑一次离线计算任务，判断这段时间内是不是有数据故障出现，但是这种方式时效性较差，然后每个系统团队的对账方式都比较零散随意，我们没有一套体系化解决数据问题的方案，线上问题又一直存在不断有新的问题产生，处理比较被动，数据质量这块一直是个空白的领域。

BCP 就是在这种背景下产生，用来帮助业务系统实时校验线上的每一笔数据，填补数据质量领域的空白。BCP 主要实现以下 4 个目标：

高实时性的发现线上业务脏数据或者错误逻辑，第一时间发现并及时通知技术保障，而不是等客户反馈。

方便的接入各种业务规则，通过脚本规则编写的方式，让各应用快速接入平台。

整合订正工具，形成规范的脏数据订正流程。

业务上线的实时监控，新上线业务可以很方便的进行校验。

为了更高效率的让应用快速接入业务对账平台，同时减少对应用带来的性能损耗和代码侵入，BCP 通过事件模式，把业务数据变化触发的消息 (如 DB 变更日志数据，消息中间件消息) 转换成响应业务的事件，放入到事件执行队列进行规则的检查，事件监听框架采用了通用的架构设计，实现了消息的对接，而 DB 日志又可以转接到消息上，实现数据库变更的实时监听。