用深度学习优化OCR,「睿琪」百倍提升票据录入效率

栏目: 数据库 · 发布时间: 5年前

企业管理的精益化往往始于与钱紧密相关的财务部门,市面上的财会报销软件也已经是琳琅满目,但管理的优化离不开大量结构化数据的积累。在这个必不可少的前端环节中,财务人员依然需要辨别纸质发票并手动录入,过程低效无趣,且操作误差难以避免。

为解决这一痛点,36氪近期接触的「睿琪智能票据识别平台」(以下简称睿琪)使用人工智能技术对票据进行自动处理,将票据信息录入效率由人力的50小时/千张提升至0.5小时/千张,节省企业人力,降低了财务软件的使用门槛。

只需对着纸质票据进行扫描或者拍照,睿琪就能 自动将票据图像“翻译”为结构化数据,单图平均识别时间小于1秒,且支持自动寻边切割、多票一次性识别 。此外,睿琪还能 自动对数据进行 去重预处理、录入对应表单、根据企业需求自动归类票据并存储票据影像等 ,帮助企业建立全量存储、集合管理的财务共享中心。

由于需求清晰、文本格式标准化程度高,票据识别是一个相对成熟的OCR市场。近几年,深度学习的发展又驱动了这一技术可用性的提升。睿琪负责人徐青松介绍称,传统OCR技术依赖模板匹配或特征提取,其弱点是对图像要求高,应付字体变化、模糊或背景干扰的能力较差。 而睿琪所采用的是基于卷积神经网络的OCR技术,能够自动提取字符图像的特征并进行分类 ,识别准确率高达95%(识别无误的票据比例为95%),具有较高的图像质量兼容度。

卷积神经网络基础的另一大优势体现在识别种类的丰富性上。由于依赖模板,对于客运票、过路费票等种类多样、版式不统一的票据,传统OCR识别技术识别准确率较低。而睿琪现已支持识别增值税发票、出租车票、客运票、过路费票、国际票等13类票据, 现有产品中覆盖最为全面的 。此外睿琪平台还 具备强扩展性 ,可在两周内开发并训练神经网络,支持全新票据类型。

在产品形态上,睿琪向大型企业提供软硬件一体、可跨区域跨公司的私有云部署方案,向中型企业提供性价比高、方便快捷的SaaS服务,向需要接入识别功能的财务软件厂商提供移动SDK与API。C端用户则可通过APP产品“票小秘”来识别管理票据。

从去年9月产品上线至今,睿琪已服务超过100家企业客户,客单价由千元至百万元不等。金蝶、每刻报销、易快报、泛微OA等厂商都接入了睿琪的票据识别技术。

用深度学习优化OCR,「睿琪」百倍提升票据录入效率

事实上,纸质票据识别录入繁琐低效这一问题,除了通过AI来解决,电子发票似乎是一个更加根本的解决方案。那么国家对电子发票的大力推动是否会挤压票据识别产品的应用空间?

徐青松认为答案是肯定的,这也是发展的必然趋势。但现有的纸质票据数量非常庞大,3-5年内智能化识别 工具 的需求不会消失。另外,睿琪也会 逐渐支持更多语种方便全球贸易环境中的企业快捷处理海外发票,扩充支持的票据品类 。更进一步,睿琪还计划 将更多办公场景内的凭证、文档、合同纳入数据结构化处理的范畴

杭州睿琪软件有限公司专注于AI关键技术研发,具有多种应用场景的AI落地经验。他们开发的其他视觉识别产品形色、 国内首个皮肤病AI辅助诊疗系统 都曾被36氪报道。团队规模目前超过200人,研发人员占比80%。

票据识别行业的玩家还包括百度云、网易旗下的有道智云、名片全能王背后的合合信息、主打车牌识别的文通科技、由卡证识别起家的易道博识等。


以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

极简算法史:从数学到机器的故事

极简算法史:从数学到机器的故事

[法] 吕克•德•布拉班迪尔 / 任轶 / 人民邮电出版社 / 2019-1 / 39.00元

数学、逻辑学、计算机科学三大领域实属一家,彼此成就,彼此影响。从古希腊哲学到“无所不能”的计算机,数字、计算、推理这些貌似简单的概念在三千年里融汇、碰撞。如何将逻辑赋予数学意义?如何从简单运算走向复杂智慧?这背后充满了人类智慧的闪光:从柏拉图、莱布尼茨、罗素、香农到图灵都试图从数学公式中证明推理的合理性,缔造完美的思维体系。他们是凭天赋制胜,还是鲁莽地大胆一搏?本书描绘了一场人类探索数学、算法与逻......一起来看看 《极简算法史:从数学到机器的故事》 这本书的介绍吧!

JSON 在线解析
JSON 在线解析

在线 JSON 格式化工具

SHA 加密
SHA 加密

SHA 加密工具

RGB HSV 转换
RGB HSV 转换

RGB HSV 互转工具