Tesseract 5.0 发布,开源 OCR 引擎

栏目: 软件资讯 · 发布时间: 3年前

内容简介:Tesseract 是一个最初由惠普公司开发的 OCR 引擎,并于 2005 年开源,Google 在第二年接管了项目的大部分开发工作。 Tesseract 5.0 发布,更新内容如下: 原生支持 Apple Silicon 默认情况下,训练和识别速度更快...

Tesseract 是一个最初由惠普公司开发的 OCR 引擎,并于 2005 年开源,Google 在第二年接管了项目的大部分开发工作。

Tesseract 5.0 发布,更新内容如下:

  • 原生支持 Apple Silicon
  • 默认情况下,训练和识别速度更快;
  • 更多的二值化选项
  • 改进了对 ARM NEON 的支持
  • 现代化的代码
  • 从公共 API 中删除了专有数据类型,如 GenericVector 和 STRING
  • 不再需要 pdf.ttf,现在集成到了代码中
  • 使用 automake 更快地进行平面构建
  • combine_tessdata 的新选项可以显示 traineddata 文件的细节
  • 改进了训练信息
  • 改进了单元测试和模糊测试
  • 大量的错误修正

更多详情可查看:https://github.com/tesseract-ocr/tesseract/releases/tag/5.0.0

 


以上所述就是小编给大家介绍的《Tesseract 5.0 发布,开源 OCR 引擎》,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对 码农网 的支持!

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

Java多线程编程实战指南(设计模式篇)

Java多线程编程实战指南(设计模式篇)

黄文海 / 电子工业出版社 / 2015-10 / 59.00

随着CPU 多核时代的到来,多线程编程在充分利用计算资源、提高软件服务质量方面扮演了越来越重要的角色。而 解决多线程编程中频繁出现的普遍问题可以借鉴设计模式所提供的现成解决方案。然而,多线程编程相关的设计模式书籍多采用C++作为描述语言,且书中所举的例子多与应用开发人员的实际工作相去甚远。《Java多线程编程实战指南(设计模式篇)》采用Java(JDK1.6)语言和UML 为描述语言,并结合作者多......一起来看看 《Java多线程编程实战指南(设计模式篇)》 这本书的介绍吧!

在线进制转换器
在线进制转换器

各进制数互转换器

URL 编码/解码
URL 编码/解码

URL 编码/解码

XML、JSON 在线转换
XML、JSON 在线转换

在线XML、JSON转换工具