反垃圾邮件插件 FuzzyOcr

码农软件 · 软件分类 · OCR开发包 · 2019-10-08 22:14:19

软件介绍

FuzzyOCR,是一套修改自OcrPlugin的Spamassassin plugin。同样是利用光学字符辨认(OCR)的方式,来识别图像式邮件所包含的「文字讯息」,并利用Fuzzy word matching算法判断辨识出来的文字。

主要具备了下列的功能:

Optical Character Recognition using different engines and settings

Fuzzy word matching algorithm applied to OCR results

Image hashing system to learn unique properties of known spam images

Dimension, size and integrity checking of images

Content-Type verification for the containing email

Matching and learning techniques

可弹性支持不同的OCR interface,并利用fuzzy word matching算法来处理辨识的结果。

支持DB,可将处理过的图片,以 feature vectors的形态储存在数据库。因此相同或是类似的图片,便可以利用储存在DB的特征向量来处理。

能检测不同维 度、size与整合性的测试。

邮件内容检测。

Resource saving techniques

仅扫描邮件,而非辨认该封信件是否为垃圾信件。信件的分类仍交由spamassassin所判别的分数高低来决定。

对于已达到 spam分数门坎的邮件,FuzzyOCR在处理该封邮件时会忽略该封信件而不进行扫描,进而减轻系统负载。(3.5版之后提供)

藉 由比对储存于DB的feature vectors(dimensions and file size)。若比对成功,则忽略该封信件,而不再进行OCR辨识与处理。

本文地址:https://codercto.com/soft/d/16341.html

引人入胜

引人入胜

Lynda Felder / 李婧 / 机械工业出版社华章公司 / 2012-9 / 59.00元

在这个信息泛滥、人人焦躁的时代,用户对待网页上密密麻麻的信息如同速食快餐一般,来不及咀嚼和回味就直接从眼前一闪而过了。用户是否能喜欢你的网站内容,往往取决于他瞬间的感受。我们如何才能使网站引人入胜、让用户看一眼就能迷上并流连忘返?本书给出了切实可行的解决方案,系统总结了创建优秀网站内容的策略、方法与最佳实践,内容丰富而生动。 本书作者极富创作魅力,将所有影响网站内容创作的问题进行逐一讲解和分......一起来看看 《引人入胜》 这本书的介绍吧!

CSS 压缩/解压工具
CSS 压缩/解压工具

在线压缩/解压 CSS 代码

Markdown 在线编辑器
Markdown 在线编辑器

Markdown 在线编辑器

HEX HSV 转换工具
HEX HSV 转换工具

HEX HSV 互换工具