- 授权协议: GPL
- 开发语言: Java
- 操作系统: 跨平台
- 软件首页: https://github.com/chungkwong/text-classifier-collection
- 软件文档: https://github.com/chungkwong/text-classifier-collection
- 官方下载: https://github.com/chungkwong/text-classifier-collection
软件介绍
文本分类器集合
一个强大易用的Java文本分类工具包
特色
功能全面
内置信息检索中各种常用的文本预处理方法,如语言感知分词、词干提取、繁简转换、停用词去除、同义词插入、n-gram生成等等
内置SVM、kNN、朴素贝叶斯等多种分类器
内置支持CSV等格式数据的读取
高度可定制
你可以插入你编写的分词方法、单词规范化方法、停用词列表、同义词列表、TF-IDF公式等等
可以轻易实现你自己的分类器而与工具包中其它工具一起使用
容易使用
可自动按给定数据集选取最优分类器
与Java8引入的流和函数式API无缝结合
效果
| 数据集 | 样本数 | 分类数 | 准确率 |
|---|---|---|---|
| YouTube Spam Collection | 1956 | 2 | 92.1% |
| SMS Spam Collection | 5574 | 2 | 98.2% |
| Sentence Classification | 1510 | 5 | 80.4% |
| Reuters-21578 Text Categorization Collection | 21578 | 135 | 59.8% |
| Reuters-21578 Text Categorization Collection | 21578 | 175 | 67.8% |
写给大家看的Web设计书
Robin Williams、John Tollett / 苏金国、刘亮 / 人民邮电出版社 / 201005 / 69.00元
在这个网络时代,Web设计几乎已经成为每个人生活的必备技能。如果你想自力更生创建一个网站,或者认为自己的网站在设计上还不尽如人意,希望它看上去更具创意和专业性,那么本书正是为你准备的! 作者Robin和John先采用通俗易懂的方式将有关基础知识娓娓道来,比如Internet、搜索信息、构建简单网页等,然后为我们奉上了精妙的技巧、技术和设计示例来启发大家的设计灵感,比如Web基本设计原则、实现......一起来看看 《写给大家看的Web设计书》 这本书的介绍吧!
