- 授权协议: Apache
- 开发语言: Java
- 操作系统: 跨平台
- 软件首页: https://github.com/hankcs/HanLP
- 软件文档: http://hanlp.linrunsoft.com/doc/_build/html/
- 官方下载: http://hanlp.linrunsoft.com/services.html
软件介绍
HanLP: Han Language Processing
汉语言处理包
HanLP 是由一系列模型与算法组成的 Java 工具包,目标是普及自然语言处理在生产环境中的应用。HanLP 具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。
HanLP 提供下列功能:
-
中文分词
-
最短路分词
-
N-最短路分词
-
CRF分词
-
索引分词
-
极速词典分词
-
用户自定义词典
-
词性标注
-
命名实体识别
-
中国人名识别
-
音译人名识别
-
日本人名识别
-
地名识别
-
实体机构名识别
-
关键词提取
-
TextRank关键词提取
-
自动摘要
-
TextRank自动摘要
-
短语提取
-
基于互信息和左右信息熵的短语提取
-
拼音转换
-
多音字
-
声母
-
韵母
-
声调
-
简繁转换
-
繁体中文分词
-
简繁分歧词
-
文本推荐
-
语义推荐
-
拼音推荐
-
字词推荐
-
依存句法分析
-
MaxEnt依存句法分析
-
CRF依存句法分析
-
语料库工具
-
分词语料预处理
-
词频词性词典制作
-
BiGram统计
-
词共现统计
-
CoNLL语料预处理
-
CoNLL UA/LA/DA评测工具
在提供丰富功能的同时,HanLP 内部模块坚持低耦合、模型坚持惰性加载、服务坚持静态提供、词典坚持明文发布,使用非常方便,同时自带一些语料处理工具,帮助用户训练自己的语料。
数据挖掘中的新方法:支持向量机
邓乃扬、田英杰 / 科学出版社 / 2004-6-10 / 53.00元
支持向量机是数据挖掘中的一个新方法。支持向量机能非常成功地处理回归问题(时间序列分析)和模式识别(分类问题、判别分析)等诸多问题,并可推广于预测和综合评价等领域,因此可应用于理科、工科和管理等多种学科。目前国际上支持向量机在理论研究和实际应用两方面都正处于飞速发展阶段。希望本书能促进它在我国的普及与提高。 本书对象既包括关心理论的研究工作者,也包括关心应用的实际工作者。对于有关领域的具有高等......一起来看看 《数据挖掘中的新方法:支持向量机》 这本书的介绍吧!
