内容简介:HanLP 是由一系列模型与算法组成的 Java 工具包,目标是普及自然语言处理在生产环境中的应用。HanLP 具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。 在提供丰富功能的同时,HanLP 内部模块坚持低...
HanLP 是由一系列模型与算法组成的 Java 工具包,目标是普及自然语言处理在生产环境中的应用。HanLP 具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。 在提供丰富功能的同时,HanLP 内部模块坚持低耦合、模型坚持惰性加载、服务坚持静态提供、词典坚持明文发布,使用非常方便,同时自带一些语料处理工具,帮助用户训练自己的模型。
HanLP v1.6.7 更新内容:
默认感知机分词模型训练自 MSRA Named Entity Corpus
词法分析器在低优先级用户词典模式下合并统计分词结果,高优先级模式则最长匹配
词法分析器用户词典覆盖词性标注器的结果:#525
改进人名UV拆分 fix #880
修复 MaxEntDependencyParser fix #914
新增TF和TF-IDF统计与关键词提取工具
word2vec适配IOAdapter与集群 fix #903
HanLP.extractWords增加更多参数
新增NERTrainer.tagSet成员,方便 Python 用户
Sentence新增更多语料操作接口
LinearModel显示压缩进度
微调人名、bigram等模型
修订简繁词典,根据国家统计局2016行政区划数据校订地名词典
新数据包data-for-1.6.7.zip
md5=4da338b7bcf3939a70b8cc16ed338c45
Portable版同步升级到v1.6.7
<dependency> <groupId>com.hankcs</groupId> <artifactId>hanlp</artifactId> <version>portable-1.6.7</version> </dependency>
源码下载:
【声明】文章转载自:开源中国社区 [http://www.oschina.net]
以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网
猜你喜欢:- 汉语言处理包 HanLP 1.6.7 发布,改进人名 UV 拆分
- iOS组件化拆分之业务与拆分并行开发
- html – 当我们拆分表时,如何将div拆分为两列?
- 微服务拆分之道
- 微服务的灾难-拆分
- 微服务的拆分与组件
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
Google是如何控制世界的
(美)丹尼尔·伊克比亚 / 李军 / 东方出版社 / 2008-08 / 36.00元
秘Google的发展之路! Google,这个有着数百亿的网页存储量、每天两亿搜索次数的搜索引擎,最初仅仅是一个方程式。这个由拉里·佩奇和塞吉·布林两位天才创造出的超级算法甚至比可口可乐的配方还要保密。 当广告公司为自己网页在搜索结果中的排序争得头破血流时,Google正悠然地坐收渔翁之利,这种天才的拍卖广告链接的商业模式给Google带来了令人瞠目结舌的企业利润!仅仅从1999~20......一起来看看 《Google是如何控制世界的》 这本书的介绍吧!