汉语言处理包 HanLP 1.6.7 发布,改进人名 UV 拆分

栏目: 编程工具 · 发布时间: 7年前

内容简介:HanLP 是由一系列模型与算法组成的 Java 工具包,目标是普及自然语言处理在生产环境中的应用。HanLP 具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。 在提供丰富功能的同时,HanLP 内部模块坚持低耦合、模型坚持惰性加载、服务坚持静态提供、词典坚持明文发布,使用非常方便,同时自带一些语料处理工具,帮助用户训练自己的模型。HanLP v1.6.7 更新内容:源码下载:

HanLP 是由一系列模型与算法组成的 Java 工具包,目标是普及自然语言处理在生产环境中的应用。HanLP 具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。 在提供丰富功能的同时,HanLP 内部模块坚持低耦合、模型坚持惰性加载、服务坚持静态提供、词典坚持明文发布,使用非常方便,同时自带一些语料处理工具,帮助用户训练自己的模型。

HanLP v1.6.7 更新内容:

  • 默认感知机分词模型训练自 MSRA Named Entity Corpus

  • 词法分析器在低优先级用户词典模式下合并统计分词结果,高优先级模式则最长匹配

  • 词法分析器用户词典覆盖词性标注器的结果: #525

  • 改进人名UV拆分 fix #880

  • 修复 MaxEntDependencyParser fix #914

  • 新增TF和TF-IDF统计与关键词提取工具

  • word2vec适配IOAdapter与集群 fix #903

  • HanLP.extractWords增加更多参数

  • 新增NERTrainer.tagSet成员,方便 Python 用户

  • Sentence新增更多语料操作接口

  • LinearModel显示压缩进度

  • 微调人名、bigram等模型

  • 修订简繁词典,根据国家统计局2016行政区划数据校订地名词典

  • 新数据包 data-for-1.6.7.zip md5=4da338b7bcf3939a70b8cc16ed338c45

  • Portable版同步升级到v1.6.7

        <dependency>
            <groupId>com.hankcs</groupId>
            <artifactId>hanlp</artifactId>
            <version>portable-1.6.7</version>
        </dependency>

源码下载:


以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

大思维:集体智慧如何改变我们的世界

大思维:集体智慧如何改变我们的世界

杰夫·摩根 / 郭莉玲、尹玮琦、徐强 / 中信出版集团股份有限公司 / 2018-8-1 / CNY 65.00

智能时代,我们如何与机器互联,利用技术来让我们变得更聪明?为什么智能技术不会自动导致智能结果呢?线上线下群体如何协作?社会、政府或管理系统如何解决复杂的问题?本书从哲学、计算机科学和生物学等领域收集见解,揭示了如何引导组织和社会充分利用人脑和数字技术进行大规模思考,从而提高整个集体的智力水平,以解决我们时代的巨大挑战。是英国社会创新之父的洞见之作,解析企业、群体、社会如何明智决策、协作进化。一起来看看 《大思维:集体智慧如何改变我们的世界》 这本书的介绍吧!

RGB转16进制工具
RGB转16进制工具

RGB HEX 互转工具

RGB HSV 转换
RGB HSV 转换

RGB HSV 互转工具