Gse v0.40.0 发布,Go 高性能分词,增加更多常用 API

栏目: 软件资讯 · 发布时间: 6年前

内容简介:Go 语言高效分词,支持英文、中文、日文等 词典用双数组 trie(Double-Array Trie)实现, 分词器算法为基于词频的最短路径加动态规划, DAG 和 HMM (Viterbi) 算法分词, 新增 API 基本和结巴分词保持一致. 支持普...

Go 语言高效分词,支持英文、中文、日文等

词典用双数组 trie(Double-Array Trie)实现, 分词器算法为基于词频的最短路径加动态规划, DAG 和 HMM (Viterbi) 算法分词, 新增 API 基本和结巴分词保持一致.

支持普通、搜索引擎、全模式、精确模式和 HMM模式多种分词模式,支持用户词典、词性标注,可运行 JSON RPC 服务。

项目地址: https://github.com/go-ego/gse

Snake River

Add

  • [NEW] Add more common APIs and more examples
  • [NEW] Export seg.Find() function
  • [NEW] Add AddToken and AddTokenForce func
  • [NEW] Update dictionary code, add LoadNoFreq and MinTokenFreq parameter configuration
  • [NEW] Update examples code, add more examples and documents
  • [NEW] Optimize benchmark test tools code
  • [NEW] Add seg.Find() test
  • [NEW] Add AddToken and AddTokenForce test code
  • [NEW] Add crf.go file directory

Update

  • [NEW] Add more hmm is bool judge
  • [NEW] Update test dictionary and example code
  • [NEW] Update segmenter test code
  • [NEW] Add clear some internal api name and update godoc
  • [NEW] Add go1.12.x remove go1.10.x
  • [NEW] Add AddToken and AddTokenForce  example code
  • [NEW] Add custom dictionary example to example.go
  • [NEW] Update godoc
  • [NEW] Update CHANGELOG.md

Fix

  • [FIX] Optimize code wait todo load model
  • [FIX] Fixed some README.md benchmark
  • [FIX] Fixed link break
  • [FIX] Fixed goroutines benchmark code open path

以上所述就是小编给大家介绍的《Gse v0.40.0 发布,Go 高性能分词,增加更多常用 API》,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对 码农网 的支持!

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

修改代码的艺术

修改代码的艺术

Michael Feathers / 刘未鹏 / 人民邮电出版社 / 2007-09-25 / 59.00元

我们都知道,即使是最训练有素的开发团队,也不能保证始终编写出清晰高效的代码。如果不积极地修改、挽救,随着时间流逝,所有软件都会不可避免地渐渐变得复杂、难以理解,最终腐化、变质。因此,理解并修改已经编写好的代码,是每一位程序员每天都要面对的工作,也是开发程序新特性的基础。然而,与开发新代码相比,修改代码更加令人生畏,而且长期以来缺乏文献和资料可供参考。 本书是继《重构》和《重构与模式》之后探讨......一起来看看 《修改代码的艺术》 这本书的介绍吧!

在线进制转换器
在线进制转换器

各进制数互转换器

XML 在线格式化
XML 在线格式化

在线 XML 格式化压缩工具

HEX CMYK 转换工具
HEX CMYK 转换工具

HEX CMYK 互转工具