Gse v0.40.0 发布,Go 高性能分词,增加更多常用 API

栏目: 软件资讯 · 发布时间: 6年前

内容简介:Go 语言高效分词,支持英文、中文、日文等 词典用双数组 trie(Double-Array Trie)实现, 分词器算法为基于词频的最短路径加动态规划, DAG 和 HMM (Viterbi) 算法分词, 新增 API 基本和结巴分词保持一致. 支持普...

Go 语言高效分词,支持英文、中文、日文等

词典用双数组 trie(Double-Array Trie)实现, 分词器算法为基于词频的最短路径加动态规划, DAG 和 HMM (Viterbi) 算法分词, 新增 API 基本和结巴分词保持一致.

支持普通、搜索引擎、全模式、精确模式和 HMM模式多种分词模式,支持用户词典、词性标注,可运行 JSON RPC 服务。

项目地址: https://github.com/go-ego/gse

Snake River

Add

  • [NEW] Add more common APIs and more examples
  • [NEW] Export seg.Find() function
  • [NEW] Add AddToken and AddTokenForce func
  • [NEW] Update dictionary code, add LoadNoFreq and MinTokenFreq parameter configuration
  • [NEW] Update examples code, add more examples and documents
  • [NEW] Optimize benchmark test tools code
  • [NEW] Add seg.Find() test
  • [NEW] Add AddToken and AddTokenForce test code
  • [NEW] Add crf.go file directory

Update

  • [NEW] Add more hmm is bool judge
  • [NEW] Update test dictionary and example code
  • [NEW] Update segmenter test code
  • [NEW] Add clear some internal api name and update godoc
  • [NEW] Add go1.12.x remove go1.10.x
  • [NEW] Add AddToken and AddTokenForce  example code
  • [NEW] Add custom dictionary example to example.go
  • [NEW] Update godoc
  • [NEW] Update CHANGELOG.md

Fix

  • [FIX] Optimize code wait todo load model
  • [FIX] Fixed some README.md benchmark
  • [FIX] Fixed link break
  • [FIX] Fixed goroutines benchmark code open path

以上所述就是小编给大家介绍的《Gse v0.40.0 发布,Go 高性能分词,增加更多常用 API》,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对 码农网 的支持!

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

美铁之战

美铁之战

[英]帕特里克·蒂利 / 黑曜、超侠 / 百花文艺出版社 / 2018-9 / 44.80元

本书的故事发生在未来,一场核战毁灭了北美大陆上的人类文明,残存下来的人类分化成两拨:生活在地面上退化到刀耕火种时代的平原人;躲藏在地下苟延残喘的沙穴人。几百年后,当保留着战前文明的沙穴人尝试着登上地面,和平原人的同室操戈将不可避免地上演……一起来看看 《美铁之战》 这本书的介绍吧!

JS 压缩/解压工具
JS 压缩/解压工具

在线压缩/解压 JS 代码

html转js在线工具
html转js在线工具

html转js在线工具

正则表达式在线测试
正则表达式在线测试

正则表达式在线测试