Go语言中文分词 GoJieba

码农软件 · 软件分类 · 中文分词库 · 2019-08-28 19:59:29

软件介绍

GoJieba 是 Jieba 分词 (结巴中文分词)的 Golang 语言版本分词库。

用法

go get github.com/yanyiwu/gojieba

示例代码请见 example/demo.go

cd example
go run demo.go

之所以需要先 cd 到 example 目录下,是因为 demo.go 里面有写死的字典相对路径。

输出结果:

全模式: 我/来到/北京/清华/清华大学/华大/大学
精确模式: 我/来到/北京/清华大学
新词识别: 他/来到/了/网易/杭研/大厦
搜索引擎模式: 小明/硕士/毕业/于/中国/中国科学院/科学/科学院/学院/计算所/,/后/在/日本/日本京都大学/京都/京都大学/大学/深造

性能测试

性能不错,因为 GoJieba 本身就是封装了 C++ 版本的 CppJieba 而成, 对比测试了一下,耗时大概是CppJieba 的 1.2 倍。 鉴于 CppJieba 性能还不错(详见jieba-performance-comparison), 所以 GoJieba性能还是可以的, 对于讲究性能的地方还是可以试试的。

客服

i@yanyiwu.com

本文地址:https://codercto.com/soft/d/13380.html

学习JavaScript数据结构与算法(第2版)

学习JavaScript数据结构与算法(第2版)

[巴西] Loiane Groner / 邓 钢、孙晓博、吴 双、陈 迪、袁 源 / 人民邮电出版社 / 2017-9 / 49.00元

本书首先介绍了JavaScript 语言的基础知识以及ES6 和ES7 中引入的新功能,接下来讨论了数组、栈、队列、链表、集合、字典、散列表、树、图等数据结构,之后探讨了各种排序和搜索算法,包括冒泡排序、选择排序、插入排序、归并排序、快速排序、堆排序、计数排序、桶排序、基数排序、顺序搜索、二分搜索,然后介绍了动态规划和贪心算法等常用的高级算法以及函数式编程,最后还介绍了如何计算算法的复杂度。一起来看看 《学习JavaScript数据结构与算法(第2版)》 这本书的介绍吧!

MD5 加密
MD5 加密

MD5 加密工具

XML、JSON 在线转换
XML、JSON 在线转换

在线XML、JSON转换工具

UNIX 时间戳转换
UNIX 时间戳转换

UNIX 时间戳转换