主题模型工具包 Gensim 3.4.0 发布,提速再提速

栏目: 软件资讯 · 发布时间: 6年前

内容简介:Gensim 是用于主题模型、文档索引和海量文本的相似检索的 Python 库,目标受众是自然语言处理(NLP)和信息检索(IR)社区。 Gensim 3.4.0 已发布,主要更新如下: 新增 cython 版 gensim.models.LdaModel ,带来...

Gensim 是用于主题模型、文档索引和海量文本的相似检索的 Python 库,目标受众是自然语言处理(NLP)和信息检索(IR)社区。

Gensim 3.4.0 已发布,主要更新如下:

  • 新增 cython 版 gensim.models.LdaModel ,带来大幅优化,训练速度更快。

主题模型工具包 Gensim 3.4.0 发布,提速再提速

  • 新增 Cython 版 MmReader,给 corpus I/O 带来大幅提速。

主题模型工具包 Gensim 3.4.0 发布,提速再提速

  • gensim.models.FastText 性能和内存优化

主题模型工具包 Gensim 3.4.0 发布,提速再提速

  • 开始使用 Soft Cosine Measure ,这是一个评估文件相似性的新方法,是 WMD 的一个很好的替代方法

主题模型工具包 Gensim 3.4.0 发布,提速再提速

此外,该版本还包含大量改进和 bug 修复,详情可查阅发行列表


【声明】文章转载自:开源中国社区 [http://www.oschina.net]


以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

算法Ⅰ-Ⅳ

算法Ⅰ-Ⅳ

塞奇威克 / 中国电力出版社 / 2003-11 / 70.00元

《算法I-IV(C实现):基础、数据结构、排序和搜索(第3版)(影印版)》实为一个卓越的读本,作为一个普通的程序员,如果在数学分析方面不算熟练,同时又对理论算法很感兴趣,那么这《算法I-IV(C实现):基础、数据结构、排序和搜索(第3版)(影印版)》确定不容错过,由此你将获益匪浅。Sedgewick擅长深入浅出的方式来解释概念,他在这方面确有天分。另外书中使用了一些实践程序,其篇幅仅有一页左右,而......一起来看看 《算法Ⅰ-Ⅳ》 这本书的介绍吧!

UNIX 时间戳转换
UNIX 时间戳转换

UNIX 时间戳转换

正则表达式在线测试
正则表达式在线测试

正则表达式在线测试

HEX CMYK 转换工具
HEX CMYK 转换工具

HEX CMYK 互转工具