- 授权协议: 未知
- 开发语言: C/C++
- 操作系统: 跨平台
- 软件首页: http://thuocl.thunlp.org/
- 软件文档: http://thuocl.thunlp.org/#%E9%A1%B9%E7%9B%AE%E4%BB%8B%E7%BB%8D
软件介绍
THUOCL(THU Open Chinese Lexicon)是由清华大学自然语言处理与社会人文计算实验室整理推出的一套高质量的中文词库,词表来自主流网站的社会标签、搜索热词、输入法词库等。
THUOCL 具有以下特点:
包含词频统计信息 DF 值(Document Frequency),方便用户个性化选择使用。
词库经过多轮人工筛选,保证词库收录的准确性。
开放更新,将不断更新现有词表,并推出更多类别词表。
该词库可以用于中文自动分词,提升中文分词效果。可搭配 THULAC 工具包使用,提升特定领域中文分词的效果。
Python高性能编程
【美】 戈雷利克 (Micha Gorelick)、【美】 欧日沃尔德(Ian Ozsvald) / 人民邮电出版社 / 2017-7-1 / 79
本书共有12章,围绕如何进行代码优化和加快实际应用的运行速度进行详细讲解。本书主要包含以下主题:计算机内部结构的背景知识、列表和元组、字典和集合、迭代器和生成器、矩阵和矢量计算、并发、集群和工作队列等。最后,通过一系列真实案例展现了在应用场景中需要注意的问题。 本书适合初级和中级Python程序员、有一定Python语言基础想要得到进阶和提高的读者阅读。一起来看看 《Python高性能编程》 这本书的介绍吧!
