内容简介:ThinkPHP之中文分词查询
这里用到的分词是 第四版的 PSCWS,虽速度然比较慢,但是简单啊,不多废话,下面开始步骤。
首先在官网上下载对应版本
这里需要下载XDB词典和pscws4的sdk,解压这两个文件,将dict.utf8.xdb词典和sdk文件夹下的rules.utf8.ini放在PUblic下的dict文件夹里
将sdk下的这两个文件移动到Vendor下的Pscws里
并修改名称为PSCWS4.PHP和xdb_r.PHP,在PSCWS4.PHP的120行左右把构造函数修改为如下形式
三、添加分词私有方法
四、在需要分词的地方调用该方法就能够进行分词,如下
$key_array = $this->get_tags($content);
接下来就是逻辑实现了,
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网
猜你喜欢:- 基于海量公司分词ES中文分词插件
- 北大开源全新中文分词工具包:准确率远超THULAC、结巴分词
- 复旦大学提出中文分词新方法,Transformer连有歧义的分词也能学
- 分词,难在哪里?
- 隐马尔可夫分词
- 【NLP】分词算法综述
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
CSS 压缩/解压工具
在线压缩/解压 CSS 代码
HTML 编码/解码
HTML 编码/解码