PHP 中文分词包 phpSplit

码农软件 · 软件分类 · 中文分词库 · 2019-08-28 18:59:18

软件介绍

phpSplit 是一个基于php开发的中文分词库。

居于Unicode编码词典的php分词器

  • 只适用于php5,必要函数 iconv

  • 本程序是使用RMM逆向匹配算法进行分词的,词库需要特别编译,本类里提供了 MakeDict() 方法

  • 简单操作流程: SetSource -> StartAnalysis -> GetResult

  • 对主词典使用特殊格式进行编码, 不需要载入词典到内存操作

使用

  • 首先 确保使用php为5.3+

  • 安装composer

composer install
require __DIR__ .'/vendor/autoload.php';
$split = new Split();
var_dump( $split->simple("您好 phpSplit"));
$this->assertTrue(True);
array(3) {
  [0] =>
  string(0) ""
  [1] =>
  string(6) "您好"
  [2] =>
  string(8) "phpSplit"
}

分词结果后缀说明

名词n、时间词t、处所词s、方位词f、数词m、量词q、区别词b、代词r、动词v、形容词a、状态词z、副词d、介词p、连词c、助词u、语气词y、叹词e、拟声词o、成语i、习用语l、简称j、前接成分h、后接成分k、语素g、非语素字x、标点符号w

同事增加了以下3类标记 *专有名词的分类标记,即人名nr,地名ns,团体机关单位名称nt,其他专有名词nz; *语素的子类标记,即名语素Ng,动语素Vg,形容语素Ag,时语素Tg,副语素Dg等; *动词和形容词的子类标记,即名动词vn(具有名词特性的动词),名形词an(具有名词特性的形容词),副动词vd(具有副词特性的动词),副形词ad(具有副词特性的形容词)

合计约40个左右。

欢迎大家完善

本文地址:https://codercto.com/soft/d/13376.html

创业的艺术2.0

创业的艺术2.0

〔美〕盖伊·川崎 / 刘悦、段歆玥 / 译言·东西文库/电子工业出版社 / 2016-9 / 68

“创业者导师”——盖伊•川崎的《创业的艺术2.0》被阿丽亚娜•赫芬顿评为“终极的创业手册”。无论您是企业家、小企业主、企业开拓者还是非盈利组织的领导人,都可以让你的产品、服务或理念获得成功。 盖伊选取了不用角度,探索前十年商界的巨大变化,并寻求解决之道。曾经所向披靡的市场巨头深陷水深火热之中,社交媒体也取代了人际关系和广告,成为营销推广的主要渠道。众筹也成为广大投资者的可行之举。“云”更是每......一起来看看 《创业的艺术2.0》 这本书的介绍吧!

在线进制转换器
在线进制转换器

各进制数互转换器

UNIX 时间戳转换
UNIX 时间戳转换

UNIX 时间戳转换

HEX HSV 转换工具
HEX HSV 转换工具

HEX HSV 互换工具