内容简介:ChineseUtil —— PHP 中文工具类,支持汉字转拼音、拼音分词、简繁互转。 PHP Chinese Tool class, support Chinese pinyin, pinyin participle, simplified and traditional conversion 目前本类库拥有的三个功...
ChineseUtil —— PHP 中文 工具 类,支持汉字转拼音、拼音分词、简繁互转。
PHP Chinese Tool class, support Chinese pinyin, pinyin participle, simplified and traditional conversion
目前本类库拥有的三个功能,都是在实际开发过程中整理出来的。这次使用的数据不同于以前我开源过汉字转拼音和简繁互转,数据都是从字典网站采集下来的,比以前的数据更加准确。
由于中文的博大精深,字有多音字,简体字和繁体字也有多种对应。并且本类库返回的所有结果,均为包含所有组合的数组。
本类库字典数据总共收录 73925 个汉字,包括:3955 个简体字,1761 个繁体字,68209 个其它汉字。
使用说明
代码及demo效果,请查看码云仓库的说明和demo代码。
Composer 直接安装
composer require yurunsoft/chinese-util
Composer 项目配置引入
"require": { "yurunsoft/chinese-util" : "~1.0" }
v1.0.2-v1.0.3 更新内容:
设置了3种不同的数据加载模式,以适应不同用户的需求。
性能模式 (Memory)
使用 SQLite 作为数据载体,一次性加载所有数据到变量,内存占用高(80 MB),性能最佳。
适合用于运行 Cli 任务。
需要 PDO 和 PDO_SQLITE 扩展支持。
通用模式 (SQLite)
使用 SQLite 作为数据载体,每次查询都通过 SQL 查询,内存占用低(600+ KB),性能中等。
适合用于大部分场景。
需要 PDO 和 PDO_SQLITE 扩展支持。
兼容模式 (JSON)
使用精简过的 JSON 数据作为数据载体,一次性加载所有数据到变量,内存占用中(28 MB),性能差。
内存占用量以实际为准,根据版本、扩展等环境的不同,占用的内存容量不一样,上述值为我电脑上的情况,仅供参考。
适合无法使用 PDO 的场景。
由于精简了数据,一些拼音结果需要经过代码计算处理才可以得出,所以性能较差。
默认情况下,优先使用通用模式,如果环境不支持 PDO 将采用兼容模式。
你可以在未执行任何初始化或者转换处理之前,设置使用何种模式运行。
类库第一个版本发布开始,群里朋友就展开了激烈的讨论,最大的问题就在于内存占用以及性能问题上。经过我不断尝试几种方案,最终决定设置三种模式,来适应不同用户之间的需求。
我已经尝试过 Redis,速度比 SQLite 慢 3 倍,没有必要加入支持。所以目前来看,SQLite 模式性价比最高!
【声明】文章转载自:开源中国社区 [http://www.oschina.net]
以上所述就是小编给大家介绍的《PHP 中文工具类 ChineseUtil v1.0.3 三种加载模式任选》,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对 码农网 的支持!
猜你喜欢:- 中文分词工具评估
- PHP 中文工具类 ChineseUtil v1.0.1 大幅减少内存占用
- 中文命名实体识别工具(NER)哪家强?
- Synonyms:中文近义词工具包
- Python中文分词工具大合集:安装、使用和测试
- 八款中文词性标注工具使用及在线测试
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。