similar_text 有哪些意想不到的惊喜（PHP）

栏目: PHP · 发布时间: 7年前

PHP字符串处理函数中有一个similar_text用于计算两个字符串的相似程度。今天来看看similar_text如何实现的。

similar_text — 计算两个字符串的相似度，返回两个字符串中匹配字符的数目

两个字符串的相似程度。注意该实现没有使用 Oliver 虚拟码中的堆栈，但是却进行了递归调用，这个做法可能会导致整个过程变慢或变快。也请注意，该算法的复杂度是 O(N**3)，N 是最长字符串的长度。

similar_text 有哪些意想不到的惊喜（PHP）

上面的文档说明还是很绕。

源码中similar_text函数在内部调用了php_similar_char进行处理。ac是参数的个数。函数返回的是两个字符串中匹配字符的数目。如果想要获取相似的百分比，则需要传递一个引用参数获取。

在php_similar_char中有调用了php_similar_str，在看php_similar_char前，先看看php_similar_str的功能。

similar_text 有哪些意想不到的惊喜（PHP）

php_similar_str内部跑了三个嵌套的循环，这就难怪文档中描述的，时间复杂度是O(N**3)。在最里面的循环中，检查两个字符串连续一致的个数。最里层循环结束之后，判断是否大于已经获取到的最大相似数目。并记录最大相似情况下两个字符串相似处开始的位置。

在php_similar_char，通过php_similar_str拿到最大相似数目，以及两个字符串起始位置。在底下，则把text1,text2分为最大相似字符串前的字符，最大相似字符串，最大相似字符串后面字符串三个部分，分别在递归调用计算两个字符串中相似字符串前后两个部分对应的相似长度。直到字符串长度为0.

similar_text 有哪些意想不到的惊喜（PHP）