strpos

mixed strpos ( string $haystack, mixed $needle [, int $offset = 0 ] )

假如offset钦赐了,查找会从offset的任务上马。offset不能够为负数。

归来needle第4回出今后haystack的职位。要是在haystack中找不到needle,则赶回FALSE。

needle,假若needle不是字符串,它会被转换到整型数值并赋值为该数值的ASCII字符。请看下边例子。

本文为咱们解析了
PHP中strpos、strstr和stripos、stristr函数,供大家仿照效法,具体内容如下

自己在github有对PHP源码更详尽的注释。感兴趣的能够扫描一下,给个star。PHP5.4源码注脚。能够经过commit记录翻看已加多的注释。

例子

$str = "hello";
$pos = strpos($str, 111);
// 111的ASCII值是o,因此$pos = 4

strpos

strpos

mixed strpos ( string $haystack, mixed $needle [, int $offset = 0 ] )

假若offset钦赐了,查找会从offset的职分上马。offset无法为负数。

回来needle第一遍面世在haystack的职分。假诺在haystack中找不到needle,则赶回FALSE。

needle,要是needle不是字符串,它会被转变来整型数值并赋值为该数值的ASCII字符。请看上面例子。

strpos大旨源码

if (Z_TYPE_P(needle) == IS_STRING) {
     if (!Z_STRLEN_P(needle)) {
          php_error_docref(NULL TSRMLS_CC, E_WARNING, "Empty needle");
          RETURN_FALSE;
     }

     // 调用php_memnstr函数查找needle
     found = php_memnstr(haystack + offset,
                            Z_STRVAL_P(needle),
                            Z_STRLEN_P(needle),
                            haystack + haystack_len);
     } else {
          // 如果不是字符串,转换成数字并赋值为该数字的ASCII字符。
          if (php_needle_char(needle, needle_char TSRMLS_CC) != SUCCESS) {
               RETURN_FALSE;
          }
          //设置结束字符
          needle_char[1] = 0;
          found = php_memnstr(haystack + offset,
                            needle_char,
                            1,
                            haystack + haystack_len);
    }
}

有少数要注意的是,假使needle不是字符串的话,会调用php_needle_char函数将needle转成整型数字并转移为其ASCII值。

mixed strpos ( string $haystack, mixed $needle [, int $offset = 0 ]
卡塔尔国如若offset钦定了,查找会从offset的职分上马。offset不能够为负数。

例子

$str = "hello";
$pos = strpos($str, 111);
// 111的ASCII值是o,因此$pos = 4

追寻函数

函数最后回到的是found,php_memnstr函数达成了查找的措施。那么再持续看看php_memnstr函数做了什么样:

#define php_memnstr zend_memnstr

php_memnstr是函数zend_memnstr的宏定义,查看zend_memnstr函数如下:

static inline char *
zend_memnstr(char *haystack, char *needle, int needle_len, char *end)
{
    char *p = haystack;
    char ne = needle[needle_len-1];
    if (needle_len == 1) {
        return (char *)memchr(p, *needle, (end-p));
    }

    if (needle_len > end-haystack) {
        return NULL;
    }

    // 第一个优化,只查找end - needle_len次
    end -= needle_len;

    while (p <= end) {
        // 第二个优化,先判断字符串的开头和结尾是否一样再判断整个字符串
        if ((p = (char *)memchr(p, *needle, (end-p+1))) && ne == p[needle_len-1]) {
            if (!memcmp(needle, p, needle_len-1)) {
                return p;
            }
        }

        if (p == NULL) {
            return NULL;
        }

        p++;
    }

    return NULL;
}

先是个优化,因为(char *)memchr(p, *needle, (end-p+1)是在end –
needle_len +
1(即haystack_len+1)中寻找,借使p为空,表达needle的第贰个字符在p中从未现身过。

归来needle第二遍面世在haystack的职分。如若在haystack中找不到needle,则赶回FALSE。

strpos核心源码

if (Z_TYPE_P(needle) == IS_STRING) {
     if (!Z_STRLEN_P(needle)) {
          php_error_docref(NULL TSRMLS_CC, E_WARNING, "Empty needle");
          RETURN_FALSE;
     }

     // 调用php_memnstr函数查找needle
     found = php_memnstr(haystack + offset,
                            Z_STRVAL_P(needle),
                            Z_STRLEN_P(needle),
                            haystack + haystack_len);
 } else {
      // 如果不是字符串,转换成数字并赋值为该数字的ASCII字符。
      if (php_needle_char(needle, needle_char TSRMLS_CC) != SUCCESS) {
          RETURN_FALSE;
      }
      //设置结束字符
      needle_char[1] = 0;
      found = php_memnstr(haystack + offset,
                        needle_char,
                        1,
                        haystack + haystack_len);
}

有有些要静心的是,要是needle不是字符串的话,会调用php_needle_char函数将needle转成整型数字并转移为其ASCII值。

strstr

string strstr ( string $haystack, mixed $needle [, bool $before_needle = false ] ) 返回needle在haystack中第一次出现的位置到结束的字符串。

这么些函数的区分朗朗上口写的。

若果needle在haystack中不设有,重返FALSE。

如果before_needle为true,则赶回haystack中needle在haystack第1回现身的职位从前的字符串。

needle,如若needle不是字符串,它会被调换来整型数值并赋值为该数值的ASCII字符。请看上面例子。

查找函数

函数最终回来的是found,php_memnstr函数完成了搜索的点子。那么再持续看看php_memnstr函数做了怎么:

#define php_memnstr zend_memnstr

php_memnstr是函数zend_memnstr的宏定义,查看zend_memnstr函数如下:

static inline char *
zend_memnstr(char *haystack, char *needle, int needle_len, char *end)
{
    char *p = haystack;
    char ne = needle[needle_len-1];
    if (needle_len == 1) {
        return (char *)memchr(p, *needle, (end-p));
    }

    if (needle_len > end-haystack) {
        return NULL;
    }

    // 第一个优化,只查找end - needle_len次
    end -= needle_len;

    while (p <= end) {
        // 第二个优化,先判断字符串的开头和结尾是否一样再判断整个字符串
        if ((p = (char *)memchr(p, *needle, (end-p+1))) && ne == p[needle_len-1]) {
            if (!memcmp(needle, p, needle_len-1)) {
                return p;
            }
        }

        if (p == NULL) {
            return NULL;
        }

        p++;
    }

    return NULL;
}

end原本指向\0字符,然后end –
needle_len,纵然尾部是needle,就绝不继续移动,因而只比较end –
needle_len次。

strstr宗旨源码

if (found) {
        // 计算出found的位置
        found_offset = found - haystack;
        if (part) {
            RETURN_STRINGL(haystack, found_offset, 1);
        } else {
            RETURN_STRINGL(found, haystack_len - found_offset, 1);
        }
}

strstr函数的前半片段跟strpos相通,不一样在于strstr函数在找到地点后,要求重临haystack部分的字符串。part变量就是调用strstr函数时传递的before_needle变量。

$str = "hello";$pos = strpos;// 111的ASCII值是o,因此$pos = 4strpos核心源码if  == IS_STRING) { if  { php_error_docref(NULL TSRMLS_CC, E_WARNING, "Empty needle"); RETURN_FALSE; } // 调用php_memnstr函数查找needle found = php_memnstr(haystack + offset, Z_STRVAL_P, Z_STRLEN_P, haystack + haystack_len); } else { // 如果不是字符串,转换成数字并赋值为该数字的ASCII字符。 if (php_needle_char(needle, needle_char TSRMLS_CC) != SUCCESS) { RETURN_FALSE; } //设置结束字符 needle_char[1] = 0; found = php_memnstr(haystack + offset, needle_char, 1, haystack + haystack_len); }}

strstr

string strstr ( string $haystack, mixed $needle [, bool $before_needle = false ] )

回到needle在haystack中率先次面世的地点到截至的字符串。

这么些函数的分化学轻工重缓急写的。

万意气风发needle在haystack中荒诞不经,重返FALSE。

如果before_needle为true,则赶回haystack中needle在haystack第二回现身的职位早先的字符串。

stripos

mixed stripos ( string $haystack, string $needle [, int $offset = 0 ] ) 不区分大小写的strpos。实现方式跟下面的类似,主要是使用一份拷贝然后将需要比较的字符串转换成小写字符后进行再进行查找。

有几许要注意的是,要是needle不是字符串的话,会调用php_needle_char函数将needle转成整型数字并转移为其ASCII值。

strstr大旨源码

if (found) {
        // 计算出found的位置
        found_offset = found - haystack;
        if (part) {
            RETURN_STRINGL(haystack, found_offset, 1);
        } else {
            RETURN_STRINGL(found, haystack_len - found_offset, 1);
        }
    }

strstr函数的前半片段跟strpos肖似,差异在于strstr函数在找到地点后,须要再次来到haystack部分的字符串。part变量就是调用strstr函数时传递的before_needle变量。

stristr

string stristr ( string $haystack, mixed $needle [, bool $before_needle = false ] ) 不区分大小写的strstr。

追寻函数

stripos

mixed stripos ( string $haystack, string $needle [, int $offset = 0 ] )

不区分抑扬顿挫写的strpos。完毕格局跟下边包车型客车切近,主若是应用豆蔻梢头份拷贝然后将索要比较的字符串调换来小写字符后进行再张开查找。

着力源码

// 拷贝一份haystack
haystack_dup = estrndup(haystack, haystack_len);

if (Z_TYPE_P(needle) == IS_STRING) {
    char *orig_needle;
    if (!Z_STRLEN_P(needle)) {
        php_error_docref(NULL TSRMLS_CC, E_WARNING, "Empty needle");
        efree(haystack_dup);
        RETURN_FALSE;
    }
    orig_needle = estrndup(Z_STRVAL_P(needle), Z_STRLEN_P(needle));
    // 调用php_stristr函数找出orig_needle的值。
    found = php_stristr(haystack_dup, orig_needle,    haystack_len, Z_STRLEN_P(needle));
    efree(orig_needle);
} else {
    if (php_needle_char(needle, needle_char TSRMLS_CC) != SUCCESS) {
        efree(haystack_dup);
        RETURN_FALSE;
    }
    needle_char[1] = 0;

    found = php_stristr(haystack_dup, needle_char,    haystack_len, 1);
}

if (found) {
    found_offset = found - haystack_dup;
    if (part) {
        RETVAL_STRINGL(haystack, found_offset, 1);
    } else {
        RETVAL_STRINGL(haystack + found_offset, haystack_len - found_offset, 1);
    }
} else {
    RETVAL_FALSE;
}

// 释放变量
efree(haystack_dup);

能够精通,found是从php_stristr中赢得的,继续查看php_stristr函数:

PHPAPI char *php_stristr(char *s, char *t, size_t s_len, size_t t_len)
{
    php_strtolower(s, s_len);
    php_strtolower(t, t_len);
    return php_memnstr(s, t, t_len, s + s_len);
} 这个函数的功能就是将字符串都转成小写之后调用php_mennstr函数来查找needle在haystack第一次出现的位置。

函数最终回来的是found,php_memnstr函数达成了追寻的方法。那么再持续看看php_memnstr函数做了哪些:

stristr

string stristr ( string $haystack, mixed $needle [, bool $before_needle = false ] )

金沙糖果派对2015cc,不区分抑扬顿挫写的strstr。

总结

因为strpos/stripos再次回到的是岗位,地方从0领头酌量,所以判别查找未果都用=== FALSE更适合。

读书PHP的源码收获挺多,一方面能够领略有些函数的实际贯彻原理是怎么的,其他方面能够学习到部分编制程序优化方案。

到此本文结束,要是万幸似何疑难如故建议,能够多多调换,原创作品,文笔有限,一无所知,文中若有不正之处,万望告知。

#define php_memnstr
zend_memnstrphp_memnstr是函数zend_memnstr的宏定义,查看zend_memnstr函数如下:

基本源码

// 拷贝一份haystack
     haystack_dup = estrndup(haystack, haystack_len);

    if (Z_TYPE_P(needle) == IS_STRING) {
        char *orig_needle;
        if (!Z_STRLEN_P(needle)) {
            php_error_docref(NULL TSRMLS_CC, E_WARNING, "Empty needle");
            efree(haystack_dup);
            RETURN_FALSE;
        }
        orig_needle = estrndup(Z_STRVAL_P(needle), Z_STRLEN_P(needle));
        // 调用php_stristr函数找出orig_needle的值。
        found = php_stristr(haystack_dup, orig_needle,    haystack_len, Z_STRLEN_P(needle));
        efree(orig_needle);
    } else {
        if (php_needle_char(needle, needle_char TSRMLS_CC) != SUCCESS) {
            efree(haystack_dup);
            RETURN_FALSE;
        }
        needle_char[1] = 0;

        found = php_stristr(haystack_dup, needle_char,    haystack_len, 1);
    }

    if (found) {
        found_offset = found - haystack_dup;
        if (part) {
            RETVAL_STRINGL(haystack, found_offset, 1);
        } else {
            RETVAL_STRINGL(haystack + found_offset, haystack_len - found_offset, 1);
        }
    } else {
        RETVAL_FALSE;
    }

    // 释放变量
    efree(haystack_dup);

能够明白,found是从php_stristr中拿到的,继续翻看php_stristr函数:

PHPAPI char *php_stristr(char *s, char *t, size_t s_len, size_t t_len)
{
    php_strtolower(s, s_len);
    php_strtolower(t, t_len);
    return php_memnstr(s, t, t_len, s + s_len);
}

其大器晚成函数的意义正是将字符串都转成小写之后调用php_mennstr函数来搜寻needle在haystack第一遍现身的岗位。

static inline char *zend_memnstr(char *haystack, char *needle, int needle_len, char *end){ char *p = haystack; char ne = needle[needle_len-1]; if  { return memchr; } if (needle_len > end-haystack) { return NULL; } // 第一个优化,只查找end - needle_len次 end -= needle_len; while  { // 第二个优化,先判断字符串的开头和结尾是否一样再判断整个字符串 if memchr)) && ne == p[needle_len-1]) { if (!memcmp(needle, p, needle_len-1)) { return p; } } if  { return NULL; } p++; } return NULL;}

总结

因为strpos/stripos重临的是岗位,地点从0最早揣测,所以剖断查找未果都用  === FALSE 更相符。

翻阅PHP的源码收获挺多,一方面能够知晓有些函数的求实实现原理是何等的,其他方面能够学习到有的编程优化方案。

金沙糖果派对网站app, 

到此本文甘休,要是还恐怕有何样难题依旧提议,能够多多调换,原创小说,文笔有限,学浅才疏,文中若有不正之处,万望告知。

设若本文对您有扶助,望点下推荐,谢谢^_^

 

最终再安利一下,作者在github有对PHP源码更详实的笺注。感兴趣的能够扫描一下,给个star。PHP5.4源码表明。能够通过commit记录翻开已加多的笺注。

更加多源码小说,应接采访个人主页继续查看:hoohack

admin

相关文章

发表评论

电子邮件地址不会被公开。 必填项已用*标注