php如何利用正则只匹配汉字-编程学习网

这篇文章主要介绍“php如何利用正则只匹配汉字”的相关知识，小编通过实际案例向大家展示操作过程，操作方法简单快捷，实用性强，希望这篇“php如何利用正则只匹配汉字”文章能帮助大家解决问题。

在php中，可以利用正则表达式“/[\x{4e00}-\x{9fff}]+/u”和preg_match_all()函数来只匹配汉字，语法“preg_match_all("/[\x{4e00}-\x{9fff}”。preg_match_all()函数会搜索字符串中所有可以和正则表达式匹配的结果，配合“/[\x{4e00}-\x{9fff}]+/u”可以过滤字符串，只获取汉字字符。

在php中，可以利用正则表达式“/[\x{4e00}-\x{9fff}]+/u”和preg_match_all()函数来只匹配汉字。

preg_match_all()函数会搜索字符串中所有可以和正则表达式匹配的结果

preg_match_all(pattern,subject,matches,flags,offset)

参数说明如下：

pattern：要搜索的模式，也就是定义好的正则表达式；
subject：要搜索的字符串；
matches：可选参数（多维数组），用来存放所有匹配的结果, 数组排序通过 $flags 指定；
flags：可选参数，可以结合下面几个标记使用（注意不能同时使用 PREG_PATTERN_ORDER 和 PREG_SET_ORDER）：

PREG_PATTERN_ORDER：结果排序为 $matches[0] 保存完整模式的所有匹配，$matches[1] 保存第一个子组的所有匹配，以此类推。
PREG_SET_ORDER：结果排序为 $matches[0] 包含第一次匹配得到的所有匹配（包含子组）， $matches[1] 是包含第二次匹配到的所有匹配(包含子组)的数组，以此类推。
PREG_OFFSET_CAPTURE：如果这个标记被传递，每个发现的匹配返回时会增加它相对目标字符串的偏移量。注意这会改变 $matches 中的每一个匹配结果字符串元素，使其成为一个第 0 个元素为匹配结果字符串，第 1 个元素为匹配结果字符串在 subject 中的偏移量。

offset：可选参数，$offset 用于从目标字符串中指定位置开始搜索（单位是字节）。

preg_match_all() 函数可以返回 pattern 的匹配次数（可能是 0），如果发生错误则返回 FALSE。

preg_match_all()函数配合正则表达式“/[\x{4e00}-\x{9fff}]+/u”可以过滤字符串，只获取汉字字符。

注：preg_match_all()函数会将匹配的函数字符一个个存入数组中（该数组由第三个参数指定）。

<?phpheader("Content-type:text/html;charset=utf-8");$str = "欢迎4546来到php这里。zblog,我的?#$%^天呀&())*(&^";echo $str;preg_match_all("/[\x{4e00}-\x{9fff}]+/u","$str",$arr);var_dump($arr);?>

php如何利用正则只匹配汉字