在PHP项目中会经常遇到中文乱码,这是一个比较恼人的问题。不过,当需要将内容输出到网页上的时候,我们遵照以下两个原则一般情况下是不会出现中文乱码的。
第一就是在html头部添加
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8" />
第二点就是保证文件的编码和meta设置的编码一致。也就是说,如果我们第一条设置的charset为UTF-8,那我们的文件编码也要设置成UTF-8。二者保持一致即可。
当然上面是针对于网页的情况,但是现在随着Ajax在web应用中占得比重越来越大,json格式的数据在数据传输中应用也越来越广。因此在PHP中使用json_encode对数据进行json转换的时候也会遇到中文乱码或者是对中文进行编码的问题。
举个例子来说
$data = array('id'=>1,'name'=>'迹忆博客','parId'=>0);
echo json_encode($data);
上面代码的输出结果为
{"id":1,"name":"\u8ff9\u5fc6\u535a\u5ba2","parId":0}
我们看,函数对中文’迹忆博客’进行了16进制转码。这不能说是错误,因为16进制表示的就是正确的中文,我们拿到这个结果以后,在前端通过js同样也可以得到我们想要的结果。但是,这样使用起来还是比较麻烦的。当然情况也会根据PHP的版本的不同而有所变化。
对于PHP的一些版本其结果会是如下的情况
{"id":1,"name":null,"parId":0}
中文无法被正确的解析出来。
没有办法,中文问题就是这么麻烦。谁让计算机不是中国人发明的呢。当然这些是有解决方法的,下面我们就来了解两个解决的办法。
一、通过json_encode第二个参数来解决
针对上面问题,在PHP>=5.4.0 的版本已经可以直接通过json_encode函数本身来解决。那就是第二个参数加上JSON_UNESCAPED_UNICODE。
$data = array('id'=>1,'name'=>'迹忆博客','parId'=>0);
echo json_encode($data, JSON_UNESCAPED_UNICODE);
现在就能得到正确的结果
{"id":1,"name":"迹忆博客","parId":0}
结果是能正确的得到了。但是,对于PHP的版本总不能让大家都换成5.4及以上的版本吧。那对于5.4以下的版本应该怎么处理呢?
二、通过url编码解决中文问题
我们知道,在PHP中有两个函数 urlencode 和 urldecode。我们可以通过urlencode函数将中文进行url编码,这样在字符串中就不会再有中文,也就不会遇到中文编码的问题。
$str = “迹忆博客”;
echo urlencode($str);
对迹忆博客进行url编码,其结果如下
%E8%BF%B9%E5%BF%86%E5%8D%9A%E5%AE%A2
所以说,我们将上面数组的name的值用urlencode编码以后,再进行json格式转化,那中文编码的问题就不存在了。
$data = array('id'=>1,'name'=>urlencode('迹忆博客'),'parId'=>0);
$res = json_encode($data);
echo $res;
现在我们得到的结果就是name编码以后的json字符串
{"id":1,"name":"%E8%BF%B9%E5%BF%86%E5%8D%9A%E5%AE%A2","parId":0}
最后再通过urldecode对url编码的字符串进行解码。当然urldecode解码不用我们再去找对应的那一段编码的字符串进行解码。我们可以直接对整个字符串进行url解码。urldecode会自动去检测相应的url编码的字符串对其进行解码。
$data = array('id'=>1,'name'=>urlencode('迹忆博客'),'parId'=>0);
$res =urldecode(json_encode($data));
echo $res;
这样其结果就是正确的了
{"id":1,"name":"迹忆博客","parId":0}
这种方法是没有版本限制的,但是效率的话肯定会相对于第一种方法要慢一些。
针对第二个方法——通过url编码解决中文问题——的封装函数
现在问题来了,对于第二个方法,我们总不能在数组的每一个中文前面都加上urlencode函数吧!这也是不现实的。那我们可以通过自己封装json_encode函数来处理这样的问题。
代码如下
function onmpw_json_encode($data){
if(is_object($data)) return false;
if(is_array($data)){
$data = deal_array($data);
}
return urldecode(json_encode($data));
}
function deal_array($data){
if (is_array($data)) {
foreach ($data as $key => $val) {
if (is_array($val)) {
//如果是多维数组,通过递归来处理多维数组
$data[$key] = deal_array($val);
} else {
//对值进行url编码
$data[$key] = urlencode($val);
}
}
} elseif (is_string($data)) {
$data = urlencode($data);
}
return $data;
}
下面我们来看一个使用示例
$data = array(
array('id'=>1,'name'=>'迹忆博客','parId'=>0),
array('id'=>2,'name'=>'学无止境','parId'=>1),
array('id'=>3,'name'=>'趣味杂谈','parId'=>1),
array('id'=>4,'name'=>'编程语言','parId'=>2),
array('id'=>5,'name'=>'网络','parId'=>2),
array('id'=>6,'name'=>'算法','parId'=>2),
array('id'=>7,'name'=>'操作系统','parId'=>2),
array('id'=>8,'name'=>'数据库','parId'=>2),
array('id'=>9,'name'=>'WEB前端','parId'=>2),
array('id'=>10,'name'=>'读书','parId'=>3),
array('id'=>11,'name'=>'观点与感想','parId'=>3)
);
$data = onmpw_json_encode($data);
echo $data;
现在我们得到了我们想要的结果
[{"id":"1","name":"迹忆博客","parId":"0"},{"id":"2","name":"学无止境","parId":"1"},{"id":"3","name":"趣味杂谈","parId":"1"},{"id":"4","name":"编程语言","parId":"2"},{"id":"5","name":"网络","parId":"2"},{"id":"6","name":"算法","parId":"2"},{"id":"7","name":"操作系统","parId":"2"},{"id":"8","name":"数据库","parId":"2"},{"id":"9","name":"WEB前端","parId":"2"}, {"id":"10","name":"读书","parId":"3"},{"id":"11","name":"观点与感想","parId":"3"}]
总结
中文编码的问题很常见,我们大家要在实际情况中多总结。在以后的开发中再遇到类似的问题就可以很容易的解决了。
对于上面自定义的json_encode函数,我会把它封装到一个公共类中。源代码都在github上,我会持续将一些常用函数封装到这个公共类中,网址:https://github.com/onmpw/PHPLibrary/blob/master/Code/Common/Common.php。希望这些对大家有所帮助。