文章详情

短信预约-IT技能 免费直播动态提醒

请输入下面的图形验证码

提交验证

短信预约提醒成功

Java Web开发中文乱码有哪些

2023-06-17 04:04

关注

这篇文章主要讲解了“Java Web开发中文乱码有哪些”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“Java Web开发中文乱码有哪些”吧!

一、有必要了解一些基本的编码知识

jsp的三次编码

***阶段:JVM将.jsp文件编译为.java文件。JVM先读取pageEncoding的值,根据该值去读取.jsp文件,然后由指定的编码方案生成UTF-8的.java文件。

第二阶段:JVM将.java文件转换为.class文件,从UTF-8至UTF-8。这个过程就与任何编码的设置都没有关系了,经过这个阶段后.java文件就转换成了统一的UTF-8编码的.class文件了。

第三阶段:服务器将处理的结果返回给浏览器,这个阶段则依靠contentType的charset,如果设置了charset则浏览器就会使用指定的编码格式进行解码,否则采用默认的ISO-8859-1编码格式进行解码处理。

jsp中的编码设置

pageEncoding:<%@ page pageEncoding=”UTF-8”%>

上文中***阶段,使用该值去读取jsp文件,为避免中文乱码,跟jsp文件编码一致;对服务器响应进行重新编码,即jsp的输出流在浏览器中显示的编码(不是主要作用)。

contentType:  <%@ page contentType=”text/html;charset=UTF-8”%>

使用该值对服务器响应进行重新编码,即jsp的输出流在浏览器中显示的编码;对表单get和post请求数据编码;上文中***阶段,使用该值去读取jsp文件(不是主要作用)。

< META http-equiv=”Content-Type” content=”text/html;charset=UTF-8”>

网页的编码信息 ,说明页面制作所使用的编码。

request.setCharacterEncoding()

可用在servlet和jsp页面中,作用是设置对客户端请求进行重新编码的编码,即post方式提交的数据进行编码。

response.setCharacterEncoding()

与<%@ page contentType=”text/html;charset=UTF-8”%>一样。

response.setContentType()

与<%@ page contentType=”text/html;charset=UTF-8”%>一样。

response.setHeader(“Content-Type”,”text/html;charset=UTF-8”)

与< META http-equiv=”Content-Type” content=”text/html;  charset=UTF-8”>一样。

注意:上文1,2,3中有部分功能是一样的,是有优先级的,在读取jsp文件时,1>2;在对服务器响应进行编码的时候,2>1>3,一般情况下,1,2都写。

http请求默认以”ISO-8859-1”的编码来传送URL的。

二、中文乱码的几种情况及最简单的解决方案:

pageEncoding设置错误

pageEncoding设置为jsp文件的编码类型。

查询字符串包含中文

中文的编码方式取决于浏览器,chrome为UTF-8,IE为GB2312,这是由于浏览器并没有遵循URI编码规范。有两种解决方法:

开发过程中,将查询字符串提前编码,

如: http://www.baidu.com/demo?demo=%D6%D0%B9%FA (UTF-8编码)

在Servlet的doGet()方法中添加

String value = new  String(request.getParameter("parameterName").getBytes("ISO-8859-1"),"浏览器的编码方式");

表单中的get和post数据包含中文

中文的编码方式取决于上文的contentType中的charset,有两种解决办法:

在Servlet的doPost()方法中添加request.setCharacterEncoding(“charset的值”);(仅对post有用)

在Servlet的doPost()方法中添加

String value = new  String(request.getParameter("parameterName").getBytes("ISO-8859-1"),"charset的值");

三、原理

我们通过上面的方法可以解决乱码问题,下面讲讲原理:

客户端发到服务器的数据需要在客户端进行编码,类似于:String parameterName =  "中国".getBytes("UTF-8")然后将编码后的数据发到服务器。

客户端接受数据,request.getParameter(“”)的作用就是对接收到的数据进行解码,默认使用ISO-8859-1进行解码,可以使用request.setCharacterEncoding(“”)进行设置,但仅对post有用。假如我们使用默认的ISO-8859-1,肯定乱码,因为编码跟解码不一致,那此时怎么办呢,引出了上文中的两种解决方案:使用request.setCharacterEncoding(“”)改变request.getParameter(“”)的解码方式或者new  String(request.getParameter("parameterName").getBytes("ISO-8859-1"),"charset的值")将request.getParameter(“”)解码的数据重新编码再解码。

四、其他

在jsp中的页面使用response.setContentType()等设置字符集会破坏jsp容器自身的页面编码,会引起html中字符乱码,脚本不会乱,所以不建议设置。在开发中多采用page指令设置字符集。

<!DOCTYPE html PUBLIC> <html> <head>     <meta http-equiv="Content-Type" content="text/html; charset=UTF-8">     <title>Insert title here</title> </head> <body>     <%         response.setContentType("text/html;charset=UTF-8");         String str = new String("你好".getBytes("iso-8859-1"), "utf-8");     %>     <p>你好</p>     <br><%=str%> </body> </html>

感谢各位的阅读,以上就是“Java Web开发中文乱码有哪些”的内容了,经过本文的学习后,相信大家对Java Web开发中文乱码有哪些这一问题有了更深刻的体会,具体使用情况还需要大家实践验证。这里是编程网,小编将为大家推送更多相关知识点的文章,欢迎关注!

阅读原文内容投诉

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

软考中级精品资料免费领

  • 历年真题答案解析
  • 备考技巧名师总结
  • 高频考点精准押题
  • 2024年上半年信息系统项目管理师第二批次真题及答案解析(完整版)

    难度     813人已做
    查看
  • 【考后总结】2024年5月26日信息系统项目管理师第2批次考情分析

    难度     354人已做
    查看
  • 【考后总结】2024年5月25日信息系统项目管理师第1批次考情分析

    难度     318人已做
    查看
  • 2024年上半年软考高项第一、二批次真题考点汇总(完整版)

    难度     435人已做
    查看
  • 2024年上半年系统架构设计师考试综合知识真题

    难度     224人已做
    查看

相关文章

发现更多好内容

猜你喜欢

AI推送时光机
位置:首页-资讯-后端开发
咦!没有更多了?去看看其它编程学习网 内容吧
首页课程
资料下载
问答资讯