java处理转义字符↑ → ↓
情景:在项目中,遇到了特殊字符字符一保存到数据库,取出来时就变样了。
解决方法:引入commons.lang3包,进行转换。
<dependency>
<groupId>org.apache.commons</groupId>
<artifactId>commons-lang3</artifactId>
<version>2.4</version>
</dependency>
在此贴一下我这边需要转换案例:
1、保存之前:曳引驱动主机(曳引轮、减速箱、联轴器、制动器的活销→抱闸间隙→弹簧力矩等)
2、保存之后:曳引驱动主机(曳引轮、减速箱、联轴器、制动器的活销→抱闸间隙→弹簧力矩等)
现在使用:封装方法StringEscapeUtils.unescapeHtml4("转换字符串"),适用于↑ → ↓ ↔ 等,打印日志如下图:
其实StringEscapeUtils常用的方法还有:
StringEscapeUtils.unescapeXml();
适用于:< > + - 等
其他类型的转义StringEscapeUtils公共类也提供了,可以根据自己的需要使用。
java转义符的一些用法
那么这里在列上一些转义字符
\\ 反斜杠
\t 间隔 ('\u0009')
\n 换行 ('\u000A')
\r 回车 ('\u000D')
\d 数字 等价于 [0-9]
\D 非数字 等价于 [^0-9]
\s 空白符号 [\t\n\x0B\f\r]
\S 非空白符号 [^\t\n\x0B\f\r]
\w 单独字符 [a-zA-Z_0-9]
\W 非单独字符 [^a-zA-Z_0-9]
\f 换页符
\e Escape
\b 一个单词的边界
\B 一个非单词的边界
\G 前一个匹配的结束
---------------------------------------------
我在应用中用到一些给大家总结一下仅供大家参考
1、如果用“.”作为分隔的话必须是如下写法String.split("\\."),这样才能正确的分隔开不能用String.split(".");
2、如果用“|”作为分隔的话必须是如下写法String.split("\\|"),这样才能正确的分隔开不能用String.split("|");
“.”和“|”都是转义字符必须得加"\\";
3、如果在一个字符串中有多个分隔符可以用“|”作为连字符 比如“acount=? and uu =? or n=?”,把三个都分隔出来可以用String.split("and|or");使用String.split方法分隔字符串时分隔符如果用到一些特殊字符可能会得不到我们预期的结果。我们看jdk doc中说明
public String[] split(String regex)
Splits this string around matches of the given regular expression.
参数regex是一个 regular-expression的匹配模式而不是一个简单的String
他对一些特殊的字符可能会出现你预想不到的结果
比如测试下面的代码用竖线 | 分隔字符串
你将得不到预期的结果
String[] aa = "aaa|bbb|ccc".split("|");
//String[] aa = "aaa|bbb|ccc".split("\\|");
这样才能得到正确的结果
for (int i = 0 ; i <aa.length ; i++ ) {
System.out.println("--"+aa[i]);
}
用竖 * 分隔字符串运行将抛出Java.util.regex.PatternSyntaxException异常用加号 + 也是如此。
String[] aa = "aaa*bbb*ccc".split("*");
//String[] aa = "aaa|bbb|ccc".split("\\*");
这样才能得到正确的结果
for (int i = 0 ; i <aa.length ; i++ ) {
System.out.println("--"+aa[i]);
}
显然+ * 不是有效的模式匹配规则表达式用"\\*" "\\+"转义后即可得到正确的结果。
"|" 分隔串时虽然能够执行但是却不是预期的目的"\\|"转义后即可得到正确的结果。
还有如果想在串中使用"\"字符则也需要转义.首先要表达"aaaa\bbbb"这个串就应该用"aaaa\\bbbb",如果要分隔就应该这样才能得到正确结果
String[] aa = "aaa\\bbb\\bccc".split("\\\\");
以上为个人经验,希望能给大家一个参考,也希望大家多多支持编程网。