正则表达式(Regular Expression),又称为正规表达式、规则表达式、常规表示法等,是一种用来匹配、查找和替换字符串的工具。它的语法和规则相对复杂,但却非常强大和灵活。
在Java中,可以使用java.util.regex包中的类来使用正则表达式。常用的类有Pattern和Matcher。
1. Pattern类:用于定义正则表达式的模式。可以通过Pattern.compile()方法来创建Pattern对象。
2. Matcher类:用于对字符串进行匹配操作。可以通过Pattern.matcher()方法来创建Matcher对象。
下面是一些常用的正则表达式语法:
1. 字符类:
- [abc]:匹配a、b、c中的任意一个字符。
- [^abc]:匹配除了a、b、c以外的任意一个字符。
- [a-z]:匹配a到z之间的任意一个小写字母。
- [A-Z]:匹配A到Z之间的任意一个大写字母。
- [0-9]:匹配0到9之间的任意一个数字。
- [a-zA-Z0-9]:匹配任意一个字母或数字。
2. 边界匹配:
- ^:匹配字符串的开始位置。
- $:匹配字符串的结束位置。
- \b:匹配单词的边界。
3. 数量词:
- *:匹配前面的元素零次或多次。
- +:匹配前面的元素一次或多次。
- ?:匹配前面的元素零次或一次。
- {n}:匹配前面的元素恰好n次。
- {n,}:匹配前面的元素至少n次。
- {n,m}:匹配前面的元素至少n次,但不超过m次。
4. 转义字符:
- \:用于转义特殊字符。
5. 分组和引用:
- (pattern):匹配pattern并捕获结果。
- \1、\2、\3...:引用前面的分组。
6. 常用的预定义字符类:
- .:匹配任意一个字符。
- \d:匹配任意一个数字。
- \D:匹配任意一个非数字字符。
- \w:匹配任意一个字母、数字或下划线。
- \W:匹配任意一个非字母、数字或下划线字符。
- \s:匹配任意一个空白字符。
- \S:匹配任意一个非空白字符。
以上只是正则表达式的一部分语法,还有很多其他的语法和操作符可以使用。在实际使用中,可以根据具体的需求来编写正则表达式。
下面是一个示例代码,演示如何使用正则表达式来匹配字符串:
```java
import java.util.regex.*;
public class RegexExample {
public static void main(String[] args) {
String text = "This is a test string.";
String pattern = "test";
Pattern p = Pattern.compile(pattern);
Matcher m = p.matcher(text);
if (m.find()) {
System.out.println("Pattern found!");
} else {
System.out.println("Pattern not found!");
}
}
}
```
运行以上代码,输出结果为:Pattern found!