文章详情

短信预约-IT技能 免费直播动态提醒

请输入下面的图形验证码

提交验证

短信预约提醒成功

39、一篇文章弄懂 Java 正则表达式中的量词、贪婪、勉强、独占和 String 的 matches 方法的底层【个人感觉非常值得学习】

2023-09-11 11:59

关注

文章目录

一、量词(Quantifier)

📝 量词用以标记某个字符出现的次数

贪婪(Greedy)勉强(Reluctant)独占(Possessive)含义
🍀{n}🍀{n}?🍀{n}+🍀 出现 n 次
🍀{n,m}🍀{n,m}?🍀{n,m}+🍀出现 n 到 m 次
🍀{n,}🍀{,}?🍀{n,}+🍀出现至少 n 次
🍀?🍀??🍀?+🍀出现 0 次或者 1 次
🍀*🍀*?🍀*+🍀出现任意次
🍀+🍀+?🍀++🍀至少出现一次

📝 贪婪、勉强、独占的区别很大,后面介绍比较合适

二、字符串的 matches 方法底层

📜 String 的 matches 方法底层用到了 PatternMatcher

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

public class TestDemo {    public static void main(String[] args) {        String input1 = "111庆222";        String input2 = "111庆";        String r = "1{3}庆";        // Pattern 的 matchers 匹配的是【整个】字符串        // match the entire region against the pattern.                // input1.matches(r): 看一看 input1 字符串是否完全匹配正则表达式 r        System.out.println(input1.matches(r)); // false                System.out.println(input2.matches(r)); // true    }}

三、Matcher 类的其他方法

📜 上一节中了解了 Matcher 类的 matches 方法【如果整个 input(字符串)和正则表达式匹配,则返回 true】,这也是 String 的 matches 方法的底层

通过下面的代码引出 Matcher 类的其他方法:

public class TestDemo {    public static void main(String[] args) {        String input0 = "520";        String input1 = "888";        String input2 = "111_222_666";        String r = "\\d{3}";        System.out.println(input0.matches(r)); // true        System.out.println(input1.matches(r)); // true        // (1) 字符串的 matches 方法底层的 Matcher 类的 matches 方法是匹配整个字符串        // (2) 必须整个字符串和正则模式匹配(必须整个字符串和正则模式匹配)        // (3) input2 里面包含三个数字, 但不仅仅只是有三个数字, 无法和正则完全匹配        System.out.println(input2.matches(r)); // false    }}

📜 上面代码中的 input2 无法完全匹配正则表达式 r(这是字符串底层 Matcher 类的 matches 方法的结果)
📜 matches 方法是对整个字符串进行匹配,必须整个字符串匹配正则表达式
📜 Matcher 类的 find 方法可以把字符串的部分序列和正则进行匹配,如果匹配成功,返回 true

在这里插入图片描述


(1) find、start、end、group

public class TestDemo {    public static void main(String[] args) {        String input = "111_222_666";        String r = "\\d{3}";        System.out.println(input.matches(r)); // false        // 假如正则表达式 r 语法错误, 会抛异常        Pattern pattern = Pattern.compile(r);        Matcher matcher = pattern.matcher(input);        // 如果调用 matches 方法, 则和 String 的 matches 方法返回的结果一样        System.out.println(matcher.matches()); // false        // input 中有子序列满足正则表达式 r 则返回 true        System.out.println(matcher.find()); // true    }}

📝 find: 如果从 input(给定字符串)中能够找到与 regex 匹配的子序列,则返回 true
📝 如果能够匹配成功,可以通过 startendgroup 方法获取更多的信息
📝 每次的查找范围会先剔除之前已经查找过的范围

📝 start: 返回上一次匹配成功的开始索引

📝 end: 返回上一次匹配成功的结束索引

📝 group: 返回上一次匹配成功的子序列

public class TestDemo {    public static void main(String[] args) {        String input = "111_222_666";        String r = "\\d{3}";        Pattern pattern = Pattern.compile(r);        Matcher matcher = pattern.matcher(input);        boolean findResult = matcher.find();        System.out.println(findResult); // true        if (findResult) {            System.out.println("匹配的子序列: " + matcher.group());            System.out.println("起始索引: " + matcher.start());            System.out.println("结束索引: " + matcher.end());        }    }}

(2) find 细节

在这里插入图片描述
📝 该方法(find)会从给定 input 的一开始(第一个字符)开始匹配
📝 但若该方法先前的调用是成功的,并且 matcher 还没有被重置,则从先前的匹配中还没有被匹配过的字符开始匹配

📜 matcher 还没有被重置: matcher 是通过 input(给定字符串)创建的
📜 只要 input 没有改变, matcher 就没有被重置

📝 find 方法被调用一次,就会在该 input 中匹配一次(从前往后匹配)


取出所有符合正则表达式的子序列:

public class TestDemo {    public static void main(String[] args) {        String input = "520_222_666";        String r = "\\d{3}";        Pattern pattern = Pattern.compile(r);        Matcher matcher = pattern.matcher(input);        // 当无法匹配到满足正则的子序列时, 结束循环        while (matcher.find()) {            System.out.println(matcher.group());        }                    }}

(3) 封装:查找字符串中匹配正则的子串

        public static List<String> okMatchRegexSubstrList(String input, String regex, int flags) {        if (input == null || regex == null) return null;        List<String> subStrings = new ArrayList<>();        Pattern p = Pattern.compile(regex, flags);        Matcher m = p.matcher(input);        while (m.find()) {            subStrings.add(m.group());        }        return subStrings;    }}

在这里插入图片描述

四、贪婪、勉强、独占

🎄 贪婪:
✏️ ① 先 “吞掉” 整个 input 进行匹配
✏️ ② 若匹配失败,则吐出最后一个字符,然后再次尝试匹配
✏️ ③ 重复该操作

public class TestDemo {    public static void main(String[] args) {        String regex = ".*good";        String input = "庆の6good8浩のgoodMorning";        List<String> ret = okMatchRegexSubstrList(input, regex, 0);        // 贪婪: [庆の6good8浩のgood]        printList("贪婪", ret, ", ");    }        public static void printList(String desc, List<String> list, String divider) {        int size = list.size();        if (size == 0) {            System.out.println("空数组");            return;        }        System.out.print(desc + ": [");        for (int i = 0; i < list.size(); i++) {            if (i != list.size() - 1) {                System.out.print(list.get(i) + divider);            }            System.out.print(list.get(i));        }        System.out.print("]");    }    public static List<String> okMatchRegexSubstrList(String input, String regex, int flags) {        if (input == null || regex == null) return null;        List<String> subStrings = new ArrayList<>();        Pattern p = Pattern.compile(regex, flags);        Matcher m = p.matcher(input);        while (m.find()) {            subStrings.add(m.group());        }        m.reset();        return subStrings;    }}

🎄 勉强:
✏️ ① 先 “吞掉” input 的第一个字符进行匹配
✏️ ② 若匹配失败,则再吞掉下一个字符,然后再次尝试匹配
✏️ ③ 重复该操作

public class TestDemo {    public static void main(String[] args) {        String regex = ".*?good";        String input = "庆の6good8浩のgoodMorning";        List<String> ret = okMatchRegexSubstrList(input, regex, 0);        // 勉强: [庆の6good, 庆の6good8浩のgood]        printList("勉强", ret, ", ");    } 

🎄 独占:
✏️ “吞掉” 整个 input 进行唯一的一次匹配(类似 equals 方法)

public class TestDemo {    public static void main(String[] args) {        String regex = ".*+good";        String input = "庆の6good8浩のgoodMorning";        List<String> ret = okMatchRegexSubstrList(input, regex, 0);         // 空数组        printList("独占", ret, ", ");    } }

结束,如有错误!请赐教

来源地址:https://blog.csdn.net/m0_54189068/article/details/127525243

阅读原文内容投诉

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

软考中级精品资料免费领

  • 历年真题答案解析
  • 备考技巧名师总结
  • 高频考点精准押题
  • 2024年上半年信息系统项目管理师第二批次真题及答案解析(完整版)

    难度     801人已做
    查看
  • 【考后总结】2024年5月26日信息系统项目管理师第2批次考情分析

    难度     348人已做
    查看
  • 【考后总结】2024年5月25日信息系统项目管理师第1批次考情分析

    难度     311人已做
    查看
  • 2024年上半年软考高项第一、二批次真题考点汇总(完整版)

    难度     432人已做
    查看
  • 2024年上半年系统架构设计师考试综合知识真题

    难度     220人已做
    查看

相关文章

发现更多好内容

猜你喜欢

AI推送时光机
位置:首页-资讯-后端开发
咦!没有更多了?去看看其它编程学习网 内容吧
首页课程
资料下载
问答资讯