Python re.sub反向引用的实现方法-编程学习网

这篇文章主要讲解了“Python re.sub反向引用的实现方法”，文中的讲解内容简单清晰，易于学习与理解，下面请大家跟着小编的思路慢慢深入，一起来研究和学习“Python re.sub反向引用的实现方法”吧！

match 分组

Python re 模块中提供了 match 函数，用来匹配字符串中指定的正则表达式规则。例如，如果想匹配到 "Isaac Newton, physicist" 中的 Isaac Newton，则可以使用正则表达式 \w+ \w+ ，运行结果如下：

>>> m = re.match("\w+ \w+", "Isaac Newton, physicist")>>> m<re.Match object; span=(0, 12), match='Isaac Newton'>

re.match 的第一个参数是指定的正则表达式规则，第二个参数是待匹配的字符串。正则表达式规则 \w+ 表示匹配一段连续的字符，要求匹配到的字符数量大于 1。 \w+ \w+ 就表示匹配两段连续的字符，且两段字符中间用空格隔开

使用 match 执行匹配时会对匹配到的结果进行分组，可以通过 match 返回结果的 group() 接口查看分组结果

>>> m.group(0)'Isaac Newton'

默认情况下， match 只会产生一个分组，就是第 0 个分组，表示整个匹配到的内容。对于上面的例子，第 0 个分组就是 \w+ \w+ 匹配到的完整的内容，也就是 Issac Newton 。
使用正则表达式中的括号 () 可以手动指定匹配的分组。例如如果想把 Issac 和 Newton 做为两个分组，那么可以将正则表达式改为 (\w+) (\w+) ：

>>> m = re.match("(\w+) (\w+)", "Isaac Newton, physicist")

在 (\w+) (\w+) 这个正则表达式中，指定了两个分组，这两个分组匹配的内容都是 \w+ ，并且两个分组之间用空格隔开。
使用 groups() 可以查看匹配结果中的所有分组：

>>> m.groups()('Isaac', 'Newton')

也可以使用 group() 接口分别查看每一个分组，其中 group(0) 仍然表示完整的匹配结果， group(1) 表示匹配结果中的第 1 个分组， group(2) 表示第 2 个分组，以此类推：

>>> m.group(0)'Isaac Newton'>>> m.group(1)'Isaac'>>> m.group(2)'Newton'

re.sub 匹配和替换

re.match() 函数提供了正则表达式的匹配接口， re.sub() 不光能匹配正则表达式，还能替换字符串中的结果，生成一个新的字符串。
例如把字符串中 (\w+) (\w+) 匹配到的结果替换成 Albert Einstein ，可以这样写：

>>> re.sub("(\w+) (\w+)", "Albert Einstein", "Isaac Newton, physicist")'Albert Einstein, physicist'

re.sub 中第 1 个参数表示匹配的正则表达式，第 2 个参数表示替换表达式，第 3 个参数表示原始字符串

这里的替换表达式是手动指定的新字符串 Albert Einstein ，他和原始字符串中的内容毫不相关。如果希望复用原始字符串中的内容，那么就需要用到 re.sub 的反向引用功能了。

反向引用

反向引用指的是在指定替换结果的过程中，可以引用原始字符串中的匹配到内容。例如 (\w+) (\w+) 在原始字符串中匹配到了 Isaac Newton ，利用匹配到的结果，将结果改写为 FirstName: Isaac, LastName: Newton 。
既然需要引用，那么就得有一个表达式能够表示匹配的内容。恰好 re.sub 的匹配结果也有和 re.match 一样的分组，因此只需要在替换表达式中引用分组的结果即可。引用方式有以下几种：

\number ：例如 \1 ，表示匹配结果中第 1 个分组，也就是例子中的 Isaac 部分。
\g<number> ：例如 \g<1> ，和 \number 表示法一样，也代表了匹配结果中的第 1 个分组。与 \number 表示法相比， \g<number> 避免了歧义。试想，如果想用 \number 把第 1 个分组匹配到的 Isaac 替换为 Isaac0 ，那么需要用 \10 ，这里本意表示在第 1 个分组后加上 0 ，但程序会识别成第 10 个分组。而使用 \g<number> 只需要写成 \g<1>0 即可。

回到开始的例子中，将匹配结果 Isaac Newton改写为 FirstName: Isaac, LastName: Newton ，可以用以下表达式实现：

>>> re.sub("(\w+) (\w+)", "FirstName: \g<1>, LastName: \g<2>", "Isaac Newton, physicist")'FirstName: Isaac, LastName: Newton, physicist'

参考

re — Regular expression operations
Python re(gex)? -- Groupings and backreferences

感谢各位的阅读，以上就是“Python re.sub反向引用的实现方法”的内容了，经过本文的学习后，相信大家对Python re.sub反向引用的实现方法这一问题有了更深刻的体会，具体使用情况还需要大家实践验证。这里是编程网，小编将为大家推送更多相关知识点的文章，欢迎关注！

文章详情

Python re.sub反向引用的实现方法

目录

match 分组

re.sub 匹配和替换

反向引用

参考

软考中级精品资料免费领

相关文章

猜你喜欢

Python re.sub反向引用的实现方法

Python re.sub 反向引用的实现

利用node.js实现反向代理的方法详解

python单向链表的实现方法

Python利用treap实现双索引的方法

PHP实现16进制字符串反向输出的方法

python列表反向排序的方法有哪些

Python实现字符串反转的6种方法

python列表反向输出的方法是什么

Python实现链表反转的方法是什么

python实现简单反弹球游戏的方法

Python实现softmax反向传播的示例代码

Node与Python双向通信的实现方法

怎么在python中利用reversed实现反向迭代

教你如何利用.net core实现反向代理中间件的方法

python怎么实现单向链表及单向链表的反转

python方法如何实现字符串反转

Python实现前向和反向自动微分的示例代码

Python字符串反转实现的方法有哪些

Python中五种实现字符串反转的方法