作用:用正则表达式的字符分割字符串,正则的字符会被抛弃。
本文以 提取URL的地址与参数 为例,介绍re模块的split的用法: 返回值 -> 列表
复杂匹配 = re.compile(正则表达式): 将正则表达式实例化
+
re.split(要匹配的字符串): 从字符串开头 开始匹配,寻找完整个字符串后,将结果以 列表 返回
简单匹配 = re.split(正则表达式, 要匹配的原字符串): 从字符串开头 开始匹配,寻找完整个字符串后,将结果以 列表 返回
懒癌,配上模块函数解释好消化
re.split(pattern, string, maxsplit=0, flags=0),如果匹配成功,则返回一个列表,否则返回原string列表;
第一个参数:正则表达式
第二个参数:要匹配查找的原始字符串;
第三个参数:可选参数,表示最大的拆分次数,默认为0,表示全部分割;
第四个参数:可选参数,标志位,用于控制正则表达式的匹配方式,如:是否区分大小写,多行匹配等等;
需要特别注意的是,这个方法并不是完全匹配。它仅仅决定在字符串开始的位置是否匹配。所以当pattern结束时若还有剩余字符,仍然视为成功。想要完全匹配,可以在表达式末尾加上边界匹配符'$'
例如: re.split(‘z’, ‘p.python.p’)返回值为['p.python.p']; #失败返回原string列表
re.split(‘p’, ‘p.python.p’)返回值为['', '.', 'ython.', ''] #成功返回新列表
方法一:
对象名1 = re.split(正则表达式, 要匹配的原字符串)
#!/usr/bin/python
# -*- coding: utf-8 -*-
import os,re;
pattern = r'[?|&]'
string = "https://www.baidu.com/baidu?&ie=utf-8&word=51cto"
result = re.split(pattern, string)
print('Match:',result)
运行结果:
Match: ['https://www.baidu.com/baidu', '', 'ie=utf-8', 'word=51cto']