文章详情

短信预约-IT技能 免费直播动态提醒

请输入下面的图形验证码

提交验证

短信预约提醒成功

python-其它有用模块1

2023-01-30 21:57

关注

re模块(正则表达式)

re模块是文件处理中必不可少的模块,它主要应用于字符串的查找,定位等等,在使用网络爬虫时,即使没有爬虫框架,re模块配合urllib.request模块也可以完成简单的爬虫功能,先来看看正则表达式,python支持的正则表达式元字符和语法

1 字符

.  点匹配任意除换行符\n外的字符,abc匹配abc

\  转义字符,使后一个字符改变原来的意思,a\.bc匹配a.bc

[...]  字符集(字符类),对应字符集中的任意字符,第一个字符是^则取反,a[bc]d匹配abd或者acd


2 预定义字符集

\d  数字[0-9],匹配数字0-9

\D  非数字[^\d],即匹配非数字

\s  空白字符[空格\t\r\n\f\v]

\S  非空白字符[^\s]

\w  单词字符[a-zA-Z0-9]

\W  非单词字符[^\w]


3 数量词

*  匹配前一个字符0或者无限次,al*b 匹配 ab,alb,allb .....

+  匹配前一个字符1或者无限次,al+b 匹配 alb,allb .....

?  匹配前一个字符0或1次,al?b 匹配 ab,alb

{m}  匹配前一个字符m次,al{3}b 匹配 alllb

{m,n}  匹配前一个字符m至n次,al{2,3}b 匹配 allb,alllb


4 边界匹配

^  匹配字符串开头,如^abc 匹配 以abc开头的字符串

$  匹配字符串结尾,如xyz$ 匹配以xyz结尾的字符串

\A  仅匹配字符串开头,如\Aabc

\Z  仅匹配字符串结尾,如xyz\Z


python的re模块提供了两种不同的原始操作:match和search,match是从字符串的起点开始做匹配,而search是对字符串做任意匹配,最常用的几个re模块方法如下

re.compile(pattern,flags=0)  将字符串形式的正则表达式编译为Pattern对象

re.search(string[,pos[,endpos]])  从string的任意位置开始匹配

re.match(string[,pos[,endpos]])  从string的开头开始匹配

re.findall(string[,pos[,endpos]])  从string任意位置开始匹配,返回一个列表

re.finditer(string[,pos[,endpos]])  从string任意位置开始匹配,返回一个迭代器,一般匹配findall就可以了,大数量的匹配还是使用finditer比较好


简单的测试一下,打开IDLE执行命令

blob.png



阅读原文内容投诉

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

软考中级精品资料免费领

  • 历年真题答案解析
  • 备考技巧名师总结
  • 高频考点精准押题
  • 2024年上半年信息系统项目管理师第二批次真题及答案解析(完整版)

    难度     813人已做
    查看
  • 【考后总结】2024年5月26日信息系统项目管理师第2批次考情分析

    难度     354人已做
    查看
  • 【考后总结】2024年5月25日信息系统项目管理师第1批次考情分析

    难度     318人已做
    查看
  • 2024年上半年软考高项第一、二批次真题考点汇总(完整版)

    难度     435人已做
    查看
  • 2024年上半年系统架构设计师考试综合知识真题

    难度     224人已做
    查看

相关文章

发现更多好内容

猜你喜欢

AI推送时光机
位置:首页-资讯-后端开发
咦!没有更多了?去看看其它编程学习网 内容吧
首页课程
资料下载
问答资讯