文章详情

短信预约-IT技能 免费直播动态提醒

请输入下面的图形验证码

提交验证

短信预约提醒成功

Python正则表达式的小练习分享

2024-04-02 19:55

关注

匹配网址 url 的小练习

定义一个函数,判断 url 是否是一个正常的地址。

定义一个函数,只获取 url 的域名部分

import re


url_ture = "https://www.csdn.net/"
url_false = "ftp://110.110.110.110:8080"

def check_url(url):
    result = re.findall('[a-zA-z]{4,5}://\w*\.*\w+\.\w+', url)

    if not len(result) == 0:
        return 'url 是一个合法的网站地址'
    else:
        return 'url 是一个不合法的网站地址'


def get_url(url):
    result = re.findall('https://(\w*\.*\w+\.\w+)', url)

    if not len(result) == 0:
        return result[0]
    else:
        return []



if __name__ == '__main__':
    result_true = check_url(url_ture)
    print(result_true)
    result_false = check_url(url_false)
    print(result_false)

    result_url_01 = check_url("http://csdn.com")
    print(result_url_01)
    result_url_02 = check_url("https://www.csdn.com")
    print(result_url_02)

    get_url_true = get_url(url_ture)
    print(get_url_true)
    get_url_false = get_url(url_false)
    print(get_url_false)

执行结果如下:

匹配邮箱地址的小练习

定义一个函数,获取邮箱的地址。

import re


email = "Neo@protonmail.com"


def get_email(email):
    # result = re.findall('[0-9a-zA-Z]+@[0-9a-zA-Z]+\.[a-zA-Z]+', email)      # 这样写比较复杂,可以使用通配符
    result = re.findall('.+@.+\.[a-zA-Z]', email)
    return result


if __name__ == '__main__':
    get_email = get_email(email)
    print(get_email)
    
# >>> 执行结果如下:
# >>> ['Neo@protonmail.com']

获取前端代码内容的练习

接下来做一个稍微复杂一些的练习:

定义一个函数,获取一段前端代码中双引号包裹的内容。

定义一个函数,获取该段前端代码中所有的双引号包裹的内容

import re


html = ('<div class="s-top-nav" style="display:none;">'
        '</div><div class="s-center-box"></div>')		# 这是前端代码,暂时不用理解是什么意思


def get_html_data(html):
    re_g = re.compile('style="(.*?)"')      # 非贪婪模式获取 style 标签的内容
    result = re_g.findall(html)
    return result


def get_all_data_html(html):
    re_g = re.compile('="(.+?)"')
    result = re_g.findall(html)
    return result


if __name__ == '__main__':
    get_html_data = get_html_data(html)
    print(get_html_data)

    get_all_data_html = get_all_data_html(html)
    print(get_all_data_html)
    
# >>> 执行结果如下:
# >>> ['display:none;']
# >>> ['s-top-nav', 'display:none;', 's-center-box']

通过获取前端代码标签内容的例子,我们可以看出,只要找到字符串的规律,通过这些规律去定义正则匹配的规则就可以拿到想要的信息。

OK,今天的练习就到这里了。正则表达式最最核心最最重要的就是匹配的相关操作, findall 与 search 函数就是常用的两个函数,以及其它函数的匹配规律都是完全相同的,只不过它们返回的值会存在着不同,或者说这些函数的使用场景存在着一定的区别,但是返回的结果几乎都是相同的。

到此这篇关于Python正则表达式的小练习分享的文章就介绍到这了,更多相关Python正则表达式练习内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网!

阅读原文内容投诉

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

软考中级精品资料免费领

  • 历年真题答案解析
  • 备考技巧名师总结
  • 高频考点精准押题
  • 2024年上半年信息系统项目管理师第二批次真题及答案解析(完整版)

    难度     807人已做
    查看
  • 【考后总结】2024年5月26日信息系统项目管理师第2批次考情分析

    难度     351人已做
    查看
  • 【考后总结】2024年5月25日信息系统项目管理师第1批次考情分析

    难度     314人已做
    查看
  • 2024年上半年软考高项第一、二批次真题考点汇总(完整版)

    难度     433人已做
    查看
  • 2024年上半年系统架构设计师考试综合知识真题

    难度     221人已做
    查看

相关文章

发现更多好内容

猜你喜欢

AI推送时光机
位置:首页-资讯-后端开发
咦!没有更多了?去看看其它编程学习网 内容吧
首页课程
资料下载
问答资讯