文章详情

短信预约-IT技能 免费直播动态提醒

请输入下面的图形验证码

提交验证

短信预约提醒成功

Python通过私信消息提取博主的赠书活动地址

2023-08-31 09:16

关注

文章目录

前言

博主空空star
主页空空star的主页

大家好,我是空空star,本篇给大家分享一下《通过私信消息提取博主的赠书活动地址》

背景

关注的博主中有一些赠书活动私信,如何从大量私信中提取出来我们想参与赠书活动的博客地址。

设计

  1. 获取私信列表;
  2. 提取内容包含‘书’的私信内容;
  3. 从内容中提取url。

开发

1.引入模块

import pprintimport reimport requests

2.获取私信内容

获取每个用户最新一条私信内容

def get_msg(username,usertoken,page):    url = f'https://msg.csdn.net/v1/im/query/historySession3?page={page}&pageSize=40'    headers = {         'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/64.0.3282.140 Safari/537.36 Edge/18.17763',         'Cookie': f'UserName={username}; UserToken={usertoken};'    }    res = requests.get(url, headers=headers)    return res.json()

3.根据文本提取url的方法

def get_urls(text):    urls = re.findall(r'http[s]?://(?:[a-zA-Z]|[0-9]|[$-_@.&+]|[!*\(\),]|(?:%[0-9a-fA-F][0-9a-fA-F]))+', text)    return urls

4.获取包含‘书’的url

def get_about_book(msg):    about_book_list = []    datas = msg['data']    for data in datas:        if '书' in data['content']:            username = data['username']            nickname = data['nickname']            content = data['content'].replace('\n', '')            urls = get_urls(content)            msg_dict = {                'username': username,                'nickname': nickname,                'content': content,                'urls': urls            }            about_book_list.append(msg_dict)    return about_book_list

5.程序入口

if __name__ == '__main__':# 遍历前3页的私信消息    for page in range(1, 4):        msg = get_msg('你的username', '你的usertoken', page)        about_book_list = get_about_book(msg)        print(f'第{page}页的赠书活动:')        pprint.pprint(about_book_list)

效果

第1页的赠书活动:
[{‘content’: ‘『赠书活动 | 第十三期』《算力经济:从超级计算到云计算》http://t.csdn.cn/p2xwU’,
‘nickname’: ‘wei_shuo’,
‘urls’: [‘http://t.csdn.cn/p2xwU’],
‘username’: ‘weixin_62765017’},
{‘content’: ‘算力经济:从超级计算到云计算——(文末送书)http://t.csdn.cn/NfTcw本期赠书三本:《算力经济:从超级计算到云计算》获得方式:高质量的评论+赞数的前两名各获得一本!评论区随机挑选一位好兄弟送书一本!截止时间:6月29日—7月1日中午12时公布时间:7月1日下午1点’,
‘nickname’: ‘网络豆’,
‘urls’: [‘http://t.csdn.cn/NfTcw’],
‘username’: ‘yj11290301’},
{‘content’: ‘三连文章抽3人送人工智能书,AI学习之路分享:https://blog.csdn.net/m0_63947499/article/details/131371175’,
‘nickname’: ‘陈橘又青’,
‘urls’: [‘https://blog.csdn.net/m0_63947499/article/details/131371175’],
‘username’: ‘m0_63947499’},
{‘content’: ‘【派森送书-第二十六期】《企业性能测试》送书5人http://t.csdn.cn/IVIB9上方文章链接进去点赞收藏,评论区留言“人生苦短,拒绝内卷!”每人最多评论三次!大数据分析新文《基于LightGBM算法构建公司破产预测模型》https://blog.csdn.net/m0_64336780/article/details/131343629,期待家人们的三连支持!评论区回访!’,
‘nickname’: ‘艾派森’,
‘urls’: [‘http://t.csdn.cn/IVIB9’,
‘https://blog.csdn.net/m0_64336780/article/details/131343629’],
‘username’: ‘m0_64336780’}]

总结

最后

如果您不知道如何支持我,InsCode AI列了一些支持博主的句子供您参考:

博主写的文章很有深度,收获了很多知识。
博主的写作风格幽默风趣。
博主勇于分享自己的经验和教训,让初学者从中受益匪浅。
博主的思想独到,文章读起来让人格外振奋。
博主为人很好,乐于助人,回复读者的问题也非常及时。
博主的专业知识非常全面,无论是哪个领域的问题都能给出详细的解答。

来源地址:https://blog.csdn.net/weixin_38093452/article/details/131460564

阅读原文内容投诉

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

软考中级精品资料免费领

  • 历年真题答案解析
  • 备考技巧名师总结
  • 高频考点精准押题
  • 2024年上半年信息系统项目管理师第二批次真题及答案解析(完整版)

    难度     813人已做
    查看
  • 【考后总结】2024年5月26日信息系统项目管理师第2批次考情分析

    难度     354人已做
    查看
  • 【考后总结】2024年5月25日信息系统项目管理师第1批次考情分析

    难度     318人已做
    查看
  • 2024年上半年软考高项第一、二批次真题考点汇总(完整版)

    难度     435人已做
    查看
  • 2024年上半年系统架构设计师考试综合知识真题

    难度     224人已做
    查看

相关文章

发现更多好内容

猜你喜欢

AI推送时光机
位置:首页-资讯-后端开发
咦!没有更多了?去看看其它编程学习网 内容吧
首页课程
资料下载
问答资讯