爬虫爬取黑马程序员论坛的网页数据-编程学习网

#引入requests库import requests#根据url发起请求，获取服务器响应文件  url：待抓取的urldef load_page(url):#这里的请求头header可以是任意一个网站上面的请求头，进入开发者模式就可以找到，推荐使用google浏览器，比较方便查看#    header = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/108.0.5359.95 Safari/537.36 QIHU 360SE'}    #发送get请求    response = requests.get(url, headers = header)    #返回html源代码    return response.text#将html文件保存为网页文件def save_file(html, filename):    print('正在保存' + filename)    with open(filename, 'w', encoding='utf-8') as file:        file.write(html)#调度函数def heima_fornum(begin_page, end_page):    for page in range(begin_page, end_page + 1):        #组合页面完整的url        url = f'http://bbs.itheima.com/forum-568-{page}.html'#上面的url以黑马程序员论坛的大数据技术交流模块为例子        #文件名称        file_name = '第' + str(page) + '页.html'        #抓取网页数据        html = load_page(url)        #保存网页数据        save_file(html, file_name)#定义主函数if __name__ == '__main__':    begin_page = int(input('请输入起始页：'))    end_page = int(input('请输出结束页：'))    heima_fornum(begin_page, end_page)

输入完成后运行将会是这样：

例如：

输入起始页码"1"

结束页码"6"

那么将会保存1—6页的网络代码

保存后也页面可以本地文件夹中查看

打开任意一个本地网页文件，将可以看到论坛上对应的内容

这样看来是不是很简单呢

来源地址：https://blog.csdn.net/weixin_66425427/article/details/129898767

文章详情

爬虫爬取黑马程序员论坛的网页数据

软考中级精品资料免费领

相关文章

猜你喜欢

爬虫爬取黑马程序员论坛的网页数据

Python爬虫入门教程！手把手教会你爬取网页数据

【Python】爬虫练习-爬取豆瓣网电影评论用户的观影习惯数据

基于Python的爬虫设计与数据分析（附源码、论文）免费赠送项目完整源码,可做计算机毕业设计JAVA、PHP、爬虫、APP、小程序、C#、C++、python、数据可视化、大数据、全套文案等

SSM 微课网站(免费领源码、附论文）可做计算机毕业设计JAVA、PHP、爬虫、APP、小程序、C#、C++、python、数据可视化、大数据、全套文案40311

美食分享交流网站 (免费领源码、附论文）可做计算机毕业设计JAVA、PHP、爬虫、APP、小程序、C#、C++、python、数据可视化、大数据、全套文案10913

40685-springboot卡塔尔世界杯门户网站 (免费领源码、附论文）可做计算机毕业设计JAVA、PHP、爬虫、APP、小程序、C#、C++、python、数据可视化、大数据、全套文案

PHP国家历史文物网站的设计与实现 63653 (免费领源码、附论文）可做计算机毕业设计JAVA、PHP、爬虫、APP、小程序、C#、C++、python、数据可视化、大数据、全套文案

springboot卡塔尔世界杯门户网站的设计与开发(免费领源码、附论文）可做计算机毕业设计JAVA、PHP、爬虫、APP、小程序、C#、C++、python、数据可视化、大数据、全套文案40685

SSM宠物领养系统的设计与实现 63813 (免费领源码、附论文）可做计算机毕业设计JAVA、PHP、爬虫、APP、小程序、C#、C++、python、数据可视化、大数据、全套文案

博物馆线上导览系统 app的设计与实现 64574 (免费领源码、附论文）可做计算机毕业设计JAVA、PHP、爬虫、APP、小程序、C#、C++、python、数据可视化、大数据、全套文案

springboot高考志愿选择系统的设计与实现 68335 (免费领源码、附论文）可做计算机毕业设计JAVA、PHP、爬虫、APP、小程序、C#、C++、python、数据可视化、大数据、全套文案