Python爬虫基础之requestes模块-编程学习网

短信预约信息系统项目管理师报名、考试、查分时间动态提醒

一、爬虫的流程

开始学习爬虫，我们必须了解爬虫的流程框架。在我看来爬虫的流程大概就是三步，即不论我们爬取的是什么数据，总是可以把爬虫的流程归纳总结为这三步：

指定 url,可以简单的理解为指定要爬取的网址

发送请求。requests 模块的请求一般为 get 和 post

将爬取的数据存储

二、requests模块的导入

因为 requests 模块属于外部库，所以需要我们自己导入库

导入的步骤：

右键Windows图标

点击“运行”

输入“cmd”打开命令面板

输入“pip install requests”,等待下载完成

如图：

在这里插入图片描述

如果还是下载失败，我的建议是百度一下，你就知道（我也是边学边写，是在是水平有限）

欧克，既然导入成功后我们就简单的来爬取一下搜狗的首页吧！

三、完整代码


import requests

if __name__ == "__main__":
    # 指定url
    url = "https://www.sougou.com/"

    # 发起请求
    # get方法会返回一个响应数据
    response = requests.get(url)

    # 获取响应数据
    page_txt = response.text # text返回一个字符串的响应数据
    # print(page_txt)

    # 存储
    with open("./sougou.html", "w", encoding = "utf-8") as fp:
        fp.write(page_txt)

    print("爬取数据结束！！！")

我们打开保存的文件，如图

在这里插入图片描述

欧克，这就是最基本的爬取，如果学会了，那就试一试爬取 B站的首页吧。

到此这篇关于Python爬虫基础之requestes模块的文章就介绍到这了,更多相关Python requestes模块内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网！

文章详情

Python爬虫基础之requestes模块

一、爬虫的流程

二、requests模块的导入

三、完整代码

软考中级精品资料免费领

相关文章

猜你喜欢

Python爬虫基础之requestes模块

Python之爬虫基础

python爬虫之selenium模块

python爬虫之『入门基础』

python基础之爬虫入门

【Python】爬虫基础

python爬虫基础

python爬虫之请求模块urllib的基本使用

Python爬虫基础之初次使用scrapy爬虫实例

Python爬虫基础讲解之请求

Python爬虫基础之爬虫的分类知识总结

Python爬虫入门：爬虫基础了解

Python爬虫基础之selenium库怎么用

Python爬虫基础讲解之scrapy框架

Python网络爬虫之Web网页基础

Python爬虫基础（一）——HTTP

python爬虫之selenium模块怎么使用

python爬虫之request模块深入讲解

python爬虫常用模块

Python 爬虫 urllib模块：p