解读requests.session()获取Cookies全过程-编程学习网

通过requests.session()查看默认配置下请求头

import requests

session = requests.session()

print("默认配置下的请求头：",session.headers.items())
# 默认配置下的请求头：
 ItemsView({'User-Agent': 'python-requests/2.21.0',
 'Accept-Encoding': 'gzip, deflate', 
 'Accept': '*/*',
 'Connection': 'keep-alive'})"

我们可以看到在默认情况下，请求头的内容很机器，没有灵性。

如果大家使用的IDE是Pycharm的话，ctrl+右键点击session.headers的headers查看源码。

得到如图：

default_headers()

使用的是default_headers()（默认请求头），这里我们依然看不到print打印在终端的内容，所以继续ctrl+右击点击default_headers()。

得到如图：

进入default_headers()

OK! But it’s not over，这里我们还有User-Agent的value没有看到，但是经过猜测我们不难得到default_user_agent()的内容就是python-requests/2.21.0。

包装请求头，让他看起来更帅气

首先，了解对headers进行一个简单的增删改查操作

删改查

包装

包装Headers

包装我们的Headers

方式一

headers = {
            'Origin': 'https://***.com',
            'Host': '***.com',
            'Referer': 'https://**.com/,
            'User-Agent': 'Mozilla/5.0',
        }
session.headers.update(headers)#字典的更新方法

方式二

换一种大家都在用的方式，在请求的时候添加headers参数即可：

response = session.get(url, headers=headers)

验证两种方式是否得到的效果一样

第一种方式

one

第二种方式

two

结论：两种方式在response端看到的效果等同，区别在于第一种方式session是永久的，而第二种常用的方式只是在请求的时候携带过去的，所以当我们查看session的时候为空，那么这就有一个问题，我们在后续的请求中任然需要带上headers=这个参数，似乎它并没有那么好？

这是在github上copy 的部分爬虫代码如下：

github

连续带了两次Headers，这样没有什么不好，你开心就好~~~。

cookies获取过程

请求之前我们先清空Headers,Cookies内的信息
headers中仅写入user-agent，Cookies为空
请求之后查看session中Cookies，得到响应端返回的cookies

如果看不到图片，请一定想办法看见！

总结

以上为个人经验，希望能给大家一个参考，也希望大家多多支持编程网。

文章详情

解读requests.session()获取Cookies全过程

目录

通过requests.session()查看默认配置下请求头

包装请求头，让他看起来更帅气

cookies获取过程

总结

软考中级精品资料免费领

相关文章

猜你喜欢

解读requests.session()获取Cookies全过程

requests.session()获取Cookies的过程是什么

Python 读取 .gz 文件全过程

在 Python 中读取 gzip 文件的过程解析

vue前端通过腾讯接口获取用户ip的全过程

C++ Qt之halcon读取像素项目过程详解

深度解析从IOC容器中获取Bean的过程

【微信小程序】免费的高德地图api——获取天气（全过程）

如何从PyTorch中获取过程特征图实例详解

通过大白话理解微信小程序获取授权

Matlab读取excel并利用拉依达准则筛选数据的全过程

python读取与写入tif图片的完整信息(过程详解)

JavaScript实现读取上传视频文件的时长和第一帧画面过程讲解

【钉钉小程序】钉钉小程序预览文件的两种方式，从获取权限到预览文件全过程

uniapp中使用vuex的过程(解决uniapp无法在data和template中获取vuex数据问题)

Python 详解通过Scrapy框架实现爬取CSDN全站热榜标题热词流程