文章详情

短信预约-IT技能 免费直播动态提醒

请输入下面的图形验证码

提交验证

短信预约提醒成功

python怎么模拟登陆网站

2023-06-14 05:18

关注

这篇文章主要介绍了python怎么模拟登陆网站,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。

使用已有cookie登陆

使用浏览器登陆,获取浏览器中的cookie信息,来进行登陆。

我们以博客园为例,先登录博客园账号。我们访问随笔列表,在控制台我们可以看到我们登陆后浏览器的cookie

python怎么模拟登陆网站

剔除一些数据统计及分析的cookie,剩下的就是登陆可能需要的.CNBlogsCookie和.Cnblogs.AspNetCore.Cookies

# _ga google分析 cookie# UM_distinctid 友盟cookie# CNZZxxx CNZZcookie# __utma,__utmc,__utmz google统计网站# Hm_lvt_xxx 百度统计网站
import urllib.requesturl = 'https://i.cnblogs.com/posts'user_agent = 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/77.0.3865.90 Safari/537.36'#浏览器登录后得到的cookie,也就是刚才复制的字符串cookie_str = '.CNBlogsCookie=xxx; .Cnblogs.AspNetCore.Cookies=xxx'headers = { 'User-Agent': user_agent, 'cookie':cookie_str}req = urllib.request.Request(url,headers=headers)resp = urllib.request.urlopen(req).read().decode('utf-8')print(resp)

python怎么模拟登陆网站

登陆获取cookie

登陆的表单一般是使用的form data,现在也有些表单使用request payload使用json格式传参。

form data如药智网

python怎么模拟登陆网站

request payload如博客园

python怎么模拟登陆网站

form data

博客园的登陆需要拖动验证所以略过。我们以药智网为例,我们打开控制台可以看到登陆需要传的表单参数,这里是使用的form data表单。我们模拟登陆后获取到登陆后的cookie,然后访问登录后的个人中心页面。

python怎么模拟登陆网站

import urllib.requestimport http.cookiejarurl = 'https://www.yaozh.com/login'user_agent = 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/77.0.3865.90 Safari/537.36'# formData数据data = {'username': '用户名',  'pwd': '密码',  'formhash': 'C3086BBA84',  'backurl': 'https%3A%2F%2Fwww.yaozh.com%2F'}post_data = urllib.parse.urlencode(data).encode('utf-8')# 请求头设置headers = { 'User-Agent': user_agent}# 构造登陆请求req = urllib.request.Request(url, headers=headers, data=post_data)# cookiecookie = http.cookiejar.CookieJar()# 构造一个opener携带登录后的cookieopener = urllib.request.build_opener(urllib.request.HTTPCookieProcessor(cookie))# 发送登陆请求resp = opener.open(req)print(resp)# 登录后个人中心url = 'https://www.yaozh.com/member/'# 构造访问请求req = urllib.request.Request(url, headers=headers)resp = opener.open(req).read().decode('utf-8')print(resp)

python怎么模拟登陆网站

request payload

如果登陆需要request payload我们需要将参数转为json字符串并在头部设置Content-Type

import json...data = {'loginType': '1',  'pwdOrVerifyCode': '密码',  'userIdentification': '账号',  'uaToken': '',  'webUmidToken':''}headers = { 'Content-Type': 'application/json;charset=UTF-8', 'User-Agent': user_agent}req = urllib.request.Request(url, headers=headers, data=json.dumps(data))...

登陆后用session保持登陆状态

我们用requests模块的Session对象来保存回话信息

import requestsurl = 'https://www.yaozh.com/login'user_agent = 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/77.0.3865.90 Safari/537.36'# formData数据data = {'username': 'chenjy1225',  'pwd': '19931225yjy',  'formhash': 'C3086BBA84',  'backurl': 'https%3A%2F%2Fwww.yaozh.com%2F'}#构造Sessionsession = requests.Session()# 发送post请求resp = session.post(url, data)# 登录后个人中心url = 'https://www.yaozh.com/member/'# 发送请求访问个人中心resp = session.get(url).content.decode('utf-8')print(resp)

python怎么模拟登陆网站

调用浏览器登陆

我们也可以在程序中调用一个浏览器来访问登陆网站。在python中使用Selenium库就能轻松实现调用浏览器,被控制的浏览器可以是chrome、firefox等。
以前较常用的还是PhantomJS但是PhantomJS被python弃用了。

UserWarning: Selenium support for PhantomJS has been deprecated, please use headless versions of Chrome or Firefox instead
warnings.warn('Selenium support for PhantomJS has been deprecated, please use headless '

firefox对应的geckodriver

chrome对应的chrnpm.taobao.org/mirrors/chromedriveromedriver

下载Selenium、firefox浏览器及firefox驱动。

将下载的firefox驱动geckodriver放在firefox浏览器安装目录

将firefox浏览器安装目录添加到path中

重启ide

我们找到需要登陆时候输入的元素id及登陆button id。

python怎么模拟登陆网站

from selenium import webdriverimport time# 新建selenium浏览器对象,后面是geckodriver.exe下载后本地路径browser = webdriver.Firefox()url = 'https://www.yaozh.com/login'# 浏览器访问登录页面browser.get(url)# 等待3s用于加载脚本文件browser.implicitly_wait(3)# 输入用户名username = browser.find_element_by_id('username')username.send_keys('chenjy1225')# 输入密码password = browser.find_element_by_id('pwd')password.send_keys('19931225yjy')# 点击登录按钮login_button = browser.find_element_by_id('button')login_button.submit()# 网页截图browser.save_screenshot('screenshot.png')# 强制等待5s,等待登录后的跳转time.sleep(5)url = 'https://www.yaozh.com/member/'browser.get(url)# 网页截图个人中心browser.save_screenshot('screenshot1.png')# 关闭浏览器browser.quit()

screenshot.png:

python怎么模拟登陆网站

screenshot1.png:

python怎么模拟登陆网站

感谢你能够认真阅读完这篇文章,希望小编分享的“python怎么模拟登陆网站”这篇文章对大家有帮助,同时也希望大家多多支持编程网,关注编程网行业资讯频道,更多相关知识等着你来学习!

阅读原文内容投诉

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

软考中级精品资料免费领

  • 历年真题答案解析
  • 备考技巧名师总结
  • 高频考点精准押题
  • 2024年上半年信息系统项目管理师第二批次真题及答案解析(完整版)

    难度     813人已做
    查看
  • 【考后总结】2024年5月26日信息系统项目管理师第2批次考情分析

    难度     354人已做
    查看
  • 【考后总结】2024年5月25日信息系统项目管理师第1批次考情分析

    难度     318人已做
    查看
  • 2024年上半年软考高项第一、二批次真题考点汇总(完整版)

    难度     435人已做
    查看
  • 2024年上半年系统架构设计师考试综合知识真题

    难度     224人已做
    查看

相关文章

发现更多好内容

猜你喜欢

AI推送时光机
位置:首页-资讯-后端开发
咦!没有更多了?去看看其它编程学习网 内容吧
首页课程
资料下载
问答资讯