如何使用Python爬虫实现自动下载图片-编程学习网

小编给大家分享一下如何使用Python爬虫实现自动下载图片，希望大家阅读完这篇文章之后都有所收获，下面让我们一起去探讨吧！

python的数据类型有哪些?

python的数据类型：1. 数字类型，包括int（整型）、long（长整型）和float（浮点型）。2.字符串，分别是str类型和unicode类型。3.布尔型，Python布尔类型也是用于逻辑运算，有两个值：True（真）和False（假）。4.列表，列表是Python中使用最频繁的数据类型，集合中可以放任何数据类型。5. 元组，元组用”()”标识，内部元素用逗号隔开。6. 字典，字典是一种键值对的集合。7. 集合，集合是一个无序的、不重复的数据组合。

python爬虫支持模块多、代码简洁、开发效率高，是我们进行网络爬虫可以选取的好工具。对于一个个的爬取下载，势必会消耗我们大量的时间，使用Python爬虫就可以解决这个问题，即可以实现自动下载。

一、自动下载图片流程

总结网址规律，以便根据网址访问网页；

根据网址规律，循环爬取并返回网页；

利用正则表达式提取并返回图片。

二、使用Python爬虫实现自动下载图片步骤

1、导入相关包

import requestsimport importlibimport urllibimport reimport osimport sysimportlib.reload(sys)

2、定义网页访问函数

cookie获得方式：正常访问此页面，鼠标右键检查或F12-在Network处查看自己的cookie，由于cookie很长且每个用户的cookie不同，故代码中将cookie省略了，读者可查看自己浏览器的cookie，将其加入代码中。

def askURL(url):    head = {           "Accept": "image/webp,image/apng,image*;q=0.8",        "Accept-Language": "zh-CN,zh;q=0.9",        "Connection": "keep-alive",        "Cookie": " ",        "User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/        71.0.3578.98 Safari/537.36"    }    s = quote(url, safe=string.printable)    # 中文转utf8字符，否则会报ascii错    print(s)    request = urllib.request.Request(s, headers=head)    html = ""    try:        response = urllib.request.urlopen(request)        html = response.read().decode("utf-8")        print(html)    except urllib.error.URLError as e:        if hasattr(e, "code"):            print(e.code)        if hasattr(e, "reason"):            print(e.reason)    return html

3、提取图片并返回

根据返回的html网页可以看到，网页中包含图片的url共有四种类型，分别是objURL、middleURL、hoverURL和thumbURL，故利用正则表达式返回四种类型的链接并合并。

i = 1def savePic(url):    global i  #     html = askURL(url)    pic_url = re.findall('"objURL":"(.*?)",', html, re.S)  # re.S表示让换行符包含在字符中    pic_url2 = re.findall('"middleURL":"(.*?)",', html, re.S)    pic_url3 = re.findall('"hoverURL":"(.*?)",', html, re.S)    pic_url4 = re.findall('"thumbURL":"(.*?)",', html, re.S)    result = pic_url2 + pic_url + pic_url4 + pic_url3    for item in result:        print("已下载" + str(i) + "张图片")        # 定义异常控制        try:            pic = requests.get(item, timeout=5)        except Exception:              print("当前图片无法下载")            continue         #  保存图片        string = 'D:/MyData/Python爬虫/图片/'+word+"/"+str(i)+".jpg"        fp = open(string, 'wb')        fp.write(pic.content)        fp.close()        i += 1

4、定义主函数

if __name__ == '__main__':  # 主程序    word = input("请输入想要下载的图片:")    #  根据搜索的关键字判断存放该类别的文件夹是否存在,不存在则创建    road = "D:/MyData/Python爬虫/图片下载器/" + word    if not os.path.exists(road):        os.mkdir(road)    #  根据输入的内容构建url列表，此处只访问了四页验证效果    urls = [        'https://image.baidu.com/search/index?tn=baiduimage&ps=1&ct=201326592&lm=-1&cl=2&nc=1&ie=utf-8&word='        + word '.format(str(i)) for i in range(0, 40, 10)]    for url in urls:        print(url)        downloadPic(url)    print("下载完成!")

看完了这篇文章，相信你对“如何使用Python爬虫实现自动下载图片”有了一定的了解，如果想了解更多相关知识，欢迎关注编程网行业资讯频道，感谢各位的阅读！

文章详情

如何使用Python爬虫实现自动下载图片

python的数据类型有哪些?

软考中级精品资料免费领

相关文章

猜你喜欢

如何使用Python爬虫实现自动下载图片

nodejs如何制作爬虫实现批量下载图片

如何使用Python爬虫爬取网站图片

如何使用Python网络爬虫实现起点小说下载

如何使用Python自动爬取图片并保存

使用python实现一个简单的图片爬虫

Android如何使用ViewFlipper实现图片上下自动轮播

Python如何实现邮件自动下载

如何使用python实现垂直爬虫系统

python中如何使用Scrapy实现定时爬虫

如何使用python爬虫实现最新12306抢票

如何使用python百行代码实现汉服圈图片爬取

python如何使用pywinauto驱动微信客户端实现公众号爬虫

如何使用Python实现图片压缩

Linux下如何使用Shell脚本实现ftp的自动上传下载

如何使用dataset和实现图片延时加载

如何使用Python实现图片自定义裁剪小工具

如何使用Python进行多线程并发下载图片

Python中如何使用win32api实现自动唤醒并截图

如何使用Python自动下载网站所有文件