文章详情

短信预约-IT技能 免费直播动态提醒

请输入下面的图形验证码

提交验证

短信预约提醒成功

一篇文章浅析Python自带的线程池和进程池

2024-12-03 10:15

关注

前言

大家好,我是星期八。

我们都知道,不管是Java,还是C++,还是Go,还是Python,都是有线程这个概念的。

但是我们知道,线程是不能随便创建的,就像每招一个员工一样,是有代价的,无限制招人肯定最后各种崩溃。

所以通常情况下,我们会引出线程池这个概念。

本质就是我就招了几个固定的员工,给他们派活,某一个人的活干完了再去任务中心领取新的活。

防止任务太多,一次性招太多工人,最后系统崩溃。

开心一刻

理想的多线程

[[385921]]

 

实际的多线程

 

 


 

[[385922]]

 

from concurrent.futures import ...

可能也是因为线程池这个东西用的越来越多了吧,从Python3.2+之后,就成了内置模块。

对的,直接就能使用,不需要pip进行安装什么的。

concurrent.futures下面主要有俩接口。

这里可没有什么所谓的异步池。

个人看法:虽然异步的性能很高,但是目前除了Go以外,其他实现的都不是太好,用法上面有些怪异,当然,你们可以说我菜,我承认。

线程池

示例代码

  1. import time 
  2. from concurrent.futures import ThreadPoolExecutor 
  3. import random 
  4.  
  5. # max_workers表示工人数量,也就是线程池里面的线程数量 
  6. pool = ThreadPoolExecutor(max_workers=10) 
  7. # 任务列表 
  8. task_list = ["任务1""任务2""任务3""任务4", ] 
  9.  
  10.  
  11. def handler(task_name): 
  12.     # 随机睡眠,模仿任务执行时间不确定性 
  13.     n = random.randrange(5) 
  14.     time.sleep(n) 
  15.     print(f"任务内容:{task_name}"
  16.  
  17.  
  18. if __name__ == '__main__'
  19.     # 遍历任务, 
  20.     for task in task_list: 
  21.         ""
  22.             交给函数处理,submit会将所有任务都提交到一个地方,不会阻塞 
  23.             然后线程池里面的每个线程会来取任务, 
  24.             比如:线程池有3个线程,但是有5个任务 
  25.             会先取走三个任务,每个线程去处理 
  26.             其中一个线程处理完自己的任务之后,会再来提交过的任务区再拿走一个任务 
  27.         ""
  28.         pool.submit(handler, task) 
  29.     print("main执行完毕"

执行结果

 

发现的问题

其实这个就是并发的,不要怀疑,但是你有没有发现个问题,main先执行,这说明啥?

这说明,我main跑完之后,是不管子线程的死活的。

那能不能设置一下,所有的子线程都执行完之后,main函数在执行完?

当然可以,需要一个参数即可。

  1. pool.shutdown() 

要完成上述的问题,我们需要一个参数,加上这个参数之后。

就可以让主线程等待所有子线程执行完之后,主线程再执行完。

示例代码

  1. ... 
  2. if __name__ == '__main__'
  3.     # 遍历任务, 
  4.     for task in task_list: 
  5.         ""
  6.             交给函数处理,submit会将所有任务都提交到一个地方 
  7.             然后线程池里面的每个线程会来取任务, 
  8.             比如:线程池有3个线程,但是有5个任务 
  9.             会先取走三个任务,每个线程去处理 
  10.             其中一个线程处理完自己的任务之后,会再来提交过的任务区再拿走一个任务 
  11.         ""
  12.         pool.submit(handler, task) 
  13.     pool.shutdown() 
  14.     print("main执行完毕"

主要就是13行的pool.shutdown()。

执行结果

 

这次结果就是我们想要的了,hhh!!!

  1. add_done_callback 

add_done_callback可以理解为是回调函数,线程执行完之后,会自动调用指定的回调函数。

并且能拿到线程执行函数的返回值。

有什么用,我也没用过,怪我才疏学浅叭。

示例代码

  1. import time 
  2. from concurrent.futures import ThreadPoolExecutor 
  3. import random 
  4. from concurrent.futures._base import Future 
  5.  
  6. # max_workers表示工人数量,也就是线程池里面的线程数量 
  7. pool = ThreadPoolExecutor(max_workers=10) 
  8. # 任务列表 
  9. task_list = ["任务1""任务2""任务3""任务4", ] 
  10.  
  11.  
  12. def handler(task_name): 
  13.     # 随机睡眠,模仿任务执行时间不确定性 
  14.     n = random.randrange(5) 
  15.     time.sleep(n) 
  16.     print(f"任务内容:{task_name}"
  17.     return f"任务内容:{task_name}" 
  18.  
  19.  
  20. def done(res: Future): 
  21.     print("done拿到的返回值:", res.result()) 
  22.  
  23.  
  24. if __name__ == '__main__'
  25.     # 遍历任务, 
  26.     for task in task_list: 
  27.         futrue = pool.submit(handler, task)  # type:Future 
  28.         futrue.add_done_callback(done) 
  29.     pool.shutdown() 
  30.     print("main执行完毕"

注意:第17,27,28行代码!

执行效果

 

我想,可能通常用在一些善后工作叭。

多进程方式

其实通过上述几个例子,我们基本是知道怎么使用上面这个线程池了。

但是都知道Python的线程,因为GIL(全局解释器锁)的原因,是不能并发到多个物理核心上的。

所以是IO密集型的,像爬虫,读写文件,使用线程池是ok的。

但是如果说我就是野,就是头铁,非要用Python做计算型应用,像图片压缩、视频流推送,那没办法,需要使用多进程池方式。

其实通过concurrent这个接口,可以很方便的创建进程池,只需要修改两个地方。

  1. ... 
  2. # 改成导入进程池方式 
  3. from concurrent.futures import ProcessPoolExecutor 
  4. ... 
  5. if __name__ == '__main__'
  6.     ... 
  7.     # 进程池方式 
  8.     pool = ProcessPoolExecutor(max_workers=10) 
  9.     ... 

只需要修改这俩地方即可,其他和上述用法一摸一样。

总结

本篇主要讲的是Python自带的线程池和进程池。

比较有特色的是,ThreadPoolExecutor,ProcessPoolExecutor的接口是一样的。

只需要修改导入的包就行。

concurrent的接口主要有pool.submit(),pool.shutdown(),futrue.add_done_callback()。

基本这几个都够自己用了。

本文转载自微信公众号「 Python爬虫与数据挖掘」,可以通过以下二维码关注。转载本文请联系 Python爬虫与数据挖掘公众号。

 

来源: Python爬虫与数据挖掘内容投诉

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

软考中级精品资料免费领

  • 历年真题答案解析
  • 备考技巧名师总结
  • 高频考点精准押题
  • 2024年上半年信息系统项目管理师第二批次真题及答案解析(完整版)

    难度     813人已做
    查看
  • 【考后总结】2024年5月26日信息系统项目管理师第2批次考情分析

    难度     354人已做
    查看
  • 【考后总结】2024年5月25日信息系统项目管理师第1批次考情分析

    难度     318人已做
    查看
  • 2024年上半年软考高项第一、二批次真题考点汇总(完整版)

    难度     435人已做
    查看
  • 2024年上半年系统架构设计师考试综合知识真题

    难度     224人已做
    查看

相关文章

发现更多好内容

猜你喜欢

AI推送时光机
位置:首页-资讯-后端开发
咦!没有更多了?去看看其它编程学习网 内容吧
首页课程
资料下载
问答资讯