1程序执行流程
有类似脚本程序或编程经验的同学都知道,程序默认是自上而下,从左到右的按顺序执行,也叫串行执行;而多线程类似于并行执行,即A模块(函数)执行时B也执行不需要等A执行完再执行,这里请区别对待并发执行(同一时间执行);以上是简单概念性描述,
2什么是线程与进程?
线程是操作系统能够进行运算调度的最小单位。它被包含在进程之中,是进程中的实际运作单位。一条线程指的是进程中一个单一顺序的控制流,一个进程中可以并发多个线程,每条线程并行执行不同的任务
本节不讨论进程.以下主要说明线程的应用.进程,以及进程与线程,有兴趣可以参考这里
3python中的线程
以下引用廖雪峰博客Python的线程虽然是真正的线程,但解释器执行代码时,有一个GIL锁:Global Interpreter Lock,任何Python线程执行前,必须先获得GIL锁,然后,每执行100条字节码,解释器就自动释放GIL锁,让别的线程有机会执行。这个GIL全局锁实际上把所有线程的执行代码都给上了锁,所以,多线程在Python中只能交替执行,即使100个线程跑在100核CPU上,也只能用到1个核。后面通过示例说明这一点.
GIL是Python解释器设计的历史遗留问题,通常我们用的解释器是官方实现的CPython,要真正利用多核,除非重写一个不带GIL的解释器。
所以,在Python中,可以使用多线程,但不要指望能有效利用多核。如果一定要通过多线程利用多核,那只能通过C扩展来实现,不过这样就失去了Python简单易用的特点。
不过,也不用过于担心,Python虽然不能利用多线程实现多核任务,但可以通过多进程实现多核任务。多个Python进程有各自独立的GIL锁,互不影响.
以下示例均在python3.5.2中完成
1、默认执行流程
import time
def Foo():
sleep(2)
print("I am Foo.")
def Bar():
sleep(3)
print("I am Bar.")
if __name__ == "__main__":
start = time.time() #程序执行开始时间
Foo()
Bar()
end = time.time()
print("程序执行完使用 %s" %(end - start))
执行结果:
可以看出,程序从上而下的调用了Foo函数休眠2秒再执行Bar函数休眠3秒,最后执行完成共使用大约5秒多一点时间.这说明 Foo执行完才执行Bar.
2、线程执行
在讨论线程时,先问一个问题,自上而下的串行执行可以满足条件,为啥要多线程并行去执行?想像一个场景,我们在看一部电影时,要是默认串行执行,先放图像 再放电影中的声音,能接受吗?
def Movie_music(func):
print(threading.current_thread())
for i in range(2):
print("Begin listening to %s . %s" %(func,ctime()))
sleep(2)
print("End listening %s" % ctime())
def Movie_grap(func):
print(threading.current_thread())
for i in range(2):
print("Begin watching at the %s! %s" %(func,ctime()))
sleep(3)
print("End watching %s" %ctime())
threads= []
t1 = threading.Thread(target=Movie_music,args=(u"七里香.mtv",))
threads.append(t1)
t2 = threading.Thread(target=Movie_grap,args=(u"七里香.mtv",))
threads.append(t2)
if __name__ == "__main__":
for t in threads:
t.start()
t.join()
print("MTV播放结束: %s" %ctime())
执行结果:
所谓的多线程并不是同一时刻而是在很多的时间内进行了切换,而人的感观只要超过1/12之秒基本等同于同一时间,从上面的started 140049239336704 可以看出纳秒级别,时间上基本是同一秒,所以这首MTV中的音乐和图像 让我感觉 是同时发生的.这就是多线程的好处.如果换成串行播放,那一个五分钟的MTV可能就要10分钟播放完,先放声音或先放图像.
由于python解释器执行代码时,有一个GIL锁:Global Interpreter Lock的限制,多线程在Python中只能交替执行,即使100个线程跑在拥有100核CPU上,也只能用到1个核。其他核无法在多线程情况下使用.
计算密集型操作之串行
import time
def add(n):
sum = 0
for i in range(int(n)):
sum+=i
print(sum)
print("finshed.")
if __name__ == "__main__":
start = time.time()
add(100000000)
add(10000000)
end = time.time()
print(end - start)
运行结果:
计算密集型操作之多线程并行执行
def add(n):
sum = 0
for i in range(int(n)):
sum+=i
print(sum)
print("finshed.")
if __name__ == "__main__":
start = time.time()
t1 = threading.Thread(target=add,args=(100000000,)) #计算密集型
t1.start()
t2 = threading.Thread(target=add, args=(10000000,))
t2.start()
t1.join()
t2.join()
end = time.time()
print(end - start)
运行结果:
可以看出无论是串行执行还是多线程并行执行,计算结果一样,但花费的时间多线程并没有少于串行执行,反而略多,在python2.x上差距会更多,而上面的例子是IO密集型多线程明显要优于串行.
所以对于IO密集型情况使用多线程比较合适,而对于计算密集型由于python GIL的限制不能真正使用多核,无法提高cpu计算效率,不宜使用多线程.可以采用多进程多线程方式 .