python模块详解—thread

标签：pythonlib

2018-02-22

python提供两个模块支持多线程编程：thread和threading。

一、关于python多线程

Python解释器中可以同时运行多个线程，但是再任意时刻只能有一个线程在解释器运行。Python虚拟机的访问是由全局解锁器（GIL）控制的，由GIL保证同时只有一个线程的运行。

执行方式如下：

1.设置GIL

2.切换进一个进程执行

3.执行下面操作中的一个

　　a.运行指定数量的字节码（操作系统中是由时钟控制的）

　　b.线程主动出让控制权

4.把线程设置为睡眠状态，即切换出线程

5.解锁GIL

6.重复以上步骤

注意：1.调用外部代码时（C/C++扩展的内置函数），GIL保持锁定，因为外部代码没有Python字节码.

　　　2.I/O密集型的Python程序要比计算密集型的程序更好的利用多线程。

二、关于thread模块的多线程

示例1，当没用使用多线程时：

from time import sleep, ctime

def loop():
    print('start loop0 at:', ctime())
    sleep(4)
    print('loop 0 done at:', ctime())

def loop1():
    print('start loop1 at:', ctime())
    sleep(2)
    print('loop1 done at:', ctime())

def main():
    print('starting at:', ctime())
    loop()
    loop1()
    print('loop1 done at:', ctime())

if __name__ == '__main__':
    main()

输出结果为：

starting at: Mon Dec 19 22:17:42 2016
start loop0 at: Mon Dec 19 22:17:42 2016
loop 0 done at: Mon Dec 19 22:17:46 2016
start loop1 at: Mon Dec 19 22:17:46 2016
loop1 done at: Mon Dec 19 22:17:48 2016
loop1 done at: Mon Dec 19 22:17:48 2016

从结果可以看出loop0和loop按照顺序执行，耗时一共6s

thread模块的核心函数是：start_new_thread()

用法：_thread.start_new_thread(func, *arg, **kwargs)

示例2，当使用多线程时候：

import _thread
from time import sleep, ctime

def loop0():
    print('start loop0 at:', ctime())
    sleep(4)
    print('loop0 done at:', ctime())

def loop1():
    print('start loop1 at:', ctime())
    sleep(2)
    print('loop1 done at:', ctime())

def main():
    print('starting at:', ctime())
    _thread.start_new_thread(loop0, ())
    _thread.start_new_thread(loop1, ())
    sleep(6)
    print('all done at:', ctime())


if __name__ == '__main__':
    main()

结果为：

starting at: Mon Dec 19 22:27:57 2016
start loop0 at: Mon Dec 19 22:27:57 2016
start loop1 at: Mon Dec 19 22:27:57 2016
loop1 done at: Mon Dec 19 22:27:59 2016
loop0 done at: Mon Dec 19 22:28:01 2016
all done at: Mon Dec 19 22:28:03 2016

从结果可以看出，1.结果不是按照顺序输出的，loop0后结束

　　　　　　　　2.loop0和loop1的运行时间一共是4s，比没有使用多线程快了2s

　　　　　　　　3.sleep(6)是针对主线程的，预计loop0和loop1会在6s前执行完毕。

如果我们把主线程的执行时间设定为3s，那么结果就有意思了

starting at: Mon Dec 19 22:33:01 2016 start loop0 at: Mon Dec 19 22:33:01 2016 start loop1 at: Mon Dec 19 22:33:01 2016 loop1 done at: Mon Dec 19 22:33:03 2016 all done at: Mon Dec 19 22:33:04 2016

从这个结果哦可以看出，loop0没有执行完毕就被迫退出！！！原因是主线程的切出时间为3s，3s过后主线程继续执行，loop0即使没运行完毕，被迫退出！！

从这里也可以看出，对主线程执行sleep()来达到同步的目的不可靠，所以引入锁的概念。

用锁怎么实现多线程呢？对于每一个子线程，我们都给它加锁，在执行结束后再释放锁，这样主线程的工作就是检查没一个子线程的加锁状态，如果都已经释放锁了，那就表示子线程全部执行结束，就可以退出了。

示例3，使用锁的多线程：

#coding: utf-8  
import thread  
from time import sleep, ctime  
  
loops = [4,2]  
  
def  loop(nloop, nsec, lock):  
    print 'loop', nloop, 'start at:', ctime()  
    print 'loop %d 挂起%d秒' % (nloop, nsec)  
    sleep(nsec)  
    print 'loop', nloop, 'done at:', ctime()  
    lock.release()  #释放锁
  
def main():  
    print 'main thread start!'  
    locks = []  		#锁列表  
    nloops = range(len(loops))  
  
    for i in nloops:  
        lock = thread.allocate_lock()  
        lock.acquire()  	#锁上锁
        locks.append(lock)  #保存锁
  
    for i in nloops:  
        thread.start_new_thread(loop, (i, loops[i], locks[i]))  
  
    for i in nloops:  
        while locks[i].locked(): pass  #主线程检查每一个子线程的加锁状态,直到所有的锁都被释放继续主线程
  
    print 'all done at:', ctime()  
  
if __name__ == '__main__':  
    main()

实际上，我们不建议使用thread模块。首先，更高级别的threading模块更为先进，对线程的支持更为完善，而且使用thread模块里的属性有可能会与threading出现冲突。其次，低级别的thread模块的同步原语只有一个，而threading模块则有很多。

还有一个原因是，使用thread对于你的进程什么时候应该结束完全没有控制，当主线程结束时，所有的线程都会被强制结束掉，没有警告也不会有正常的清除工作。但是threading模块能确保重要的子线程退出后进程才退出。

不过如果想访问线程的底层结构，那就可能要使用thread模块了。

本文参考： https://www.cnblogs.com/fcyworld/p/6200968.html http://blog.csdn.net/whoami021/article/details/21265031

上篇： python模块详解—subprocess

下篇： python模块详解—threading

请修改_includes/comment.html添加评论代码。

python模块详解—thread

栏目分类

最新文章