最近在看Python的多线程,经常我们会听到老手说:“Python下多线程是鸡肋,推荐使用多进程!”,但是为什么这么说呢?        
        
要知其然,更要知其所以然。所以有了下面的深入研究:

首先强调背景:        
1、GIL是什么?
GIL的全称是Global Interpreter Lock(全局解释器锁),来源是python设计之初的考虑,为了数据安全所做的决定。        
2、每个CPU在同一时间只能执行一个线程(在单核CPU下的多线程其实都只是并发,不是并行,并发和并行从宏观上来讲都是同时处理多路请求的概念。但并发和并行又有区别,并行是指两个或者多个事件在同一时刻发生;而并发是指两个或多个事件在同一时间间隔内发生。)

在Python多线程下,每个线程的执行方式:
1、获取GIL
2、执行代码直到sleep或者是python虚拟机将其挂起。
3、释放GIL        
        
可见,某个线程想要执行,必须先拿到GIL,我们可以把GIL看作是“通行证”,并且在一个python进程中,GIL只有一个。拿不到通行证的线程,就不允许进入CPU执行。        
        
在Python2.x里,GIL的释放逻辑是当前线程遇见IO操作或者ticks计数达到100(ticks可以看作是Python自身的一个计数器,专门做用于GIL,每次释放后归零,这个计数可以通过
sys.setcheckinterval 来调整),进行释放。        
        
而每次释放GIL锁,线程进行锁竞争、切换线程,会消耗资源。并且由于GIL锁存在,python里一个进程永远只能同时执行一个线程(拿到GIL的线程才能执行),这就是为什么在多核CPU上,python的多线程效率并不高。        
                                
那么是不是python的多线程就完全没用了呢?        
在这里我们进行分类讨论:        
1、CPU密集型代码(各种循环处理、计数等等),在这种情况下,由于计算工作多,ticks计数很快就会达到阈值,然后触发GIL的释放与再竞争(多个线程来回切换当然是需要消耗资源的),所以python下的多线程对CPU密集型代码并不友好。

2、IO密集型代码(文件处理、网络爬虫等),多线程能够有效提升效率(单线程下有IO操作会进行IO等待,造成不必要的时间浪费,而开启多线程能在线程A等待时,自动切换到线程B,可以不浪费CPU的资源,从而能提升程序执行效率)。所以python的多线程对IO密集型代码比较友好。

而在python3.x中,GIL不使用ticks计数,改为使用计时器(执行时间达到阈值后,当前线程释放GIL),这样对CPU密集型程序更加友好,但依然没有解决GIL导致的同一时间只能执行一个线程的问题,所以效率依然不尽如人意。        
                                
请注意:多核多线程比单核多线程更差,原因是单核下多线程,每次释放GIL,唤醒的那个线程都能获取到GIL锁,所以能够无缝执行,但多核下,CPU0释放GIL后,其他CPU上的线程都会进行竞争,但GIL可能会马上又被CPU0拿到,导致其他几个CPU上被唤醒后的线程会醒着等待到切换时间后又进入待调度状态,这样会造成线程颠簸(thrashing),导致效率更低
        
                                
回到最开始的问题:经常我们会听到老手说:“python下想要充分利用多核CPU,就用多进程”,原因是什么呢?

原因是:每个进程有各自独立的GIL,互不干扰,这样就可以真正意义上的并行执行,所以在python中,多进程的执行效率优于多线程(仅仅针对多核CPU而言)。        
                                
所以在这里说结论:多核下,想做并行提升效率,比较通用的方法是使用多进程,能够有效提高执行效率

转载地址:点击

最新文章

  1. 设置Android Studio启动时可选最近打开过的工程
  2. [经验交流] Mesos-dns 和 Marathon-lb 简要使用方法
  3. Java设计模式--模板方法模式
  4. hdu 5106 组合数学+找规律
  5. Swift开发小技巧--识别选中照片中的二维码
  6. Swift开发小技巧--private访问修饰符报错的情况
  7. LeetCode 453 Minimum Moves to Equal Array Elements
  8. 关于centos6.5系统安装FTP服务和配置的方法
  9. JavaScript加密解密压缩工具
  10. WCF消息之XmlDictionaryWriter
  11. java中集合框架
  12. IOS系统配置FFMEPG
  13. NOI2006 郁闷的出纳员
  14. bzoj2733 永无乡 splay树的启发式合并
  15. 0008 合并K个排序链表
  16. 远程服务器设置Mysql的操作权限
  17. 【转】Python之正则表达式(re模块)
  18. 什么是restful api
  19. Rust 阴阳谜题,及纯基于代码的分析与化简
  20. day52 进程与守护进程

热门文章

  1. java面试第十三天
  2. linux sar命令详细说明相关参数
  3. HTTP Header具体解释
  4. 26、线性表(List)
  5. LoadRunner设置检查点的几种方法介绍
  6. cpuinfo详解
  7. ScriptManager.RegisterAsyncPostBackControl 方法
  8. Mac 通过活动监视器关闭卡死进程
  9. 有用的git片段
  10. 给定随机数列求第k大的数字