提升CPU算力,在Python中使用多程序模型

語言: CN / TW / HK

作者|盧佳瑜,單位:中移物聯網有限公司

Labs 導讀

雲原生時代,應用對硬體資源的需求增長巨大,但單核CPU效能的提升存在瓶頸,摩爾定律已經失效。效能的提升更多側重於使用多核併發,而不是依賴單核效能。

俗話說再強的個人也敵不過訓練有素的團隊,便是這個道理。

但即便是對多核的利用,也分為多程序、多執行緒等不同的方案, 我們經常會聽到老手說:“python下多執行緒是雞肋,推薦使用多程序!”

為什麼這麼說呢?

要知其然,更要知其所以然。所以有了下面的深入研究。

Part 01 概述

目前算力網路發展中,經常出現平行計算的需求,而在python中,如果你使用多執行緒進行並行,那麼就會面臨一個尷尬的問題:一核幹活,其它圍觀。為什麼會出現這樣一個尷尬的問題呢?是因為python中GIL鎖的存在。

GIL是什麼?

GIL的全稱是Global Interpreter Lock(全域性直譯器鎖),來源是python設計之初的考慮,為了資料安全所做的決定,每個程序單獨擁有一把GIL鎖。

程序是什麼?

程序是程式的一次執行過程,是一個動態概念,是程式在執行過程中分配和管理資源的基本單位,

執行緒是什麼?

執行緒是CPU排程和分派的基本單位,它可與同屬一個程序的其他的執行緒共享程序所擁有的全部資源。

程序與執行緒的關係?

執行緒是程序的一部分,一個執行緒只能屬於一個程序,而一個程序可以有多個執行緒,但至少有一個執行緒。

為什麼用多程序和多執行緒?

現代CPU通常是多核CPU,如果業務程式碼是單程序/單執行緒,那麼在執行時實際上就只能使用一個CPU核心,其他核心只能浪費,為了提升程式碼執行效率,我們使用多程序or多執行緒,對多個CPU核心進行充分利用,以提升程式碼執行效率。

Part 02  執行原理

每個CPU核心在同一時間只能執行一個執行緒(在單核CPU下的多執行緒其實都只是併發,不是並行,併發和並行從巨集觀上來講都是同時處理多路請求的概念。但併發和並行又有區別,並行是指兩個或者多個事件在同一時刻發生;而併發是指兩個或多個事件在同一時間間隔內發生。)

在Python多執行緒下,每個執行緒的執行方式:

  • 獲取GIL
  • 執行程式碼直到sleep或者是python虛擬機器將其掛起。
  • 釋放GIL

可見,某個執行緒想要執行,必須先拿到GIL,我們可以把GIL看作是“通行證”,並且在一個python程序中,GIL只有一個。拿不到通行證的執行緒,就不允許進入CPU執行。

在python2.x裡,GIL的釋放邏輯是當前執行緒遇見IO操作或者ticks計數達到100(ticks可以看作是python自身的一個計數器,專門做用於GIL,每次釋放後歸零,這個計數可以通過 sys.setcheckinterval 來調整),進行釋放。

而每次釋放GIL鎖,執行緒進行鎖競爭、切換執行緒,會消耗資源。並且由於GIL鎖存在,python裡一個程序永遠只能同時執行一個執行緒(拿到GIL的執行緒才能執行),這就是為什麼在多核CPU上,python的多執行緒效率並不高。

Part 03  實際場景分析

在實際應用場景中,並不是所有業務都能將CPU跑滿,也就並不是所有業務都需要使用多程序,接下來我們分類進行討論:

1、CPU密集型業務(各種迴圈處理、計數、數學計算等),在這種情況下,ticks計數很快就會達到閾值,然後觸發GIL的釋放與再競爭(多個執行緒來回切換當然是需要消耗資源的),所以python下的多執行緒對CPU密集型程式碼並不友好。

2、IO密集型業務(檔案處理、網路爬蟲等),多執行緒能夠有效提升效率(單執行緒下有IO操作會進行IO等待,造成不必要的時間浪費,而開啟多執行緒能線上程A等待時,自動切換到執行緒B,可以不浪費CPU的資源,從而能提升程式執行效率)。所以python的多執行緒對IO密集型程式碼比較友好。

而在python3.x中,GIL不使用ticks計數,改為使用計時器(執行時間達到閾值後,當前執行緒釋放GIL),這樣對CPU密集型程式更加友好,但依然沒有解決GIL導致的同一時間只能執行一個執行緒的問題,所以效率依然不盡如人意。

Part 04  總結

回到最開始的問題:經常我們會聽到老手說:“python下想要充分利用多核CPU,就用多程序”,原因是什麼呢?

原因是每個程序有各自獨立的GIL,互不干擾,這樣就可以真正意義上的並行執行,所以在python中,多程序的執行效率優於多執行緒(僅僅針對多核CPU而言)。

所以我們能夠得出結論:多核下,想做並行提升效率,比較通用的方法是使用多程序,能夠有效提高執行效率。​