大哥,這是併發不是並行,Are You Ok?

語言: CN / TW / HK

theme: channing-cyan

本文內容整理自 博學谷狂野架構師

開啟掘金成長之旅!這是我參與「掘金日新計劃 · 2 月更文挑戰」的第 4 天,點選檢視活動詳情

多執行緒概述

file

基礎概念

程序和執行緒

程序是程式執行資源分配的最小單位

​ 程序是作業系統進行資源分配的最小單位,其中資源包括:CPU、記憶體空間、磁碟IO等,同一程序中的多條執行緒共享該程序中的全部系統資源,而程序和程序之間是相互獨立的。程序是具有一定獨立功能的程式關於某個資料集合上的一次執行活動,程序是系統進行資源分配和排程的一個獨立單位。

​ 程序是程式在計算機上的一次執行活動。當你執行一個程式,你就啟動了一個程序。顯然,程式是死的、靜態的,程序是活的、動態的。程序可以分為系統程序和使用者程序。凡是用於完成作業系統的各種功能的程序就是系統程序,它們就是處於執行狀態下的作業系統本身,使用者程序就是所有由你啟動的程序。

執行緒是CPU排程的最小單位,必須依賴於程序而存在

​ 執行緒是程序的一個實體,是CPU排程和分派的基本單位,它是比程序更小的、能獨立執行的基本單位。執行緒自己基本上不擁有系統資源,只擁有一點在執行中必不可少的資源(如程式計數器,一組暫存器和棧),但是它可與同屬一個程序的其他的執行緒共享程序所擁有的全部資源。

執行緒無處不在

​ 任何一個程式都必須要建立執行緒,特別是Java不管任何程式都必須啟動一個main函式的主執行緒; Java Web開發裡面的定時任務、定時器、JSP和 Servlet、非同步訊息處理機制,遠端訪問介面RM等,任何一個監聽事件, onclick的觸發事件等都離不開執行緒和併發的知識。

CPU核心數和執行緒數的關係

多核心:也指單晶片多處理器( Chip Multiprocessors,簡稱CMP),CMP是由美國斯坦福大學提出的,其思想是將大規模並行處理器中的SMP(對稱多處理器)整合到同一晶片內,各個處理器並行執行不同的程序。這種依靠多個CPU同時並行地執行程式是實現超高速計算的一個重要方向,稱為並行處理

多執行緒: Simultaneous Multithreading.簡稱SMT.讓同一個處理器上的多個執行緒同步執行並共享處理器的執行資源。

核心數、執行緒數:目前主流CPU都是多核的。增加核心數目就是為了增加執行緒數,因為作業系統是通過執行緒來執行任務的,一般情況下它們是1:1對應關係,也就是說四核CPU一般擁有四個執行緒。但 Intel引入超執行緒技術後,使核心數與執行緒數形成1:2的關係

file

CPU時間片輪轉機制

file

為什麼感受不到CPU執行緒數的限制

我們平時在開發的時候,感覺並沒有受cpu核心數的限制,想啟動執行緒就啟動執行緒,哪怕是在單核CPU上,為什麼?這是因為作業系統提供了一種CPU時間片輪轉機制。

​ 時間片輪轉排程是一種最古老、最簡單、最公平且使用最廣的演算法,又稱RR排程。每個程序被分配一個時間段,稱作它的時間片,即該程序允許執行的時間。

什麼是CPU輪轉機制

百度百科對CPU時間片輪轉機制原理解釋如下:

​ 如果在時間片結束時程序還在執行,則CPU將被剝奪並分配給另一個程序。如果程序在時間片結束前阻塞或結來,則CPU當即進行切換。排程程式所要做的就是維護一張就緒程序列表,當程序用完它的時間片後,它被移到佇列的末尾

時間片長度

​ 時間片輪轉排程中唯一有趣的一點是時間片的長度。從一個程序切換到另一個程序是需要定時間的,包括儲存和裝入暫存器值及記憶體映像,更新各種表格和佇列等。假如程序切( processwitch),有時稱為上下文切換( context switch),需要5ms,再假設時間片設為20ms,則在做完20ms有用的工作之後,CPU將花費5ms來進行程序切換。CPU時間的20%被浪費在了管理開銷上了。

​ 為了提高CPU效率,我們可以將時間片設為5000ms。這時浪費的時間只有0.1%。但考慮到在一個分時系統中,如果有10個互動使用者幾乎同時按下回車鍵,將發生什麼情況?假設所有其他程序都用足它們的時間片的話,最後一個不幸的程序不得不等待5s才獲得執行機會。多數使用者無法忍受一條簡短命令要5才能做出響應,同樣的問題在一臺支援多道程式的個人計算機上也會發

​ 結論可以歸結如下:時間片設得太短會導致過多的程序切換,降低了CPU效率:而設得太長又可能引起對短的互動請求的響應變差。將時間片設為100ms通常是一個比較合理的折衷。

​ 在CPU宕機的情況下,其實大家不難發現當執行一個程式的時候把CPU給弄到了100%再不重啟電腦的情況下,其實我們還是有機會把它KILL掉的,我想也正是因為這種機制的緣故。

澄清並行和併發

​ 我們舉個例子,如果有條高速公路A上面並排有8條車道,那麼最大的並行車輛就是8輛此條高速公路A同時並排行走的車輛小於等於8輛的時候,車輛就可以並行執行。CPU也是這個原理,一個CPU相當於一個高速公路A,核心數或者執行緒數就相當於並排可以通行的車道;而多個CPU就相當於並排有多條高速公路,而每個高速公路並排有多個車道。

當談論併發的時候一定要加個單位時間,也就是說單位時間內併發量是多少?離開了單位時間其實是沒有意義的。

​ 俗話說,一心不能二用,這對計算機也一樣,原則上一個CPU只能分配給一個程序,以便執行這個程序。我們通常使用的計算機中只有一個CPU,也就是說只有一顆心,要讓它一心多用同時執行多個程序,就必須使用併發技術。實現併發技術相當複雜,最容易理解的是“時間片輪轉程序排程演算法”。

綜合來說:

併發:指應用能夠交替執行不同的任務,比如單CPU核心下執行多執行緒並非是同時執行多個任務,如果你開兩個執行緒執行,就是在你幾乎不可能察覺到的速度不斷去切換這兩個任務,已達到"同時執行效果",其實並不是的,只是計算機的速度太快,我們無法察覺到而已.

並行:指應用能夠同時執行不同的任務,例:吃飯的時候可以邊吃飯邊打電話,這兩件事情可以同時執行

兩者區別:一個是交替執行,一個是同時執行.

file 感覺上是同時發生的,但是微觀上還是有區別的,並行是同意時刻發生的,併發是同一時刻交替執行

file

高併發的意義

由於多核多執行緒的CPU的誕生,多執行緒、高併發的程式設計越來越受重視和關注。多執行緒可以給程式帶來如下好處。

1. 充分利用CPU的資源

​ 從上面的CPU的介紹,可以看的出來,現在市面上沒有CPU的核心不使用多執行緒併發機制的,特別是伺服器還不止一個CPU,如果還是使用單執行緒的技術做思路,明顯就out了。因為程式的基本排程單元是執行緒,並且一個執行緒也只能在一個CPU的一個核的一個執行緒跑,如果你是個i3的CPU的話,最差也是雙核心4執行緒的運算能力:如果是一個執行緒的程式的話,那是要浪費3/4的CPU效能:如果設計一個多執行緒的程式的話,那它就可以同時在多個CPU的多個核的多個執行緒上跑,可以充分地利用CPU,減少CPU的空閒時間,發揮它的運算能力,提高併發量。

​ 就像我們平時坐地鐵一樣,很多人坐長線地鐵的時候都在認真看書,而不是為了坐地鐵而坐地鐵,到家了再去看書,這樣你的時間就相當於有了兩倍。這就是為什麼有些人時間很充裕,而有些人老是說沒時間的一個原因,工作也是這樣,有的時候可以併發地去做幾件事情,充分利用我們的時間,CPU也是一樣,也要充分利用。

2. 加快響應使用者的時間

​ 比如我們經常用的迅雷下載,都喜歡多開幾個執行緒去下載,誰都不願意用一個執行緒去下載,為什麼呢?答案很簡單,就是多個執行緒下載快啊。

​ 我們在做程式開發的時候更應該如此,特別是我們做網際網路專案,網頁的響應時間若提升1s,如果流量大的話,就能增加不少轉換量。做過高效能web前端調優的都知道,要將靜態資源地址用兩三個子域名去載入,為什麼?因為每多一個子域名,瀏覽器在載入你的頁面的時候就會多開幾個執行緒去載入你的頁面資源,提升網站的響應速度。多執行緒,高併發真的是無處不在。

3. 可以使你的程式碼模組化,非同步化,簡單化

​ 例如我們實現電商系統,下訂單和給使用者傳送簡訊、郵件就可以進行拆分,將給使用者傳送簡訊、郵件這兩個步驟獨立為單獨的模組,並交給其他執行緒去執行。這樣既增加了非同步的操作,提升了系統性能,又使程式模組化,清晰化和簡單化。

多執行緒應用開發的好處還有很多,大家在日後的程式碼編寫過程中可以慢慢體會它的魅力。

多執行緒程式需要注意事項

1. 執行緒之間的安全性

​ 從前面的章節中我們都知道,在同一個程序裡面的多執行緒是資源共享的,也就是都可以訪問同一個記憶體地址當中的一個變數。例如:若每個執行緒中對全域性變數、靜態變數只有讀操作,而無寫操作,一般來說,這個全域性變數是執行緒安全的:若有多個執行緒同時執行寫操作,一般都需要考慮執行緒同步,否則就可能影響執行緒安全。

2. 執行緒之間的死鎖

​ 為了解決執行緒之間的安全性引入了Java的鎖機制,而一不小心就會產生Java執行緒死鎖的多執行緒問題,因為不同的執行緒都在等待那些根本不可能被釋放的鎖,從而導致所有的工作都無法完成。假設有兩個執行緒,分別代表兩個飢餓的人,他們必須共享刀叉並輪流吃飯。他們都需要獲得兩個鎖:共享刀和共享叉的鎖。

假如執行緒A獲得了刀,而執行緒B獲得了叉。執行緒A就會進入阻塞狀態來等待獲得叉,而執行緒B則阻塞來等待執行緒A所擁有的刀。這只是人為設計的例子,但儘管在執行時很難探測到,這類情況卻時常發生

3. 執行緒太多了會將伺服器資源耗盡形成宕機當機

​ 執行緒數太多有可能造成系統建立大量執行緒而導致消耗完系統記憶體以及CPU的“過渡切換”,造成系統的宕機,那麼我們該如何解決這類問題呢?

​ 某些系統資源是有限的,如檔案描述符。多執行緒程式可能耗盡資源,因為每個執行緒都可能希望有一個這樣的資源。如果執行緒數相當大,或者某個資源的侯選執行緒數遠遠超過了可用的資源數則最好使用資源池。一個最好的示例是資料庫連線池。只要執行緒需要使用一個數據庫連線,它就從池中取出一個,使用以後再將它返回池中。資源池也稱為資源庫。

多執行緒應用開發的注意事項很多,希望大家在日後的工作中可以慢慢體會它的危險所在。

本文由傳智教育博學谷狂野架構師教研團隊釋出。

如果本文對您有幫助,歡迎關注點贊;如果您有任何建議也可留言評論私信,您的支援是我堅持創作的動力。

轉載請註明出處!