Unix/Linux 線程的實質
線 程
線程與進程的比較
概述:
進程是具有一定獨立功能的程序關于某個數據集合上的一次運行活動,進程是系統進行資源分配和調度的一個獨立單位.
線程是進程的一個實體,是CPU調度和分派的基本單位,它是比進程更小的能獨立運行的基本單位.線程自己基本上不擁有系統資源,只擁有一點在運行中必不可少的資源(如程序計數器,一組寄存器和棧),但是它可與同屬一個進程的其他的線程共享進程所擁有的全部資源.
一個線程可以創建和撤銷另一個線程;同一個進程中的多個線程之間可以并發執行.
相對進程而言,線程是一個更加接近于執行體的概念,它可以與同進程中的其他線程共享數據,但擁有自己的棧空間,擁有獨立的執行序列。
在串行程序基礎上引入線程和進程是為了提高程序的并發度,從而提高程序運行效率和響應時間。
區別:
進 程和線程的主要差別在于它們是不同的操作系統資源管理方式。進程有獨立的地址空間,一個進程崩潰后,在保護模式下不會對其它進程產生影響,而線程只是一個 進程中的不同執行路徑。線程有自己的堆棧和局部變量,但線程之間沒有單獨的地址空間,一個線程死掉就等于整個進程死掉,所以多進程的程序要比多線程的程序 健壯,但在進程切換時,耗費資源較大,效率要差一些。但對于一些要求同時進行并且又要共享某些變量的并發操作,只能用線程,不能用進程。
1) 簡而言之,一個程序至少有一個進程,一個進程至少有一個線程.
2) 線程的劃分尺度小于進程,使得多線程程序的并發性高。
3) 另外,進程在執行過程中擁有獨立的內存單元,而多個線程共享內存,從而極大地提高了程序的運行效率。
4) 線程在執行過程中與進程還是有區別的。每個獨立的線程有一個程序運行的入口、順序執行序列和程序的出口。但是線程不能夠獨立執行,必須依存在應用程序中,由應用程序提供多個線程執行控制。
5) 從邏輯角度來看,多線程的意義在于一個應用程序中,有多個執行部分可以同時執行。但操作系統并沒有將多個線程看做多個獨立的應用,來實現進程的調度和管理以及資源分配。這就是進程和線程的重要區別。
優缺點:
線程和進程在使用上各有優缺點:線程執行開銷小,但不利于資源的管理和保護;而進程正相反。同時,線程適合于在SMP機器上運行,而進程則可以跨機器遷移。
多進程,多線程
概述:
進程就是一個程序運行的時候被CPU抽象出來的,一個程序運行后被抽象為一個進程,但是線程是從一個進程里面分割出來的,由于CPU處理進程的時候是采用時間片輪轉的方式,所以要把一個大個進程給分割成多個線程,例如:網際快車中文件分成100部分 10個線程 文件就被分成了10份來同時下載 1-10 占一個線程 11-20占一個線程,依次類推,線程越多,文件就被分的越多,同時下載 當然速度也就越快
進程是程序在計算機上的一次執行活動。當 你運行一個程序,你就啟動了一個進程。顯然,程序只是一組指令的有序集合,它本身沒有任何運行的含義,只是一個靜態實體。而進程則不同,它是程序在某個數 據集上的執行,是一個動態實體。它因創建而產生,因調度而運行,因等待資源或事件而被處于等待狀態,因完成任務而被撤消,反映了一個程序在一定的數據集上 運行的全部動態過程。進程是操作系統分配資源的單位。在Windows下,進程又被細化為線程,也就是一個進程下有多個能獨立運行的更小的單位。線程(Thread)是進程的一個實體,是CPU調度和分派的基本單位。線程不能夠獨立執行,必須依存在應用程序中,由應用程序提供多個線程執行控制。
線程和進程的關系是:線程是屬于進程的,線程運行在進程空間內,同一進程所產生的線程共享同一內存空間,當進程退出時該進程所產生的線程都會被強制退出并清除。線程可與屬于同一進程的其它線程共享進程所擁有的全部資源,但是其本身基本上不擁有系統資源,只擁有一點在運行中必不可少的信息(如程序計數器、一組寄存器和棧)。
在同一個時間里,同一個計算機系統中如果允許兩個或兩個以上的進程處于運行狀態,這便是多任務。現代的操作系統幾乎都是多任務操作系統,能夠同時管理多個進程的運行。 多任務帶來的好處是明顯的,比如你可以邊聽mp3邊上網,與此同時甚至可以將下載的文檔打印出來,而這些任務之間絲毫不會相互干擾。那么這里就涉及到并行的問題,俗話說,一心不能二用,這對計算機也一樣,原則上一個CPU只能分配給一個進程,以便運行這個進程。我們通常使用的計算機中只有一個CPU,也就是說只有一顆心,要讓它一心多用,同時運行多個進程,就必須使用并發技術。實現并發技術相當復雜,最容易理解的是“時間片輪轉進程調度算法”,它的思想簡單介紹如下:在操作系統的管理下,所有正在運行的進程輪流使用CPU,每個進程允許占用CPU的時間非常短(比如10毫秒),這樣用戶根本感覺不出來CPU是在輪流為多個進程服務,就好象所有的進程都在不間斷地運行一樣。但實際上在任何一個時間內有且僅有一個進程占有CPU。
如果一臺計算機有多個CPU,情況就不同了,如果進程數小于CPU數,則不同的進程可以分配給不同的CPU來運行,這樣,多個進程就是真正同時運行的,這便是并行。但如果進程數大于CPU數,則仍然需要使用并發技術。
在Linux中,進行CPU分配是以線程為單位的,一個進程可能由多個線程組成,這時情況更加復雜,但簡單地說,有如下關系:
總線程數<= CPU數量:并行運行
總線程數> CPU數量:并發運行
并行運行的效率顯然高于并發運行,所以在多CPU的計算機中,多任務的效率比較高。但是,如果在多CPU計算機中只運行一個進程(線程),就不能發揮多CPU的優勢。
多任務操作系統(如Windows)的基本原理是:操作系統將CPU的時間片分配給多個線程,每個線程在操作系統指定的時間片內完成(注意,這里的多個線程是分屬于不同進程的).操作系統不斷的從一個線程的執行切換到另一個線程的執行,如此往復,宏觀上看來,就好像是多個線程在一起執行.由于這多個線程分屬于不同的進程,因此在我們看來,就好像是多個進程在同時執行,這樣就實現了多任務.
分類
根據進程與線程的設置,操作系統大致分為如下類型:
(1) 單進程、單線程,MS-DOS大致是這種操作系統;
(2) 多進程、單線程,多數UNIX(及類UNIX的LINUX)是這種操作系統;
(3) 多進程、多線程,Win32(Windows NT/2000/XP等)、Solaris 2.x和OS/2都是這種操作系統;
(4) 單進程、多線程,VxWorks是這種操作系統。
引入線程帶來的主要好處
(1) 在進程內創建、終止線程比創建、終止進程要快;
(2) 同一進程內的線程間切換比進程間的切換要快,尤其是用戶級線程間的切換。
===================================================================
用戶級線程 (UserLevel Threads — ULT)
內核級線程 (Kernel Supported threads — KST)
- 內核級線程KST </ul>
- 用戶級線程 ULT </ul>
- 混合方式 </ul>
對于一切的進程,無論是系統進程還是用戶進程,進程的創建和撤銷,以及I/O操作都是利用系統調用進入到內核,由內核處理完成,所以說在KST下, 所有進程都是在操作系統內核的支持下運行的,是與內核緊密相關的。內核空間實現還為每個內核支持線程設置了一個線程控制快,內核是根據該控制快而感知某個 線程是否存在,并加以控制。
優點:
1. 在多處理器上,內核可以調用同一進程中的多個線程同時工作;
2. 如果一個進程中的一個線程阻塞了,其他線程仍然可以得到運行;
缺點:對于用戶線程的切換代價太大,在同一個線程中,從一個線程切換到另一個線程時,需要從用戶態,進入到內核態并且由內核切換。因為線程調度和管理在內核實現。
內核級線程駐留在內核空間,它們是內核對象。有了內核線程,每個用戶線程被映射或綁定到一個內核線程。用戶線程在其生命期內都會綁定到該內核線程。一旦用 戶線程終止,兩個線程都將離開系統。這被稱作"一對一"線程映射,如圖所示。操作系統調度器管理、調度并分派這些線程。運行時庫為每個用戶級 線程請求一個內核級線程。操作系統的內存管理和調度子系統必須要考慮到數量巨大的用戶級線程。您必須了解每個進程允許的線程的最大數目是多少。操作系統為 每個線程創建上下文。進程的每個線程在資源可用時都可以被指派到處理器內核。
用戶進程ULT僅存在于用戶空間中。對于這種線程的創建、撤銷、線程之間的同步和通信等功能,都無需系統調用來實現。對于同一進程的線程之間切換仍然是不需要內核支持的。所以,內核也會是完全不會知道用戶級線程的存在。
但是有一點必須注意:設置了用戶級線程的系統,其調度荏苒是以進程為單位進行的哦。
優點:
1. 線程切換不需要轉換到內核空間,節省了寶貴的內核空間;
2. 調度算法可以是進程專用,由用戶程序進行指定;
3. 用戶級線程實現和操作系統無關;
缺點:
1. 系統調用阻塞,同一進程中一個線程阻塞和整個進程都阻塞了。
2. 一個進程只能在一個cpu上獲得執行。
用戶級線程駐留在用戶空間或模式。運行時庫管理這些線程,它也位于用戶空間。它們對于操作系統是不可見的,因此無法被調度到處理器內核。每個線程并不具有 自身的線程上下文。因此,就線程的同時執行而言,任意給定時刻每個進程只能夠有一個線程在運行,而且只有一個處理器內核會被分配給該進程。對于一個進程, 可能有成千上萬個用戶級線程,但是它們對系統資源沒有影響。運行時庫調度并分派這些線程。如同在圖中看到的那樣,庫調度器從進程的多個線程中 選擇一個線程,然后該線程和該進程允許的一個內核線程關聯起來。內核線程將被操作系統調度器指派到處理器內核。用戶級線程是一種"多對一"的線程映射。
在很多的操作系統中ULT和KLT進行組合,整合了ULT和KLT的優點。
混合線程實現是用戶線程和內核線程的交叉,使得庫和操作系統都可以管理線程。用戶線程由運行時庫調度器管理,內核線程由操作系統調度器管理。在這種實現 中,進程有著自己的內核線程池。可運行的用戶線程由運行時庫分派并標記為準備好執行的可用線程。操作系統選擇用戶線程并將它映射到線程池中的可用內核線 程。多個用戶線程可以分配給相同的內核線程。在圖中,進程A在它的線程池中有兩個內核線程,而進程B有3個內核線程。進程A的用戶線程2和3 被映射到內核線程(2)。進程B有5個線程,用戶線程1和2映射到同一個內核線程(3),用戶線程4和5映射到內核同一個內核線程(5)。當創建新的用戶 線程時,只需要簡單地將它映射到線程池中現有的一個內核線程即可。這種實現使用了"多對多"線程映射。該方法中盡量使用多對一映射。很多用戶線程將會映射 到一個內核線程,就像您在前面的示例中所看到的。因此,對內核線程的請求將會少于用戶線程的數目。
內核線程池不會被銷毀和重建,這些線程總是位于系統中。它們會在必要時分配給不同的用戶級線程,而不是當創建新的用戶級線程時就創建一個新的內核線程,而 純內核級線程被創建時,就會創建一個新的內核線程。只對池中的每個線程創建上下文。有了內核線程和混合線程,操作系統分配一組處理器內核,進程的線程可以 在這些處理器內核之上運行。線程只能在為它們所屬線程指派的處理器內核上運行。
線程上下文
操 作系統管理很多進程的執行。有些進程是來自各種程序、系統和應用程序的單獨進程,而某些進程來自被分解為很多進程的應用或程序。當一個進程從內核 中移出,另一個進程成為活動的,這些進程之間便發生了上下文切換。操作系統必須記錄重啟進程和啟動新進程使之活動所需要的所有信息。這些信息被稱作上下 文,它描述了進程的現有狀態。當進程成為活動的,它可以繼續從被搶占的位置開始執行。進程的上下文信息包括:
進程id
指向可執行文件的指針
棧
靜態和動態分配的變量的內存
處理器寄存器
進 程上下文的多數信息都與地址空間的描述有關。進程的上下文使用很多系統資源,而且會花費一些時間來從一個進程的上下文切換到另一個進程的上下文。 線程也有上下文。當線程被搶占時,就會發生線程之間的上下文切換。如果線程屬于相同的進程,它 們共享相同的地址空間,因為線程包含在它們所屬于的進程的地址空間內。這樣,進程需要恢復的多數信息對于線程而言是不需要的。盡管進程和它的線程共享了很 多內容,但最為重要的是其地址空間和資源,有些信息對于線程而言是本地且唯一的,而線程的其他方面包含在進程的各個段的內部。
上下文內容 </td> |
進 程 </td> |
線 程 </td> </tr> | |||||||
指向可執行文件的指針 </td> |
x </td> |
</td> </tr> | |||||||
棧 </td> |
x </td> |
x </td> </tr> | |||||||
內存(數據段和堆) </td> |
x </td> |
</td> </tr> | |||||||
狀態 </td> |
x </td> |
x </td> </tr> | |||||||
優先級 </td> |
x </td> |
x </td> </tr> | |||||||
程序I/O的狀態 </td> |
x </td> |
</td> </tr> | |||||||
授予權限 </td> |
x </td> |
</td> </tr> | |||||||
調度信息 </td> |
x </td> |
</td> </tr> | |||||||
審計信息 </td> |
x </td> |
</td> </tr> | |||||||
有關資源的信息 ● 文件描述符 ● 讀/寫指針 </td> |
x </td> |
</td> </tr> | |||||||
有關事件和信號的信息 </td> |
x </td> |
</td> </tr> | |||||||
寄存器組 ● 棧指針 ● 指令計數器 ● 諸如此類 </td> |
x </td> |
x </td> </tr> </tbody> </table>
本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!
相關經驗相關資訊 |