Program、Process、Thread 傻傻分不清楚?本文介紹作業系統 Process 的概念。
Program vs. Process vs. Thread
Program
靜態的指令集 (File),例如:秘密小文件、週記、Hello World 程式等等。
Process
正在執行的指令集,有被載入主記憶體的 Program (Executable File)。
首先會先被傳入 Ready Queue(準備變成 Process 的動作),再來被載入主記憶體、載入 CPU 裡面正在執行。
簡而言之,就是正在執行的程式。
Thread
Process 的小分身,寄生在 Process 裡面,共用 Process 的記憶體,而且自己也擁有一個獨立的空間 (Stack) 可以做自己的事情。
例如:Word 拼音檢查的紅線。
如果拼音檢查也寫成 Process 的話,Word 的 Process 會先被關掉才能做拼音檢查。
小結
一定要有 Process 才會有 Thread;一個 Process 有好多個 Thread(看看我們常用的 Chrome 就知道)。
Process 組成架構
Text:一個 C 語言的程式
Data:全域變數
Heap:動態記憶體配置
Stack:放一些暫存的資料
I/O-bound process
平常的程式通常是 I/O 與 CPU 這兩個 bound process 結合起來的。
- I/O-bound process
- 通常我們較多使用 I/O 的東西使用
- 例如:Word processor
- CPU bound process
- 需要 CPU 不斷運算的程式
- 例如:算圓周率
Process 狀態及流程
New:新增一個 Process 出來
Ready:程式載入記憶體
Running:正在跑,Process 正在運算
Waiting:有中斷,進入等待
Terminated:此 Process 結束
Process Control Block, PCB
像是 ER 圖用資料庫存起來,或者像是排球紀錄表,而 OS 管理 Process 所使用的紀錄表,就叫做 PCB。
PCB 有以下幾個重要資訊:
- Process State:上面提到的那五個狀態,像是 new 與 ready
- Process Number:即 Process 的 ID
- Process Counter:記錄下一個 Process 的位址
- CPU Registers:紀錄一些中斷資訊
排程器
短程排程器 (Short-Term Scheduler)
不管哪個 OS 都一定有。
因為 CPU 暫存器大小有限,所以會挑選哪些 Process 最適合現在做、最有效率。
中程排程器 (Median-Term Scheduler)
類似資源短程排程。
在 Process 載入 CPU 之前,已經通過了長程、短程排程器的篩選,使 CPU 以最有效率的排程完成 Process 們。但是排程的 Process 愈多,Content Switch 轉換的次數就愈多,代表 Degree of Multi-programming 愈高,也就是 CPU 大部分的時間都在做 Content Switch。
因此,中程排程器就會在 Degree of Multi-programming 過高的時候,挑選幾個 Process 回到 Ready Queue。例如:Content Switch 轉換太頻繁時,100 個工作 1000 秒會完成,其中 CPU 花 500 秒在轉換工作,這對 CPU 來講很沒效率!
這時候就需要中程排程器,把幾個 Process 拉回 Ready Queue。以下三個例子都是發生中斷,而使得 Process 跳回 Ready Queue:
- 需要鍵盤或滑鼠,產生 I/O Request、中斷,先放在 I/O Queue 裡面再逐一使用
- 某一個 Process 使用時間到了,它會先跳回 Ready Queue,再重新分配
- OS 發現其他東西有中斷,做 Context Switch
長程排程器 (Long-Term Scheduler)
不一定每個 OS 都有。
看哪個 Process 適合現在載入主記憶體,將它放入 Ready Queue。
Context Switch
轉換 CPU 至另一個行程。先儲存舊行程的狀態,再載入新行程的狀態。例如:A 發生中斷,要把 A Process 的 PCB 表轉換成 B Process 的 PCB 表,才能繼續執行。
有點類似交接班表。
花的時間的多寡取決於硬體的快慢。
Process 的溝通方式
- 獨立的 Process (Independent Process)
- 獨立不受其他 Process 影響
- 需要溝通的 Process (Cooperating Process)
- 例如:「洗手」這個 Process 必須搭配「開水龍頭」這個 Process 才能達成洗手的動作
- 用 Inter-process Communication (IPC) 溝通
Inter-process Communication (IPC)
- 共享記憶體 (Shared Memory):Process 之間共用一個記憶空間,你的資料就是我的資料,我的資料就是你的資料。
- Message Passing (Block send/receive, rendezvous)
- 兩個 Process 中間會多一個 Process Queue(類似郵箱的功能)暫存,需要的 Process 可以從這裡拿取資料
- 隔開來多一個 Queue 去傳送
- Blocking send:確保一定寄出
- Blocking receive:確保一定收到
- Rendezvous:兩者兼具,確保一定會寄出去,也確保一定會收到
Client-Server 之間 Process 的傳遞
Socket
IP 位址 (IP Address) + 服務口 (Port) = A Socket
- 3 種 Socket 方式:
- Connection-Oriented (TCP):確保兩邊都活著,規範嚴謹、動作多、檢查需要時間
- Connectionless (UDP):串流影音、通常需要大量傳遞的
- Multicast Socket(類似廣播):傳播出去讓很多主機連接
- 使用 Socket 是比較底層、有效率的,通常傳一些位元、字串等比較難懂的東西,會一個一個傳
Remote Procedure Call, RPC
運用在應用層(最上層)的服務。
把需要的東西(服務)包起來傳出去給其他主機,就像是一台主機本身有另一台主機的東西(服務),最常見的例子像是分散式網路服務、遠端管理、NFS 檔案分享等等。
RPC 傳遞中的一些小問題
XDR 轉換
- 不同主機,定義存取(儲存記憶體)的方式不同
- Big endian:數字最大的東西放在記憶體位置最大的地方
- 例如:1 儲存在 A;5 儲存在 E
- Small endian:數字最小的東西放在記憶體位置最大的地方
- 例如:1 儲存在 E;5 儲存在 A
- 造成雙方聽不懂、雞同鴨講的問題,因此需要一位翻譯、代理人,也就是 Stub
Stub (proxy)
主要就是做 XDR 轉換 (External Data Representation),也就是轉換 Big/Small 的部分。
XDR 的意思是一種通用的格式,Big/Small Endian 的資料經過 Stub 都會轉換成這種大家都看得懂的格式。
Stub 轉換成 XDR 送出去的動作是 Marshalling,即翻譯好丟出去,例如:中翻英,再用英文講出去的這個動作)。而 Stub 收到 XDR 格式的資料就會依自身主機需求,轉換成 Big/Small Endian (Unmarshalling),例如:聽到英文,轉成中文再傳給 Server 聽(解譯)。
過去 big endian 比較常見,但現在的作業系統 big 跟 small 兩種都會,比較少出問題了。
RPC 在 TCP/IP 傳輸時可能漏掉東西,或是多傳了幾次
改善的方式與技術:
- Exactly once(僅處理一次):一定要剛好傳一次就到
- 資料不能重複,要求 100%,做法較難
- 使用 match maker,類似三方交握的方法
- At most once(最多處理一次):最多傳一次就到
- 一直傳,使用時間戳記 (Timestamp) 紀錄,發現時間戳記不對就丟掉,因此資料可能會丟失
- 大部分都是這個方式,因為比較簡單
Pipe
仿照硬體 Pipeline 的行為,在 Process 之間開一條或數條線來放資料。
電腦如果要一次做很多工作,會先把動作切成碎片,每個工作輪流做一些、快速切換,讓人看起來是很多工作同時被做。
有讀取端 (Read-end) 與寫入端 (Write-end),就叫做 Pipeline,輸入 Linux 指令或 CGI 時會看到。
Pipe 又分為 Ordinary Pipe(單向)與 Named Pipe(雙向)。
Ordinary Pipe
兩個 Process 的 f_inode
會指向同一個地方,f_op
代表這個 Process 是要做什麼的,有 fd[0]
(Write end) 跟 fd[1]
(Read end)。
步驟:
首先有一個人先建管線,假設是 A process 自願建 Pipe 跟 B 連接,A 的 f_inode
連到 Pipe,此時 A process 的 f_op
有寫入端與讀取端。
A Process 透過 fork()
的動作,複製子 Process (fd[0]
, d[1]
) 的定義給 B Process,接著 B 把它的 f_inode
也連起來,此時兩邊都有讀取端與寫入端。
因為一端只能是讀或是寫,所以 A 把自己的讀取端砍掉,B 把自己的寫入端砍掉,變成 A process 寫給 B Process 去讀取。
Named Pipe
有一端可以同時是讀 + 寫。
以上資源是我自己整理過後的筆記,若有錯誤歡迎隨時和我聯繫