CPU指令集是什么东西
生活随笔
收集整理的這篇文章主要介紹了
CPU指令集是什么东西
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
(已更正) 這個問題包括CPU的硬件結構和匯編語言的范疇. 這里梳理一下.
首先, 題主"李建國"自問自答的部分說的是正確的, CPU的指令集是軟件與CPU這兩個層級之間的接口, 而CPU自己, 就是對于這一套CPU指令集的"實例化".
無論處于上層的軟件多么的高級, 想要在CPU執行, 就必須被翻譯成"機器碼", 翻譯這個工作由編譯器來執行. 編譯器在這個過程中, 要經過"編譯", "匯編", "鏈接"幾個步驟, 最后生成"可執行文件". 可執行文件中保存的是二進制機器碼. 這串機器碼可以直接被CPU讀取和執行.
軟件意義上, "指令集"實際上是一個規范, 規范匯編的文件格式.
以下為一條x86匯編代碼:
mov word ptr es:[eax + ecx * 8 + 0x11223344], 0x12345678
這里可以體現出指令集的格式限制:
1. 可以使用mov指令, 但它只能有2個操作數.
2. 它的操作數長度是16 (word), 不要看到后面0x12345678就認為是32位操作數.
3. 它帶有段超越前綴, 這里使用了es, 還可以使用ds, cs, ss, fs, gs. 但是只能用這幾個.
4. 第一個操作數是一個內存地址, 第二個是立即數. 但是, 這個內存地址不能亂寫, 寫成[eax+ecx*10+0x11223344]就錯了.
實際上, 一條匯編指令與一段機器碼是一一對應的. 上面這段匯, 可以被x86編譯器翻譯成幾乎唯一的一段機器碼:
26 66 c7 84 c8 44 33 22 11 78 56
上面提到的1,2,3,4點如果有一個弄錯, 這一步就會失敗.
可以看出來, 指令集的作用, 就是告訴程序員/編譯器, 匯編一定要有格式. 支持什么指令, 指令帶什么限制條件, 用什么操作數, 用什么地址, 都是指令集規范的內容, 要是寫錯了, 就無法翻譯成機器碼.
指令集規范匯編, 匯編可以翻譯成機器碼, 機器碼告訴CPU每個周期去做什么. 因此, CPU指令集是描述CPU能實現什么功能的一個集合, 就是描述"CPU能使用哪些機器碼"的集合".
那機器碼進入到CPU后又做什么呢?
=====================編譯器和CPU的分界線========================
需要被執行的機器碼先要被OS調度到內存之中, 程序執行時, 機器碼依次經過了Memory--Cache--CPU fetch, 進入CPU流水線, 接著就要對它進行譯碼了, 譯碼工作生成的象是CPU內部數據格式, 微碼(或者類似的格式, 這個格式不同的廠商會自己設計).
這個過程畫成圖就是:
軟件層: 匯編語言
------------------------------------------------------------------------
接口: 匯編語言所對應的機器碼
------------------------------------------------------------------------
硬件層: CPU使用內部數據結構進行運算
如果機器碼代表的功能是在指令集規范內的, 這條機器碼就可以生產微碼, 并在CPU內正常流動. 假設機器碼是錯誤的, 是不可以通過CPU的譯碼階段的, 控制電路一定會報錯. 這種情況反映在Windows里往往都是藍屏, 因為CPU無法繼續執行, 它連下一條指令在哪都不知道.
那么指令集在CPU里就代表: 只有CPU指令集范圍內的指令可以被成功的譯碼, 并送往CPU流水線后端去執行.
和常規的想法不一樣, CPU不需要任何形式的存儲介質去存儲指令集, 因為"譯碼"這個步驟就是在對指令集里規范的機器碼做解碼. 硬件上, 譯碼這件事需要龐大數目的邏輯門陣列來實現.
跳出格式這個圈子來看待這個問題. 可以說, CPU執行單元的能力, 決定了指令集的范圍. 比如, CPU的執行單元有能力執行16位加法, 32位加法, 64位加法, 那么指令集里一般就會有ADD 16, ADD 32, ADD 64這樣的表達方式. 如果CPU的執行單元沒有電路執行AVX指令, 那么指令集里一般就沒有VINSERTF128這樣的指令供使用. 所以, 強有力的執行單元能夠提供更多的指令集.
再來看"CPU指令集在哪里"這個問題, 回答是, CPU本身就是CPU指令集. 指令集規定CPU可以做什么事, CPU就是具體做這件事的工具. 如果一定要指定一個狹義的CPU指令集的存放位置. 那就是CPU中的"譯碼電路".
=======================================================================================================================
=======================================================================================================================
作者:Cascade
鏈接:https://www.zhihu.com/question/20793038/answer/16198162
來源:知乎
著作權歸作者所有,轉載請聯系作者獲得授權。
是,這個解釋起來有點長。Be patient
現代的CPU沒拆過,我只在計算機組成原理實驗課上用VHDL在某個實驗平臺上做過一個模擬的CPU。舉個例子你可能比較好理解。
比如我們設計一套指令集,其中肯定有條加法指令。比如Add R1 R2 。我們可以認為這條指令的意思是計算寄存器R1中的內容和R2的和,然后把結果存到R1寄存器中。
那么經過編譯后這條指令會變成二進制,比如010100010010 。這條二進制指令一共12位。明顯可以分為三大部分。最前面的0101表示這是條加法指令,后面0001說的是第一個操作數是寄存器1,最后0010說的是第二個數就是寄存器2(其實實際沒有這么簡單的指令,至少應該區分操作數是寄存器還是直接的數據,但為了把這說的更容易理解作了簡化)。我們可以通過十二根導線把這條指令輸入一個CPU中。導線通電就是1,不通電就是0 。為了敘述方便我們從左到右用A0-A11給這12根導線編上號。
然后計算機會分析這條指令。步驟如下:
當然,從匯編到機器碼這步是匯編程序翻譯的。匯編程序當然知道某條指令要翻譯成什么樣的機器碼。
============================================================================================================================
============================================================================================================================
總結
以上是生活随笔為你收集整理的CPU指令集是什么东西的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: linux脚本 sed,Linux脚本利
- 下一篇: java 一对多 socket_js作为