深入理解 Lua 虚拟机
作者:nicochen,騰訊 IEG 游戲開(kāi)發(fā)工程師
本文從一個(gè)簡(jiǎn)單示例入手,詳細(xì)講解 Lua 字節(jié)碼文件的存儲(chǔ)結(jié)構(gòu)及各字段含義,進(jìn)而引出 Lua 虛擬機(jī)指令集和運(yùn)行時(shí)的核心數(shù)據(jù)結(jié)構(gòu) Lua State,最后解釋 Lua 虛擬機(jī)的 47 條指令如何在 Lua State 上運(yùn)作的。
為了達(dá)到較高的執(zhí)行效率,lua 代碼并不是直接被 Lua 解釋器解釋執(zhí)行,而是會(huì)先編譯為字節(jié)碼,然后再交給 lua 虛擬機(jī)去執(zhí)行。lua 代碼稱為 chunk,編譯成的字節(jié)碼則稱為二進(jìn)制 chunk(Binary chunk)。lua.exe、wlua.exe 解釋器可直接執(zhí)行 lua 代碼(解釋器內(nèi)部會(huì)先將其編譯成字節(jié)碼),也可執(zhí)行使用 luac.exe 將 lua 代碼預(yù)編譯(Precompiled)為字節(jié)碼。使用預(yù)編譯的字節(jié)碼并不會(huì)加快腳本執(zhí)行的速度,但可以加快腳本加載的速度,并在一定程度上保護(hù)源代碼。luac.exe 可作為編譯器,把 lua 代碼編譯成字節(jié)碼,同時(shí)可作為反編譯器,分析字節(jié)碼的內(nèi)容。
luac.exe?-v??//?顯示luac的版本號(hào) luac.exe?Hello.lua??// 在當(dāng)前目錄下,編譯得到Hello.lua的二進(jìn)制chunk文件luac.out(默認(rèn)含調(diào)試符號(hào))luac.exe?-o?Hello.out?Hello1.lua?Hello2.lua?// 在當(dāng)前目錄下,編譯得到Hello1.lua和Hello2.lua的二進(jìn)制chunk文件Hello.out(默認(rèn)含調(diào)試符號(hào))luac.exe?-s?-o?d:\\Hello.out?Hello.lua??// 編譯得到Hello.lua的二進(jìn)制chunk文件d:\\Hello.out(去掉調(diào)試符號(hào))luac.exe?-p?Hello1.lua?Hello2.lua??// 對(duì)Hello1.lua和Hello2.lua只進(jìn)行語(yǔ)法檢測(cè)(注:只會(huì)檢查語(yǔ)法規(guī)則,不會(huì)檢查變量、函數(shù)等是否定義和實(shí)現(xiàn),函數(shù)參數(shù)返回值是否合法)lua 編譯器以函數(shù)為單位對(duì)源代碼進(jìn)行編譯,每個(gè)函數(shù)會(huì)被編譯成一個(gè)稱之為原型(Prototype)的結(jié)構(gòu),原型主要包含 6 部分內(nèi)容:函數(shù)基本信息(basic info,含參數(shù)數(shù)量、局部變量數(shù)量等信息)、字節(jié)碼(bytecodes)、常量(constants)表、upvalue(閉包捕獲的非局部變量)表、調(diào)試信息(debug info)、子函數(shù)原型列表(sub functions)。
原型結(jié)構(gòu)使用這種嵌套遞歸結(jié)構(gòu),來(lái)描述函數(shù)中定義的子函數(shù):
注:lua 允許開(kāi)發(fā)者可將語(yǔ)句寫到文件的全局范圍中,這是因?yàn)?lua 在編譯時(shí)會(huì)將整個(gè)文件放到一個(gè)稱之為 main 函數(shù)中,并以它為起點(diǎn)進(jìn)行編譯。
Hello.lua 源代碼如下:
print?("hello") function?add(a,?b)return?a+b end編譯得到的 Hello.out 的二進(jìn)制為:
二進(jìn)制 chunk(Binary chunk)的格式并沒(méi)有標(biāo)準(zhǔn)化,也沒(méi)有任何官方文檔對(duì)其進(jìn)行說(shuō)明,一切以 lua 官方實(shí)現(xiàn)的源代碼為準(zhǔn)。其設(shè)計(jì)并沒(méi)有考慮跨平臺(tái),對(duì)于需要超過(guò)一個(gè)字節(jié)表示的數(shù)據(jù),必須要考慮大小端(Endianness)問(wèn)題。
lua 官方實(shí)現(xiàn)的做法比較簡(jiǎn)單:編譯 lua 腳本時(shí),直接按照本機(jī)的大小端方式生成二進(jìn)制 chunk 文件,當(dāng)加載二進(jìn)制 chunk 文件時(shí),會(huì)探測(cè)被加載文件的大小端方式,如果和本機(jī)不匹配,就拒絕加載。二進(jìn)制 chunk 格式設(shè)計(jì)也沒(méi)有考慮不同 lua 版本之間的兼容問(wèn)題,當(dāng)加載二進(jìn)制 chunk 文件時(shí),會(huì)檢測(cè)其版本號(hào),如果和當(dāng)前 lua 版本不匹配,就拒絕加載。另外,二進(jìn)制 chunk 格式設(shè)計(jì)也沒(méi)有被刻意設(shè)計(jì)得很緊湊。在某些情況下,一段 lua 代碼編譯成二進(jìn)制 chunk 后,甚至?xí)晃谋拘问降脑创a還要大。預(yù)編譯成二進(jìn)制 chunk 主要是為了提升加載速度,因此這也不是很大的問(wèn)題。
頭部字段:
嵌套的函數(shù)原型:
注 1:二進(jìn)制 chunk 中的字符串分為三種情況:
①NULL 字符串用 0x00 表示;
② 長(zhǎng)度小于等于 253(0xFD)的字符串,先用 1 個(gè) byte 存儲(chǔ)字符串長(zhǎng)度+1 的數(shù)值,然后是字節(jié)數(shù)組;
③ 長(zhǎng)度大于等于 254(0xFE)的字符串,第一個(gè)字節(jié)是 0xFF,后面跟一個(gè) 8 字節(jié) size_t 類型存儲(chǔ)字符串長(zhǎng)度+1 的數(shù)值,然后是字節(jié)數(shù)組。
注 2:常量 tag 對(duì)應(yīng)表
查看二進(jìn)制 chunk 中的所有函數(shù)(精簡(jiǎn)模式):
luac.exe -l Hello.lua
luac.exe -l Hello.out
注 1:每個(gè)函數(shù)信息包括兩個(gè)部分:前面兩行是函數(shù)的基本信息,后面是函數(shù)的指令列表。
注 2:函數(shù)的基本信息包括:函數(shù)名稱、函數(shù)的起始行列號(hào)、函數(shù)包含的指令數(shù)量、函數(shù)地址。函數(shù)的參數(shù) params 個(gè)數(shù)(0+表示函數(shù)為不固定參數(shù))、寄存器 slots 數(shù)量、upvalue 數(shù)量、局部變量 locals 數(shù)量、常量 constants 數(shù)量、子函數(shù) functions 數(shù)量。
注 3:指令列表里的每一條指令包含指令序號(hào)、對(duì)應(yīng)代碼行號(hào)、操作碼和操作數(shù)。分號(hào)后為 luac 生成的注釋,以便于我們理解指令。
注 4:整個(gè)文件內(nèi)容被放置到了 main 函數(shù)中,并以它作為嵌套起點(diǎn)。
查看二進(jìn)制 chunk 中的所有函數(shù)(詳細(xì)模式):
luac.exe -l -l Hello.lua ? 注:參數(shù)為 2 個(gè)-l
luac.exe -l -l Hello.out ? 注:詳細(xì)模式下,luac 會(huì)把常量表、局部變量表和 upvalue 表的信息也打印出來(lái)
main?<Test2.lua:0,0>?(6?instructions?at?0046e528) 0+?params,?2?slots,?1?upvalue,?0?locals,?3?constants,?1?function序號(hào)????代碼行????指令1???????[1]?????GETTABUP????????0?0?-1??;?_ENV?"print"???//GETTABUP?A?B?C??//將upvalues表索引為B:0的upvalue(即:_ENV)中key為常量表索引為C:-1的(即print),放到寄存器索引為A:0的地方2???????[1]?????LOADK???????????1?-2????;?"hello"??//LOADK?A?Bx??//將常量表索引為Bx:-2的hello加載到寄存器索引為A:1的地方3???????[1]?????CALL????????????0?2?1????;?//CALL?A?B?C??//調(diào)用寄存器索引為A:0的函數(shù),參數(shù)個(gè)數(shù)為B:2減1(即1個(gè)),C:1表示無(wú)返回值4???????[5]?????CLOSURE?????????0?0?????;?0046e728??????//CLOSURE?A?Bx??//將子函數(shù)原型列表索引為Bx:0的函數(shù)地址,放到寄存器索引為A:0的地方5???????[3]?????SETTABUP????????0?-3?0??;?_ENV?"add"???//SETTABUP?A?B?C??//將upvalues表索引為A:0的upvalue(即:_ENV)中key為常量表索引為B:-3(即add),設(shè)置為寄存器索引為C:0指向的值6???????[5]?????RETURN??????????0?1????????;?//RETURN?A?B???//B:1表示無(wú)返回值 constants?(3)?for?0046e528:序號(hào)????常量名1???????"print"2???????"hello"3???????"add" locals?(0)?for?0046e528: upvalues?(1)?for?0046e528:序號(hào)????upvalue名????是否為直接外圍函數(shù)的局部變量????在外圍函數(shù)調(diào)用幀的索引0???????_ENV????????1???????????????????????????????0function?<Test2.lua:3,5>?(3?instructions?at?0046e728) 2?params,?3?slots,?0?upvalues,?2?locals,?0?constants,?0?functions序號(hào)????代碼行????指令1???????[4]?????ADD?????????????2?0?1????;?//ADD?A?B?C??//將寄存器索引為0、1的兩個(gè)數(shù)相加得到的結(jié)果放到寄存器索引為2的地方2???????[4]?????RETURN??????????2?2????????;?//RETURN?A?B?//B:2表示有一個(gè)返回值??A:2表示返回值在寄存器索引為2的地方3???????[5]?????RETURN??????????0?1????????;?//RETURN?A?B?//B:1表示無(wú)返回值 constants?(0)?for?0046e728: locals?(2)?for?0046e728:寄存器索引????起始指令序號(hào)??終止指令序號(hào)??-1得到實(shí)際指令序號(hào)0???????a???????1???????4????????;?a變量的指令范圍為[0,?3],起始為0表示為傳入的參數(shù)變量1???????b???????1???????4????????;?b變量的指令范圍為[0,?3] upvalues?(0)?for?0046e728:luac.exe -l -??// 從標(biāo)準(zhǔn)設(shè)備讀入腳本,輸完后按回車,然后按 Ctrl+Z 并回車,會(huì)打印出輸入內(nèi)容對(duì)應(yīng)的二進(jìn)制 chunk 內(nèi)容 ?? 注:進(jìn)入輸入模式后可按 Ctrl+C 強(qiáng)制退出
luac.exe -l --?// 使用上次輸入,打印出二進(jìn)制 chunk 內(nèi)容
luac.exe -l -l --?// 使用上次輸入,詳細(xì)模式下打印出二進(jìn)制 chunk 內(nèi)容(參數(shù)為 2 個(gè)-l)
Stack Based VM??vs Rigister?Based VM
高級(jí)編程語(yǔ)言的虛擬機(jī)是利用軟件技術(shù)對(duì)硬件進(jìn)行的模擬和抽象。按照實(shí)現(xiàn)方式,可分為兩類:基于棧(Stack Based)和基于寄存器(Rigister Based)。Java、.NET CLR、Python、Ruby、Lua5.0 之前的版本的虛擬機(jī)都是基于棧的虛擬機(jī);從 5.0 版本開(kāi)始,Lua 的虛擬機(jī)改成了基于寄存器的虛擬機(jī)。
一個(gè)簡(jiǎn)單的加法賦值運(yùn)算:a=b+c
基于棧的虛擬機(jī),會(huì)轉(zhuǎn)化成如下指令:
push?b;?//?將變量b的值壓入stackpush?c;?//?將變量c的值壓入stackadd;?//?將stack頂部的兩個(gè)值彈出后相加,然后將結(jié)果壓入stack頂mov?a;?//?將stack頂部結(jié)果放到a中所有的指令執(zhí)行,都是基于一個(gè)操作數(shù)棧的。你想要執(zhí)行任何指令時(shí),對(duì)不起,得先入棧,然后算完了再給我出棧。總的來(lái)說(shuō),就是抽象出了一個(gè)高度可移植的操作數(shù)棧,所有代碼都會(huì)被編譯成字節(jié)碼,然后字節(jié)碼就是在玩這個(gè)棧。好處是實(shí)現(xiàn)簡(jiǎn)單,移植性強(qiáng)。壞處是指令條數(shù)比較多,數(shù)據(jù)轉(zhuǎn)移次數(shù)比較多,因?yàn)槊恳淮稳霔3鰲6紶可鏀?shù)據(jù)的轉(zhuǎn)移。
基于寄存器的虛擬機(jī),會(huì)轉(zhuǎn)化成如下指令:
add?a?b?c;?//?將b與c對(duì)應(yīng)的寄存器的值相加,將結(jié)果保存在a對(duì)應(yīng)的寄存器中沒(méi)有操作數(shù)棧這一概念,但是會(huì)有許多的虛擬寄存器。這類虛擬寄存器有別于 CPU 的寄存器,因?yàn)?CPU 寄存器往往是定址的(比如 DX 本身就是能存東西),而寄存器式的虛擬機(jī)中的寄存器通常有兩層含義:
(1)寄存器別名(比如 lua 里的 RA、RB、RC、RBx 等),它們往往只是起到一個(gè)地址映射的功能,它會(huì)根據(jù)指令中跟操作數(shù)相關(guān)的字段計(jì)算出操作數(shù)實(shí)際的內(nèi)存地址,從而取出操作數(shù)進(jìn)行計(jì)算;
(2)實(shí)際寄存器,有點(diǎn)類似操作數(shù)棧,也是一個(gè)全局的運(yùn)行時(shí)棧,只不過(guò)這個(gè)棧是跟函數(shù)走的,一個(gè)函數(shù)對(duì)應(yīng)一個(gè)棧幀,棧幀里每個(gè) slot 就是一個(gè)寄存器,第 1 步中通過(guò)別名映射后的地址就是每個(gè) slot 的地址。
好處是指令條數(shù)少,數(shù)據(jù)轉(zhuǎn)移次數(shù)少。壞處是單挑指令長(zhǎng)度較長(zhǎng)。具體來(lái)看,lua 里的實(shí)際寄存器數(shù)組是用 TValue 結(jié)構(gòu)的棧來(lái)模擬的,這個(gè)棧也是 lua 和 C 進(jìn)行交互的虛擬棧。
lua 指令集
Lua 虛擬機(jī)的指令集為定長(zhǎng)(Fixed-width)指令集,每條指令占 4 個(gè)字節(jié)(32bits),其中操作碼(OpCode)占 6bits,操作數(shù)(Operand)使用剩余的 26bits。Lua5.3 版本共有 47 條指令,按功能可分為 6 大類:常量加載指令、運(yùn)算符相關(guān)指令、循環(huán)和跳轉(zhuǎn)指令、函數(shù)調(diào)用相關(guān)指令、表操作指令和 Upvalue 操作指令。
按編碼模式分為 4 類:iABC(39)、iABx(3)、iAsBx(4)、iAx(1)
4 種模式中,只有 iAsBx 下的 sBx 操作數(shù)會(huì)被解釋成有符號(hào)整數(shù),其他情況下操作數(shù)均被解釋為無(wú)符號(hào)整數(shù)。操作數(shù) A 主要用來(lái)表示目標(biāo)寄存器索引,其他操作數(shù)按表示信息可分為 4 種類型:OpArgN、OpArgU、OpArgR、OpArgK:
Lua 棧索引
注 1:絕對(duì)索引是從 1 開(kāi)始由棧底到棧頂依次增長(zhǎng)的;
注 2:相對(duì)索引是從-1 開(kāi)始由棧頂?shù)綏5滓来芜f減的(在 lua API 函數(shù)內(nèi)部會(huì)將相對(duì)索引轉(zhuǎn)換為絕對(duì)索引);
注 3:上圖棧的容量為 7,棧頂絕對(duì)索引為 5,有效索引范圍為:[1,5],可接受索引范圍為:[1, 7];
注 4:Lua 虛擬機(jī)指令里寄存器索引是從 0 開(kāi)始的,而 Lua API 里的棧索引是從 1 開(kāi)始的,因此當(dāng)需要把寄存器索引當(dāng)成棧索引使用時(shí),要進(jìn)行+1。
Lua State
指令表
下面是 Lua 的 47 條指令詳細(xì)說(shuō)明:
B:1?C?A:3 MOVE
把源寄存器(索引由 B 指定)里的值移動(dòng)到目標(biāo)寄存器(索引有 A 指定),常用于局部變量賦值和參數(shù)傳遞。
公式:R(A) := R(B)
Bx:2 A:4 LOADK
給單個(gè)寄存器(索引由 A 指定)設(shè)置成常量(其在常量表的索引由 Bx 指定),將常量表里的某個(gè)常量加載到指定寄存器。
在 lua 中,數(shù)值型、字符串型等局部變量賦初始值 (數(shù)字和字符串會(huì)放到常量表中):
公式:R(A) := Kst(Bx)
Bx A:4 LOADKX
Ax:585028?EXTRAARG
LOADK 使用 Bx(18bits,最大無(wú)符號(hào)整數(shù)為 262143)表示常量表索引。當(dāng)將 lua 作數(shù)據(jù)描述語(yǔ)言使用時(shí),常量表可能會(huì)超過(guò)這個(gè)限制,為了應(yīng)對(duì)這種情況,lua 提供了 LOADKX 指令。LOADKX 指令需要和 EXTRAAG 指令搭配使用,用后者的 Ax(26bits)操作數(shù)來(lái)指定常量索引。
公式:R(A) := Kst(Ax)
| LOADBOOL | iABC | 0x03 | OpArgU | OpArgU | 目標(biāo)寄存器 idx |
B:0 C:1 A:2 LOADBOOL
給單個(gè)寄存器(索引由 A 指定)設(shè)置布爾值(布爾值由 B 指定),如果寄存器 C 為非 0 則跳過(guò)下一條指令。
公式:
R(A) := (bool)B
if(C) pc++
| LOADNIL | iABC | 0x04 | OpArgU | OpArgN | 目標(biāo)寄存器 idx |
B:4 C A:0 LOADNIL
將序號(hào)[A,A+B]連續(xù) B+1 個(gè)寄存器設(shè)置成 nil 值,用于給連續(xù) n 個(gè)寄存器放置 nil 值。在 lua 中,局部變量的默認(rèn)初始值為 nil,LOADNIL 指令常用于給連續(xù) n 個(gè)局部變量設(shè)置初始值。
公式:R(A), R(A+1), ... ,R(A+B) := nil
| GETUPVAL | iABC | 0x05 | OpArgU | OpArgN | 目標(biāo)寄存器 idx |
B:1 C A:3 GETUPVAL
把當(dāng)前閉包的某個(gè) Upvalue 值(索引由 B 指定)拷貝到目標(biāo)寄存器(索引由 A 指定)中 ?。
公式:R(A) := Upvalue[B]
| GETTABUP | iABC | 0x06 | OpArgU | OpArgK | 目標(biāo)寄存器 idx |
B:0 C:0x002 A:3 GETTABUP
把當(dāng)前閉包的某個(gè) Upvalue 值(索引由 B 指定)拷貝到目標(biāo)寄存器(索引由 A 指定)中,與 GETUPVAL 不同的是,Upvalue 從表里取值(鍵由 C 指定,為寄存器或常量表索引)。
R(A) := Upvalue[B][rk(c)]
| GETTABLE | iABC | 0x07 | OpArgR | OpArgK | 目標(biāo)寄存器 idx |
B:0 C:0x002 A:3 GETTABLE
把表中某個(gè)值拷貝到目標(biāo)寄存器(索引由 A 指定)中,表所在寄存器索引由 B 指定,鍵由 C(為寄存器或常量表索引)指定。
公式:R(A) := R[B][rk(c)]
| SETTABUP | iABC | 0x08 | OpArgK | OpArgK | 目標(biāo)寄存器 idx |
B:0x002 C:0x003 A:0?SETTABUP
設(shè)置當(dāng)前閉包的某個(gè) Upvalue 值(索引由 A 指定)為寄存器或常量表的某個(gè)值(索引由 C 指定),與 SETUPVAL 不同的是,Upvalue 從表里取值(鍵由 B 指定,為寄存器或常量表索引)。
Upvalue[A][rk(b)] := RK(C)
| SETUPVAL | iABC | 0x09 | OpArgU | OpArgN | 目標(biāo)寄存器 idx |
B:0 C A:3 SETUPVAL
設(shè)置當(dāng)前閉包的某個(gè) Upvalue 值(索引由 B 指定)為寄存器的某個(gè)值(索引由 A 指定)。
公式:Upvalue[B] := R(A)
| SETTABLE | iABC | 0x0A | OpArgK | OpArgK | 目標(biāo)寄存器 idx |
B:0x002 C:0x003 A:1 SETTABLE
給寄存器中的表(索引由 A 指定)的某個(gè)鍵進(jìn)行賦值,鍵和值分別由 B 和 C 指定(為寄存器或常量表索引)。
公式:R(A)[RK(B)] := RK(C)
| NEWTABLE | iABC | 0x0B | OpArgU | OpArgU | 目標(biāo)寄存器 idx |
B:0 C:2 A:4 NEWTABLE
創(chuàng)建空表,并將其放入指定寄存器(索引有 A 指定),表的初始數(shù)組容量和哈希表容量分別有 B 和 C 指定。
公式:R(A) := {} (size = B, C)
| SELF | iABC | 0x0C | OpArgR | OpArgK | 目標(biāo)寄存器 idx |
B:1 C:0x100 A:2 SELF
把寄存器中對(duì)象(索引由 B 指定)和常量表中方法(索引由 C 指定)拷貝到相鄰的兩個(gè)目標(biāo)寄存器中,起始目標(biāo)寄存器的索引由 A 指定。
公式:
R(A+1) := R(B)
R(A) := R(B)[RK(C)]
| ADD | iABC | 0x0D | OpArgK | OpArgK | 目標(biāo)寄存器 idx |
B:0x001 C:0x100 A:4 ADD
對(duì)兩個(gè)寄存器或常量值(索引由 B 和 C 指定)進(jìn)行相加,并將結(jié)果放入另一個(gè)寄存器中(索引由 A 指定)。
公式:R(A) := RK(B) + RK(C)
| SUB | iABC | 0x0E | OpArgK | OpArgK | 目標(biāo)寄存器 idx |
B:0x001 C:0x100 A:4 SUB
對(duì)兩個(gè)寄存器或常量值(索引由 B 和 C 指定)進(jìn)行相減,并將結(jié)果放入另一個(gè)寄存器中(索引由 A 指定)
公式:
R(A) := RK(B) - RK(C)
| MUL | iABC | 0x0F | OpArgK | OpArgK | 目標(biāo)寄存器 idx |
B:0x001 C:0x100 A:4 MUL
對(duì)兩個(gè)寄存器或常量值(索引由 B 和 C 指定)進(jìn)行相乘,并將結(jié)果放入另一個(gè)寄存器中(索引由 A 指定)。
公式:R(A) := RK(B) * RK(C)
| MOD | iABC | 0x10 | OpArgK | OpArgK | 目標(biāo)寄存器 idx |
B:0x001 C:0x100 A:4 MOD
對(duì)兩個(gè)寄存器或常量值(索引由 B 和 C 指定)進(jìn)行求摸運(yùn)算,并將結(jié)果放入另一個(gè)寄存器中(索引由 A 指定)。
公式:R(A) := RK(B) % RK(C)
| POW | iABC | 0x11 | OpArgK | OpArgK | 目標(biāo)寄存器 idx |
B:0x001 C:0x100 A:4 POW
對(duì)兩個(gè)寄存器或常量值(索引由 B 和 C 指定)進(jìn)行求冪運(yùn)算,并將結(jié)果放入另一個(gè)寄存器中(索引由 A 指定)。
公式:R(A) := RK(B) ^ RK(C)
| DIV | iABC | 0x12 | OpArgK | OpArgK | 目標(biāo)寄存器 idx |
B:0x001 C:0x100 A:4 DIV
對(duì)兩個(gè)寄存器或常量值(索引由 B 和 C 指定)進(jìn)行相除,并將結(jié)果放入另一個(gè)寄存器中(索引由 A 指定)。
公式:R(A) := RK(B) / RK(C)
| IDIV | iABC | 0x13 | OpArgK | OpArgK | 目標(biāo)寄存器 idx |
B:0x001 C:0x100 A:4 IDIV
對(duì)兩個(gè)寄存器或常量值(索引由 B 和 C 指定)進(jìn)行相整除,并將結(jié)果放入另一個(gè)寄存器中(索引由 A 指定)。
公式:R(A) := RK(B) // RK(C)
| BAND | iABC | 0x14 | OpArgK | OpArgK | 目標(biāo)寄存器 idx |
B:0x001 C:0x100 A:4 BAND
對(duì)兩個(gè)寄存器或常量值(索引由 B 和 C 指定)進(jìn)行求與操作,并將結(jié)果放入另一個(gè)寄存器中(索引由 A 指定)。
公式:R(A) := RK(B) & RK(C)
| BOR | iABC | 0x15 | OpArgK | OpArgK | 目標(biāo)寄存器 idx |
B:0x001 C:0x100 A:4 BOR
對(duì)兩個(gè)寄存器或常量值(索引由 B 和 C 指定)進(jìn)行求或操作,并將結(jié)果放入另一個(gè)寄存器中(索引由 A 指定)。
公式:R(A) := RK(B) | RK(C)
| BXOR | iABC | 0x16 | OpArgK | OpArgK | 目標(biāo)寄存器 idx |
B:0x001 C:0x100 A:4 BXOR
對(duì)兩個(gè)寄存器或常量值(索引由 B 和 C 指定)進(jìn)行求異或操作,并將結(jié)果放入另一個(gè)寄存器中(索引由 A 指定)
公式:R(A) := RK(B) ~ RK(C)
| SHL | iABC | 0x17 | OpArgK | OpArgK | 目標(biāo)寄存器 idx |
B:0x001 C:0x100 A:4 SHL
索引由 B 指定的寄存器或常量值進(jìn)行左移位操作(移動(dòng)位數(shù)的索引由 C 指定的寄存器或常量值),并將結(jié)果放入另一個(gè)寄存器中(索引由 A 指定)。
公式:R(A) := RK(B) << RK(C)
| SHR | iABC | 0x18 | OpArgK | OpArgK | 目標(biāo)寄存器 idx |
B:0x001 C:0x100 A:4 SHR
索引由 B 指定的寄存器或常量值進(jìn)行右移位操作(移動(dòng)位數(shù)的索引由 C 指定的寄存器或常量值),并將結(jié)果放入另一個(gè)寄存器中(索引由 A 指定)。
公式:R(A) := RK(B) >> RK(C)
| UNM | iABC | 0x19 | OpArgR | OpArgN | 目標(biāo)寄存器 idx |
B:1 C A:3 UNM
對(duì)寄存器(索引由 B 指定)進(jìn)行取負(fù)數(shù)操作,并將結(jié)果放入另一個(gè)寄存器中(索引由 A 指定)。
公式:R(A) := - R(B)
| BNOT | iABC | 0x1A | OpArgR | OpArgN | 目標(biāo)寄存器 idx |
B:1 C A:3 BNOT
對(duì)寄存器(索引由 B 指定)進(jìn)行取反操作,并將結(jié)果放入另一個(gè)寄存器中(索引由 A 指定)。
公式:R(A) := ~ R(B)
| NOT | iABC | 0x1B | OpArgR | OpArgN | 目標(biāo)寄存器 idx |
B:1 C A:3 NOT
對(duì)寄存器(索引由 B 指定)進(jìn)行求非操作,并將結(jié)果放入另一個(gè)寄存器中(索引由 A 指定)。
公式:R(A) := not R(B)
| LEN | iABC | 0x1C | OpArgR | OpArgN | 目標(biāo)寄存器 idx |
B:1 C A:3 LEN
對(duì)寄存器(索引由 B 指定)進(jìn)行求長(zhǎng)度操作,并將結(jié)果放入另一個(gè)寄存器中(索引由 A 指定)。
公式:R(A) := length of R(B)
| CONCAT | iABC | 0x1D | OpArgR | OpArgR | 目標(biāo)寄存器 idx |
B:2 C:4 A:1 CONCAT
將連續(xù) n 個(gè)寄存器(起始索引和終止索引由 B 和 C 指定)里的值進(jìn)行拼接,并將結(jié)果放入另一個(gè)寄存器中(索引由 A 指定)。
公式:R(A) := R(B) .. ... .. R(C)
| JMP | iAsBx | 0x1E | OpArgR | 目標(biāo)寄存器 idx |
sBx:-1 A JMP
當(dāng) sBx 不為 0 時(shí),進(jìn)行無(wú)條件跳轉(zhuǎn),執(zhí)行 pc = pc + sBx(sBx 為-1,表示將當(dāng)前指令再執(zhí)行一次 ? 注:這將是一個(gè)死循環(huán))
sBx:0 A:0x001 JMP;
當(dāng) sBx 為 0 時(shí)(繼續(xù)執(zhí)行后面指令,不跳轉(zhuǎn)),用于閉合處于開(kāi)啟狀態(tài)的 Upvalue(即:把即將銷毀的局部變量的值復(fù)制出來(lái),并更新到某個(gè) Upvalue 中)。
當(dāng)前閉包的某個(gè) Upvalue 值的索引由 A 指定:
| EQ | iABC | 0x1F | OpArgK | OpArgK | 目標(biāo)寄存器 idx |
B:0x001 C:0x100 A:1 EQ
寄存器或常量表(索引由 B 指定)是否等于寄存器或常量表(索引由 C 指定),若結(jié)果等于操作數(shù) A,則跳過(guò)下一條指令。
公式:if ((RK(B) == RK(C)) pc++
| LT | iABC | 0x20 | OpArgK | OpArgK | 目標(biāo)寄存器 idx |
B:0x001 C:0x100 A:1 LT
寄存器或常量表(索引由 B 指定)是否小于寄存器或常量表(索引由 C 指定),若結(jié)果等于操作數(shù) A,則跳過(guò)下一條指令。
公式:if ((RK(B) < RK(C)) pc++
| LE | iABC | 0x21 | OpArgK | OpArgK | 目標(biāo)寄存器 idx |
B:0x001 C:0x100 A:1 LE
寄存器或常量表(索引由 B 指定)是否小于等于寄存器或常量表(索引由 C 指定),若結(jié)果等于操作數(shù) A,則跳過(guò)下一條指令。
公式:if ((RK(B) <= RK(C)) pc++
| TEST | iABC | 0x22 | OpArgN | OpArgU | 目標(biāo)寄存器 idx |
B C:0 A:1 TEST
判斷寄存器(索引由 A 指定)中的值轉(zhuǎn)換為 bool 值后,是否和操作數(shù) C 表示的 bool 值一致,若結(jié)果不一致,則跳過(guò)下一條指令。
公式:
if not (R(A) <=> C) pc++
注:<=>表示按 bool 值比較
| TESTSET | iABC | 0x23 | OpArgR | OpArgU | 目標(biāo)寄存器 idx |
B:3? C:0 A:1 TESTSET
判斷寄存器(索引由 B 指定)中的值轉(zhuǎn)換為 bool 值后,是否和操作數(shù) C 表示的 bool 值一致,若結(jié)果一致,將寄存器(索引由 B 指定)中的值復(fù)制到寄存器中(索引由 A 指定),否則跳過(guò)下一條指令。
公式:
if?(R(B)?\<=\>?C)R(A)?:=?R(B) elsepc++?注:<=>表示按 bool 值比較
| CALL | iABC | 0x24 | OpArgU | OpArgU | 目標(biāo)寄存器 idx |
B:5 C:4 A:0 CALL
被調(diào)用函數(shù)位于寄存器中(索引由 A 指定),傳遞給被調(diào)用函數(shù)的參數(shù)值也在寄存器中,緊挨著被調(diào)用函數(shù),參數(shù)個(gè)數(shù)為操作數(shù) B 指定。
① B==0,接受其他函數(shù)全部返回來(lái)的參數(shù)
② B>0,參數(shù)個(gè)數(shù)為 B-1
函數(shù)調(diào)用結(jié)束后,原先存放函數(shù)和參數(shù)值的寄存器會(huì)被返回值占據(jù),具體多少個(gè)返回值由操作數(shù) C 指定。
① C==0,將返回值全部返回給接收者
② C==1,無(wú)返回值
③ C>1,返回值的數(shù)量為 C-1
公式:R(A), ... ,
| TAILCALL | iABC | 0x25 | OpArgU | OpArgU | 目標(biāo)寄存器 idx |
函數(shù)調(diào)用一般通過(guò)調(diào)用棧來(lái)實(shí)現(xiàn)。用這種方法,每調(diào)用一個(gè)函數(shù)都會(huì)產(chǎn)生一個(gè)調(diào)用幀。
如果調(diào)用層次太深(如遞歸),容易導(dǎo)致棧溢出。尾遞歸優(yōu)化則可以讓我們發(fā)揮遞歸函數(shù)調(diào)用威力的同時(shí),避免調(diào)用棧溢出。利用這種優(yōu)化,被調(diào)函數(shù)可以重用主調(diào)函數(shù)的調(diào)用幀,因此可有效緩解調(diào)用棧溢出癥狀。不過(guò)該優(yōu)化只適合某些特定情況。
如:return f(args) 會(huì)被編譯器優(yōu)化成 TAILCALL 指令,公式:return R(A)(R(A+1), ... , R(A+B-1))
| RETURN | iABC | 0x26 | OpArgU | OpArgN | 目標(biāo)寄存器 idx |
B:4 C? A:2 RETURN
把存放在連續(xù)多個(gè)寄存器里的值返回給父函數(shù),其中第一個(gè)寄存器的索引由操作數(shù) A 指定,寄存器數(shù)量由操作數(shù) B 指定,操作數(shù) C 沒(méi)有使用,需要將返回值推入棧頂:
① B==1,不需要返回任何值
② B > 1,需要返回 B-1 個(gè)值;這些值已經(jīng)在寄存器中了,只用再將它們復(fù)制到棧頂即可
③ B==0,一部分返回值已經(jīng)在棧頂了,只需將另一部分也推入棧頂即可
公式:return R(A),...,R(A+B-2)
| FORLOOP | iAsBx | 0x27 | OpArgR | 目標(biāo)寄存器 idx |
數(shù)值 for 循環(huán):用于按一定步長(zhǎng)遍歷某個(gè)范圍內(nèi)的數(shù)值 ? 如:for i=1,100,2 ?do ?f()? end // 初始值為 1,步長(zhǎng)為 2,上限為 100
該指令先給 i 加上步長(zhǎng),然后判斷 i 是否在范圍之內(nèi)。若已經(jīng)超出范圍,則循環(huán)結(jié)束;若為超出范圍,則將數(shù)值拷貝給用戶定義的局部變量,然后跳轉(zhuǎn)到循環(huán)體內(nèi)部開(kāi)始執(zhí)行具體的代碼塊。
公式:
R(A)?+=?R(A+2) if?R(A)?<?=?R(A+1)pc+=sBxR(A+3)=R(A)注:當(dāng)步長(zhǎng)為正數(shù)時(shí)<?=為<=
當(dāng)步長(zhǎng)為負(fù)數(shù)時(shí)<?=為>=
| FORPREP | iAsBx | 0x28 | OpArgR | 目標(biāo)寄存器 idx |
數(shù)值 for 循環(huán):用于按一定步長(zhǎng)遍歷某個(gè)范圍內(nèi)的數(shù)值 ? 如:for i=1,100,2 ?do ?f()? end // 初始值為 1,步長(zhǎng)為 2,上限為 100。
該指令的目的是在循環(huán)之前預(yù)先將 i 減去步長(zhǎng)(得到-1),然后跳轉(zhuǎn)到 FORLOOP 指令正式開(kāi)始循環(huán):
公式:
R(A)-=R(A+2)
pc+=sBx
| TFORCALL | iABC | 0x29 | OpArgN | OpArgU | 目標(biāo)寄存器 idx |
通用 for 循環(huán):for k,v in pairs(t) do print(k,v) end
編譯器使用的第一個(gè)特殊變量(generator):f 存放的是迭代器,其他兩個(gè)特殊變量(state):s、(control):var 來(lái)調(diào)用迭代器,把結(jié)果保存在用戶定義的變量 k、v 中。
公式:R(A+3),...,R(A+2+C) := R(A)(R(A+1),R(A+2))
| TFORLOOP | iAsBx | 0x2A | OpArgR | 目標(biāo)寄存器 idx |
通用 for 循環(huán):for k,v in pairs(t) do print(k,v) end
若迭代器返回的第一個(gè)值(變量 k)不是 nil,則把該值拷貝到(control):var,然后跳轉(zhuǎn)到循環(huán)體;若為 nil,則循環(huán)結(jié)束。
公式:
if R(A+1) ~= nil
R(A)=R(A+1)
pc+=sBx
| SETLIST | iABC | 0x2B | OpArgU | OpArgU | 目標(biāo)寄存器 idx |
SETTABLE 是通用指令,每次只處理一個(gè)鍵值對(duì),具體操作交給表去處理,并不關(guān)心實(shí)際寫入的是表的 hash 部分還是數(shù)組部分。SETLIST 則是專門給數(shù)組準(zhǔn)備的,用于按索引批量設(shè)置數(shù)組元素。其中數(shù)組位于寄存器中,索引由操作數(shù) A 指定;需要寫入數(shù)組的一系列值也在寄存器中,緊挨著數(shù)組,數(shù)量由操作數(shù) B 指定;數(shù)組起始索引則由操作數(shù) C 指定。
因?yàn)?C 操作數(shù)只有 9bits,所以直接用它表示數(shù)組索引顯然不夠用。這里解決辦法是讓 C 操作數(shù)保存批次數(shù),然后用批次數(shù)乘上批大小(FPF,默認(rèn)為 50)就可以算出數(shù)組的起始索引。因此,C 操作數(shù)能表示的最大索引為 25600(50*512),當(dāng)數(shù)組長(zhǎng)度大于 25600 時(shí),SETLIST 指令后會(huì)跟一條 EXTRAARG 指令,用其 Ax 操作數(shù)來(lái)保存批次數(shù)。
綜上,C>0,表示的是批次數(shù)+1,否則,真正批次數(shù)存放在后續(xù)的 EXTRAARG 指令中。
操作數(shù) B 為 0 時(shí),當(dāng)表構(gòu)造器的最后一個(gè)元素是函數(shù)調(diào)用或者 vararg 表達(dá)式時(shí),Lua 會(huì)把它們產(chǎn)生的所有值都收集起來(lái)供 SETLIST 使用。
公式:
R(A)[(C-1)*FPF+i] := R(A+i)
1 <= i <= B
| CLOSURE | iABx | 0x2C | OpArgU | 目標(biāo)寄存器 idx |
把當(dāng)前 Lua 函數(shù)的子函數(shù)原型實(shí)例化為閉包,放入由操作數(shù) A 指定的寄存器中子函數(shù)原型來(lái)自于當(dāng)前函數(shù)原型的子函數(shù)原型表,索引由操作數(shù) Bx 指定。
下圖為將 prototypes 表中索引為 1 的 g 子函數(shù),放入索引為 4 的寄存器中:
公式:R(A) := closure(KPROTO[Bx])
| VARARG | iABC | 0x2D | OpArgU | OpArgN | 目標(biāo)寄存器 idx |
把傳遞給當(dāng)前函數(shù)的變長(zhǎng)參數(shù)加載到連續(xù)多個(gè)寄存器中。
其中第一個(gè)寄存器的索引由操作數(shù) A 指定,寄存器數(shù)量由操作數(shù) B 指定,操作數(shù) C 沒(méi)有使用,操作數(shù) B 若大于 1,表示把 B-1 個(gè) vararg 參數(shù)復(fù)制到寄存器中,否則只能等于 0。
公式:R(A),R(A+1),...R(A+B-2)=vararg
| EXTRAARG | iAx | 0x2E | OpArgU |
Ax:67108864 EXTRAARG
Ax 有 26bits,用來(lái)指定常量索引,可存放最大無(wú)符號(hào)整數(shù)為 67108864,可滿足大部分情況的需要了。
參考
《自己動(dòng)手實(shí)現(xiàn) Lua》源代碼
Lua 設(shè)計(jì)與實(shí)現(xiàn)--虛擬機(jī)篇
Lua 5.3 Bytecode Reference?
Lua 源碼解析??
總結(jié)
以上是生活随笔為你收集整理的深入理解 Lua 虚拟机的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: Javascript 多线程编程的前世
- 下一篇: 可能是世界上最简单的用 Go 来写 We