[转][C/C++]函数名字修饰(Decorated Name)方式
1、C/C++函數修飾名:
對于我們的C/C++源程序而言,函數名只是函數的一小部分,函數還有調用方式(參數入棧方式)、返回值類型、參數個數和各參數類型等信息,對于C++類成員函數,還有更多信息。這些信息按照約定格式有序排列,程序員閱讀起來非常方便。但對編譯器和鏈接器等工具而言,把這些信息集中到一個字符串中更符合它們的“閱讀”習慣,所以函數修飾名(Decorated?Name)應運而生了。函數修飾名是在編譯函數定義或原型期間生成的,用于編譯工具內部的函數識別、定位。程序員一般情況下不需要接觸函數修飾名,但在一些特殊形況下,我們還是要直接接觸到函數修飾名,譬如鏈接過程中的排錯;在匯編程序中嵌入C/C++函數。
2、C/C++函數修飾名規則:?
2.1.?C編譯器的函數名修飾規則?
c語言不支持重載,所以不會出現函數名相同,而返回值類型、參數個數和參數類型不同的情況。也就是說函數修飾名只需添加調用方式(參數入棧方式)即可。對于常見的三種調用方式:
- __stdcall調用約定:編譯器和鏈接器會在輸出函數名前加上一個下劃線前綴,函數名后面加上一個“@”符號和其參數的字節數,例如_functionname@number。
- __cdecl調用約定:僅在輸出函數名前加上一個下劃線前綴,例如_functionname。
- __fastcall調用約定:在輸出函數名前加上一個“@”符號,后面也是一個“@”符號和其參數的字節數,例如@functionname@number???
2.2.?C++編譯器的函數名修飾規則
? ?因為C++支持函數重載,所以它的函數名修飾規則有些復雜。經過修飾后的C++函數名,不僅攜帶函數調用方式信息,還攜帶有返回值類型、參數個數和參數類型信息,可能還有命名空間和類信息。不管__cdecl,__fastcall還是__stdcall調用方式,函數修飾都是以一個“?”開始,后面緊跟函數的名字,再后面是參數表的開始標識和按照參數類型代號拼出的參數表。對于__stdcall方式,參數表的開始標識是“@@YG”,對于__cdecl方式則是“@@YA”,對于__fastcall方式則是“@@YI”。參數表的拼寫代號如下所示:??X--void?????D--char?????
E--unsigned?char?????F--short?????H--int?????
I--unsigned?int?????J--long?????
K--unsigned?long(DWORD)??M--float?????N--double?????_N--bool??U--struct??....??
指針的方式有些特別,用PA表示指針,用PB表示const類型的指針。后面的代號表明指針類型,如果相同類型的指針連續出現,以“0”代替,一個“0”代表一次重復。U表示結構
類型,通常后跟結構體的類型名,用“@@”表示結構類型名的結束。函數的返回值不作特殊處理,它的描述方式和函數參數一樣,緊跟著參數表的開始標志,也就是說,函數參數表的第一項實際上是表示函數的返回值類型。參數表后以“@Z”標識整個名字的結束,如果該函數無參數,則以“Z”標識結束。下面舉兩個例子,假如有以下函數聲明:???
int?Function1?(char?*var1,unsigned?long);??
其函數修飾名為“?Function1@@YG?H?PA?D?K@Z”,而對于函數聲明:??void?Function2();??
其函數修飾名則為“?Function2@@YGXXZ”?。???
????對于C++的類成員函數(其調用方式是thiscall),函數的名字修飾與非成員的C++函數稍有不同,首先就是在函數名字和參數表之間插入以“@”字符引導的類名;其次是參數表的開始標識不同,公有(public)成員函數的標識是“@@QAE”,保護(protected)成員函數的標識是“@@IAE”,私有(private)成員函數的標識是“@@AAE”,如果函數聲明使用了const關鍵字,則相應的標識應分別為“@@QBE”,“@@IBE”和“@@ABE”。如果參數類型是類實例的引用,則使用“AAV1”,對于const類型的引用,則使用“ABV1”。下面就以類CTest為例說明C++成員函數的名字修飾規則:??class?CTest??{??......??private:??
????void?Function(int);??protected:??
????void?CopyInfo(const?CTest?&src);??public:??
????long?DrawText(HDC?hdc,?long?pos,?const?TCHAR*?text,?RGBQUAD?color,?BYTE?bUnder,?bool?bSet);??
????long?InsightClass(DWORD?dwClass)?const;??......??};???
對于成員函數Function,其函數修飾名為“?Function@CTest@@AAEXH@Z”,字符串“@@AAE”表示這是一個私有函數。成員函數CopyInfo只有一個參數,是對類CTest的const引用參數,其函數修飾名為“?CopyInfo@CTest@@IAEXABV1@@Z”。DrawText是一個比較復雜的函數聲明,不僅有字符串參數,還有結構體參數和HDC句柄參數,需要指出的是HDC實際上是一個HDC__結構類型的指針,這個參數的表示就是“PAUHDC__@@”,?其完整的函數修飾名為?
?“?DrawText@CTest@@QAEJPAUHDC__@@JPBDUtagRGBQUAD@@E_N@Z”。InsightClass是一個共有的const函數,它的成員函數標識是“@@QBE”,完整的修飾名就是“?InsightClass@CTest@@QBEJK@Z”。???
無論是C函數名修飾方式還是C++函數名修飾方式均不改變輸出函數名中的字符大小寫,這和PASCAL調用約定不同,PASCAL約定輸出的函數名無任何修飾且全部大寫。
3.查看函數的名字修飾???
????有兩種方式可以檢查你的程序中的函數的名字修飾:使用編譯輸出列表或使用Dumpbin工具。使用/FAc,/FAs或/FAcs命令行參數可以讓編譯器輸出函數或變量名字列表。使用dumpbin.exe?/SYMBOLS命令也可以獲得obj文件或lib文件中的函數或變量名字列表。此外,還可以使用?undname.exe?將修飾名轉換為未修飾形式。?????
函數調用約定和名字修飾規則不匹配引起的常見問題??????函數調用時如果出現堆棧異常,十有八九是由于函數調用約定不匹配引起的。比如動態鏈接庫a有以下導出函數:long?MakeFun(long?lFun);??
動態庫生成的時候采用的函數調用約定是__stdcall,所以編譯生成的a.dll中函數MakeFun的調用約定是_stdcall,也就是函數調用時參數從右向左入棧,函數返回時自己還原堆棧。現在某個程序模塊b要引用a中的MakeFun,b和a一樣使用C++方式編譯,只是b模塊的函數調用方式是__cdecl,由于b包含了a提供的頭文件中MakeFun函數聲明,所以MakeFun在b模塊中被其它調用MakeFun的函數認為是__cdecl調用方式,b模塊中的這些函數在調用完MakeFun當然要幫著恢復堆棧啦,可是MakeFun已經在結束時自己恢復了堆棧,b模塊中的函數這樣多此一舉就引起了棧指針錯誤,從而引發堆棧異常。宏觀上的現象就是函數調用沒有問題(因為參數傳遞順序是一樣的),MakeFun也完成了自己的功能,只是函數返回后引發錯誤。解決的方法也很簡單,只要保證兩個模塊的在編譯時設置相同的函數調用約定就行了。??
???在了解了函數調用約定和函數的名修飾規則之后,再來看在C++程序中使用C語言編譯的庫時經常出現的LNK?2001錯誤就很簡單了。還以上面例子的兩個模塊為例,這一次兩個模塊在編譯的時候都采用__stdcall調用約定,但是a.dll使用C語言的語法編譯的(C語言方式),所以a.dll的載入庫a.lib中MakeFun函數的名字修飾就是“_MakeFun@4”。b包含了a提供的頭文件中MakeFun函數聲明,但是由于b采用的是C++語言編譯,所以MakeFun在b模塊中被按照C++的名字修飾規則命名為“?MakeFun@@YGJJ@Z”,編譯過程相安無事,鏈接程序時c++的鏈接器就到a.lib中去找“?MakeFun@@YGJJ@Z”,但是a.lib中只有“_MakeFun@4”,沒有“?MakeFun@@YGJJ@Z”,于是鏈接器就報告:???
error?LNK2001:?unresolved?external?symbol??MakeFun@@YGJJ@Z???
解決的方法和簡單,就是要讓b模塊知道這個函數是C語言編譯的,extern?"C"可以做到這一點。一個采用C語言編譯的庫應該考慮到使用這個庫的程序可能是C++程序(使用C++編譯器),所以在設計頭文件時應該注意這一點。通常應該這樣聲明頭文件:????
#ifdef?_cplusplus??extern?"C"?{??#endif???
long?MakeFun(long?lFun);?
#ifdef?_cplusplus??}??
#endif?????
這樣C++的編譯器就知道MakeFun的修飾名是“_MakeFun@4”,就不會有鏈接錯誤了。???
????許多人不明白,為什么我使用的編譯器都是VC的編譯器還會產生“error?LNK2001”錯誤?其實,VC的編譯器會根據源文件的擴展名選擇編譯方式,如果文件的擴展名是“.C”,編譯器會采用C的語法編譯,如果擴展名是“.cpp”,編譯器會使用C++的語法編譯程序,所以,最好的方法就是使用extern?"C"。???
1.__stdcall??
以“?”標識函數名的開始,后跟函數名;?函數名后面以“@@YG”標識參數表的開始,后跟參數表;??
參數表以代號表示:?X--void?,?D--char,?E--unsigned?char,?F--short,?H--int,?I--unsigned?int,?J--long,?K--unsigned?long,?M--float,?N--double,?_N--bool,?....?PA--表示指針,后面的代號表明指針類型,如果相同類型的指針連續出現,以“0”代替,一個“0”代表一次重復;??
參數表的第一項為該函數的返回值類型,其后依次為參數的數據類型,指針標識在其所指數據類型前;??
參數表后以“@Z”標識整個名字的結束,如果該函數無參數,則以“Z”標識結束。?其格式為“?functionname@@YG*****@Z”或“?functionname@@YG*XZ”,?例如?int?Test1(char?*var1,unsigned?long)-----“?Test1@@YGHPADK@Z”?void?Test2()?-----“?Test2@@YGXXZ”??2?__cdecl調用約定:?規則同上面的?_stdcall?調用約定,只是參數表的開始標識由上面的“@@YG”變為“@@YA”。???
3?__fastcall調用約定:?規則同上面的_stdcall調用約定,只是參數表的開始標識由上面的“@@YG”變為“@@YI”。???
VC++對函數的省缺聲明是"__cedcl",將只能被C/C++調用。???
CB在輸出函數聲明時使用4種修飾符號?:???
__cdecl?cb?的默認值,它會在輸出函數名前加?"_",并保留此函數名不變,參數按照從右到左的順序依次傳遞給棧,也可以寫成_cdecl和cdecl形式。??
__fastcall?修飾的函數的參數將盡可能的使用寄存器來處理,其函數名前加@,參數按照從左到右的順序壓棧;??
__pascal?它說明的函數名使用?Pascal?格式的命名約定。這時函數名全部大寫。參數按照從左到右的順序壓棧;??
__stdcall?使用標準約定的函數名。函數名不會改變。使用?__stdcall?修飾時。參數按照由右到左的順序壓棧,也可以是_stdcall;
語言函數調用約定???
在C語言中,假設我們有這樣的一個函數:???
int?function(int?a,int?b)???
調用時只要用?result?=?function(1,2)?這樣的方式就可以使用這個函數。但是,當高級語言被編譯成計算機可以識別的機器碼時,有一個問題就出現來:在CPU中,計算機沒有辦法知道一個函數調用需要多少個、什么樣的參數,也沒有硬件可以保存這些參數。也就是說,計算機不知道怎么給這個函數傳遞參數,傳遞參數的工作必須由函數調用者和函數本身來協調。為此,計算機提供了一種被稱為棧的數據結構來支持參數傳遞。???
棧是一種先后進先出的數據結構,棧有一個存儲區、一個棧頂指針。棧頂指針指向堆棧中第一個可用的數據項(被稱為棧頂)。用戶可以在棧頂上方向棧中加入數據,這個操作被稱為壓棧?(Push),壓棧以后,棧頂自動變成新加入數據項的位置,棧頂指針也隨之修改。用戶也可以從堆棧中取走棧頂,稱為彈出棧?(pop),彈出棧后,棧頂下的一個元素變成棧頂,棧頂指針隨之修改。???
函數調用時,調用者依次把參數壓棧,然后調用函數,函數被調用以后,在堆棧中取得數據,并進行計算。函數計算結束以后,或者調用者、或者函數本身修改堆棧,使堆棧恢復原裝。???
在參數傳遞中,有兩個很重要的問題必須得到明確說明:???
當參數個數多于一個時,按照什么順序把參數壓入堆棧??函數調用后,由誰來把堆棧恢復原狀??
在高級語言中,通過函數調用約定來說明這兩個問題。常見的調用約定有:???
stdcall??cdecl??fastcall??thiscall??naked?call???
stdcall調用約定??
stdcall很多時候被稱為pascal調用約定,因為pascal是早期很常見的一種教學用計算機程序設計語言,其語法嚴謹,使用的函數調用約定就是stdcall。在Microsoft?C++系列的C/C++編譯器中,常常用PASCAL宏來聲明這個調用約定,類似的宏還有WINAPI和CALLBACK。???
stdcall調用約定聲明的語法為(以前文的那個函數為例):???
int?__stdcall?function(int?a,int?b)???
stdcall的調用約定意味著:1)參數從右向左壓入堆棧,2)函數自身修改堆棧?3)函數名自
動加前導的下劃線,后面緊跟一個@符號,其后緊跟著參數的尺寸???
以上述這個函數為例,參數b首先被壓棧,然后是參數a,函數調用function(1,2)調用處翻譯成匯編語言將變成:???
push?2??????//?第二個參數入棧??push?1??????//?第一個參數入棧??
call?function?//?調用參數,注意此時自動把cs:eip入棧???
而對于函數自身,則可以翻譯為:???
push?ebp?????//?保存ebp寄存器,該寄存器將用來保存堆棧的棧頂指針,可以在函數退出時恢復??
mov?ebp,esp?//?保存堆棧指針??
mov?eax,[ebp?+?8H]?//?堆棧中ebp指向位置之前依次保存有?ebp,cs:eip,a,b,ebp?+?8指向?a??add?eax,[ebp?+?0CH]?//?堆棧中ebp?+?1?2處保存了b??mov?esp,ebp????????//?恢復esp??pop?ebp??ret?8??
而在編譯時,這個函數的名字被翻譯成_function@8???
注意不同編譯器會插入自己的匯編代碼以提供編譯的通用性,但是大體代碼如此。??其中在函數開始處保留esp到ebp中,在函數結束恢復是編譯器常用的方法。???
從函數調用看,2和1依次被push進堆棧,而在函數中又通過相對于ebp(即剛進函數時的堆棧指針)的偏移量存取參數。??
函數結束后,ret?8?表示清理8個字節的堆棧,函數自己恢復了堆棧。???
cdecl調用約定??
cdecl?調用約定又稱為C調用約定,是C語言缺省的調用約定,它的定義語法是:???
int?function?(int?a?,int?b)?//不加修飾就是C調用約定??int?__cdecl?function(int?a,int?b)?//明確指出C調用約定???
cdecl調用約定的參數壓棧順序是和?stdcall是一樣的,參數首先由有向左壓入堆棧。??所不同的是,函數本身不清理堆棧,調用者負責清理堆棧。??
由于這種變化,C?調用約定允許函數的參數的個數是不固定的,這也是C語言的一大特色。??對于前面的function函數,使用cdecl后的匯編碼變成:???
調用處??push?1??push?2??
call?functionadd??
esp,8???//?注意:這里調用者在恢復堆棧
被調用函數_function處??
push?ebp??????//?保存ebp寄存器,該寄存器將用來保存堆棧的棧頂指針,可以在函數退出時恢復??
mov?ebp,esp?//?保存堆棧指針??
mov?eax,[ebp?+?8H]?//?堆棧中ebp指向位置之前依次保存有?ebp,?cs:eip,a,b,ebp?+8指向a??add?eax,[ebp?+?0CH]?//?堆棧中ebp?+?12處保存了b??mov?esp,ebp?????????//?恢復esp??pop?ebp??
???ret?????????//?注意,這里沒有修改堆棧???
MSDN中說,該修飾自動在函數名前加前導的下劃線,因此函數名在符號表中被記錄為_function,但是我在編譯時似乎沒有看到這種變化。??由于參數按照從右向左順序壓棧,因此最開始的參數在最接近棧頂的位置,因此當采用不定個數參數時,第一個參數在棧中的位置肯定能知道,只要不定的參數個數能夠根據第一個后者后續的明確的參數確定下來,就可以使用不定參數,例如對于CRT中的sprintf函數,定義為:???
int?sprintf(char*?buffer,const?char*?format,...)???
由于所有的不定參數都可以通過?format?確定,因此使用不定個數的參數是沒有問題的。???
fastcall調用約定??
fastcall調用約定和stdcall類似,它意味著:???
函數的第一個和第二個DWORD參數(或者尺寸更小的)通過ecx和edx傳遞,其他參數通過從右向左的順序壓棧??被調用函數清理堆棧??函數名修改規則同stdcall??
其聲明語法為:int?fastcall?function(int?a,int?b)???
為了說明這個調用約定,定義如下類和使用代碼:??class?A??{??
public:???????
int?function1(int?a,int?b);???????int?function2(int?a,...);??};???
int?A::function1?(int?a,int?b)??{????
return?a+b;??}?
int?A::function2(int?a,...)??{?????
va_list?ap;???
va_start(ap,a);???
int?i;????
int?result?=?0;???
for(i?=?0??i?<?a??i?++)?????{????????
???result?+=?va_arg(ap,int);?????}???
return?result;??}???
void?callee()??{?????A?a;?????
a.function1?(1,2);????a.function2(3,1,2,3);??}???
//?下面這段匯編代碼是原文章的,我覺得有問題,還是自己反匯編看看???
//函數function1調用0401C1D????push????????200401C1F????push????????100401C21????
lea?????????ecx,[ebp-8]00401C24????call?function1????????????
//?注意,這里this沒有被入棧??//函數function2調用00401C29????push????????300401C2B????push????????200401C2D????push????????100401C2F????push????????300401C31????lea?????????eax,[ebp-8]????
這里引入this指針00401C34????push????????eax00401C35????call???function200401C3A????add?????????esp,14h???
?
?
以下代碼是我修改分析的:???
上面的C++代碼,必須包含?stdarg.h?,提供動態參數頭文件???
int?A::function1?(int?a,int?b)?????//??{????
004113A0?push????????ebp??004113A1?mov?????????ebp,esp??004113A3?sub?????????esp,0CCh??004113A9?push????????ebx??004113AA?push????????esi??004113AB?push????????edi??004113AC?push????????ecx??
004113AD?lea?????????edi,[ebp-0CCh]??004113B3?mov?????????ecx,33h??
004113B8?mov?????????eax,0CCCCCCCCh??004113BD?rep?stos????dword?ptr?es:[edi]??004113BF?pop?????????ecx??
004113C0?mov?????????dword?ptr?[ebp-8],ecx??return?a+b;??
004113C3?mov?????????eax,dword?ptr?[a]??004113C6?add?????????eax,dword?ptr?[b]??}???
004113C9?pop?????????edi??004113CA?pop?????????esi??004113CB?pop?????????ebx??004113CC?mov?????????esp,ebp??004113CE?pop?????????ebp??004113CF?ret?????????8???
void?callee()??{?????
00411460?push????????ebp??00411461?mov?????????ebp,esp??00411463?sub?????????esp,0CCh??00411469?push????????ebx??0041146A?push????????esi??0041146B?push????????edi??
0041146C?lea?????????edi,[ebp-0CCh]??00411472?mov?????????ecx,33h??
00411477?mov?????????eax,0CCCCCCCCh??0041147C?rep?stos????dword?ptr?es:[edi]??A?a;?????
?
?
a.function1?(1,2);????
0041147E?push????????2????????????????//?參數?2?入棧??00411480?push????????1?????????????????//?參數?1?入棧??00411482?lea?????????ecx,[a]???????????//?this?指針?---->?ECX??00411485?call????????A::function1?(411050h)??a.function2(3,1,2,3);??
0041148A?push????????3?????0041148C?push????????2?????0041148E?push????????1?????00411490?push????????3?????
00411492?lea?????????eax,[a]??????????//?這里?this?指針入棧了,對照?callee?對?function1?的調用,???
00411495?push????????eax?????????????//?對?this?的處理是不同的????
00411496?call????????A::function2?(411122h)?????//?此處調用者自己沒有恢復堆棧???
//?由于上面的入棧順序可知,在?function?2中?當保存ebp?后(打開stack?frame后),堆棧的狀態如下.??
ebp???????????????//?保存的?EBP?的值,?且?此時ebp指向該處??RetAddr???????//?返回地址??
this指針???????//?入棧的?this?指針??
參數?3??????????//?下面是入棧的參數,?從右向左入棧??參數?1??參數?2??參數?3????
0041149B?add?????????esp,14h????????????????????????????//?此處調用者自己恢復堆棧???
//.............下面的匯編代碼是?檢查堆棧和恢復?callee?堆棧的操作,不再寫了??}???
可見,對于參數個數固定情況下,它類似于stdcall,不定時則類似cdecl???
naked?call?調用約定??
這是一個很少見的調用約定,一般程序設計者建議不要使用。編譯器不會給這種函數增加初始化和清理代碼,更特殊的是,你不能用return返???
回返回值,只能用插入匯編返回結果。這一般用于實模式驅動程序設計,假設定義一個求和的加法程序,可以定義為:???
__declspec(naked)?int?add(int?a,int?b)??{????
???__asm?mov?eax,a????
?
?
???__asm?add?eax,b???????__asm?ret??}???
注意,這個函數沒有顯式的return返回值,返回通過修改eax寄存器實現,而且連退出函數的ret指令都必須顯式插入。???
上面代碼被翻譯成匯編以后變成:???
mov?eax,[ebp+8]??add?eax,[ebp+12]??ret?8???
注意這個修飾是和__stdcall及cdecl結合使用的,前面是它和cdecl結合使用的代碼,對于和stdcall結合的代碼,則變成:???
__declspec(naked)?int?__stdcall?function(int?a,int?b)??{?????
__asm?mov?eax,a?????__asm?add?eax,b?????
__asm?ret?8????????//注意后面的8??}??
至于這種函數被調用,則和普通的cdecl及stdcall調用函數一致。????
函數調用約定導致的常見問題??
如果定義的約定和使用的約定不一致,則將導致堆棧被破壞,導致嚴重問題,下面是兩種常見的問題:??
函數原型聲明和函數體定義不一致??
DLL導入函數時聲明了不同的函數約定??
以后者為例,假設我們在dll種聲明了一種函數為:???
__declspec(dllexport)?int?func(int?a,int?b);//注意,這里沒有stdcall,使用的是cdecl??使用時代碼為:???
typedef?int?(*WINAPI?DLLFUNC)func(int?a,int?b);???????hLib?=?LoadLibrary(...);???????
DLLFUNC?func?=?(DLLFUNC)GetProcAddress(...)?//這里修改了調用約定???????result?=?func(1,2);???????//導致錯誤??
由于調用者沒有理解WINAPI的含義錯誤的增加了這個修飾,上述代碼必然導致堆棧被破壞,??
MFC在編譯時插入的checkesp函數將告訴你,堆棧被破壞了
轉載于:https://www.cnblogs.com/victor-ma/p/4184806.html
總結
以上是生活随笔為你收集整理的[转][C/C++]函数名字修饰(Decorated Name)方式的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 新闻部主任个人主要事迹材料3篇
- 下一篇: ### 学习《C++ Primer》-