程序的装入和链接
程序的裝入和鏈接
標簽: phpweb服務優化extensionzendcache 2010-07-05 11:02 5787人閱讀 評論(4) 收藏 舉報 分類: 操作系統(4)版權聲明:本文為博主原創文章,未經博主允許不得轉載。
目錄(?)[+]
???????
1. 地址相關概念
1. 物理地址(physical address)
????? 物理內存,真實存在的插在主板內存槽上的內存條的容量的大小.
????? 內存是由若干個存儲單元組成的,每個存儲單元有一個編號,這種編號可唯一標識一個存儲單元,稱為內存地址(或物理地址)。我們可以把內存看成一個從0字節一直到內存最大容量逐字節編號的存儲單元數組,即每個存儲單元與內存地址的編號相對應。
??
2. 虛擬內存(Virtual memory)(也叫虛擬存儲器)
?
?????? ?虛擬內存地址就是每個進程可以直接尋址的地址空間,不受其他進程干擾。每個指令或數據單元都在這個虛擬空間中擁有確定的地址。??????
????? 虛擬內存就是進程中的目標代碼,數據等虛擬地址組成的虛擬空間?????
????? 虛擬內存不考慮物理內存的大小和信息存放的實際位置,只規定進程中相互關聯信息的相對位置。每個進程都擁有自己的虛擬內存,且虛擬內存的大小由處理機的地址結構和尋址方式決定。
?????? 如直接尋址,如果cpu的有效地址長度為16位,則其尋址范圍0 -64k。
?????? 再比如32位機器可以直接尋址4G空間,意思是每個應用程序都有4G內存空間可用。但是顯然機器內存罕有如此之大,可以支持每個程序使用4G內存的。
??????虛擬內存與物理內存的區別:虛擬內存就與物理內存相反,是指根據系統需要從硬盤虛擬地勻出來的內存空間,是一種計算機系統內存管理技術,屬于計算機程序,而物理內存為硬件。因為有時候當你處理大的程序時候系統內存不夠用,此時就會把硬盤當內存來使用,來交換數據做緩存區,不過物理內存的處理速度是虛擬內存的30倍以上。
3. 邏輯地址(logical address)
??????? 源程序經過匯編或編譯后,形成目標代碼,每個目標代碼都是以0為基址順序進行編址的,原來用符號名訪問的單元用具體的數據——單元號取代。這樣生成的目標程序占據一定的地址空間,稱為作業的邏輯地址空間,簡稱邏輯空間。
???????在邏輯空間中每條指令的地址和指令中要訪問的操作數地址統稱為邏輯地址。即應用程序中使用的地址。要經過尋址方式的計算或變換才得到內存中的物理地址。
?????? 很簡單,邏輯地址就是你源程序里使用的地址,或者源代碼經過編譯以后編譯器將一些標號,變量轉換成的地址,或者相對于當前段的偏移地址。
??????邏輯地址是指由程序產生的與段相關的偏移地址部分。例如,你在進行C語言指針編程中,可以讀取指針變量本身值(&操作),實際上這個值就是邏輯地址,它是相對于你當前進程數據段的地址,不和絕對物理地址相干。只有在Intel實模式下,邏輯地址才和物理地址相等(因為實模式沒有分段或分頁機制,Cpu不進行自動地址轉換);邏輯也就是在Intel保護模式下程序執行代碼段限長內的偏移地址(假定代碼段、數據段如果完全一樣)。應用程序員僅需與邏輯地址打交道,而分段和分頁機制對您來說是完全透明的,僅由系統編程人員涉及。應用程序員雖然自己可以直接操作內存,那也只能在操作系統給你分配的內存段操作。
???? 不過有些資料是直接把邏輯地址當成虛擬地址,兩者并沒有明確的界限。
??? 在linux內核,虛擬地址是3G-4G這段地址,它與物理地址通過頁表來映射,邏輯地址是指3G-3G+main_memory_size這段虛擬地址,它與物理地址的映射是線性的,當然也可以通過頁表映射。所以邏輯地址是虛擬地址的一部分。
??????? 邏輯地址的組成:是由一個段標識符加上一個指定段內相對地址的偏移量,表示為 [段標識符:段內偏移量]
?
???
????????????????????? 圖4.1? 作業的名空間、邏輯地址空間和裝入后的物理空間
4. 線性地址或Linux下也叫虛擬地址(virtual address)
???????? 這個地址很重要,也很不容易理解。分段機制下CPU尋址是二維的地址即,段地址:偏移地址,CPU不可能認識二維地址,因此需要轉化成一維地址即,段地址*16+偏移地址,這樣得到的地址便是線性地址(在未開啟分頁機制的情況下也是物理地址)。這樣有什么意義呢?或者說這個一維地址的計算方法隨便一個學計算機的人都知道,但是你真的理解它的意思嗎?要想理解它的意思,必須要知道什么是地址空間,下文詳述。
?????? 線性地址是邏輯地址到物理地址變換之間的中間層。程序代碼會產生邏輯地址,或者說是段中的偏移地址,加上相應段的基地址就生成了一個線性地址。如果啟用了分頁機制,那么線性地址可以再經變換以產生一個物理地址。若沒有啟用分頁機制,那么線性地址直接就是物理地址。Intel 80386的線性地址空間容量為4G(2的32次方即32根地址總線尋址)。
?????? 跟邏輯地址類似,它也是一個不真實的地址,如果邏輯地址是對應的硬件平臺段式管理轉換前地址的話,那么線性地址則對應了硬件頁式內存的轉換前地址。
?????? CPU將一個虛擬內存空間中的地址轉換為物理地址,需要進行兩步:首先將給定一個邏輯地址(其實是段內偏移量=),CPU要利用其段式內存管理單元,先將為個邏輯地址轉換成一個線程地址,再利用其頁式內存管理單元,轉換為最終物理地址。
?
程序如何運行
?????? 在多道程序環境下,要使程序運行,必須先為之創建進程。而創建進程的第一件事,便是將程序和數據裝入內存。如何將一個用戶源程序變為一個可在內存中執行的程序,通常都要經過以下幾個步驟:
??????? 首先是要編譯,由編譯程序(Compiler)將用戶源代碼編譯成cpu可執行的目標代碼,產生了若干個目標模塊(Object? Module)(即若干程序段),
????????其次是鏈接,由鏈接程序(Linker)將編譯后形成的一組目標模塊(程序段),以及它們所需要的庫函數鏈接在一起,形成一個完整的裝入模塊(Load? Module);
??????? 最后是裝入,由裝入程序(Loader)將裝入模塊裝入內存。圖 4-2 示出了這樣的三步過程。
?????????
?????????????????????????????????????????????????????????????????????? 圖4-2? 對用戶程序的處理步驟
2. 程序的裝入(地址的變換)
??????? ?為了闡述上的方便,我們先介紹一個無需進行鏈接的單個目標模塊的裝入過程。該目標模塊也就是裝入模塊。在將一個裝入模塊裝入內存時,可以有絕對裝入方式、可重定位裝入方式和動態運行時裝入方式,下面分別簡述之。
1.絕對裝入方式(Absolute Loading Mode)
?
??????????
???????? 在編譯時,如果知道程序將駐留在內存的什么位置,那么,編譯程序將產生絕對地址的目標代碼。即按照物理內存的位置賦予實際的物理地址。例如,事先已知用戶程序(進程)駐留在從R處開始的位置,則編譯程序所產生的目標模塊(即裝入模塊)便從R處開始向上擴展。絕對裝入程序按照裝入模塊中的地址,將程序和數據裝入內存。裝入模塊被裝入內存后,由于程序中的邏輯地址與實際內存地址完全相同,故不須對程序和數據的地址進行修改。程序中所使用的絕對地址,既可在編譯或匯編時給出,也可由程序員直接賦予。
??????? 這個方式的優點:是CPU執行目標代碼快。
?????? 缺點:1)是由于內存大小限制,能裝入內存并發執行的進程數大大減少
???????????????? ? 2)編譯程序必須知道內存的當前空閑地址部分和其地址,并且把進程的不同程序段連續地存放起來,編譯非常復雜。由于程序??
?????? 因此,通常是寧可在程序中采用符號地址,然后在編譯或匯編時,再將這些符號地址轉換為絕對地址。
?????? 如何把虛擬內存地址空間變換到內存唯一的一維物理線性空間?涉及到兩個問題:
??????? 一是虛擬空間的劃分問題。
??????? 二是把虛擬空間中已經鏈接和劃分好的內容裝入內存,并將虛擬空間地址映射內存地址的問題。即地址映射。
??????? 地址映射就是建立虛擬地址與內存地址的關系。
2.靜態地址重定位(可重定位裝入方式 Relocation Loading Mode)
?
?????? 絕對裝入方式只能將目標模塊裝入到內存中事先指定的位置。在多道程序環境下,編譯程序不可能預知所編譯的目標模塊應放在內存的何處,因此,絕對裝入方式只適用于單道程序環境。在多道程序環境下,所得到的目標模塊的起始地址通常是從 0 開始的,程序中的其它地址也都是相對于起始地址計算的。此時應采用可重定位裝入方式,根據內存的當前情況,將裝入模塊裝入到內存的適當位置。?
?????? 靜態地址重定位:即在程序裝入對目標代碼裝入內存的過程中完成,是指在程序開始運行前,程序中指令和數據的各個地址均已完成重定位,即完成虛擬地址到內存地址映射。地址變換通常是在裝入時一次完成的,以后不再改變。
?????? 值得注意的是, 在采用可重定位裝入程序將裝入模塊裝入內存后, 會使裝入模塊中的所有邏輯地址與實際裝入內存的物理地址不同,圖4-3示出了這一情況。
????
??????????????????? 圖4-3? 作業裝入內存時的情況
??? ?例如,在用戶程序的 1000 號單元處有一條指令LOAD 1,2500,該指令的功能是將 2500 單元中的整數 365 取至寄存器 1。但若將該用戶程序裝入到內存的 10000~15000號單元而不進行地址變換, 則在執行11000號單元中的指令時,它將仍從 2500 號單元中把數據取至寄存器1而導致數據錯誤。由圖4-3 可見,正確的方法應該是將取數指令中的地址 2500 修改成 12500,即把指令中的相對地址 2500 與本程序在內存中的起始地址 10000 相加,才得到正確的物理地址12500。除了數據地址應修改外,指令地址也須做同樣的修改,即將指令的相對地址 1000 與起始地址 10000 相加,得到絕對地址 11000。
優點:無需硬件支持
缺點:1)程序重定位之后就不能在內存中搬動了;
??????????? 2)要求程序的存儲空間是連續的,不能把程序放在若干個不連續的區域中。
?
3.動態地址重地位(動態運行時裝入方式 Dynamic Run-time Loading)?
??????? 可重定位裝入方式可將裝入模塊裝入到內存中任何允許的位置,故可用于多道程序環境;但這種方式并不允許程序運行時在內存中移動位置。因為,程序在內存中的移動,意味著它的物理位置發生了變化, 這時必須對程序和數據的地址(是絕對地址)進行修改后方能運行。然而,實際情況是,在運行過程中它在內存中的位置可能經常要改變,此時就應采用動態運行時裝入的方式。
?
???? 動態地址重定位:不是在程序執行之前而是在程序執行過程中進行地址變換。更確切的說,是把這種地址轉換推遲到程序真正要執行時才進行,即在每次訪問內存單元前才將要訪問的程序或數據地址變換成內存地址。動態重定位可使裝配模塊不加任何修改而裝入內存。為使地址轉換不影響指令的執行速度,這種方式需要一個重定位寄存器的支持,
優點:1)目標模塊裝入內存時無需任何修改,因而裝入之后再搬遷也不會影響其正確執行,這對于存儲器緊縮、解決碎片問題是極其有利的;
??????2)一個程序由若干個相對獨立的目標模塊組成時,每個目標模塊各裝入一個存儲區域,這些存儲區域可以不是順序相鄰的,只要各個模塊有自己對應的定位寄存器就行。
缺點:需要硬件支持。
3. 程序的鏈接
?????
? 源程序經過編譯后,可得到一組目標模塊,再利用鏈接程序將這組目標模塊鏈接,形成裝入模塊。根據鏈接時間的不同,可把鏈接分成如下三種:
?????? (1)?、 靜態鏈接。在程序運行之前,先將各目標模塊及它們所需的庫函數,鏈接成一個完整的裝配模塊,以后不再拆開。我們把這種事先進行鏈接的方式稱為靜態鏈接方式。
?????? (2)、? 裝入時動態鏈接。這是指將用戶源程序編譯后所得到的一組目標模塊,在裝入內存時,采用邊裝入邊鏈接的鏈接方式。
?????? (3)、? 運行時動態鏈接。這是指對某些目標模塊的鏈接,是在程序執行中需要該(目標)模塊時,才對它進行的鏈接。
?
1.靜態鏈接方式(Static Linking)
?????? 我們通過一個例子來說明在實現靜態鏈接時應解決的一些問題。在圖 4-4(a)中示出了經過編譯后所得到的三個目標模塊A、B、C,它們的長度分別為 L、M和N。在模塊A中有一條語句CALL B,用于調用模塊B。在模塊B中有一條語句CALL C,用于調用模塊C。B和C都屬于外部調用符號,在將這幾個目標模塊裝配成一個裝入模塊時,須解決以下兩個問題:??
???????? (1)? 對相對地址進行修改。在由編譯程序所產生的所有目標模塊中,使用的都是相對地址,其起始地址都為 0,每個模塊中的地址都是相對于起始地址計算的。在鏈接成一個裝入模塊后,原模塊B和 C在裝入模塊的起始地址不再是 0,而分別是 L和 L+M,所以此時須修改模塊B和C中的相對地址,即把原B中的所有相對地址都加上 L,把原 C中的所有相對地址都加上L+M。?
??????????(2)? 變換外部調用符號。將每個模塊中所用的外部調用符號也都變換為相對地址,如把B 的起始地址變換為 L,把 C 的起始地址變換為 L+M,如圖 4-4(b)所示。這種先進行鏈接所形成的一個完整的裝入模塊,又稱為可執行文件。通常都不再拆開它,要運行時可直接將它裝入內存。這種事先進行鏈接,以后不再拆開的鏈接方式,稱為靜態鏈接方式。
???????
???????????????????????????????????? 圖? 4-4? 程序鏈接示意圖
?
2.裝入時動態鏈接(Load-time Dynamic Linking)?
?????? 用戶源程序經編譯后所得的目標模塊,是在裝入內存時邊裝入邊鏈接的,即在裝入一個目標模塊時,若發生一個外部模塊調用事件,將引起裝入程序去找出相應的外部目標模塊,并將它裝入內存,還要按照圖4-4所示的方式來修改目標模塊中的相對地址。裝入時動態鏈接方式有以下優點:
??????? (1)?、 便于修改和更新。對于經靜態鏈接裝配在一起的裝入模塊,如果要修改或更新其中的某個目標模塊,則要求重新打開裝入模塊。這不僅是低效的,而且有時是不可能的。若采用動態鏈接方式,由于各目標模塊是分開存放的,所以要修改或更新各目標模塊是件非常容易的事。
??????? (2)、? 便于實現對目標模塊的共享。在采用靜態鏈接方式時,每個應用模塊都必須含有其目標模塊的拷貝,無法實現對目標模塊的共享。但采用裝入時動態鏈接方式,OS則很容易將一個目標模塊鏈接到幾個應用模塊上,實現多個應用程序對該模塊的共享。
3.運行時動態鏈接(Run-time Dynamic Linking)
??????? 在許多情況下,應用程序在運行時,每次要運行的模塊可能是不相同的。但由于事先無法知道本次要運行哪些模塊,故只能是將所有可能要運行到的模塊都全部裝入內存,并在裝入時全部鏈接在一起。顯然這是低效的,因為往往會有些目標模塊根本就不運行。比較典型的例子是作為錯誤處理用的目標模塊,如果程序在整個運行過程中都不出現錯誤,則顯然就不會用到該模塊。 近幾年流行起來的運行時動態鏈接方式,是對上述在裝入時鏈接方式的一種改進。這種鏈接方式是將對某些模塊的鏈接推遲到程序執行時才進行鏈接,亦即,在執行過程中,當發現一個被調用模塊尚未裝入內存時,立即由OS去找到該模塊并將之裝入內存,把它鏈接到調用者模塊上。凡在執行過程中未被用到的目標模塊,都不會被調入內存和被鏈接到裝入模塊上,這樣不僅可加快程序的裝入過程,而且可節省大量的內存空間。
?
4. Windows NT動態鏈接庫
4.1. 構造動態鏈接庫
??????? DLL是包含函數和數據的模塊,它的調用模塊可為EXE或DLL,它由調用模塊在運行時加載;加載時,它被映射到調用進程的地址空間。在VC中有一類工程用于創建DLL。
????? ?庫程序文件 .C:相當于給出一組函數定義的源代碼; ????? ?模塊定義文件 .DEF:相當于定義鏈接選項,也可在源代碼中定義;如:DLL中函數的引入和引出(dllimport和dllexport)。 ????? ?編譯程序利用 .C文件生成目標模塊 .OBJ ????? ?庫管理程序利用 .DEF文件生成DLL輸入庫 .LIB和輸出文件 .EXP ???? ??鏈接程序利用 .OBJ和 .EXP文件生成動態鏈接庫 .DLL。?4.2. DLL的裝入方法
1)裝入時動態鏈接(load-time): ?????????? –在編程時顯式調用某個DLL函數,該DLL函數在可執行文件中稱為引入(import)函數。 ????????? –鏈接時需利用 .LIB文件。在可執行文件中為引入的每個DLL建立一個IMAGE_IMPORT_DESCRIPTOR結構。????? 在裝入時由系統根據該DLL映射在進程中的地址改寫Import Address Table中的各項函數指針。Hint是DLL函數在DLL文件中的序號,當DLL文件修改后,就未必指向原先的DLL函數。在裝入時,系統會查找相應DLL,并把它映射到進程地址空間,獲得DLL中各函數的入口地址,定位本進程中對這些函數的引用
?
裝入時動態鏈接過程:
?(注:Import Address Table是在裝入時依據DLL模塊的加載位置確定)。
?
?
DLL函數的調用過程:
2)運行時動態鏈接(run-time): ?????? 在編程時通過LoadLibrary(給出DLL名稱,返回裝入和鏈接之后該DLL的句柄), FreeLibrary, GetProcAddress(其參數包括函數的符號名稱,返回該函數的入口指針)等API來使用DLL函數。這時不再需要引入庫(import library)。 ????? –LoadLibrary或LoadLibraryEx把可執行模塊映射到調用進程的地址空間,返回模塊句柄; ????? –GetProcAddress獲得DLL中特定函數的指針,返回函數指針; ????? –FreeLibrary把DLL模塊的引用計數減1;當引用計數為0時,拆除DLL模塊到進程地址空間的映射; ? 運行時動態鏈接的例子 [cpp] view plaincopyprint?
?
總結
- 上一篇: C语言单链表实现FCFS算法,2014腾
- 下一篇: java servlet 返回404_j