[MetalKit]34-Working-with-memory-in-Metal内存管理
本系列文章是對 metalkit.org 上面MetalKit內(nèi)容的全面翻譯和學(xué)習(xí).
MetalKit系統(tǒng)文章目錄
今天我們關(guān)注一下使用GPU時的內(nèi)存管理.Metal框架將內(nèi)存資源定義為MTLBuffer對象,它是分配的無類型,無格式的內(nèi)存(任何數(shù)據(jù)類型),MTLTexture對象則是分配的格式化內(nèi)存來保存圖片數(shù)據(jù).我們在本文中只關(guān)注緩沖器.
創(chuàng)建MTLBuffer對象時有三種選項:
- makeBuffer(length:options:) 創(chuàng)建一個MTLBuffer對象并分配一塊新內(nèi)存.
- makeBuffer(bytes:length:options:) 從一片已經(jīng)存在的區(qū)域復(fù)制數(shù)據(jù)到一塊新分配的內(nèi)存.
- makeBuffer(bytesNoCopy:length:options:deallocator:) 重用一塊已經(jīng)存在的內(nèi)存.
讓我們創(chuàng)建一組緩沖器,看看數(shù)據(jù)是如何被傳遞到GPU的,及如何回傳給CPU.我們首先創(chuàng)建一塊緩沖器給輸入和輸出數(shù)據(jù),并給它們初始化一些值:
let count = 1500 var myVector = [Float](repeating: 0, count: count) var length = count * MemoryLayout< Float >.stride var outBuffer = device.makeBuffer(bytes: myVector, length: length, options: []) for (index, value) in myVector.enumerated() { myVector[index] = Float(index) } var inBuffer = device.makeBuffer(bytes: myVector, length: length, options: []) 復(fù)制代碼新的MemoryLayout< Type >.stride語法在Swift 3被引入,來替代老的strideof(Type)函數(shù).同時,因為內(nèi)存排列的原因我們用.stride替代了.size.stride是指針增長時移動的字節(jié)數(shù).下一步是把我們緩沖器告訴命令編碼器:
encoder.setBuffer(inBuffer, offset: 0, at: 0) encoder.setBuffer(outBuffer, offset: 0, at: 1) 復(fù)制代碼注意: <Metal最佳實踐指南>指出當我們的數(shù)據(jù)小于4KB(例如一個千位的浮點數(shù))時就避免創(chuàng)建緩沖器.在本例中我們應(yīng)該使用setBytes()函數(shù)來代替創(chuàng)建緩沖器.
最后一步是讀取GPU通過contents() 函數(shù)返回的數(shù)據(jù),綁定內(nèi)存數(shù)據(jù)到我們的輸出緩沖器上:
let result = outBuffer.contents().bindMemory(to: Float.self, capacity: count) var data = [Float](repeating:0, count: count) for i in 0 ..< count { data[i] = result[i] } 復(fù)制代碼Metal資源必須被配置好,以便快速內(nèi)存訪問和驅(qū)動器性能優(yōu)化.資源的儲存模式允許我們定義緩沖器和紋理的儲存位置和訪問權(quán)限.如果你再看一眼上面我們創(chuàng)建緩沖器的地方,我們使用了默認([])的儲存模式.
所有的iOS和tvOS設(shè)備支持unified memory model統(tǒng)一內(nèi)存模型,它可以讓CPU和GPU共享系統(tǒng)內(nèi)存,而macOS設(shè)備支持discrete memory model離散內(nèi)存模型即GPU擁有自己的內(nèi)存.在iOS和tvOS中,Shared模式(MTLStorageModeShared)定義了系統(tǒng)內(nèi)存可以被CPU和GPU訪問,而Private模式(MTLStorageModePrivate)定義系統(tǒng)內(nèi)存只能被GPU訪問.Shared模式是所有三種操作系統(tǒng)中的默認儲存模式.
除了這兩種儲存模式外,macOS還有一種Managed模式(MTLStorageModeManaged),它為一種資源定義了一對同步內(nèi)存,一個副本在系統(tǒng)內(nèi)存中,另一個在視頻內(nèi)存中來獲得更快的CPU和GPU本地訪問.
現(xiàn)在讓我們看看當我們將數(shù)據(jù)緩沖器發(fā)送給GPU時,GPU上面發(fā)生了什么.下面是個典型的頂點著色器例子:
vertex Vertices vertex_func(const device Vertices *vertices [[buffer(0)]], constant Uniforms &uniforms [[buffer(1)]], uint vid [[vertex_id]]) {... } 復(fù)制代碼Metal Shading Language實現(xiàn)了地址空間修飾詞來指定當函數(shù)變量或參數(shù)分配時的內(nèi)存區(qū)域:
- device - 指緩沖器內(nèi)存對象,從設(shè)備內(nèi)存池中分配,既可讀又可寫除非前面有const關(guān)鍵詞就是只讀的.
- constant - 指緩沖器內(nèi)存對象,從設(shè)備內(nèi)存池中分配,但是是read-only只讀的.程序作用域內(nèi)的變量必須被聲明為常量地址空間,并在聲明語句中被初始化.常量地址空間為多個實例在執(zhí)行圖形或內(nèi)核函數(shù)時訪問緩沖器中的同一塊位置的做了優(yōu)化.
- threadgroup - 僅用來分配內(nèi)核函數(shù)中使用的變量,它們是為每個執(zhí)行內(nèi)核的線程組分配的,被線程組內(nèi)的所有線程共享,只在執(zhí)行內(nèi)核的線程組的生命周期內(nèi)才存在.
- thread - 指每個線程的內(nèi)存地址空間.分配在這個地址空間的變量對其它線程是不可見的.在圖形或內(nèi)核函數(shù)中聲明的變量是分配在線程地址空間的.
作為獎勵,讓我們也看一下在Swift 3中另一種訪問內(nèi)存位置的方法.這段代碼是從前面的文章The Model I/O framework中摘抄的,所以我們就不再講解體素的細節(jié)了.只要想著我們需要遍歷一個數(shù)組來獲取值:
let url = Bundle.main.url(forResource: "teapot", withExtension: "obj") let asset = MDLAsset(url: url) let voxelArray = MDLVoxelArray(asset: asset, divisions: 10, patchRadius: 0) if let data = voxelArray.voxelIndices() {data.withUnsafeBytes { (voxels: UnsafePointer<MDLVoxelIndex>) -> Void inlet count = data.count / MemoryLayout<MDLVoxelIndex>.sizelet position = voxelArray.spatialLocation(ofIndex: voxels.pointee)print(position)} } 復(fù)制代碼在本例中,MDLVoxelArray對象有了個名為spatialLocation()的函數(shù),它讓我們用一個MDLVoxelIndex類型的UnsafePointer指針來遍歷數(shù)組,并通過每個位置的pointee來訪問數(shù)據(jù).在本例中,我們只打印出地址中的第一個值,但一個簡單的循環(huán)可以讓我們得到所有的數(shù),像這樣:
var voxelIndex = voxels for _ in 0..<count {let position = voxelArray.spatialLocation(ofIndex: voxelIndex.pointee)print(position)voxelIndex = voxelIndex.successor() } 復(fù)制代碼源代碼source code已發(fā)布在Github上.
下次見!
總結(jié)
以上是生活随笔為你收集整理的[MetalKit]34-Working-with-memory-in-Metal内存管理的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 从jQuery 入口方式写jQuery工
- 下一篇: .net程序员面试考试题目