共享CUDA内存
共享CUDA內存
進程間共享
此功能僅限于Linux。
將設備陣列導出到另一個進程
使用CUDA IPC API,可以與同一臺計算機上的另一個進程共享設備陣列。為此,請使用.get_ipc_handle()設備陣列上的方法獲取一個IpcArrayHandle對象,該對象可以轉移到另一個進程。
DeviceNDArray.get_ipc_handle()
返回一個IpcArrayHandle對象,該對象可以安全地序列化并傳輸到另一個進程以共享本地分配。
注意:此功能僅在Linux上可用。
類numba.cuda.cudadrv.devicearray.IpcArrayHandle(ipc_handle,array_desc )
IPC陣列句柄可以序列化并轉移到同一臺計算機上的另一個進程,以共享GPU分配。
在目標進程上,使用.open()方法創建一個新的 DeviceNDArray對象,該對象共享來自原始進程的分配。要釋放資源,請調用.close()方法。此后,目標將無法再使用共享數組對象。(注意:對資源的底層weakref現在已失效。)
該對象實現了上下文管理器接口,該接口自動調用 .open()和.close()方法:
with the_ipc_array_handle as ipc_array:
# use ipc_array here as a normal gpu array object
some_code(ipc_array)
ipc_array is dead at this point
close()
關閉陣列的IPC句柄。
open()
返回一個共享原始進程分配的新DeviceNDArray。不得在原始過程中使用。
從另一個進程導入IPC內存
以下函數用于從另一個進程作為設備陣列打開IPC句柄。
cuda.open_ipc_array(shape,dtype,strides = None,offset = 0 )
一個上下文管理器,它打開一個IPC句柄(CUipcMemHandle),該句柄表示為一個字節序列(例如,字節,int元組),并將其表示為給定形狀,步幅和dtype的數組,步幅可以省略。在那種情況下,假定它是一維C連續數組。
產生一個設備陣列。
上下文管理器退出時,IPC句柄將自動關閉。
總結
- 上一篇: CUDA功能和通用功能
- 下一篇: 适用于CUDA GPU的Numba例子