日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

GPU 编程入门到精通(一)之 CUDA 环境安装

發布時間:2025/3/15 编程问答 21 豆豆
生活随笔 收集整理的這篇文章主要介紹了 GPU 编程入门到精通(一)之 CUDA 环境安装 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

GPU 編程入門到精通(一)之 CUDA 環境安裝

標簽: cudagpunvidia

GPU 編程入門到精通(一)之 CUDA 環境安裝

標簽: cudagpunvidia 2632人閱讀 評論(0) 收藏 舉報 分類: 并行計算(6)

目錄(?)[+]


博主由于工作當中的需要,開始學習 GPU 上面的編程,主要涉及到的是基于 GPU 的深度學習方面的知識,鑒于之前沒有接觸過 GPU 編程,因此在這里特地學習一下 GPU 上面的編程。有志同道合的小伙伴,歡迎一起交流和學習,我的郵箱:caijinping220@gmail.com 。使用的是自己的老古董筆記本上面的 Geforce 103m 顯卡,雖然顯卡相對于現在主流的系列已經非常的弱,但是對于學習來說,還是可以用的。本系列博文也遵從由簡單到復雜,記錄自己學習的過程。


0. 目錄

  • GPU 編程入門到精通(一)之 CUDA 環境安裝
  • GPU 編程入門到精通(二)之 運行第一個程序
  • GPU 編程入門到精通(三)之 第一個 GPU 程序
  • GPU 編程入門到精通(四)之 GPU 程序優化
  • GPU 編程入門到精通(五)之 GPU 程序優化進階

1. CUDA-5.5 的新特性

  • —— 動態并行(Dynamic Parallelism):GPU 加速新算法

    GPU 線程可以動態地衍生新線程,從而更好地適應數據流。
    通過最大程度地簡化與 GPU 的往來通信,動態并行技術可以大大簡化并行編程,
    讓更多流行算法支持 GPU 加速,比如自適應網格加密、計算流體動力學等等。

  • —— GPU-Callable 庫:支持第三方生態系統

    新的 CUDA BLAS 庫可以讓開發人員為他們自己的 PU-Callable 庫使用動態并行,
    比如設計插件API、讓其他人擴展其內核的功能性,部署 GPU Callback、自定義第三方 GPU-Callable 庫的功能性。
    對象鏈接(object linking)可將多個 CUDA 源文件編譯成不同的對象文件,然后鏈接到更大的應用和庫中,從而更簡單、更高效地開發大型 GPU 應用。

  • —— GPUDirect 支持 RDMA (遠程直接內存訪問):消除系統內存瓶頸
    GPUDirect 技術建立了 GPU 與其它 PCI-E 設備的直接通信,并支持網卡與 GPU 之間的 RDMA,還能大幅降低集群中GPU 節點間的 MPISendRecv 延遲、改進整體應用性能。

  • —— NVIDIA Nsight Eclipse Edition:快速簡單地生成 GPU 代碼

    Linux、Mac OS X 平臺上,NVIDIA Nsight Eclipse Edition 可以讓開發人員在熟悉的 Eclipse IDE 環境內開發、調試和編譯 GPU 應用,并自帶 CUDA 編輯器和 CUDA 示例,可以更快地生成 CUDA 代碼,還整合了專家級的分析系統,提供自動性能分析,以及修復代碼中性能瓶頸的向導,還有語法高亮區分 GPU 代碼和 CPU 代碼。

2. 操作系統支持

CUDA 5 操作系統支持包括:Windows XP 臺式機、Windows Vista/7/8 臺式機和筆記本、Ubuntu 11.04/11.10、Fedora 16、Red Hat Enterprise Linux 5.x/6.x(后者僅限64位)、OpenSUSE 12.1(64位)、SUSE Server 11 SP1/SP2、Mac OS X。

3. 安裝環境檢測

3.1. 檢測自己的電腦是否具備支持 CUDA 的 GPU

可以采用如下命令:

lspci | grep -i nvidia

通過運行上面的命令,得到如下結果:

01:00.0 VGA compatible controller: NVIDIA Corporation G98M [GeForce G 103M] (rev a1)

通過命令,獲知我的筆記本是 GeForce G 103M 型號的 GPU
進入如下鏈接,查看自己 GPU 型號是否支持 CUDA。
官網鏈接

3.2. 下載安裝包

CUDA-5.5 安裝包下載地址

進入后出現如下下載界面,現在已經出來 CUDA-6.5了,大家只要找到自己相應的安裝包即可,這里視各自情況不同,自行選擇。

我的系統是 ubuntu12.04 32位的,所以選擇下載 Ubuntu 12.04 下面 32 位的 RUN 就可以了,600M+

4. CUDA-5.5 安裝

4.1. 軟件安裝

安裝 build-essential 安裝包,以確保 cuda 及顯卡驅動所需的 gcc 的安裝

apt-get install build-essential

退出圖形界面,進入控制臺

/etc/init.d/lightdm stop

按【Ctrl】+【alt】+【F1】進入控制臺界面,運行如下命令

sudo sh cuda_5.5.22_linux_32.run

在此過程中,一開始會出來一個文檔,比較長,可以通過按下按鍵【q】退出文檔,然后輸入【accept】就可以安裝,一直按確認,默認安裝即可,中間會選擇驅動文件目錄等。

4.2. 環境變量配置

在 /etc/profile 下添加如下語句:

export PATH=$PATH:/usr/local/cuda-5.5/bin export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-5.5/lib

通過運行如下命令,使得環境變量生效:

source /etc/profile

4.3. 退出控制臺

啟動 lightdm 服務

service lightdm start

5. 編譯 Sample

直接運行 make 就可以編譯 samples 里面的程序

隨機找了一個例子運行如下:



關于 CUDA 的安裝,介紹到這里,后續將關注 CUDA 編程方面的具體問題。
歡迎大家和我一起討論和學習 GPU 編程。
caijinping220@gmail.com
http://blog.csdn.net/xsc_c
2632人閱讀 評論(0) 收藏 舉報 分類: 并行計算(6)

目錄(?)[+]


博主由于工作當中的需要,開始學習 GPU 上面的編程,主要涉及到的是基于 GPU 的深度學習方面的知識,鑒于之前沒有接觸過 GPU 編程,因此在這里特地學習一下 GPU 上面的編程。有志同道合的小伙伴,歡迎一起交流和學習,我的郵箱:caijinping220@gmail.com 。使用的是自己的老古董筆記本上面的 Geforce 103m 顯卡,雖然顯卡相對于現在主流的系列已經非常的弱,但是對于學習來說,還是可以用的。本系列博文也遵從由簡單到復雜,記錄自己學習的過程。


0. 目錄

  • GPU 編程入門到精通(一)之 CUDA 環境安裝
  • GPU 編程入門到精通(二)之 運行第一個程序
  • GPU 編程入門到精通(三)之 第一個 GPU 程序
  • GPU 編程入門到精通(四)之 GPU 程序優化
  • GPU 編程入門到精通(五)之 GPU 程序優化進階

1. CUDA-5.5 的新特性

  • —— 動態并行(Dynamic Parallelism):GPU 加速新算法

    GPU 線程可以動態地衍生新線程,從而更好地適應數據流。
    通過最大程度地簡化與 GPU 的往來通信,動態并行技術可以大大簡化并行編程,
    讓更多流行算法支持 GPU 加速,比如自適應網格加密、計算流體動力學等等。

  • —— GPU-Callable 庫:支持第三方生態系統

    新的 CUDA BLAS 庫可以讓開發人員為他們自己的 PU-Callable 庫使用動態并行,
    比如設計插件API、讓其他人擴展其內核的功能性,部署 GPU Callback、自定義第三方 GPU-Callable 庫的功能性。
    對象鏈接(object linking)可將多個 CUDA 源文件編譯成不同的對象文件,然后鏈接到更大的應用和庫中,從而更簡單、更高效地開發大型 GPU 應用。

  • —— GPUDirect 支持 RDMA (遠程直接內存訪問):消除系統內存瓶頸
    GPUDirect 技術建立了 GPU 與其它 PCI-E 設備的直接通信,并支持網卡與 GPU 之間的 RDMA,還能大幅降低集群中GPU 節點間的 MPISendRecv 延遲、改進整體應用性能。

  • —— NVIDIA Nsight Eclipse Edition:快速簡單地生成 GPU 代碼

    Linux、Mac OS X 平臺上,NVIDIA Nsight Eclipse Edition 可以讓開發人員在熟悉的 Eclipse IDE 環境內開發、調試和編譯 GPU 應用,并自帶 CUDA 編輯器和 CUDA 示例,可以更快地生成 CUDA 代碼,還整合了專家級的分析系統,提供自動性能分析,以及修復代碼中性能瓶頸的向導,還有語法高亮區分 GPU 代碼和 CPU 代碼。

2. 操作系統支持

CUDA 5 操作系統支持包括:Windows XP 臺式機、Windows Vista/7/8 臺式機和筆記本、Ubuntu 11.04/11.10、Fedora 16、Red Hat Enterprise Linux 5.x/6.x(后者僅限64位)、OpenSUSE 12.1(64位)、SUSE Server 11 SP1/SP2、Mac OS X。

3. 安裝環境檢測

3.1. 檢測自己的電腦是否具備支持 CUDA 的 GPU

可以采用如下命令:

lspci | grep -i nvidia

通過運行上面的命令,得到如下結果:

01:00.0 VGA compatible controller: NVIDIA Corporation G98M [GeForce G 103M] (rev a1)

通過命令,獲知我的筆記本是 GeForce G 103M 型號的 GPU
進入如下鏈接,查看自己 GPU 型號是否支持 CUDA。
官網鏈接

3.2. 下載安裝包

CUDA-5.5 安裝包下載地址

進入后出現如下下載界面,現在已經出來 CUDA-6.5了,大家只要找到自己相應的安裝包即可,這里視各自情況不同,自行選擇。

我的系統是 ubuntu12.04 32位的,所以選擇下載 Ubuntu 12.04 下面 32 位的 RUN 就可以了,600M+

4. CUDA-5.5 安裝

4.1. 軟件安裝

安裝 build-essential 安裝包,以確保 cuda 及顯卡驅動所需的 gcc 的安裝

apt-get install build-essential

退出圖形界面,進入控制臺

/etc/init.d/lightdm stop

按【Ctrl】+【alt】+【F1】進入控制臺界面,運行如下命令

sudo sh cuda_5.5.22_linux_32.run

在此過程中,一開始會出來一個文檔,比較長,可以通過按下按鍵【q】退出文檔,然后輸入【accept】就可以安裝,一直按確認,默認安裝即可,中間會選擇驅動文件目錄等。

4.2. 環境變量配置

在 /etc/profile 下添加如下語句:

export PATH=$PATH:/usr/local/cuda-5.5/bin export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-5.5/lib

通過運行如下命令,使得環境變量生效:

source /etc/profile

4.3. 退出控制臺

啟動 lightdm 服務

service lightdm start

5. 編譯 Sample

直接運行 make 就可以編譯 samples 里面的程序

隨機找了一個例子運行如下:



關于 CUDA 的安裝,介紹到這里,后續將關注 CUDA 編程方面的具體問題。
歡迎大家和我一起討論和學習 GPU 編程。
caijinping220@gmail.com
http://blog.csdn.net/xsc_c

總結

以上是生活随笔為你收集整理的GPU 编程入门到精通(一)之 CUDA 环境安装的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。