跳转至

CUDA

docs

安装与卸载

安装

下载安装包并运行

linux cudnn 直接解压要解压到 /usr/local/cuda-X.Y/target/linux.../ 路径下

sudo tar -xvf cudnn-linux-x86_64-X.Y.Z_cudaXX-archive.tar.xz -C /usr/local/cuda/targets/x86_64-linux/  --strip-components 1

卸载

在卸载程序界面卸载

cd /usr/local-X.Y/cuda
sudo ./cuda-uninstaller
sudo ./uninstall_cuda_X.Y.pl  # CUDA 10.0 以下
sudo rm -rf /usr/local/cuda-X.Y

nvcc

参数 描述
-arch=compute_XY 指定虚拟架构的计算能力
-code=sm_XY 指定真实架构的计算能力

PTX

PTX(Parallel Thread Execution)

nvcc -ptx cuda_file.cu -o ptx_file.ptx