ubuntu24.04安装nvidia cuda和cudnn

全新安装的ubuntu 24.04,最近安装完stable-diffusion后,在使用命令./webui.sh启动时报错:

1
RuntimeError: Torch is not able to use GPU

经过查询得知,stable-diffusion-webui默认你已经安装好了cuda,而在ubuntu下安装完nvidia的私有驱动后,并不会安装cudacudnn库。

使用nvidia-smi查询,显示的cuda版本只是最高能兼容的版本,并不代表已经安装好cuda了。

由此也就有了本文。

设置nvidia官方源

使用nvidia官方安装源的方式,来在线安装nvidia 驱动、cudacudnn

安装官方源的keyring

1
2
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2404/x86_64/cuda-keyring_1.1-1_all.deb
sudo dpkg -i cuda-keyring_1.1-1_all.deb

安装设置官方源

1
echo "deb [signed-by=/usr/share/keyrings/cuda-archive-keyring.gpg] https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2404/x86_64/ /" | sudo tee /etc/apt/sources.list.d/cuda-ubuntu2404-x86_64.list

给官方源添加pin文件

1
2
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2404/x86_64/cuda-ubuntu2404.pin
sudo mv cuda-ubuntu2404.pin /etc/apt/preferences.d/cuda-repository-pin-600

至此,nvidia官方源设置完毕

升级nvidia驱动

为什么要升级为官方源里nvidia驱动呢?这是因为ubuntu 24.04自带的驱动是550版本,最高支持到cuda 12.4,而nvidia官方源里的cuda版本是12.6。所以需要把nvidia驱动升级到官方源里的560版本以适配cuda版本。

1
sudo apt install nvidia-driver-560

安装cuda

1
sudo apt install cuda-toolkit

安装 cudnn

1
sudo apt install cudnn-cuda-12

至此,nvidia驱动、cuda以及cudnn安装完毕。

测试cuda是否正常

查询设备信息

1
2
3
4
git clone https://github.com/NVIDIA/cuda-samples.git
cd ./cuda-samples/Samples/1_Utilities/deviceQuery
make
./deviceQuery

输出如下:

测试带宽

1
2
3
cd ~/cuda-samples/Samples/1_Utilities/bandwidthTest
make
./bandwidthTest

输出如下: