ubuntu24.04安装nvidia cuda和cudnn
全新安装的ubuntu 24.04,最近安装完stable-diffusion后,在使用命令./webui.sh
启动时报错:
1 | RuntimeError: Torch is not able to use GPU |
经过查询得知,stable-diffusion-webui默认你已经安装好了cuda
,而在ubuntu
下安装完nvidia的私有驱动后,并不会安装cuda
和cudnn
库。
使用nvidia-smi
查询,显示的cuda
版本只是最高能兼容的版本,并不代表已经安装好cuda
了。
由此也就有了本文。
设置nvidia官方源
使用nvidia官方安装源的方式,来在线安装nvidia 驱动、cuda
和cudnn
。
安装官方源的keyring
1 | wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2404/x86_64/cuda-keyring_1.1-1_all.deb |
安装设置官方源
1 | echo "deb [signed-by=/usr/share/keyrings/cuda-archive-keyring.gpg] https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2404/x86_64/ /" | sudo tee /etc/apt/sources.list.d/cuda-ubuntu2404-x86_64.list |
给官方源添加pin文件
1 | wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2404/x86_64/cuda-ubuntu2404.pin |
至此,nvidia官方源设置完毕
升级nvidia驱动
为什么要升级为官方源里nvidia驱动呢?这是因为ubuntu 24.04自带的驱动是550版本,最高支持到cuda 12.4,而nvidia官方源里的
cuda
版本是12.6。所以需要把nvidia驱动升级到官方源里的560版本以适配cuda
版本。
1 | sudo apt install nvidia-driver-560 |
安装cuda
1 | sudo apt install cuda-toolkit |
安装 cudnn
1 | sudo apt install cudnn-cuda-12 |
至此,nvidia驱动、cuda以及cudnn安装完毕。
测试cuda是否正常
查询设备信息
1 | git clone https://github.com/NVIDIA/cuda-samples.git |
输出如下:
测试带宽
1 | cd ~/cuda-samples/Samples/1_Utilities/bandwidthTest |
输出如下: