CUDA環境が壊れたため入れ直した際の手順(Ubuntu 20.04)

PCをシャットダウンし、つけ直すと、CUDAの環境が壊れてしまった。

PCはUbuntu 20.04。

 

具体的には以下のような状況だった。

nvidia-smiのコマンドは正常に動く。

・nvcc -VはCommand 'nvcc' not foundになる。

・/usr/local/ ディレクトリを確認すると、あるはずのcudaディレクトリが無い。

 

補足をすると、

$ nvidia-sminvidiaドライバーの情報である。

このコマンドで表示されるCUDA Versionはドライバーが対応している最大のCUDA Versionである。

一方、$ nvcc -VはCUDA Tookkitのバージョン、つまりCUDAのバージョンが表示される。

 

よって、CUDAを入れ直す必要があった。

その際、以下のサイトを参考にした。

https://qiita.com/yukoba/items/c4a45435c6ee5d66706d

 

行ったこと:

sudo apt update

 

sudo apt-key adv --fetch-keys http://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/7fa2af80.pub

 

wget wget http://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/cuda-repo-ubuntu1804_10.2.89-1_amd64.deb

 

sudo dpkg -i cuda-repo-ubuntu1804_10.2.89-1_amd64.deb

 

sudo apt update

 

sudo apt install cuda cuda-drivers

 

sudo reboot

 

rm cuda-repo-ubuntu1804_10.2.89-1_amd64.deb

 

vim ~/.bashrc

ファイルの末尾に以下の2行を追加する

export PATH="/usr/local/cuda/bin:$PATH"

export LD_LIBRARY_PATH="/usr/local/cuda/lib64:$LD_LIBRARY_PATH"

 

sudo reboot

 

 これでCUDAが入った。

参考したサイトにはその後もcuDNNのインストールの手順が載っているが、それは行わなかった。

 

これでpytorchなどが使えるようになった。