CUDA環境が壊れたため入れ直した際の手順(Ubuntu 20.04)
PCをシャットダウンし、つけ直すと、CUDAの環境が壊れてしまった。
PCはUbuntu 20.04。
具体的には以下のような状況だった。
・nvidia-smiのコマンドは正常に動く。
・nvcc -VはCommand 'nvcc' not foundになる。
・/usr/local/ ディレクトリを確認すると、あるはずのcudaディレクトリが無い。
補足をすると、
$ nvidia-smiはnvidiaドライバーの情報である。
このコマンドで表示されるCUDA Versionはドライバーが対応している最大のCUDA Versionである。
一方、$ nvcc -VはCUDA Tookkitのバージョン、つまりCUDAのバージョンが表示される。
よって、CUDAを入れ直す必要があった。
その際、以下のサイトを参考にした。
https://qiita.com/yukoba/items/c4a45435c6ee5d66706d
行ったこと:
sudo apt update
sudo apt-key adv --fetch-keys http://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/7fa2af80.pub
wget wget http://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/cuda-repo-ubuntu1804_10.2.89-1_amd64.deb
sudo dpkg -i cuda-repo-ubuntu1804_10.2.89-1_amd64.deb
sudo apt update
sudo apt install cuda cuda-drivers
sudo reboot
rm cuda-repo-ubuntu1804_10.2.89-1_amd64.deb
vim ~/.bashrc
ファイルの末尾に以下の2行を追加する
export PATH="/usr/local/cuda/bin:$PATH"
export LD_LIBRARY_PATH="/usr/local/cuda/lib64:$LD_LIBRARY_PATH"
sudo reboot
これでCUDAが入った。
参考したサイトにはその後もcuDNNのインストールの手順が載っているが、それは行わなかった。
これでpytorchなどが使えるようになった。