xxxxプログラマのメモ

先人に感謝と敬意:自分の困ったこと調べたことのメモ

Update NVIDIA Driver

Docker Container + NVIDIA Device Plugin環境での実行

  • アクセスしているプロセスの停止
 sudo systemctl stop docker
 sudo systemctl stop kubelet

停止しておかないと更新エラーが発生。
ドライバインストール終わったらOS再起動化プロセスをスタートしてください

An NVIDIA kernel module 'nvidia' appears to already be loaded in your kernel. This may be because it is in use (for example, by an X server, a CUDA program, or the NVIDIA Persistence Daemon), but this may also happen if your kernel was configured without support for module unloading. Please be sure to exit any programs that may be using the GPU(s) before attempting to upgrade your driver

  • インストール
 sudo NVIDIA-Linux-x86_64-535.86.05.run --no-x-check
  • 動作確認

TensorFlowからGPUが認識できているかを2行コードで確認する - 動かざることバグの如し

Thanks!