GPU 드라이버
nvidia-smi가 동작하지 않아요
원인
Ubuntu 커널이 apt upgrade 또는 unattended-upgrades로 업데이트된 후 재부팅 시, NVIDIA 드라이버 DKMS 재빌드가 실패하면 모듈 로드가 안 됩니다.
확인
# 커널 버전 확인
uname -r
# 드라이버 모듈 로드 상태 확인
lsmod | grep nvidia
# DKMS 빌드 상태 확인
sudo dkms status
해결
# 현재 커널에 맞게 DKMS 재빌드
KERNEL=$(uname -r)
DRIVER=$(dkms status | grep nvidia | head -1 | awk -F'[, ]' '{print $2}')
sudo dkms install nvidia/$DRIVER -k $KERNEL
# 모듈 재로드
sudo modprobe nvidia
nvidia-smi
재빌드 후에도 실패하면 가상머신을 재시작합니다.
재발 방지
-
apt작업은 tmux 안에서 실행하세요. SSH 세션이 끊겨도 DKMS 빌드가 중단되지 않습니다.tmux # 또는 tmux attachsudo apt upgrade -
자동 커널 업데이트를 끄려면
unattended-upgrades를 제거합니다.sudo apt remove unattended-upgrades
Driver/Library version mismatch 오류
원인
가상머신 내부에서 NVIDIA 드라이버를 수동으로 업데이트했거나, 패키지 설치 도중 드라이버가 변경된 경우 발생합니다.