상세 컨텐츠

본문 제목

[ubuntu 서버만들기 #2] nvidia graphic driver 설치

Linux

by 힐둔 2022. 1. 9. 02:55

본문

 

우분투 딥러닝서버 만들기 두번째, Nvidia Graphic Driver 설치하기 !

 

Graphic Driver를 설치하는 순서는 다음과 같다.

  1. Graphic Card 확인
  2. 설치 가능한 Driver 버전 확인
  3. 설치 하고자 하는 Driver 버전 설치
  4. 재부팅 후 버전 확인

딥러닝용 서버를 구축하기 위해 GPU Driver > CUDA > cudnn > Anaconda > tensorflow > Jupyter notebook 차례로 설치할 예정이다. 사실 이런 계획 없이 가장 마지막에 GPU와 CUDA 설치하다가 우분투를 두 세번 재 설치 했다. 우선적으로 window만 주종으로 써왔던 터라 우분투 (리눅스)는 많이 생소했다. 그 동안은 누가 서버 열어주면 터미널로만 소스 받고 빌드하는 정도 였다. 

 

Graphic Driver와 CUDA 설치 단계에서 고배를 마셨던 주요 내용은 CUDA 설치 시에 Graphic driver 까지 같이 설치해주게 되는데 (나중에 안 거지만 CUDA만 깔고 Driver는 깔지 않도록 선택할 수 있었다.), 이전 설치된 driver와 충돌이 많이 발생했다. 쨋든 난 Graphic Driver 설치 > CUDA 설치 (이 때, Graphic Driver는 제외)의 순으로 했다. 사실 CUDA도 conda 명령으로 설치 할 수 있다는 걸 나중에 알았다. 만약 이쯤되면 여러개의 가상환경에서 서로 다른 CUDA 버전을 깔아도 되는 것 같다. 나중에 한번 해보게 되면 포스팅 해보려 한다. 

 

tensorflow를 사용하고 있기에 google에서 테스트 된 환경을 (recommanded) 설치하려고 한다. 그 중 일단 가장 최신 버전으로... 문제 있다면 나중에 다시 깔면 되니 !

 

https://www.tensorflow.org/install/source#tested_build_configurations

 

CUDA 11.2를 위해서는 최소 450.80.02 이상만 깔면 된다고 한다. Minimum Required Driver 버전이다.

https://docs.nvidia.com/deploy/cuda-compatibility/

 

 


1. Graphic Card 확인

 

 Nvidia Quadro RTX 4000 이고, nouveau driver가 설치되어 있다. Ubuntu 설치하면 기본으로 설치되는 것 같다. lshw (list hardware)는 hw 정보를 알 수 있는 리눅스 명령이며 display라는 class 명령을 통해 Graphic card를 확인 할 수 있다.

sudo lshw -c display

lshw -c display

CUDA core가 2304개이고, 8GB의 메모리를 가지고 있다. 음 의외로 괜찮은 걸 주운듯? 참고로 AWS EC2 g4dn.2xlarge는 Tesla T4 였던 것 같다. 그것 대비 나쁘지는 않다. 어차피 개나 나나 Graphic Card는 하나 뿐이다.

Quadro RTX 4000


2. 설치 가능한 Driver 버전 확인

ubuntu-drivers devices로 확인 가능하며 아래와 같이 recommended 버전도 확인해준다. command가 먹지 않으면  sudo apt install -y ubuntu-drivers-common 명령으로 설치먼저 해주자.  apt-cache나 apt search로도 확인 가능하다. 

ubuntu-drivers devices

apt-cache search nvidia-driver # 대체
apt search nvidia-driver # 대체

우분투 그래픽 드라이버 설치

 


3. 설치 하고자 하는 Driver 버전 설치

추천해준 버전을 sudo apt-get install nvidia-driver-470 이라는 명령으로 설치한다. 설치하기전에 sudo apt update와 sudo apt upgrade를 꼭 먼저 해주자.

sudo apt update
sudo apt upgrade

sudo apt-get install nvidia-driver-470

우분투 그래픽 카드 드라이버 설치하기

 

설치되는 동안 광고 좀 보면서...

 


4. 재부팅 후 버전 확인

아래와 같은 명령들로 패키지 확인 가능하다. nvidia-smi에서 나오는 CUDA 버전은 실제 설치된 버전이 아니라 470.86에 어울리는 버전이라고 표시한 것 뿐이다. 처음에는 Graphic Driver를 깔면 자동으로 CUDA가 깔리는 것인줄 알았으나 그게 아닌 거였다. 일단 잘 깔린듯 하다.

cat /proc/driver/nvidia/version
dpkg -l | grep -i nvidia
nvidia-smi

cat /proc/driver/nvidia/version

nvidia-smi

 

 

관련글 더보기

댓글 영역