Ubuntu Box dengan beberapa kartu grafis NVIDIA

3

Saya baru-baru ini membeli sebuah kotak dari System76 yang memiliki beberapa GPU: satu Quadro M6000, dan dua Tesla K40.

Kapan saya melakukannya lspci | grep -i nvidia ia mengatakan

05:00.0 VGA compatible controller: NVIDIA Corporation Device 17f0 (rev a1)
05:00.1 Audio device: NVIDIA Corporation Device 0fb0 (rev a1)
06:00.0 3D controller: NVIDIA Corporation GK110BGL [Tesla K40c] (rev a1)
09:00.0 3D controller: NVIDIA Corporation GK110BGL [Tesla K40c] (rev a1)

Jadi mereka sana .. Tapi, ketika saya melakukannya nvidia-smi -L itu hanya menunjukkan

GPU 0: Quadro M6000 (UUID: GPU-09446504-6a9e-866a-a65d-0f1d55b7657b)

dan, ls -l /dev/nvidia* menunjukkan

crw-rw-rw- 1 root root 195,   0 Aug  9 03:29 /dev/nvidia0
crw-rw-rw- 1 root root 195, 255 Aug  9 03:29 /dev/nvidiactl
crw-rw-rw- 1 root root 248,   0 Aug 12 16:19 /dev/nvidia-uvm

Saya tidak yakin, tapi saya menduga /dev/nvidia0 adalah Quadro M6000, dan mungkin fakta bahwa tidak ada /dev/nvidia1 atau a /dev/nvidia2, adalah gejala lain (atau mungkin penyebabnya) dari kotak tidak melihat Tesla K40 .. Juga, program pengujian saya yang memanggil cudaGetDeviceCount , hanya menghasilkan satu GPU ..

Saya menjalankan Ubuntu 14.04.3, dan saya telah menginstal cuda_7.0.28_linux.run (dan menginstal driver NVIDIA melalui file run itu.)

Mengapa kartu lainnya tidak dapat diakses? Bagaimana cara membuatnya dapat diakses?

bnsh
sumber
Saya memiliki banyak masalah ketika mencoba mengatur beberapa kartu Nvidia di Ubuntu yang saya berikan. Lebih baik berkonsultasi dengan dukungan Nvidia secara langsung: Saya akan Anda ke komputasi GPU mereka sebenarnya baik dalam membantu Anda, tetapi linux bukan keahlian

Jawaban:

2

Baik! txbob kesini forum nvidia devtalk memberi saya cukup petunjuk untuk mendapatkan solusi.

Jadi, pada dasarnya, nouveau mengganggu driver nvidia, dan meskipun saya melihat disable-nouveau file dalam /etc/modprobe.d, itu belum berlaku, karena saya tidak mengulangi initramfs...

Jadi, untuk melakukan itu, saya perlu melakukannya

rm -f /boot/initrd*
update-initramfs -c -k all
update-grub2

setelah itu berjalan nvidia-smi -L hasil panen

GPU 0: Quadro M6000 (UUID: GPU-09446504-6a9e-866a-a65d-0f1d55b7657b)
GPU 1: Tesla K40c (UUID: GPU-e992022a-724f-8f47-e08f-a954053020e6)
GPU 2: Tesla K40c (UUID: GPU-4d14695e-3e43-bf43-a3e3-91190f696d39)

Jadi, semuanya baik-baik saja sekarang! Semoga ini bisa membantu orang lain!

bnsh
sumber