NVIDIA-SMI gagal karena tidak dapat berkomunikasi dengan driver NVIDIA. Pastikan driver NVIDIA terbaru diinstal dan dijalankan

23

Saya baru saja menginstal CUDA di notebook seperti ini:

sudo apt-get install cuda

Seperti yang dikatakan di sini .

Kompilasi wokrs baik-baik saja tetapi ketika saya mencoba untuk menjalankan saya mendapat masalah berikut: CUDA error di file.cu:128 code = 35 (cudaErrorInsufficientDriver) "cudaStreamCreate (& (stream [i]))" "

Versi nvcc saya:

nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2016 NVIDIA Corporation
Built on Tue_Jan_10_13:22:03_CST_2017
Cuda compilation tools, release 8.0, V8.0.61

Info kartu grafis:

lspci | egrep 'VGA|3D'
00:02.0 VGA compatible controller: Intel Corporation Skylake Integrated Graphics (rev 06)
02:00.0 3D controller: NVIDIA Corporation GM107M [GeForce GTX 960M] (rev a2)

Saya juga menginstal VirtualGL, bumblebee-nvidia, primus, freeglut3-dev. Mengikuti ini .

Ketika saya mencoba menjalankan sesuatu pada lebah saya mendapat ini: optirun glxspheres64

[   41.413478] [ERROR]Cannot access secondary GPU - error: Could not load GPU driver
[   41.413520] [ERROR]Aborting because fallback start is disabled.

Sopir nvidia tidak bekerja.

nvidia-smi
NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.

Sepertinya versi nvidia 375 sudah diinstal tetapi saya tidak bisa membuatnya berfungsi.

whereis nvidia
nvidia: /usr/lib/nvidia /usr/share/nvidia /usr/src/nvidia-375-375.66/nvidia

Dan beberapa info driver.

modinfo nvidia_375
filename:       /lib/modules/4.8.0-54-generic/updates/dkms/nvidia_375.ko
alias:          char-major-195-*
version:        375.66
supported:      external
license:        NVIDIA
srcversion:     68751AFD79A210CEFFB8758
alias:          pci:v000010DEd00000E00sv*sd*bc04sc80i00*
alias:          pci:v000010DEd*sv*sd*bc03sc02i00*
alias:          pci:v000010DEd*sv*sd*bc03sc00i00*
depends:        
vermagic:       4.8.0-54-generic SMP mod_unload modversions 
parm:           NVreg_Mobile:int
parm:           NVreg_ResmanDebugLevel:int
parm:           NVreg_RmLogonRC:int
parm:           NVreg_ModifyDeviceFiles:int
parm:           NVreg_DeviceFileUID:int
parm:           NVreg_DeviceFileGID:int
parm:           NVreg_DeviceFileMode:int
parm:           NVreg_UpdateMemoryTypes:int
parm:           NVreg_InitializeSystemMemoryAllocations:int
parm:           NVreg_UsePageAttributeTable:int
parm:           NVreg_MapRegistersEarly:int
parm:           NVreg_RegisterForACPIEvents:int
parm:           NVreg_CheckPCIConfigSpace:int
parm:           NVreg_EnablePCIeGen3:int
parm:           NVreg_EnableMSI:int
parm:           NVreg_TCEBypassMode:int
parm:           NVreg_UseThreadedInterrupts:int
parm:           NVreg_MemoryPoolSize:int
parm:           NVreg_RegistryDwords:charp
parm:           NVreg_RmMsg:charp
parm:           NVreg_AssignGpus:charp

Saya pikir itu bisa menjadi beberapa masalah versi driver:

dpkg -l | grep nvidia
ii  bumblebee-nvidia                            3.2.1-10                                      amd64        NVIDIA Optimus support using the proprietary NVIDIA driver
ii  nvidia-375                                  375.66-0ubuntu0.16.04.1                       amd64        NVIDIA binary driver - version 375.66
ii  nvidia-375-dev                              375.66-0ubuntu0.16.04.1                       amd64        NVIDIA binary Xorg driver development files
ii  nvidia-modprobe                             375.51-0ubuntu1                               amd64        Load the NVIDIA kernel driver and create device files
ii  nvidia-opencl-icd-375                       375.66-0ubuntu0.16.04.1                       amd64        NVIDIA OpenCL ICD
ii  nvidia-prime                                0.8.2                                         amd64        Tools to enable NVIDIA's Prime

Apa yang saya lewatkan?

Rodolfo
sumber
bagaimana Anda menginstal driver?
Charlie Parker
Menghadapi kesalahan yang sama, dan tidak ada jawaban yang berhasil. Apa yang bekerja adalah sederhana: $ reboot now.
darthbhyrava

Jawaban:

14

Jika Anda nvidia-smigagal berkomunikasi tetapi Anda telah menginstal driver berkali-kali, periksa prime-select.

  1. Jalankan prime-select queryuntuk mendapatkan semua opsi yang mungkin. Anda harus melihat setidaknya nvidia | intel.
  2. Pilih prime-select nvidia.
  3. Jika dikatakan nvidia is already selected, pilih yang berbeda, misalnya prime-select intel, lalu beralih kembali ke nvidiaprime-select nvidia
  4. Mulai ulang dan periksa nvidia-smi.
Phuc Le
sumber
Membantuku. Terima kasih!
Yaroslav Schubert
uh oh, prime-select querybahkan tidak mencantumkan intel, saya kira saya punya 2 masalah sekarang ...
Inspi
11

Anda mungkin ingin menginstal cuda toolkit. Menggunakan perintah berikut untuk menginstalnya.

sudo apt install nvidia-cuda-toolkit

Setelah instalasi selesai, reboot mesin. nvidia-smiharus bekerja.

Jack Chan
sumber
bekerja untukku !!
x0v
Ini bekerja untuk saya
Sundeep
5
Tidak berfungsi di sini
Bill Kotsias
1
jangan lakukan ini jika Anda memiliki cuda> = 10. Ini akan menurunkan peringkat cuda Anda menjadi 9, yang saat ini tersedia di ubuntu tanpa CUDA PPA.
loretoparisi
Melakukan sudo apt-get purge nvidia-*sebelumnya, kemudian baris di atas memperbaiki semua yang berhubungan dengan CUDA untuk saya, menginstal driver 430 dengan CUDA 10.1
Dinari
6

Saya menonaktifkan Boot Aman dan itu bekerja dengan sangat baik.

@ rod-smith menjawab pertanyaan lain yang lebih spesifik menjelaskan bagaimana melakukannya, pada dasarnya adalah konfigurasi konfigurasi, tetapi ia juga menulis artikel yang bagus tentang bagaimana melakukannya di sini .

Rodolfo
sumber
2
Itu membantu saya untuk dengan driver nvidia 390 juga! Saya tidak pernah berpikir itu mungkin karena boot aman, thx :)
samutamm
Mode UEFI dengan Boot Aman yang dinonaktifkan sudah dilakukan di sini. =) Sepertinya itu tidak bekerja untuk semua orang, sayangnya.
Renan Willian Prado
3

karena saya tidak dapat mengomentari jawaban @ Rodolfo di atas (tidak cukup reputasi), saya menambahkan jawaban baru.

Di mesin saya, saya harus mengkonfigurasi Boot Aman sesuai dengan OS saya. Saya memiliki mainboard ASUS yang menjalankan Ubuntu 18.04 dan mencoba menginstal NVIDIA CUDA 10.1 Pembaruan 2 dengan driver NVIDIA yang dikemas. Saya menghadapi masalah yang sama seperti yang dijelaskan di atas. Ternyata, Boot Aman diatur ke mode Windows UEFI. Mengubahnya ke OS Lain memperbaikinya untuk saya.

markus
sumber
1
Terima kasih, saya harus menonaktifkan Secure Bootyang secara otomatis diaktifkan kembali selama pembaruan otomatis Windows / BIOS !!! Sekarang nvidia berfungsi dengan baik.
Bill Kotsias
maukah Anda menjelaskan bagaimana Anda mengubah boot aman ke OS lain ?
Inspi
1
@ BillKotsias, terima kasih! : D
Marek
1

Untuk pembaca masa depan:

Saya menggunakan mesin virtual (Google Cloud Platform)

dan saya mengikuti inti ini untuk menginstal Cudadan CuDNndi VM saya.

Saya harus mengunggah CuDNnbagian itu secara manual . (Hanya meletakkannya di sana.)

Sekarang, sampai ke kesalahan:

Saya mengalami masalah ini tetapi restart lengkap contoh melakukan pekerjaan. Dan dengan sepenuhnya restart maksud saya menghentikan instance dan menyalakannya kembali.

Saya harap ini membantu seseorang.

Pramesh Bajracharya
sumber