Saya melihat pesan kesalahan seperti di bawah ini:
Nov 15 15:49:52 x99 kernel: pcieport 0000:00:03.0: AER: Multiple
Corrected error received: id=0018 Nov 15 15:49:52 x99 kernel: pcieport
0000:00:03.0: PCIe Bus Error: severity=Corrected, type=Data Link Layer,
id=0018(Receiver ID) Nov 15 15:49:52 x99 kernel: pcieport 0000:00:03.0:
device [8086:6f08] error status/mask=00000040/00002000 Nov 15 15:49:52
x99 kernel: pcieport 0000:00:03.0: [ 6] Bad TLP
Ini akan menyebabkan kinerja yang menurun walaupun mereka (sejauh ini) telah diperbaiki. Jelas, masalah ini perlu diselesaikan. Namun, saya tidak dapat menemukan banyak hal di internet. (Mungkin saya mencari di tempat yang salah.) Saya hanya menemukan beberapa tautan yang akan saya posting di bawah ini.
Adakah yang tahu lebih banyak tentang kesalahan ini?
Apakah motherboard, Samsung 950 Pro, atau GPU (atau kombinasi dari semuanya)?
Perangkat kerasnya adalah: Asus X99 Deluxe II Samsung 950 Pro NVMe di M2. slot pada mb (yang berbagi port PCIe 3). Tidak ada lagi yang dicolokkan ke port PCIe 3. GeForce GTX 1070 dalam slot PCIe 1 Core i7 6850K CPU
Beberapa tautan yang saya temukan menyebutkan perangkat keras yang sama (X99 Deluxe II mb & Samsung950 Pro). Saya menjalankan Arch Linux.
Saya tidak menemukan string "8086: 6f08" di journalctl atau di mana pun saya berpikir untuk mencari sejauh ini.
pesan kesalahan aneh dengan nvme ssd (TLP Buruk): linuxquestions https://www.reddit.com/r/linuxquestions/comments/4walnu/odd_error_message_with_nvme_ssd_bad_tlp/
PCIe: Apakah kartu Anda berjuang dengan diam-diam dengan transmisi ulang TLP? http://billauer.co.il/blog/2011/07/pcie-tlp-dllp-retransmit-data-link-layer-error/
GTX 1080 Melempar Kesalahan Buruk TLP PCIe Bus - Forum GeForce https://forums.geforce.com/default/topic/957456/gtx-1080-throwing-bad-tlp-pcie-bus-errors/
driver - Kesalahan PCIe dalam log dmesg - Tanyakan Ubuntu /ubuntu/643952/pcie-error-in-dmesg-log
780Ti X99 hard lock - Kesalahan PCIE - Forum Pengembang NVIDIA https://devtalk.nvidia.com/default/topic/779994/linux/780ti-x99-hard-lock-pcie-errors/
Jawaban:
Saya dapat memberikan setidaknya beberapa detail, meskipun saya tidak dapat sepenuhnya menjelaskan apa yang terjadi.
Seperti dijelaskan untuk contoh di sini , CPU berkomunikasi dengan pengendali bus PCIe dengan paket lapisan transaksi (TLP). Perangkat keras mendeteksi ketika ada yang salah, dan kernel Linux melaporkannya sebagai pesan.
Opsi kernel
pci=nommconf
menonaktifkan Memory-Mapped PCI Configuration Space, yang tersedia di Linux sejak kernel 2.6. Sangat kasar, semua perangkat PCI memiliki area yang menggambarkan perangkat ini (yang Anda lihat denganlspci -vv
), dan metode awalnya untuk mengakses area ini melibatkan melalui port I / O, sementara PCIe memungkinkan ruang ini dipetakan ke memori untuk akses yang lebih sederhana.Itu berarti dalam kasus ini, sesuatu yang tidak beres ketika PCIe controller menggunakan metode ini untuk mengakses ruang konfigurasi dari perangkat tertentu. Mungkin bug perangkat keras di perangkat, di pengontrol root PCIe pada motherboard, dalam interaksi spesifik keduanya, atau sesuatu yang lain.
Dengan menggunakan
pci=nommconf
, ruang konfigurasi semua perangkat akan diakses dengan cara yang asli, dan mengubah metode akses dapat mengatasi masalah ini. Jadi jika Anda mau, itu sekaligus menyelesaikan dan menekannya.sumber
Menambahkan opsi baris perintah kernel
pci=nommconf
menyelesaikan masalah bagi saya. Oleh karena itu, saya menganggap masalahnya terkait dengan motherboard. Ini terjadi pada semua komputer yang dilengkapi motherboard X99 saya. Itu tidak terjadi pada sistem Z170 atau perangkat keras lain yang saya miliki.sumber
Coba langkah-langkah ini:
cp /etc/default/grub ~/Desktop
Edit grub. Tambahkan
pci=noaer
di akhirGRUB_CMDLINE_LINUX_DEFAULT
. Baris akan seperti ini:sudo cp ~/Desktop/grub /etc/default/
sudo update-grub
sumber
pci=noaer
saya gunakanpci=nommconf
seperti yang disarankan oleh @dirktsudoedit
untuk pengeditan yang aman? -1 untuk salinan ini di sini dan di sana langkah-langkahnya adalah omong kosong lengkappci=noaer
hanya menonaktifkan Pelaporan Kesalahan Lanjut. Jadi Anda masih memiliki kesalahan itu, Anda hanya tidak melihatnya ...Saya mendapatkan kesalahan yang sama (TLP buruk terkait dengan perangkat 8086: 6f08). Saya memiliki X99 Deluxe II, Samsung 960 pro, Nvidia 1080 ti. Masalah-masalah ini tampaknya terkait dengan chipset X99 dan perangkat M.2, seperti Samsung Pro.
Motherboard X99 Deluxe II berbagi bandwidth antara slot PCIE16_3 dan M.2 / U.2. Mengikuti komentar dari @Nic, di BIOS saya mengubah Konfigurasi Perangkat Onboard | U.2_2 Bandwidth dari Otomatis ke U.2_2. Ini memperbaiki masalah bagi saya.
sumber
Saya mengubah slot PCIE16_3 Konfigurasi dalam Bios di x99-E saya menjadi statis diatur ke mode x8, bukan otomatis yang standar untuk dukungan perangkat M.2. Sekarang berfungsi dengan baik tanpa kesalahan TLP pada kedua kartu 1070GTX saya yang terhubung melalui papan ekstensi PCIe 1x hingga 16x.
Saya tidak menggunakan port 16_3 terlebih dahulu, pindah ke slot itu untuk menguji tetapi masih memiliki masalah sebelum perubahan bios. Juga mengubah pengaturan bsleep untuk semua kartu menjadi 30 di konfigurasi penambang.
Sebelum perubahan saya memiliki log kernel spammed dengan kesalahan. Juga mencoba untuk menyalakan sistem sebelum dan sesudah perubahan. Tampaknya cukup gigih.
sumber
Cari manual motherboard Anda untuk "AER". Anda dapat membunuh sumber masalah dengan mengoreksi ketidaksesuaian spesifik atau menonaktifkan AER sama sekali. Hanya gunakan ini jika semua kesalahan terkait dengan kesalahan yang diperbaiki , jika tidak, Anda bisa menutupi masalah yang sebenarnya.
sumber