Ubuntu 18.04 kesalahan saat bangun dari tidur: Baca-kesalahan pada perangkat swap

11

Setelah laptop dalam mode tidur selama beberapa jam, ketika saya mencoba dan melanjutkan sesi saya, saya mendapatkan kesalahan berikut:

Baca-kesalahan pada perangkat swap

Dibutuhkan sekitar 30 detik untuk layar login untuk memuat posting ini terjadi. Setelah saya masuk, layar akan kosong satu atau dua kali selama satu detik, dan tidak ada program saya yang terbuka lagi. Saya mendapatkan prompt "Masalah sistem terdeteksi". Ketika saya mengklik "Kirim Laporan", pemberitahuan lain muncul mengatakan:

Maaf program "Xorg" ditutup secara tak terduga. Komputeer Anda tidak memiliki cukup memori bebas untuk menganalisis masalah secara otomatis dan mengirim laporan ke pengembang.

Apa yang saya coba sejauh ini adalah menambah ruang swap yang tersedia. Awalnya sekitar 2 GB dan saya membuat file swap 9 GB. Ini tidak membantu. Ruang swap yang ditempati (sesuai perintah swapon) setelah crash selalu sekitar 170MB.

DMESG untuk ketika saya melanjutkan sesi saya, hingga kesalahan baca pada perangkat swap adalah sebagai berikut:

    
[64046.474054] ACPI: Resume tingkat rendah selesai
[64046.474162] ACPI: EC: EC dimulai
[64046.474162] PM: Memulihkan memori platform NVS
[64046.475139] Mengaktifkan CPU non-boot ...
[64046.475196] x86: Booting konfigurasi SMP:
[64046.475196] smpboot: Booting Node 0 Processor 1 APIC 0x2
[64046.475663] cache: parent cpu1 tidak boleh tidur
[64046.475859] CPU1 aktif
[64046.475910] smpboot: Booting Node 0 Processor 2 APIC 0x4
[64046.476330] cache: parent cpu2 tidak boleh tidur
[64046.476506] CPU2 naik
[64046.476539] smpboot: Booting Node 0 Processor 3 APIC 0x6
[64046.477071] cache: parent cpu3 tidak boleh tidur
[64046.477255] CPU3 aktif
[64046.477274] smpboot: Booting Node 0 Processor 4 APIC 0x1
[64046.477721] cache: parent cpu4 tidak boleh tidur
[64046.477922] CPU4 aktif
[64046.477947] smpboot: Booting Node 0 Processor 5 APIC 0x3
[64046.478371] cache: parent cpu5 tidak boleh tidur
[64046.478571] CPU5 aktif
[64046.478591] smpboot: Booting Node 0 Processor 6 APIC 0x5
[64046.479018] cache: parent cpu6 tidak boleh tidur
[64046.479229] CPU6 aktif
[64046.479247] smpboot: Booting Node 0 Processor 7 APIC 0x7
[64046.479675] cache: parent cpu7 tidak boleh tidur
[64046.479899] CPU7 aktif
[64046.485913] ACPI: Bangun dari kondisi tidur sistem S3
[64046.639206] ACPI: EC: event unblocked
[64046.639711] sd 2: 0: 0: 0: [sda] Mulai disk
[64046.873289] usb 1-11: reset perangkat USB kecepatan penuh nomor 2 menggunakan xhci_hcd
[64046.976869] ata4: Tautan SATA bawah (SStatus 4 SControl 300)
[64046.976892] ata2: Tautan SATA bawah (SStatus 4 SControl 300)
[64047.149289] usb 1-6: reset perangkat USB kecepatan tinggi nomor 40 menggunakan xhci_hcd
[64047.437370] psmouse serio1: sinaptik: kueri koordinat maks: x [..5660], y [..4570]
[64047.476302] psmouse serio1: sinaptik: kueri koordinat min: x [1364 ..], y [1284 ..]
[64047.922603] Pembunuh OOM diaktifkan.
[64047.922605] Memulai ulang tugas ... selesai.
[64047.928727] thermal thermal_zone1: gagal membaca zona termal (-61)
[64047.930036] Bluetooth: hci0: Revisi bootloader 0,0 build 2 minggu 52 2014
[64047.935036] Bluetooth: hci0: Revisi perangkat adalah 5
[64047.935037] Bluetooth: hci0: Boot aman diaktifkan
[64047.935038] Bluetooth: hci0: Kunci OTP diaktifkan
[64047.935038] Bluetooth: hci0: Kunci API diaktifkan
[64047.935039] Bluetooth: hci0: Kunci debug dinonaktifkan
[64047.935040] Bluetooth: hci0: Pembuatan firmware minimum 1 minggu 10 2014
[64047.935042] Bluetooth: hci0: Perangkat firmware yang ditemukan: intel / ibt-11-5.sfi
[64047.944372] PM: tunda keluar
[64048.050329] Kesalahan baca di perangkat swap (8: 0: 1543400288)
[64048.460888] [drm] RC6 aktif

Tolong beri tahu saya jika ada informasi lain yang diperlukan.

Vedant
sumber
Saya mengalami masalah yang sangat mirip - setelah memutakhirkan ke 18,04, menutup penutup laptop menghasilkan pesan kesalahan yang sama (Baca kesalahan pada perangkat swap) dan reboot. Jika Anda berhasil menemukan perbaikan di tempat lain, alangkah baiknya jika Anda bisa membagikannya di sini.
Adrian
1
Memiliki masalah yang sama persis. Saya melakukan beberapa penelitian dan pengguna di lengkungan Linux mengalami masalah yang sama beberapa bulan yang lalu dan menyimpulkan itu mungkin ada hubungannya dengan kernel 4,15
user8814

Jawaban:

10

Kernel Ubuntu 18.04 yang Anda gunakan saat ini tidak memiliki perbaikan bug yang cukup penting.

Perbaikan untuk ini sudah ada di kernel Linux versi hulu 4.16.8. (Bug menangguhkan secara efektif mulai terjadi di kernel versi 4.15). Ubuntu hanya perlu memilih cherry-patch kecil ini dari hulu. Bug ini sering menyebabkan Xorg crash segera setelah ditangguhkan, yaitu crash seluruh sesi login grafis.

Perhatikan bug ini sering terjadi tanpa muncul Read-error on swap device. Sebagian besar waktu, tidak ada kesalahan dalam log kernel. (Beberapa kali, itu menunjukkan EXT4-fs errordan Buffer I/O errorsebaliknya). Selain itu, pesan kesalahan ini bisa disebabkan oleh kegagalan perangkat keras. Saat mendiagnosis masalah ini, harap fokus pada detail lain yang lebih berbeda.

Kernel uji tersedia di akhir bug Ubuntu ini, yaitu dalam komentar ini: https://bugs.launchpad.net/ubuntu/+source/linux/+bug/1776887/comments/5

Sejauh ini belum ada yang melaporkan hasil penangguhannya dengan kernel uji Ubuntu. Mungkin saja jika seseorang dapat melaporkan keberhasilan, itu akan mendorong pengembang Ubuntu untuk akhirnya menyertakan perbaikan bug. Saya bisa saja salah, saya tidak 100% yakin apa yang menahan ini.

Ada juga solusi yang diketahui. Anda dapat menghindari crash jika mengkonfigurasi baris perintah kernel untuk memasukkan opsi scsi_mod.scan=sync.

https://bugs.launchpad.net/ubuntu/+source/linux/+bug/1776887


Bug hulu ini telah dikonfirmasi untuk memengaruhi pengguna Ubuntu [1]. Sesuai komit perbaikan (di bawah), gejala yang paling sering adalah crash Xorg / Xwayland, yaitu membunuh seluruh GUI, ketika laptop terbangun dari tidur sistem. Frekuensi bug digambarkan setiap beberapa hari [2].

[1] Misalnya pengguna ini mengkonfirmasi bug & solusi yang sangat spesifik: https://bugs.launchpad.net/ubuntu/+source/xorg-server/+bug/1760450/comments/11

[2] Misalnya log macet ini: https://bugzilla.redhat.com/show_bug.cgi?id=1553979#c23

Ini adalah bug di blk-core.c. Ini tidak spesifik untuk driver satu perangkat keras. Secara teknis bug menangguhkan dipicu oleh inti SCSI - yang digunakan oleh semua perangkat SATA .

Komit juga mencakup tes yang dengan cepat dan andal membuktikan adanya bug yang mengerikan.

Saya kira Anda mungkin menghindari bug ini hanya jika Anda memiliki root pada NVMe. Cara lain untuk tidak menabrak crash Xorg adalah jika Anda tidak menggunakan semua RAM Anda, jadi tidak ada tekanan yang mengarah ke halaman dingin Xorg yang ditukar. Juga, Anda tidak akan mereproduksi crash Xorg jika Anda menunda + melanjutkan segera. (Ini membuat saya frustrasi tes pada satu titik, hanya dipicu setelah meninggalkan sistem ditunda selama makan siang :).

Perbaiki: "blokir: jangan gunakan menunggu interupsi di mana pun"

dalam kernel 4.17: https://github.com/torvalds/linux/commit/1dc3039bc87ae7d19a990c3ee71cfd8a9068f428

dalam kernel 4.16.8: https://git.kernel.org/pub/scm/linux/kernel/git/stable/linux-stable.git/commit/?h=linux-4.16.y&id=7859056bc73dea2c3714b00c83b253d4c22bf7b6

kurangnya perbaikan di 4.15.0-24.26 (ubuntu 18.04): https://git.launchpad.net/~ubuntu-kernel/ubuntu/+source/linux/+git/bionic/tree/block/blk-core.c ? id = Ubuntu-4.15.0-24.26 # n856

Yaitu, bug ini masih ada dalam paket sumber Ubuntu linux-4.15.0-24.26 (dan 4.15.0-23.25). Saya lampirkan detail perangkat keras (lspci-vnvn.log) dari sistem di mana bug ini diketahui terjadi.

Salam Alan

WORKAROUND: Gunakan parameter kernel: scsi_mod.scan = sinkronisasi

sourcejedi
sumber
Kerja luar biasa! Dikonfirmasi pada Ubuntu 18,04 w / 4,15 kernel.
ricosrealm
Sebenarnya ini tidak berhasil setelah tes kedua.
ricosrealm
@ricosrealm paling tak terduga. Harap konfirmasi bahwa masalah Anda (kadang-kadang) bermanifestasi sebagai SIGBUS (nomor sinyal 7) di Xorg atau gnome-shell. Ini mudah jika Anda telah systemd-coredumpmenginstal dan menggunakan coredumpctl -r, tetapi saya tidak tahu apa yang harus dilakukan ketika Anda telah menginstal apport. (paket systemd-coredump dan apport saling bertentangan, mohon lakukan penilaian).
sourcejedi
@ricosrealm Tapi setidaknya aku bisa meminta Anda untuk mengkonfirmasi bahwa 1) sesi grafis Anda saat ini hilang, tapi sistem tetap dinyatakan dapat digunakan dan Anda dapat login kembali lagi 2) dmesgtidak tidak menunjukkan "segfault" pesan untuk Xorg / gnome-shell . (Dan paling umum saya tidak melihat kesalahan kernel, tetapi Anda mungkin melihat "Read-error pada perangkat swap" beberapa waktu).
sourcejedi
@ricosrealm Btw, tambalan tampaknya telah membuat sedikit lebih banyak kemajuan sejak saya memposting jawabannya. lists.ubuntu.com/archives/kernel-team/2018-June/093612.html
sourcejedi