Kesalahan EXT4-fs setelah peningkatan Ubuntu 17.04

18

Saya memiliki Dell XPS 15 9550 . Saya sudah menjalankan Ubuntu 16.10 di atasnya selama empat bulan tanpa drama.

Dua hari yang lalu, saya meningkatkan ke Ubuntu 17.04 . Sekitar satu jam setelah pemutakhiran, hard drive saya me-remount ke mode read-only. Ketika saya melompat ke layar tty, ini muncul:

[ 746.341551] EXT4-fs error (device nvme0n1p7): ext4_find_entry:1463: inode #525023: comm NetworkManager: reading directory iblock 0
[ 746.343318] EXT4-fs error (device nvme0n1p7): ext4_find_entry:1463: inode #524289: comm pool: reading directory iblock 0
[ 746.356125] EXT4-fs error (device nvme0n1p7): ext4_find_entry:1463: inode #11272213: comm systemd-udevd: reading directory iblock 0
[ 746.356139] EXT4-fs error (device nvme0n1p7): ext4_find_entry:1463: inode #11272210: comm systemd-udevd: reading directory iblock 0
[ 746.356332] EXT4-fs error (device nvme0n1p7): ext4_find_entry:1463: inode #11272193: comm systemd-udevd: reading directory iblock 0
[ 746.356338] EXT4-fs error (device nvme0n1p7): ext4_find_entry:1463: inode #11272825: comm systemd-udevd: reading directory iblock 0
[ 746.356400] EXT4-fs error (device nvme0n1p7): ext4_find_entry:1463: inode #11272210: comm systemd-udevd: reading directory iblock 0
[ 746.474632] EXT4-fs error (device nvme0n1p7): ext4_find_entry:1463: inode #524539: comm unity-settings-: reading directory iblock 0
[ 746.992814] EXT4-fs error (device nvme0n1p7): ext4_find_entry:1463: inode #5506108: comm BrowserBlocking: reading directory iblock 0
[ 746.304451] EXT4-fs error (device nvme0n1p7): ext4_find_entry:1463: inode #5506117: comm BrowserBlocking: reading directory iblock 0

Inilah yang fdisk -lditunjukkan:

Disk /dev/nvme0n1: 477 GiB, 512110190592 bytes, 1000215216 sectors
Units: sectors of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 512 bytes / 512 bytes
Disklabel type: gpt
Disk identifier: 3CD27380-DAC8-48DC-910A-D084CE857DA3

Device             Start        End   Sectors   Size Type
/dev/nvme0n1p1      2048    1026047   1024000   500M EFI System
/dev/nvme0n1p2   1026048    1288191    262144   128M Microsoft reserved
/dev/nvme0n1p3   1288192  487948287 486660096 232.1G Microsoft basic data
/dev/nvme0n1p4 972302336  973223935    921600   450M Windows recovery environmen
/dev/nvme0n1p5 973223936  998094847  24870912  11.9G Windows recovery environmen
/dev/nvme0n1p6 998094848 1000204287   2109440     1G Windows recovery environmen
/dev/nvme0n1p7 487948288  939046911 451098624 215.1G Linux filesystem
/dev/nvme0n1p8 939046912  972302335  33255424  15.9G Linux swap

Partition table entries are not in disk order.

Saya reboot, dan terus mendapatkan kesalahan sekitar satu jam sekali. Jadi saya menginstal ulang Ubuntu 17.04 dari awal . Namun saya masih mendapatkan masalah yang sama.

Saya mencoba menjalankan fsck dengan membuat file / forcefsck (saya membuat skrip shell wrapper yang menambahkan -vflag dan output stdout ke file). Inilah hasilnya:

fsck.fat 4.0 (2016-05-06)                               
Checking we can access the last sector of the filesystem
Boot sector contents:                                   
System ID "MSDOS5.0"                                    
Media byte 0xf8 (hard disk)                             
       512 bytes per logical sector                     
      4096 bytes per cluster                            
      6206 reserved sectors                             
First FAT starts at byte 3177472 (sector 6206)          
         2 FATs, 32 bit entries                         
    508416 bytes per FAT (= 993 sectors)                
Root directory start at cluster 2 (arbitrary size)      
Data area starts at byte 4194304 (sector 8192)          
    126976 data clusters (520093696 bytes)              
63 sectors/track, 255 heads                             
      2048 hidden sectors                               
   1024000 sectors total                                
Reclaiming unconnected clusters.                        
Checking free cluster summary.                          
/dev/nvme0n1p1: 212 files, 15526/126976 clusters    

Saya mencoba mem-boot dari USB langsung dan berjalan e2fsck -p /dev/nvme0n1p7seperti yang disarankan di sini ( /ubuntu//a/768813/679041 ). Itu tidak memberikan kesalahan.

Saya juga mencoba menjalankan smartctl -t long /dev/nvme0n1p7namun hasilnya menunjukkan bahwa alat tersebut tidak bekerja dengan SSD khusus saya:

smartctl 6.6 2016-05-31 r4324 [x86_64-linux-4.10.0-19-generic] (local build)
Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Number:                       PM951 NVMe SAMSUNG 512GB
Serial Number:                      S29PNX0H611013
Firmware Version:                   BXV77D0Q
PCI Vendor/Subsystem ID:            0x144d
IEEE OUI Identifier:                0x002538
Controller ID:                      1
Number of Namespaces:               1
Namespace 1 Size/Capacity:          512,110,190,592 [512 GB]
Namespace 1 Utilization:            254,982,533,120 [254 GB]
Namespace 1 Formatted LBA Size:     512
Local Time is:                      Mon Apr 17 17:45:48 2017 AEST
Firmware Updates (0x06):            3 Slots
Optional Admin Commands (0x0017):   Security Format Frmw_DL *Other*
Optional NVM Commands (0x001f):     Comp Wr_Unc DS_Mngmt Wr_Zero Sav/Sel_Feat
Maximum Data Transfer Size:         32 Pages

Supported Power States
St Op     Max   Active     Idle   RL RT WL WT  Ent_Lat  Ex_Lat
 0 +     6.00W       -        -    0  0  0  0        5       5
 1 +     4.20W       -        -    1  1  1  1       30      30
 2 +     3.10W       -        -    2  2  2  2      100     100
 3 -   0.0700W       -        -    3  3  3  3      500    5000
 4 -   0.0050W       -        -    4  4  4  4     2000   22000

Supported LBA Sizes (NSID 0x1)
Id Fmt  Data  Metadt  Rel_Perf
 0 +     512       0         0

=== START OF SMART DATA SECTION ===
Read NVMe SMART/Health Information failed: NVMe Status 0x2002

Tahu mengapa masalah ini mungkin terjadi dan bagaimana saya bisa menyelesaikannya? Terima kasih! :)

Ben B
sumber
1
Selamat datang di AskUbuntu! Sepertinya Anda mungkin terpengaruh oleh bug ini. Saya sarankan Anda memberi tahu para devs bahwa bug ini juga memengaruhi Anda dan berlangganan bug sehingga Anda dapat diberitahu tentang kemajuan / resolusi.
Penatua Geek
Saya mengalami masalah yang sama persis pada Lenovo Thinkpad X270 dengan SSD Toshiba "THNSF5256GPUK TOSHIBA". Saya kira itu baik untuk mengetahui bahwa saya bukan satu-satunya.
Maeher
@ElderGeek membaca laporan bug yang ditautkan, tampaknya sampai masalah ini diperbaiki, perbaikan sementara akan menonaktifkan APST, namun dari diskusi tidak jelas bagi saya bagaimana melakukan itu. Sepertinya cara untuk melakukannya akan menjadi jawaban yang valid untuk pertanyaan ini.
Maeher
Terima kasih atas komentar Anda, teman-teman :) Dengan tidak sabar, saya menginstal ulang lagi tadi malam, namun kali ini saya secara eksplisit memformat / dev / nvme0n1p7 dan menghapus / dev / nvme0n1p8 sebelumnya (saya pikir mungkin menginstal ulang dengan semua opsi default mungkin tidak benar-benar memformat, dan sebagai gantinya hapus saja file lama sebelum menginstal yang baru). Saya belum mengalami masalah setelah 4 jam penggunaan tanpa gangguan namun hanya waktu yang akan menjawab. Anda akan mendengar isak tangis saya di seluruh Pasifik jika saya lakukan :)
Ben B
OK saya dapat mengonfirmasi - Saya baru saja mendapatkan masalah meskipun memformat partisi sepenuhnya. Akan menambahkan komentar ke bug yang ditautkan di atas
Ben B

Jawaban:

19

Sebagaimana ditunjukkan dalam komentar oleh Penatua Geek , ini disebabkan oleh bug yang dikenal .

Dari laporan bug:

Dukungan APST baru saja mendarat di kernel Zesty terbaru (4.10.0-14.16) sebagai bagian dari https://bugs.launchpad.net/ubuntu/+source/linux/+bug/1664602 . Patch itu memiliki kekhasan untuk drive Samsung 256GB tertentu yang ditemukan pada laptop Dell yang tidak berperilaku baik ketika APST diaktifkan. Saya mengalami gejala yang sama dengan laptop model yang sama kecuali dengan Samsung 512GB. Sebelum menonaktifkan APST secara manual, drive akan mati dan sistem akan mati karena kesalahan I / O dalam waktu 20 hingga 40 menit setelah boot.

Sampai perbaikan yang tepat diimplementasikan, solusi disarankan, yang melibatkan penambahan parameter kernel :

Silakan coba nvme_core.default_ps_max_latency_us=5500, jika masalah berlanjut, silakan coba nvme_core.default_ps_max_latency_us=200.

Untuk menambahkan parameter boot kernel, edit file konfigurasi untuk GRUB:

sudo nano /etc/default/grub

Temukan baris awal GRUB_CMDLINE_LINUX_DEFAULTdan tambahkan parameter boot ke yang lain di antara tanda kutip. Misalnya, dalam hal ini Anda mungkin akan berakhir dengan

GRUB_CMDLINE_LINUX_DEFAULT="quiet splash nvme_core.default_ps_max_latency_us=5500"

Simpan file dan keluar, lalu untuk membuat perubahan itu efektif, jalankan

sudo update-grub 
Ben B
sumber
1
Apakah perbaikan ini berhasil untuk Anda? BTW tautan tentang cara mengatur parameter kernel untuk siapa yang mungkin menemukan jawaban Anda wiki.ubuntu.com/Kernel/KernelBootParameters
justmyfault
1
Saya menjalankan Ubuntu 16.04 dan saya telah memutakhirkan paket secara berurutan ke zesty, sesuatu yang saya tidak akan rekomendasikan kepada siapa pun kecuali melakukannya karena kebutuhan. Paket terakhir adalah libc, sesuatu yang sangat integral dengan sistem sehingga jika terjadi kesalahan, itu akan menjadi saat meningkatkan libc. Pada reboot, saya melihat semua kesalahan EXT4 yang disebutkan dalam pertanyaan di atas, tetapi menambahkan parameter kernel akhirnya memungkinkan saya untuk reboot dengan tenang dan melanjutkan. Terima kasih.
lukecampbell
ada pembaruan tentang ini? Saya menderita masalah ini pada siluman pisau razer saya dengan samsung 512GB ssd
Lucas Zanella
Solusi di atas bekerja untuk saya, tetapi bug telah diperbaiki pada paket linux - 4.10.0-22.24. Jika Anda masih mengalami masalah, Anda harus membuka laporan bug baru di launchpad.
Ben B
Saya mencoba kedua nilai tersebut, tetapi masih macet. nvme_core.default_ps_max_latency_us = 0 bekerja untuk saya. Kernel 4.15.0-36-generik Ubuntu 16.04
Mike Schroll
0

Pertama, saya akan mengunjungi situs web dukungan Samsung dan memastikan Anda telah menginstal firmware terbaru untuk SSD model Anda.

Kemudian, fsck Anda tidak masuk akal, jadi lakukan dengan cara ini ...

Untuk memeriksa sistem file di partisi Ubuntu Anda ...

  • boot ke menu GRUB
  • pilih Opsi Tingkat Lanjut
  • pilih mode Pemulihan
  • pilih akses Root
  • di prompt, ketik sudo fsck -f /
  • ulangi perintah fsck jika ada kesalahan
  • Tipe reboot
heynnema
sumber
1
Terimakasih atas tanggapan Anda! Saya telah menginstal ulang, tetapi kali ini saya secara eksplisit memformat partisi masalah terlebih dahulu (jika proses instal ulang default tidak benar-benar memformat). Mudah-mudahan tidak apa-apa sekarang, namun jika masalah berlanjut saya akan menjalankan fsck dan memposting hasilnya (meskipun saya akan mengatakan jika masalah tetap ada pada partisi yang baru diformat, mungkin di luar kemampuan fsck)
Ben B
Masalah ini terjadi lagi, namun seperti yang ditunjukkan oleh Penatua Geek dalam komentar di bawah pertanyaan saya, sepertinya itu disebabkan oleh bug yang diketahui ( bugs.launchpad.net/ubuntu/+source/linux/+bug/1678184 ).
Ben B
@ BenB apakah Anda pernah memeriksa firmware di Samsung SSD Anda, seperti yang saya sarankan sebelumnya? Tergantung pada modelnya, mereka memiliki beberapa pembaruan yang sangat wajib untuk membuat drive berfungsi dengan baik.
heynnema
Saya sebenarnya tidak 100% yakin bagaimana melakukan ini. Saya menemukan beberapa firmware di sini, tetapi saya tidak 100% yakin semua itu berlaku untuk SSD khusus saya. Laporan bug tidak menunjuk ke masalah yang berkaitan dengan firmware, jadi pada titik ini saya lebih suka menunggu info lebih lanjut dari para pengembang mengatasi bug sebelum mencoba untuk mengupgrade firmware (mengetahui saya, saya akan melakukannya dengan salah dan kehilangan semua barang saya: P).
Ben B
1
fsck tidak menunjukkan kesalahan. Masalahnya bukanlah masalah firmware atau kerusakan SSD. Itu karena APST, yang telah diaktifkan pada 17,04. Pengaturan parameter kernel 'nvme_core.default_ps_max_latency_us = 5500' telah memperbaiki masalah ini untuk saya, dan yang lain telah melaporkan bahwa menonaktifkan APST sama sekali memperbaikinya untuk mereka.
Ben B
0

Salah satu solusi untuk bug yang saya sebutkan yang tidak dapat saya uji karena saya tidak memiliki perangkat keras NVMe yang dimaksud adalah dengan mencoba mem-boot paket arus utama harian kernel saat ini untuk arsitektur Anda yang tersedia di sini.

Tunggu! sebelum Anda lari untuk mencoba ini, saya harus menekankan bahwa kecuali Anda yakin Anda tahu persis apa yang Anda lakukan dan bagaimana memulihkan dari konsekuensi yang tidak diinginkan sangat disarankan untuk membuat cadangan.

Jika Anda tidak tahu apa yang Anda lakukan dan memiliki cadangan saat ini, Anda dapat menemukan informasi lebih lanjut tentang membangun kernel di sini.

Catatan: Jika Anda membaca sekilas kalimat pertama, jawaban ini didasarkan pada penelitian, bukan pengujian. Jika rusak, pulihkan cadangan Anda.

Penatua Geek
sumber