Mengapa sistem saya hang ketika saya menjalankan ps, w dan mungkin perintah lainnya?

10

Aku tidak tahu mengapa, tapi aku tidak bisa menjalankan psatau wperintah pada mesin Ubuntu 10.04LTS saya. Saya melakukan penelusuran untuk keduanya, dan keduanya berhenti ketika membaca bagian dari file yang sama.

Inilah hasil dari menjalankanps

Dan inilah hasilnya untukw

File juga berhenti saat membaca ... itu sendiri? http://pastebin.com/9qRB5eHh

Apa yang terjadi?

pengguna69239
sumber

Jawaban:

9

Saya pernah mengalami hal itu ketika server NFS turun.

Fakta bahwa itu tergantung mencoba membaca informasi tentang pid 17398, dan pid 17398 dalam Dkeadaan (menunggu disk), menunjukkan bahwa bisa menjadi penyebab bagi Anda juga.

read(6, "Name:\tconvert\nState:\tD (disk sle"..., 1023) = 664
open("/proc/17398/cmdline", O_RDONLY)   = 6

Jika Anda memiliki NFS mounts, saya pikir pilihan terbaik adalah mencoba untuk membawa server NFS kembali.

Kalau tidak, umount -f <mount>bisa membantu.

Mikel
sumber
Saya kira reboot harus memperbaiki ini, tetapi saya tidak ingin melakukannya, karena saya ingin memastikan apa penyebabnya: P
Apa yang mountdikatakan? Perhatikan ada kemungkinan yang menggantung juga (saya pikir tidak seharusnya, tapi saya tidak 100% yakin).
Mikel
3

sigh penanganan pertanyaan tertutup sangat buruk, ini akan menjadi ketiga kalinya saya mencoba mengetik ini, jadi tolong maafkan keleness.

Pertama, gunakan intrNFS mounts. hardMount NFS default hang selamanya. softNFS me-mount kesalahan keluar setelah batas waktu (yang mungkin bodoh untuk kesalahan sementara). intrMemungkinkan Anda memutuskan untuk menghentikan operasi NFS yang macet. Tepat.

Kedua, untuk memperbaiki masalah bodoh ini, saya telah menggunakan trik bodoh sebelumnya, mungkin masih berfungsi. Memunculkan alias antarmuka pada lodengan NFS Server Alamat IP ( mengedit : ifconfig eth0:0 <ipaddress>). Buat /etc/exportsfile yang berisi baris untuk mengekspor sistem file tempat Anda menggantung ( edit : ekspor sistem file dengan nama yang sama dengan sistem file 'hung'; Anda harus membuat pathname yang sama dengan apa yang telah Anda pasang) . Mulai server NFS Anda di mesin lokal Anda, dan semoga program Anda yang macet dapat kesalahan dengan "file tidak ditemukan" atau "direktori tidak ditemukan" atau sesuatu seperti itu, membiarkan Anda melanjutkan pekerjaan Anda tanpa me-reboot.

Jangan lupa mematikan server NFS Anda lagi dan menghapus antarmuka alias setelah Anda selesai.

sarnold
sumber
Saya menggunakan intr NFS mounts ... di mana Anda melihat sebaliknya?
user69239
Tentang "paragraf kedua" saya tidak mengerti dengan baik ... maaf! :(
user69239
@ user69239 Anda tidak memberikan detail, jadi saya berasumsi Anda menggunakan hardtipe mount default . :)
sarnold
@ user69239, saya sedikit memperluas paragraf dengan trik konyol - Saya harap ini lebih mudah dimengerti sekarang. :)
sarnold
2

Saya tidak yakin mengapa fokus pada NFS? Apakah penanya menjalankan NFS? Tidak melihat apa-apa tentang itu.

Bagaimanapun, ini adalah masalah yang sangat aneh sejak / proc. Cobalah hal-hal berikut untuk memberi diri Anda lebih banyak info tentang masalah:

  • Pergilah ke / proc dan temukan direktori pid lain dan coba baca file cmdline dari direktori tersebut.
  • Coba baca / proc / pid / stat juga, jika itu tidak berhasil, saya akan mengatakan sistem Anda mengalami masalah kernel.
  • Apakah Anda dapat menjalankan netstat -n? Ini berbunyi dari berbagai bagian / proc sehingga mungkin berfungsi dan akan menunjukkan lebih sedikit masalah dengan antarmuka proc.
  • Coba remounting / proc dengan mount -o remount / proc walaupun saya tidak tahu apa yang akan dilakukan dalam situasi ini.

Saya hanya menyarankan me-reboot. Jika Anda tidak dapat membaca hal-hal dari proc, saya tidak yakin apa yang akan Anda temukan melalui metode lain. Jika itu terjadi lagi, maka mulailah khawatir.

deltaray
sumber
Ya, saya dengan NFS ... masalahnya adalah menyalin file melalui sistem sekering s3
user69239
sekering dan nfs adalah hal yang berbeda. Saya pikir Anda perlu memberikan semua detail yang Anda bisa. Anda menyediakan banyak strace, tetapi mengetahui lebih banyak tentang pengaturan Anda dan bagaimana semua ini dimulai adalah langkah pertama yang perlu.
deltaray
Masalahnya muncul melakukan perintah "cp" besar-besaran dari host saya (contoh kecil dari Amazon) ke S3, terhubung dengan s3f3 1,40 hanya dengan opsi allow_other. Ubuntu saya adalah instalasi dasar 10,10 normal dengan upgrade khas. Tidak ada lagi. Really: P
user69239