Bagaimana saya memecahkan masalah ketika saya tidak tahu harus mulai dari mana?

40

Saya mencari petunjuk, kiat, dan jawaban tentang cara memulai pemecahan masalah saat:

  1. Masalahnya terputus-putus
  2. Masalahnya bisa terletak di mana saja - sistem operasi; perangkat lunak sumber gratis; pengembangan perangkat lunak saya sendiri; perangkat lunak yang dibeli; remah-remah pada keyboard; kombinasi spesifik perangkat lunak yang saat ini saya jalankan; Iblis Maxwell; pria biru kecil yang benar-benar menjalankan mesin telah mogok; dll.
  3. Saya hanya memiliki keahlian di beberapa bidang yang merupakan kandidat potensial untuk penyebab masalah.

Masalah khusus yang saya alami dirinci di bawah ini sebagai contoh, tetapi saya tidak mencari jawaban untuk masalah saya saat ini, melainkan di mana dan bagaimana memulai menangani masalah tersebut.

Saat ini saya menghadapi masalah dengan mesin baru saya. Pada beberapa kesempatan, mesin baru saja beku; tidak menerima penekanan tombol, mouseclick, atau apa pun kecuali saklar daya on / off. Biasanya saya hanya menjelajahi web; Saya telah menjalankan beberapa (<= 6 aplikasi lain). Tidak satu pun dari aplikasi ini yang utama; dan mewakili campuran program komersial dan program sumber terbuka, biasanya dimigrasikan dari Unix dari beberapa variasi.

Mesin saya adalah laptop quad core Windows 7 I7.

EDIT:

Meskipun saya menyatakan bahwa deskripsi masalah yang sebenarnya hanya merupakan contoh, beberapa komentar berkonsentrasi pada penyelesaian masalah ini. Sayangnya, karena itu hanya contoh, informasi yang diberikan benar tetapi tidak lengkap. Agar orang-orang tidak membuang-buang waktu untuk mencoba, dari jarak jauh, untuk membantu masalah yang sebenarnya, saya memberikan beberapa informasi lain tentang pengaturan saya. Seperti yang saya katakan pada awalnya, saya tidak mencari jawaban untuk masalah khusus ini.

Mesin saya adalah laptop bertenaga tinggi; adalah mesin utama saya; digunakan untuk pengembangan dan penulisan teknis, komunikasi - email, web, FTP, dll, dan untuk pengeditan dan pengindeksan foto. Serangkaian program pengujian perangkat keras yang ketat dan ekstensif, termasuk tes CPU, beberapa tes memori, dan tes pada semua komponen lainnya dijalankan setidaknya sebulan sekali. Juga menjalankan setidaknya setiap bulan adalah pemindaian virus lengkap; pemindaian spyware lengkap; pembersihan disk; dan defragmentasi disk.

Disk berisi sekitar 3 * 10 ^ 6 file; penggunaan disk adalah 300 Gb meninggalkan 150 Gb gratis. Memori adalah 8 Gb. Sementara mesin bisa menjadi sedikit hangat ketika saya menjalankan pelengkap penuh alat pengembangan utama, saya telah mengalami masalah hanya ketika menggunakan mesin sangat ringan - penelusuran web ditambah Textpad plus Graphviz plus basis data Firebird plus peramban basis data ringan (Flame Robin ). Dalam keadaan ini bahkan kipas tidak sedikit hangat. Saya tidak membuat perubahan pada perangkat lunak, sistem operasi atau perangkat keras selama periode saya mengalami masalah. Ada sejumlah pembaruan otomatis terjadi - Microsoft, Adobe, dan Lenovo sebagian besar tetapi tidak secara eksklusif.

Latar belakang ini menempatkan dalam konteks (saya harap) alasan saya untuk mengajukan pertanyaan ini seperti yang saya lakukan. Saya sekarang akan mulai menyelidiki berbagai log yang disebutkan dalam jawaban sebagai langkah pertama dalam mencoba mempersempit bidang investigasi. Dan saya akan mencoba latihan salah satu karakteristik yang disarankan dalam jawaban yang saya terima sejauh ini - kesabaran - dalam penyelidikan saya.

Chris Walton
sumber
6
+1 Karena pertanyaan ini dapat bermanfaat bagi saya untuk ditautkan di masa mendatang.
Tamara Wijsman
2
Kadang-kadang, sebelum meluncurkan pendekatan penyelesaian masalah yang lengkap dan metodis, Anda harus mencoba pembersihan buah-buahan umum yang rendah: Jalankan pemindaian spyware penuh, cari log windows untuk shutdown yang tidak terduga dan lihat apa (jika ada) masalah yang mendahuluinya, periksa situasi ruang disk, jalankan check disk, berikan Autoruns Sysinternal pemindaian cepat untuk perangkat lunak yang tidak dikenal / mencurigakan. Memiliki seperangkat alat sederhana untuk dijalankan yang dapat dengan cepat mengidentifikasi berbagai masalah perangkat keras dan perangkat lunak. Jika mereka tidak menemukan apa pun, Anda hanya membuang sedikit waktu dan dapat memulai proses yang lebih menyeluruh.
Alain
1
Juga, ikuti Blog Mark untuk contoh bagaimana masalah yang mengganggu diselesaikan dengan Sysinternals.
Tamara Wijsman
1
Selamat mencoba pemecahan masalah, saya akan menyarankan untuk membuat pertanyaan baru jika Anda ingin lebih banyak umpan balik untuk mengatur segalanya ...
Tamara Wijsman

Jawaban:

42

Dapatkan ide yang lebih baik.

Anda tidak akan memenangkan pertempuran tanpa informasi lapangan yang memadai.

  1. Jelaskan masalah Anda secara terperinci sehingga Anda memiliki ide yang bagus tentang itu, siapa tahu itu terjadi sekali saja.

  2. Lacak kembali waktu yang terjadi sebelum dan bersama-sama dengan masalah, Anda dan komputer Anda.

  3. Pikirkan kemungkinan penyebabnya karena kadang-kadang itu mungkin sesuatu yang tidak jelas.

  4. Dapatkan lebih banyak informasi kapan pun Anda tidak tahu apa yang sedang terjadi, ini bisa berkisar dari Acara , hingga SysInternals Tools , hingga Analisis Kinerja , hingga Debugging , hingga alat lain dalam keahlian Anda .

  5. Uji asumsi Anda untuk memastikan bahwa pikiran Anda tidak menyaring penyebabnya.

Membagi dan menaklukkan.

Karena itulah cara militer mengalahkan lawan mereka bahkan ketika kalah jumlah.

Hilangkan kemungkinan penyebabnya, atau Anda akan mengalami masalah melacak masalah. Dengan cara ini, Anda akan semakin dekat dan dekat dengan akar penyebab masalah, itu memungkinkan Anda untuk memecahkan masalah lebih mudah.

Misalnya, dengan perangkat keras , putuskan sambungan dan hapus apa pun yang tidak Anda perlukan untuk memperbaiki masalah Anda. Dengan cara ini, Anda dapat memutuskan komponen yang menyebabkan masalah. Dan kemudian itu lagi masalah memasukkan setengah komponen ke dalam, memeriksa apakah itu terjadi kembali dan ulang pemisahan sampai Anda memiliki komponen yang buruk ...

Menguji sesuatu di komputer lain, jika tersedia, juga bermanfaat untuk menyelesaikan masalah.

Misalnya, dengan perangkat lunak , me-reboot ke mode aman, menonaktifkan entri start-up juga membantu. Ini juga berlaku untuk mengaktifkan / menonaktifkan pengaturan, mencoba konfigurasi default dan seterusnya ...

Mari kita uji.

Saat ini saya menghadapi masalah dengan mesin baru saya. Pada beberapa kesempatan, mesin baru saja beku; tidak menerima penekanan tombol, mouseclick, atau apa pun kecuali saklar daya on / off. Biasanya saya hanya menjelajahi web; Saya telah menjalankan beberapa (<= 6 aplikasi lain). Tidak satu pun dari aplikasi ini yang utama; dan mewakili campuran program komersial dan program sumber terbuka, biasanya dimigrasikan dari Unix dari beberapa variasi.

  1. Itu deskripsi yang tepat dengan sendirinya, itu tidak terjadi begitu saja .

  2. Anda tahu apa yang terjadi bersama dengan masalah tersebut,
    tetapi belum memikirkan hal-hal yang Anda atau komputer Anda lakukan sebelum masalahnya .

    Saya tidak bisa mengatakan ini, tetapi Anda, log acara Anda dan file / folder yang baru saja dimodifikasi bisa tahu.

  3. Kemungkinan penyebabnya kemungkinan besar terkait dengan CPU , karena itu komponen yang memproses sesuatu.

    Lebih spesifik ini bisa berupa proses, driver atau kegagalan perangkat keras (mungkin masalah suhu?).

  4. Saya tahu ini CPU, tapi tidak tahu apa. Acara tidak menunjukkan ini, Process Explorer akan bertahan pada DPC .

    Jadi, langkah selanjutnya, saya membiarkan analisis jejak berjalan yang saya tutup setelah terjadi hang.

    Saya melihat ke jejak, dan saya melihat bahwa driver X menyebabkan masalah !

  5. Tidak ada asumsi nyata yang dibuat. Asumsi CPU ditangani oleh pendekatan Divide & Conquer kami ...

Jadi, di sinilah saya mulai membagi untuk menaklukkan masalah, saya berhenti setelah dipecahkan:

  1. Ada masalah dengan versi driver saat ini?
    Perbarui driver ke versi terbaru.

  2. Ada masalah dengan driver versi terbaru?
    Dapatkan jejak baru. Perbarui driver ke versi yang lebih lama berbeda dari yang awal.

  3. Ada masalah dengan perangkat? Masalah konfigurasi dalam registri?
    Dapatkan jejak baru. Instal ulang dan / atau nonaktifkan perangkat jika memungkinkan.

  4. Masalahnya acak, apakah prosesor memanas?
    Periksa suhu prosesor, ganti kipas jika perlu.

  5. Masalahnya bukan prosesor, apakah ada pengaruh perangkat keras dan lunak lainnya?
    Hapus perangkat keras dan nonaktifkan perangkat lunak dari menjalankan, untuk memakukan pengaruh pihak ketiga.

  6. Masalahnya bukan di bagian yang bisa dilepas, itu harus diganti.
    Dalam kasus terburuk, jika semuanya gagal, Anda harus mencari penggantinya.

Mendapatkan jejak baru dan menghapus perangkat keras memberi kami informasi lebih lanjut, jadi kami tahu ke mana harus mencari berikutnya.

Tamara Wijsman
sumber
4
+1 untuk membagi dan menaklukkan. Diterima untuk spesifikasi deskripsi, pelacakan kembali, dan mekanisme untuk membagi dan menaklukkan masalah.
Chris Walton
5
+1 Jawaban cemerlang. Satu-satunya yang ditambahkan adalah ini: Uji asumsi Anda
Bevan
bagaimana dengan "mengubah satu hal pada satu waktu"?
Florenz Kley
2
@Florenz: Ya, dengan membagi Anda mengambilnya satu per satu (untuk jumlah kecil, atau ketika Anda tidak dapat mendasarkan diri pada beberapa penyebab) atau Anda membaginya (untuk jumlah yang lebih besar, ketika Anda dapat memeriksa beberapa hal di sekali. Membagi menjadi dua, jika mungkin, lebih cepat daripada melakukannya satu per satu. Misalnya, untuk memecahkan masalah 100 hal, Anda hanya perlu mengujinya 8 kali (100-> 50-> 25-> 13-> 7-> 4-> 2-> 1), bukan 100 kali ...
Tamara Wijsman
2
divisi yang masuk akal! Yang ingin saya katakan adalah "jangan memperbaiki hal-hal lebih cepat daripada yang Anda dapat atribut perubahan ke delta yang diamati". Menggunakan buku praktikum dengan halaman yang tidak bisa saya sobek adalah metode saya untuk memastikan saya bisa melakukannya.
Florenz Kley
6

Log dan intuisi bagus - sungguh.

  • Mulai hari 1, pantau semua yang Anda lakukan pada sistem: pembaruan aplikasi & OS, pemasangan baru, perangkat keras atau koneksi baru atau yang dihapus, badai yang "tidak menyebabkan masalah".
  • Ketika Anda pertama kali menyadari masalah ini:
    • Apa yang telah kamu lakukan?
    • Apa lagi yang tidak biasa terjadi baru-baru ini?
    • Apa yang telah Anda lakukan secara berbeda baru-baru ini?
    • Sejak saat itu, tetap waspada dengan apa yang Anda lakukan sehingga pada saat itu terjadi, Anda memiliki pegangan yang lebih baik pada apa yang baru saja mendahuluinya.
    • Snapshot log sistem.
  • Lihat apakah Anda bisa memperbanyakinya. Sampai Anda dapat mereproduksinya, Anda tidak dapat menemukannya.
  • Mulai mempartisi sistem: safe mode vs running live, akun baru vs. akun reguler Anda, keyboard dan mouse berbeda dari yang biasa Anda (terutama bluetooth vs kabel), apakah itu terjadi dalam beberapa menit setelah mulai atau bangun vs hanya setelah satu jam lebih berjalan (pikirkan termal).
JRobert
sumber
2
+1 untuk aktivitas logging; dan untuk intuisi. Bukan jawaban yang diterima hanya karena penebangan hanya baik jika dilakukan sejak hari pertama. Saya telah menyimpan log tetapi tidak cukup detail; dan belum termasuk pembaruan sistem dari Microsoft, dan pembaruan otomatis lainnya.
Chris Walton
1
@ ChrisWalton: Ada log terperinci untuk Pembaruan Windows, penyisipan / penghapusan perangkat, instalasi driver dan sebagainya. Lihat C:\Windows\*.log, C:\Windows\Logs, C:\Windows\inf\*.logdan juga Performance Monitor > Data Collector Sets > (Startup) Event Trace Sessions. @JRobert, +1 untuk menjelaskan cara mendapatkan ide secara lebih rinci ...
Tamara Wijsman
4

Saya biasanya mulai dengan log peristiwa dan setiap log yang dibuat oleh sebuah program sendiri. Program terkadang akan membuat log di folder program.

Setelah Anda dapat mengidentifikasi waktu, cari log untuk acara. Secara alami log windows mungkin hadir dengan galat Stop yang akan mudah diidentifikasi.

Periksa semua driver dan pastikan mereka terbaru.

Kesabaran akan diperlukan dalam dosis besar.

Dave M
sumber
2

Selain semua saran bagus yang telah diberikan, jika file log tidak memberi Anda banyak hal untuk dilanjutkan, tes memori yang tepat dari mesin sering bermanfaat - memori yang salah dapat menyebabkan segala macam macet dan macet yang terputus-putus. Tes memori internal jauh lebih mirip dengan jumlah memori, sangat jarang daya pada tes menangkap kesalahan memori.

Google for Windows Memory Diagnostic dan membakarnya ke CD. Ini sudah tua tapi itu salah satu tes memori yang lebih baik, dan gratis.

Mat
sumber
terima kasih atas jawaban Anda dan alat yang disarankan. Saya khawatir Anda agak tidak mengerti maksud pertanyaan saya - Anda menyarankan pengujian memori; orang lain menyarankan unduhan perangkat lunak otomatis Adobe. Pertanyaan saya adalah; dalam keadaan ini bagaimana Anda memutuskan apa yang harus dilakukan ketika ada sejumlah besar kemungkinan.
Chris Walton
1
@ Chris: Seperti yang saya katakan; ketika memecahkan masalah yang terputus-putus dan masalah yang tidak dapat dijelaskan (Dalam situasi pengembangan yang tidak pasti), jika tidak ada log untuk memulai, dan tidak ada spidol lain yang menyarankan mulai dari mana, saya akan menjalankan tes memori. Logikanya, itu relatif cepat dijalankan dibandingkan dengan mencoba mereplikasi masalah berselang. Setelah dikesampingkan maka Anda mulai dari mempersempit dan mendapatkan ide seperti yang TomWij katakan.
Mat
cukup adil.
Chris Walton