Sayangnya, penyedia hosting kami mengalami kehilangan data 100%, jadi saya kehilangan semua konten untuk dua situs web yang di-host blog:
(Ya, ya, saya benar - benar harus melakukan backup di luar kantor. Sayangnya, semua cadangan saya ada di server itu sendiri. Jadi simpan kuliah; Anda 100% benar sekali, tetapi itu tidak membantu saya saat ini. Mari tetap fokus pada pertanyaan di sini!)
Saya memulai proses pemulihan situs web yang lambat dan menyakitkan dari cache perayap web.
Ada beberapa alat otomatis untuk memulihkan situs web dari internet web spider (Yahoo, Bing, Google, dll) cache, seperti Warrick , tetapi saya memiliki beberapa hasil buruk menggunakan ini:
- Alamat IP saya dengan cepat diblokir dari Google untuk menggunakannya
- Saya mendapatkan banyak kesalahan 500 dan 503 dan "menunggu 5 menit ..."
- Pada akhirnya, saya dapat memulihkan konten teks lebih cepat dengan tangan
Saya lebih beruntung dengan menggunakan daftar semua posting blog, mengklik tembolok Google dan menyimpan setiap file sebagai HTML. Meskipun ada banyak posting blog, tidak ada yang banyak, dan saya pikir saya pantas beberapa menyalahi diri karena tidak memiliki strategi cadangan yang lebih baik. Bagaimanapun, yang penting adalah saya beruntung mendapatkan teks posting blog dengan cara ini, dan saya pasti bisa mendapatkan teks dari halaman web dari cache internet. Berdasarkan apa yang telah saya lakukan sejauh ini, saya yakin saya dapat memulihkan semua teks dan komentar posting blog yang hilang .
Namun, gambar yang masuk dengan setiap posting blog terbukti ... lebih sulit.
Adakah tip umum untuk memulihkan halaman situs web dari cache Internet, dan khususnya, tempat untuk memulihkan gambar yang diarsipkan dari halaman situs web ?
(Dan, sekali lagi, tolong, tidak ada kuliah cadangan. Anda benar-benar, sepenuhnya, benar sekali! Tapi menjadi benar tidak menyelesaikan masalah langsung saya ... Kecuali Anda memiliki mesin waktu ...)
sumber
Jawaban:
Inilah tikaman liar saya di kegelapan: konfigurasikan server web Anda untuk mengembalikan 304 untuk setiap permintaan gambar, lalu kerumunan sumber pemulihan dengan memposting daftar URL di suatu tempat dan bertanya pada podcast agar semua pembaca Anda memuat setiap URL dan memanen gambar apa pun yang memuat dari cache lokal mereka. (Ini hanya dapat berfungsi setelah Anda mengembalikan halaman HTML itu sendiri, lengkap dengan
<img ...>
tag, yang tampaknya menyiratkan pertanyaan Anda bahwa Anda akan dapat melakukannya.)Ini pada dasarnya adalah cara mewah untuk mengatakan, "dapatkan dari cache browser web pembaca Anda." Anda memiliki banyak pembaca dan pendengar podcast, sehingga Anda dapat secara efektif memobilisasi sejumlah besar orang yang cenderung telah melihat situs web Anda baru-baru ini. Tetapi menemukan dan mengekstraksi gambar secara manual dari berbagai cache web browser adalah sulit, dan seluruh pendekatan ini bekerja dengan baik jika cukup mudah sehingga banyak orang akan mencobanya dan menjadi sukses. Dengan demikian pendekatan 304. Yang diperlukan pembaca adalah mereka mengklik serangkaian tautan dan menarik gambar apa pun yang dimuat di browser web mereka (atau klik kanan dan simpan-seperti, dll.) Lalu kirim lewat email kepada Anda atau unggah ke lokasi pusat yang Anda atur, atau apa pun. Kelemahan utama dari pendekatan ini adalah bahwa cache browser web tidak kembali sejauh itu. Tetapi hanya perlu satu pembaca yang memuat pos dari tahun 2006 dalam beberapa hari terakhir untuk menyelamatkan bahkan gambar yang sangat lama. Dengan audiens yang cukup besar, segalanya mungkin terjadi.
sumber
canvas
dan mengirimnya ke rumah oleh AJAX.Beberapa dari kami mengikuti Anda dengan pembaca RSS dan tidak menghapus cache. Saya memiliki posting blog yang tampaknya kembali ke 2006. Tidak ada gambar, dari apa yang saya lihat, tetapi mungkin lebih baik daripada apa yang Anda lakukan sekarang.
sumber
(1) Ekstrak daftar nama file dari semua gambar yang hilang dari cadangan HTML. Anda akan dibiarkan dengan sesuatu seperti:
(2) Lakukan Pencarian Gambar Google untuk nama file tersebut. Sepertinya BANYAK dari mereka telah, um, "dicerminkan" oleh blogger lain dan siap untuk mengambil karena mereka memiliki nama file yang sama .
(3) Anda bisa melakukan ini secara otomatis jika terbukti berhasil, misalnya, 10+ gambar.
sumber
Dengan pergi ke pencarian dan mengetik Gambar Google
site:codinghorror.com
Anda setidaknya dapat menemukan versi thumbnail dari semua gambar Anda. Tidak, itu tidak selalu membantu, tetapi memberi Anda titik awal untuk mengambil ribuan gambar itu.Sepertinya Google menyimpan thumbnail yang lebih besar dalam beberapa kasus:
Google di sebelah kiri, Bing di sebelah kanan.
sumber
Maaf mendengar tentang blog. Tidak akan kuliah. Tapi saya memang menemukan apa yang tampak seperti gambar Anda di Imageshack. Apakah mereka benar-benar milik Anda atau seseorang telah menyimpan salinannya di sekitar Anda.
http://profile.imageshack.us/user/codinghorror
Mereka tampaknya memiliki apa yang tampak seperti 456 gambar yang berukuran penuh. Ini mungkin taruhan terbaik untuk memulihkan semuanya. Mungkin mereka bahkan dapat memberi Anda dump.
sumber
Jeff, aku telah menulis sesuatu untukmu di sini
Singkatnya apa yang saya usulkan Anda lakukan adalah:
Konfigurasikan server web untuk mengembalikan 304 untuk setiap permintaan gambar. 304 berarti file tidak dimodifikasi dan ini berarti browser akan mengambil file dari cache jika ada di sana. (kredit: jawaban SuperUser ini )
Di setiap halaman di situs web, tambahkan skrip kecil untuk mengambil data gambar dan mengirimkannya ke server.
Simpan data gambar di server.
Voila!
Anda bisa mendapatkan skrip dari tautan yang diberikan.
sumber
Coba kueri ini di Mesin Wayback :
Ini akan memberi Anda semua gambar dari codinghorror.com diarsipkan oleh archive.org. Ini mengembalikan 3878 gambar, beberapa di antaranya adalah duplikat. Itu tidak akan lengkap, tetapi awal yang baik tidak kurang.
Untuk gambar yang tersisa, Anda dapat menggunakan thumbnail dari cache mesin pencari, dan kemudian melakukan reverse look-up menggunakan ini di http://www.tineye.com/ . Anda memberikan gambar thumbnail, dan itu akan memberi Anda pratinjau dan pointer ke gambar yang cocok cocok ditemukan di web.
sumber
Memberi +1 pada
dd
rekomendasi jika (1) disk mentah tersedia di suatu tempat; dan (2) gambar adalah file sederhana. Kemudian Anda dapat menggunakan alat 'pahat data' forensik untuk (misalnya) menarik semua rentang yang kredibel yang tampaknya adalah JPG / PNG / GIF. Saya telah memulihkan 95% foto di iPhone yang dihapus dengan cara ini.Alat open source 'terkemuka' dan 'pisau bedah' penggantinya dapat digunakan untuk ini:
http://foremost.sourceforge.net/
http://www.digitalforensicssolutions.com/Scalpel/
sumber
Untungnya, generasi masa depan akan baik-baik saja.
Bahkan dengan hanya beberapa batu besar ini, para ilmuwan / ahli bahasa menemukan banyak hal.
Jika beberapa gambar hilang, serahkan pada seseorang untuk mencari tahu dalam beberapa ribu tahun.
Semoga Anda sedikit tertawa. :)
sumber
Anda selalu dapat mencoba archive.org juga. Gunakan mesin wayback. Saya menggunakan ini untuk memulihkan gambar dari situs web saya.
sumber
Jadi, kasus terburuk absolut, Anda tidak dapat memulihkan apa pun. Sial.
Coba ambil yang google minified, dan letakkan di TinEye , mesin pencari gambar terbalik. Mudah-mudahan itu akan mengambil duplikat atau rehost yang dibuat orang.
sumber
Ini adalah pukulan panjang, tetapi Anda dapat mempertimbangkan:
Misalnya, lihat Nirsoft Mozilla Cache Viewer :
(sumber: nirsoft.net )
Itu dapat dengan cepat menggali gambar "blog.stackoverflow.com" yang masih ada melalui baris perintah sederhana:
Catatan: mereka memiliki explorer cache yang sama untuk Chrome .
(sumber: nirsoft.net )
(Saya harus memiliki 15 hari gambar blog.stackoverflow.com di dalamnya)
Dan Internet Explorer , atau Opera .
Kemudian perbarui daftar publik untuk mencerminkan apa yang dilaporkan pembaca temukan dalam cache mereka.
sumber
Di masa lalu saya telah menggunakan http://www.archive.org/ untuk menarik gambar cache. Ini semacam hit atau miss tapi itu berhasil untuk saya.
Juga, ketika mencoba memulihkan stok foto yang saya gunakan di situs lama, www.tineye.com bagus ketika saya hanya memiliki thumbnail dan saya membutuhkan gambar ukuran penuh.
Saya harap ini membantu Anda. Semoga berhasil.
sumber
Ini mungkin bukan solusi termudah atau paling lengkap, tetapi layanan seperti Evernote biasanya menyimpan teks dan gambar ketika mereka disimpan di dalam aplikasi - mungkin beberapa pembaca bermanfaat yang menyimpan artikel Anda dapat menyimpan gambar dan mengirimkannya kembali kepada Anda ?
sumber
Saya memiliki pengalaman hebat dengan archive.org . Bahkan jika Anda tidak dapat mengekstraksi semua posting blog Anda dari situs tersebut, mereka menyimpan snapshot berkala:
Dengan cara ini Anda dapat memeriksa setiap halaman dan melihat posting blog yang Anda buat. Dengan nama semua posting Anda dapat dengan mudah menemukannya di cache Google jika archive.org tidak memilikinya. Arsip mencoba menyimpan gambar, cache Google akan memiliki gambar, dan saya belum mengosongkan cache saya baru-baru ini sehingga saya dapat membantu Anda dengan posting blog yang lebih baru :)
sumber
Sudahkah Anda mencoba cache browser lokal Anda sendiri? Peluang yang cukup bagus beberapa hal yang lebih baru masih ada. http://lifehacker.com/385883/resurrect-images-from-my-web-browser-cache
(Atau Anda dapat mengompilasi daftar semua gambar yang hilang dan semua orang dapat memeriksa cache mereka untuk melihat apakah kami dapat mengisi yang kosong)
sumber
Saran untuk masa depan: Saya menggunakan Windows Live Writer untuk blogging dan menyimpan salinan posting lokal di mesin saya, selain menerbitkannya ke blog.
sumber
Sekitar lima tahun yang lalu, inkarnasi awal hard drive eksternal tempat saya menyimpan semua foto digital saya gagal total. Saya membuat gambar dari hard drive menggunakan
dd
dan menulis alat yang belum sempurna untuk memulihkan apa pun yang tampak seperti gambar JPEG. Dapatkan sebagian besar foto saya dari itu.Jadi, pertanyaannya adalah, bisakah Anda mendapatkan salinan gambar disk mesin virtual yang menyimpan gambar?
sumber
Arsip web cache gambar. Itu di bawah beban berat sekarang, Anda harus baik-baik saja sampai 2008 atau lebih.
http://web.archive.org/web/20080618014552rn%5F2/www.codinghorror.com/blog/
sumber
Saya menyarankan kombinasi archive.org dan anonimizer permintaan seperti [Tor] [2]. Saya sarankan menggunakan anonimizer karena dengan cara itu setiap permintaan Anda akan memiliki IP dan lokasi acak dan dengan cara itu Anda dapat menghindari pemblokiran oleh archive.org (seperti Google) untuk jumlah permintaan yang luar biasa tinggi.
Semoga Sukses, ada banyak permata di blog itu.
sumber
Mesin wayback akan memiliki beberapa. Google cache dan cache serupa akan memilikinya.
Salah satu hal paling efektif yang dapat Anda lakukan adalah mengirim email ke poster asli, meminta bantuan.
Sebenarnya saya punya beberapa rekomendasi infrastruktur, karena setelah ini semua dibersihkan. Masalah mendasar sebenarnya bukan cadangan, itu bukan replikasi situs dan kurangnya audit. Jika Anda mengirimi saya email di isian bidang email pribadi, nanti, ketika Anda kembali berdiri, saya ingin membahas masalah ini dengan Anda.
sumber
Jika gambar Anda disimpan pada layanan eksternal seperti Flickr atau CDN (seperti yang disebutkan dalam salah satu podcast Anda), Anda mungkin masih memiliki sumber gambar di sana.
Beberapa gambar dapat ditemukan mencari di Gambar Google dan klik "Cari gambar yang serupa" , mungkin ada salinan di situs lain.
sumber
archive.org terkadang menyembunyikan gambar. Dapatkan setiap URL secara manual (atau tulis skrip pendek) dan minta mereka seperti ini:
string.Format ("GET / * / {0}", nextUri)
Tentu saja itu akan sangat menyebalkan untuk dicari.
Saya mungkin memiliki beberapa di cache browser saya. Jika saya melakukannya saya akan menjadi tuan rumah mereka di suatu tempat.
sumber
Jika Anda berharap untuk mengikis cache pengguna, Anda mungkin ingin mengatur server untuk menanggapi
304 Not Modified
semua permintaan bersyarat-GET ('Jika-Dimodifikasi-Sejak' atau 'Jika-Tidak-Cocokkan'), yang digunakan browser untuk memvalidasi ulang materi cache mereka.Jika tajuk caching awal Anda pada konten statis seperti gambar cukup liberal - memungkinkan hal-hal di-cache selama berhari-hari atau berbulan-bulan - Anda dapat terus mendapatkan permintaan validasi ulang untuk sementara waktu. Tetapkan cookie pada permintaan itu, dan minta pengguna untuk menjalankan skrip terhadap cache mereka untuk mengekstrak gambar yang masih mereka miliki.
Namun berhati-hatilah: saat Anda mulai memasang konten teks dengan sumber daya sebaris yang belum ada, Anda dapat menghapus versi yang di-cache saat revalidator mencapai 404s.
sumber
Anda dapat menggunakan TinEye untuk menemukan duplikat gambar Anda dengan mencari thumbnail dengan cache Google . Ini hanya akan membantu dengan gambar yang Anda ambil dari situs lain.
sumber
Dengan risiko menunjukkan yang sudah jelas, cobalah menambang cadangan komputer Anda sendiri untuk gambar. Saya tahu strategi cadangan saya cukup serampangan sehingga saya memiliki banyak salinan dari banyak file yang berkeliaran di drive eksternal, cakram yang dibakar, dan dalam file zip / tar. Semoga berhasil!
sumber
Saya telah berhasil memulihkan file-file ini dari cache Safari saya di Snow Leopard:
Jika ada orang yang ingin mencoba, saya telah menulis skrip Python untuk mengekstraknya ke ~ / codinghorror / nama file, yang telah saya tempatkan online di sini .
Saya harap ini membantu.
sumber
Apakah Anda mendapatkan kesempatan untuk melihat apakah, penyedia hosting Anda memiliki cadangan sama sekali (beberapa versi yang lebih lama)?
sumber
Berapa nilai data ini bagi Anda? Jika nilainya sangat besar (ribuan dolar) maka pertimbangkan untuk meminta hard drive yang digunakan untuk menyimpan data untuk situs web Anda (jika terjadi kehilangan data karena kegagalan perangkat keras). Anda kemudian dapat mengambil drive untuk ontrack atau layanan pemulihan data lainnya untuk melihat apa yang bisa Anda dapatkan dari drive. Ini mungkin sulit untuk dinegosiasikan karena kemungkinan data orang lain yang belum pulih pada drive juga, tetapi jika Anda benar-benar peduli tentang hal itu, Anda mungkin dapat menyelesaikannya.
sumber
Sangat menyesal mendengar ini dan saya sangat kesal untuk Anda, dan waktunya - Saya ingin salinan offline beberapa posting Anda dan melakukan HTTrack di seluruh situs Anda tetapi harus keluar (ini beberapa minggu yang lalu) dan Saya menghentikannya.
Jika host setengah keturunan - dan pada kenyataannya saya menduga Anda adalah pelanggan yang baik ... Saya akan meminta mereka untuk mengirimi Anda hard drive (karena saya kira mereka harus menggunakan RAID) atau melakukan pemulihan sendiri.
Walaupun ini mungkin bukan proses yang cepat, saya melakukan ini dengan satu host untuk klien dan dapat memulihkan seluruh database secara utuh (... pada dasarnya, host mencoba memutakhirkan untuk panel kontrol yang mereka gunakan dan mengacaukannya .. tapi tidak ada yang ditimpa).
Apa pun yang terjadi - Semoga sukses dari semua penggemar Anda di situs SO!
sumber