Algoritma file shredder

8

Sebagai bagian dari pemrograman sistem pembelajaran, saya mencari untuk mengimplementasikan file shredder. Cara paling sederhana (dan mungkin terlihat naif) adalah mengganti byte data dengan nol (Saya tahu OS membagi file dan saya akan mengganti byte di semua potongan itu). Tetapi ketika saya google pada topik ini, saya terkejut menemukan beberapa algoritma pass, beberapa akan setinggi 35!

Bisakah seseorang menjelaskan manfaat multiple pass? Saya tidak dapat menemukan penjelasan.

Terima kasih

Mike
sumber
1
Anda mungkin ingin membaca ini: stackoverflow.com/questions/4448772
Blrfl

Jawaban:

14

Bayangkan disk fisik menyimpan nilai biner 0101. Secara fisik, pada disk, muatan ada sebagai nilai nyata, yang dibulatkan ke atas atau ke bawah oleh pengontrol disk

biner -> muatan fisik

0 1 0 1 -> 0,1 0,9 0,1 0,9

Jika Anda menimpa data dengan nol, beberapa biaya sisa akan tetap dari nilai sebelumnya, sehingga Anda bisa dalam contoh sederhana ini, nilai-nilai baru menjadi

biner -> fisik

0 0 0 0 -> 0,01 0,09 0,01 0,09

Peralatan yang cukup sensitif untuk membaca biaya ini pada resolusi tinggi, kemudian dapat digunakan untuk mengekstrak "bayangan" dari data yang ditimpa ini. Itu sebabnya menulis ulang beberapa kali (dan menggunakan nilai acak) membantu mengaburkan data.

ikan buntal
sumber
-1, tidak bukan. Kami telah mendorong batasan pada disk begitu lama sehingga kami secara jelas memasukkan domain fisika kuantum. Asumsi analog ini tidak berlaku lagi. Setiap domain magnetik (butiran) pada piring menunjukkan satu arah, dan hanya satu. Hanya ada beberapa ratus butir per bit paling banyak, mereka sangat berpasangan, dan mereka sama sekali tidak didinginkan. Selanjutnya, bit aktual ditransformasikan oleh fungsi PRML dan ECC, sehingga Anda bahkan tidak bisa langsung mengatakan bit mana yang sesuai dengan masing-masing butir. Pada dasarnya, disk 1TB + dimungkinkan karena residu ini sekarang sepenuhnya digunakan.
MSalters
3
@MSalters - Anda mengasumsikan bahwa semua disk yang digunakan adalah seperti ini. WD Still membuat disk yang tidak memanfaatkan ini. Pertanyaannya adalah mengapa menggunakan 35 pass. Ini untuk mengaburkan data karena alasan yang ditunjukkan. Sampai drive gaya lama tidak lagi digunakan maka jenis perusak ini diperlukan. Apa yang hilang adalah bahwa pengontrol baru tidak memberi Anda kendali butir halus atas perangkat keras. Undang-undang yang dirancang untuk mencegah penghancuran bukti telah mengarah pada pengontrol yang tidak menimpa area yang digunakan sebelumnya sampai mereka tidak punya pilihan lain.
SoylentGray
4
@ MSalters, apakah itu perlu tidak relevan. Ini adalah jawaban yang benar untuk pertanyaan yang diajukan oleh OP .
Caleb
@Malters, ya seluruh butir menunjuk ke satu arah, tetapi sumbu kuantisasi mungkin berbeda dari biji ke biji, mendorong beberapa variasi. Ini akan dipengaruhi oleh fluktuasi termal, fluktuasi magnetik dari kepala baca yang lewat, atau butiran tetangga yang dibalik.
rcollyer
@ Chad: Semua bahan magnetik memiliki butiran. Matematika sederhana membuktikan bahwa disk WD menggunakan beberapa ratus butir per bit, mengingat ukuran dan kapasitas piring-piring mereka. Anda mungkin bingung dengan media yang terpola. Mereka dengan sengaja melukiskan butiran untuk mengurangi kopling. Media yang tidak terpola hanya memiliki biji-bijian yang didistribusikan secara acak.
MSalters
7

Penghapusan multipass diperlukan untuk menghancurkan data pada perangkat penyimpanan magnetik. Data dapat dipulihkan dengan peralatan yang tepat bahkan jika itu ditimpa oleh urutan 1s dan 0s lainnya dari lapisan di bawah atau di antaranya.

Namun, ada suara - suara di internet yang mengklaim bahwa penghapusan multipass tidak lagi diperlukan, karena kepadatan areal data pada perangkat keras modern telah meningkat 10.000 kali lipat.

Elang
sumber
1
Sama-sama. Sayang sekali Anda belum mendapatkan hak suara =)
Falcon
0

Dikatakan bahwa para ahli dengan peralatan khusus dapat merekonstruksi drive yang diformat. Oleh karena itu sarannya adalah menimpa data pada drive beberapa kali dengan pola (acak) yang berbeda.

Ingo
sumber
0

Penimpaan data dengan 0s dalam beberapa lintasan hanya masuk akal untuk perangkat penyimpanan magnetik, karena apa yang dikatakan @pufferfish. Untuk SSD dan mekanisme penyimpanan flash lain ini gagal, lihat http://www.usenix.org/events/fast11/tech/full_papers/Wei.pdf

Moral dari cerita: Berurusan dengan masalah perangkat keras dalam perangkat lunak dapat berubah ketika teknologi perangkat keras berubah, meskipun API tidak akan berubah.

Residuum
sumber