Saya terkadang mendapatkan file dari klien saya yang memiliki ekstensi file salah. Sebagai contoh, namanya image.jpg
tetapi file tersebut sebenarnya adalah gambar TIFF. Dalam banyak kasus saya dapat mengklarifikasi dengan membuka file dalam editor teks, melihat beberapa byte pertama, kemudian menyimpulkan jenis file yang mana itu.
Ini berfungsi untuk saya dengan file JPEG, TIFF, GIF dan PDF. Namun ada banyak jenis file di luar sana.
Apakah mungkin untuk mengotomatiskan identifikasi jenis file yang benar dengan menganalisis data yang mengandung?
file
perintah melakukan ini pada mesin * nix.windows
, tetapi komentarnya menyiratkan: "Anda tidak dapat melakukannya di Windows, Anda harus menggunakan * nix". Begitu? Komentar diarahkan "untuk mereka yang tertarik". Dalam apa? Ubah komputer?:(
Jawaban:
Anda dapat menggunakan alat TrID yang memiliki pustaka definisi tipe file yang berkembang untuk mengidentifikasi file.
Wildcard didukung, jadi dalam contoh Anda, Anda bisa meletakkan semua gambar untuk diperiksa dalam folder, misalnya C: \ verifikasi gambar - maka Anda dapat menggunakan perintah:
Ini akan memeriksa semua file di
verifyimages
folder.Ada juga versi GUI yang tersedia, TrIDNet :
Ada dokumentasi yang tersedia tentang bagaimana Anda dapat dengan mudah mengintegrasikan TrID atau TrIDNet ke Windows Explorer dan Total Commander:
Windows Explorer
Komandan Total
sumber
mengajukan
sumber
file
standar, tetapi pada sistem yang lebih lama (terutama non-Linux) tidak terlalu luas. Untuk Ubuntu dll itu harus cukup terhormat dan bahkan dipasang sebagai standar.file
ke Windows. Jika perintah * nix lain menarik bagi Anda sebagai pengguna Windows, maka cari di situs itu untuk menemukan semua jenis permata.file
adalah ahli pada file yang dibuat oleh aplikasi Windows.file
sama sekali, namun Anda hampir memutuskan tentang efektivitasnya.Saya dulu bekerja untuk Perpustakaan Nasional Prancis, untuk membangun sistem arsip digital yang tidak hanya berisi buku-buku digital, tetapi juga jutaan artefak digital dengan semua jenis jenis file yang aneh. Kami menggunakan JHOVE untuk mengenali format file.
JHOVE adalah open source, dikelola oleh JSTOR dan Perpustakaan Universitas Harvard. Ini agak mudah digunakan .
sumber
Saya menggunakan pustaka OutsideIn Oracle dalam program saya. Tidak gratis, tetapi mereka bekerja dengan baik, terutama untuk gambar. Pasar-bicara mengatakan mendukung lebih dari 500 jenis file.
sumber
Anda dapat memeriksa jenis file dari komputer mana saja termasuk windows at
http://www.checkfiletype.com
sumber