Bagaimana saya bisa menentukan jenis file tanpa ekstensi di Windows?

150

Saya terkadang mendapatkan file dari klien saya yang memiliki ekstensi file salah. Sebagai contoh, namanya image.jpgtetapi file tersebut sebenarnya adalah gambar TIFF. Dalam banyak kasus saya dapat mengklarifikasi dengan membuka file dalam editor teks, melihat beberapa byte pertama, kemudian menyimpulkan jenis file yang mana itu.

Ini berfungsi untuk saya dengan file JPEG, TIFF, GIF dan PDF. Namun ada banyak jenis file di luar sana.

Apakah mungkin untuk mengotomatiskan identifikasi jenis file yang benar dengan menganalisis data yang mengandung?

Martin
sumber
36
Bagi yang tertarik, fileperintah melakukan ini pada mesin * nix.
boehj
10
Saya tidak mengerti mengapa pertanyaan ini di luar topik (setelah 3 tahun). Saya tidak meminta perangkat lunak tertentu (saya menulis ulang pertanyaan saya untuk menggarisbawahi ini). Saya hanya meminta solusi.
Martin
2
Saya tidak mengerti mengapa 26 orang berpikir bahwa komentar terkait boehj * nix di atas "menambahkan sesuatu yang bermanfaat pada pos". Pertanyaan ini ditandai windows, tetapi komentarnya menyiratkan: "Anda tidak dapat melakukannya di Windows, Anda harus menggunakan * nix". Begitu? Komentar diarahkan "untuk mereka yang tertarik". Dalam apa? Ubah komputer? :(
Aacini
2
@Aacini berguna untuk * nix orang yang datang ke sini dari google.
jingyu9575

Jawaban:

145

Anda dapat menggunakan alat TrID yang memiliki pustaka definisi tipe file yang berkembang untuk mengidentifikasi file.

Tangkapan layar

Wildcard didukung, jadi dalam contoh Anda, Anda bisa meletakkan semua gambar untuk diperiksa dalam folder, misalnya C: \ verifikasi gambar - maka Anda dapat menggunakan perintah:

trid C:\verifyimages\*

Ini akan memeriksa semua file di verifyimagesfolder.


Ada juga versi GUI yang tersedia, TrIDNet :

Tangkapan layar

Ada dokumentasi yang tersedia tentang bagaimana Anda dapat dengan mudah mengintegrasikan TrID atau TrIDNet ke Windows Explorer dan Total Commander:

Windows Explorer

Komandan Total

Taji
sumber
4
Perhatikan bahwa ini menunjukkan bahwa itu bukan lisensi untuk penggunaan komersial, hanya penggunaan pribadi
Chris Magnuson
2
Saya mengalami beberapa kesulitan mencari tahu file unduhan mana yang diperlukan untuk menggunakan program ini. Jadi komentar ini untuk membantu itu. Anda harus mengunduh dua file. Pertama, baik utilitas baris perintah atau utilitas GUI. Kedua, folder definisi XML yang disebut "TrID XML defs". Tempatkan file XML definisi dalam direktori yang sama dengan TrID. Kemudian pindai definisi. Akhirnya Anda bisa mulai menggunakannya.
mrtsherman
Terima kasih, mrtsherman, untuk klarifikasi. Saya juga bingung. Documents dapat ditingkatkan, tetapi alat yang bagus!
J Woodchuck
52

mengajukan

File menguji setiap argumen dalam upaya untuk mengklasifikasikannya. Ada tiga set tes, dilakukan dalam urutan ini: tes sistem file, tes angka ajaib, dan tes bahasa. The pertama tes yang berhasil menyebabkan jenis file yang akan dicetak.

Jenis yang dicetak biasanya akan berisi salah satu kata teks (file hanya berisi karakter pencetakan dan beberapa karakter kontrol umum dan mungkin aman untuk dibaca di terminal ASCII), dapat dieksekusi (file berisi hasil kompilasi program dalam bentuk dapat dimengerti oleh beberapa kernel UNIX atau lainnya), atau data yang berarti hal lain (data biasanya "biner" atau tidak dapat dicetak). Pengecualian adalah format file yang terkenal (file inti, arsip tar) yang diketahui mengandung data biner.

Ignacio Vazquez-Abrams
sumber
1
filestandar, tetapi pada sistem yang lebih lama (terutama non-Linux) tidak terlalu luas. Untuk Ubuntu dll itu harus cukup terhormat dan bahkan dipasang sebagai standar.
Thorbjørn Ravn Andersen
1
@Anm_LA, ini sama sekali bukan standar di Windows, tetapi tautan dalam jawabannya adalah ke port versi GNU fileke Windows. Jika perintah * nix lain menarik bagi Anda sebagai pengguna Windows, maka cari di situs itu untuk menemukan semua jenis permata.
RBerteig
2
Saya sangat meragukan bahwa itu fileadalah ahli pada file yang dibuat oleh aplikasi Windows.
Robin Green
5
@Robin: Sama-sama mengujinya.
Ignacio Vazquez-Abrams
11
@Robin: Saya sangat meragukan Anda telah menggunakan filesama sekali, namun Anda hampir memutuskan tentang efektivitasnya.
tzot
13

Saya dulu bekerja untuk Perpustakaan Nasional Prancis, untuk membangun sistem arsip digital yang tidak hanya berisi buku-buku digital, tetapi juga jutaan artefak digital dengan semua jenis jenis file yang aneh. Kami menggunakan JHOVE untuk mengenali format file.

JHOVE adalah open source, dikelola oleh JSTOR dan Perpustakaan Universitas Harvard. Ini agak mudah digunakan .

Nicolas Raoul
sumber
keren! tetapi apakah ia mengenali format eksklusif seperti TrID? Bagaimanapun , saya memiliki beberapa kegunaan untuk mengidentifikasi subformat / varian format non-eksklusif (atau, tepatnya, 'ekstensi' eksklusif untuk format standar), jadi ini akan berguna. terima kasih atas head-up!
pepoluan
1

Saya menggunakan pustaka OutsideIn Oracle dalam program saya. Tidak gratis, tetapi mereka bekerja dengan baik, terutama untuk gambar. Pasar-bicara mengatakan mendukung lebih dari 500 jenis file.

Richard Brightwell
sumber