Saya sedang mengerjakan proyek kecil yang melibatkan wajah pengguna twitter melalui foto profil mereka.
Masalah yang saya temui adalah bahwa setelah saya memfilter semua kecuali gambar yang merupakan foto potret yang jelas, sebagian kecil tapi signifikan pengguna twitter menggunakan gambar Justin Bieber sebagai gambar profil mereka.
Untuk memfilternya, bagaimana saya bisa tahu secara terprogram apakah gambar Justin Bieber?
[justin-bieber]
tag.Jawaban:
Gagasan yang lebih baik mungkin untuk membuang semua gambar yang muncul di umpan lebih dari satu pengguna - tidak diperlukan pengenalan.
sumber
Saya merasa bahwa http://www.tineye.com/commercial_api dapat menjadi solusi di sini. Cukup lempar gambar profil Twitter ke Tineye, lihat apakah itu mengembalikan gambar (dan URL terkait) yang dapat dengan jelas diidentifikasi (atau secara otomatis dinilai menggunakan logika penghitungan kata sederhana) yang terkait dengan (atau) sedikit karung * *.
Sederhana!
sumber
Karena Anda dapat memfilter hanya pada foto potret yang jernih, saya mengasumsikan Anda memiliki beberapa metode pembuatan fitur untuk mengubah gambar mentah menjadi fitur yang berguna untuk tujuan pembelajaran mesin. Jika itu benar, Anda bisa mencoba untuk melatih algoritma klasifikasi (ada banyak dari mereka: jaringan saraf, dll) dengan memberi makan algoritma sekelompok foto Bieber yang dikenal serta sekelompok non-Biebers yang dikenal. Setelah Anda melatih modelnya, ini dapat digunakan untuk memprediksi apakah gambar baru adalah Bieber atau tidak.
Teknik pembelajaran semacam ini memang mengharuskan Anda untuk memiliki data di mana Anda tahu jawaban yang benar (Bieber atau tidak), tetapi itu mungkin dapat ditemukan dari pencarian gambar Google. Ini juga mengharuskan Anda memiliki jenis fitur yang tepat, dan saya tidak cukup tahu tentang pemrosesan gambar atau algoritma Anda untuk mengetahui apakah itu merupakan kelemahan utama.
sumber
Anda dapat menggunakan metode seperti eigenfaces, http://en.wikipedia.org/wiki/Eigenface . Berikut ini adalah langkah-langkah yang baik dari prosedur serta tautan ke berbagai implementasi.
http://www.pages.drexel.edu/~sis26/Eigenface%20Tutorial.htm
Dari sini lazim untuk menggunakan ini dalam pendekatan klasifikasi, melatih model dan kemudian memprediksi kasus. Anda bisa melakukan ini dengan melatih sekelompok selebriti yang dikenal dan jika Anda memprediksi wajah dari twitter sebagai salah satu model selebriti yang terlatih, hapus saja. Mirip dengan ini http://blog.cordiner.net/2010/12/02/eigenfaces-face-recognition-matlab/
Ini menderita dari amandemen yang konstan. Segera akan ada Justin Bieber baru yang tidak akan menjadi model terlatih Anda, sehingga Anda tidak dapat memprediksinya. Ada juga kasus seperti Whitney Houston, Anda mungkin tidak pernah berpikir untuk menambahkannya sebelumnya, tetapi ia mungkin merupakan citra umum karena rasa hormat dan kekaguman selama beberapa minggu. Anda tidak akan memiliki kekurangan gambar bayi seperti yang disebutkan di atas. Untuk mengatasi masalah ini, Anda dapat menggunakan lebih dari pendekatan pengelompokan hierarkis. Menghapus beberapa set cluster yang sangat dekat jika mereka mencapai tingkat dukungan tertentu, cluster pertama Anda memiliki 15 item sebelum yang kedua dibangun. Sekarang Anda tidak perlu khawatir tentang yang ada dalam model pelatihan Anda tetapi Anda akan jatuh ke masalah gambar bayi.
sumber
http://face.com/ memiliki API pengenalan wajah yang gratis
sumber
Jika Anda ingin melakukannya sendiri, saya akan merekomendasikan menggunakan proyek OpenCV (CV untuk visi komputer) Intel gratis dan open source.
http://opencv.willowgarage.com/
http://oreilly.com/catalog/9780596516130
sumber
Anda harus menggunakan algoritme yang mendeteksi orang yang dimaksud gambar. Anda dapat membangun model berdasarkan gambar potret berbeda dari kepribadian terkenal dan menggunakan pengklasifikasi untuk memastikan bahwa gambar ini merujuk ke salah satu gambar basis data Anda. Anda perlu menggunakan classifier tertentu berdasarkan pada berbagai parameter yang disukai wajah, seperti jarak antara mata atau parameter lainnya untuk meningkatkan akurasi model Anda. Ada juga analisis kulit. Yang paling penting adalah membangun classifier yang baik. Metode ini bisa rentan.
Tetapi ada juga proyek yang sangat bagus yang bekerja pada pengenalan wajah http://opencv-code.com/Opencv_Face_Detection
sumber
Anda dapat mencoba hashing sensitif lokalitas .
sumber