Misalkan Anda memiliki file video yang urutan pikselnya telah dikocok sekali. Artinya, urutan acak telah didefinisikan sekali dan diterapkan ke semua bingkai.
Apakah ada beberapa pendekatan yang dikenal untuk mengambil urutan piksel awal?
Saya punya beberapa ide untuk mengambil topologi awal dengan menempatkan piksel yang nilainya berkorelasi dalam ruang dan waktu yang lebih dekat. Saya ingin tahu apakah ini telah dipelajari dan apakah algoritma yang efisien diterbitkan.
Juga masalah ini dapat dianggap sebagai cara untuk memproyeksikan ke matriks 2D satu set nilai yang bervariasi dalam waktu untuk dapat menerapkan teknik visi komputer (seperti CNN), dengan asumsi bahwa nilai-nilai ini memang entah bagaimana berkorelasi.
statistics
convnet
image-recognition
convolution
tsne
Denis Dollfus
sumber
sumber
Jawaban:
Ini adalah masalah kombinatorial yang menarik. Saya akan menampilkan setiap piksel menggunakan lintasan temporal penuhnya, lalu menanamkannya dalam kotak menggunakan k tetangga terdekat. Tujuan sebenarnya adalah untuk memaksimalkan kemungkinan video menjadi urutan gambar alami (kehidupan nyata), yang dapat Anda uji dengan penggolong, tetapi Anda mungkin bisa lolos hanya dengan biaya kehalusan; katakanlah, jumlah perbedaan antara piksel yang berdekatan. Setelah Anda mulai mengisi kisi-kisi, kendala kehalusan akan mengurangi ruang pencarian (karena piksel harus dekat dengan beberapa piksel lainnya), sehingga mempercepat, dengan asumsi Anda menggunakan struktur data yang efisien untuk menanyakan tetangga terdekat; lihat misalnya http://www.itu.dk/people/pagh/SSS/ann-benchmarks/
sumber
Solusi umum untuk ini tidak ada, bahkan jika kami menambahkan beberapa asumsi tentang distribusi misalnya warna dan bentuk pada gambar atau penggabungan sementara seperti frame yang berurutan serupa.
Masalah
MembiarkanF1, ... ,Fsaya menjadi n bingkai asli, masing-masing dengan m piksel. MembiarkanP menjadi permutasi yang diterapkan pada piksel setiap frame sebelum kita mendapatkannya. Anda bisa memikirkannyaP sebagai buku kode musuh.
Sekarang, sebagai input yang kami terimaP(F1) , ... , P(Fn) . Tujuannya adalah untuk menemukan permutasi terbalikQ untuk mengembalikan gambar. JadiQ P= Saya adalah peta identitas dan misalnya Q ( P(F1) ) =F1 . Perhatikan bahwa kita tidak tahu bingkai yang benarFsaya .
MembiarkanQ1, . . . ,Qm ! menjadi m ! kemungkinan fungsi permutasi dari m piksel.
Tujuannya untuk memilih yang unikj ∈ { 1 , … , m ! } maka QjP=Saya .
Tidak Ada Solusi Umum
Di bawah model statistik kami ini berarti memilihQj yang memaksimalkan kemungkinan itu Qj( P(Fsaya) ) diambil dari distribusi yang sama dengan statistik referensi untuk gambar dan statistik temporal antara frame berturut-turut Qj( P(Fsaya) dan Qj( P(Fi + 1) yang merupakan pengetahuan kami sebelumnya.
Ada contoh tandingan kanonik di mana musuh memberi Anda film orak dengan dua frame di mana semua piksel memiliki warna yang sama, jadin = 2 , F1=F2 dan Qj(F1) =Qj(F2) = F1 = F2 untuk setiap j . Demikian untuk semuanyaj , statistik dalam-bingkai dan antar-bingkai dapat digunakan untuk masing-masing j dan tidak memberi kami informasi untuk memilih permutasi kemungkinan maksimum Qj (Kecuali dalam kasus degenerasi di mana m ! = 1 ).
Dengan demikian, kami tidak dapat menjamin keunikan dan masalahnya tidak dapat diselesaikan tanpa asumsi lebih lanjut.
Asumsi Lebih Lanjut
Sangat menarik untuk melihat apakah kita dapat memecahkan masalah dengan menambahkan lebih banyak kendala.
Jika kita membatasi musuh untuk hanya mengirim kami film "nyata" dan dengan asumsi ada cukup banyak piksel dan bingkai sehingga unikQj dengan kemungkinan maksimum ada, kami masih harus menghitung statistik untuk O ( m ! × n ) bingkai permutasi untuk menemukan maksimum.
Ini adalah pemecah kode brute force.
Untuk mendapatkan manfaat dari jaringan saraf, dan back-propagation khususnya, kita akan memerlukan fungsi kerugian yang terdiferensiasi sehubungan dengan input (yang merupakan pengkodean darij atau permutasi kami Qj ). Pertanyaannya kemudian, adalah untuk melihat apakah fungsi tersebut dapat ditemukan.
Kalau tidak, masalahnya lebih mirip dengan cryptanalysis dalam kasus khusus di mana kita tahu bahwa buku kode musuh adalah permutasi dari teks-jelas (atau gambar-jelas).
sumber