Pertanyaan yang diberi tag computer-vision

22

Bagaimana cara menghitung peta untuk tugas deteksi untuk Tantangan PASCAL VOC?

Bagaimana cara menghitung peta (rata-rata Presisi Rata-Rata) untuk tugas deteksi untuk papan peringkat Pascal VOC? http://host.robots.ox.ac.uk:8080/leaderboard/displaylb.php?challengeid=11&compid=4 Di sana dikatakan - di halaman 11 :

18

Apa perbedaan antara Inception v2 dan Inception v3?

Makalah yang masuk lebih dalam dengan konvolusi menjelaskan GoogleNet yang berisi modul-modul awal: Perubahan ke awal v2 adalah bahwa mereka mengganti konvolusi 5x5 oleh dua konvolusi 3x3 berturut-turut dan pooling diterapkan: Apa perbedaan antara Inception v2 dan Inception

image-classification convnet computer-vision inception

17

Apa arti notasi mAP @ [. 5: .95]?

Untuk deteksi, cara umum untuk menentukan apakah satu proposal objek benar adalah Persimpangan atas Union (IoU, IU). Ini mengambil himpunan dari objek piksel yang diusulkan dan set piksel objek benar dan menghitung:BSEBUAHSEBUAHABBB sayao U( A , B ) = A ∩ BA ∪

computer-vision

13

Mengapa konvolusi selalu menggunakan angka ganjil sebagai filter_size

Jika kita melihat 90-99% dari makalah yang diterbitkan menggunakan CNN (ConvNet). Sebagian besar dari mereka menggunakan ukuran filter angka ganjil : {1, 3, 5, 7} untuk yang paling banyak digunakan. Situasi ini dapat menyebabkan beberapa masalah: Dengan ukuran filter ini, biasanya operasi...

deep-learning convnet computer-vision convolution

11

Apa perbedaan antara Dilatasi Konvolusi dan Dekonvolusi?

Dua operasi konvolusi ini sangat umum dalam pembelajaran mendalam saat ini. Saya membaca tentang pelebaran lapisan konvolusional dalam tulisan ini: WAVENET: A GENERATIVE MODEL FOR RAW AUDIO dan De-convolution ada dalam makalah ini: Jaringan Sepenuhnya Konvolusional untuk Segmentasi...

machine-learning deep-learning convnet computer-vision convolution

11

Apakah ada model bahasa out-of-the-box yang bagus untuk python?

Saya membuat prototipe aplikasi dan saya membutuhkan model bahasa untuk menghitung kebingungan pada beberapa kalimat yang dihasilkan. Apakah ada model bahasa terlatih dalam python yang bisa saya gunakan? Sesuatu yang sederhana seperti model = LanguageModel('en') p1 = model.perplexity('This is a...

python nlp language-model r statistics linear-regression machine-learning classification random-forest xgboost python sampling data-mining orange predictive-modeling recommender-system statistics dimensionality-reduction pca machine-learning python deep-learning keras reinforcement-learning neural-network image-classification r dplyr deep-learning keras tensorflow lstm dropout machine-learning sampling categorical-data data-imputation machine-learning deep-learning machine-learning-model dropout deep-network pandas data-cleaning data-science-model aggregation python neural-network reinforcement-learning policy-gradients r dataframe dataset statistics prediction forecasting r k-means python scikit-learn labels python orange cloud-computing machine-learning neural-network deep-learning rnn recurrent-neural-net logistic-regression missing-data deep-learning autoencoder apache-hadoop time-series data preprocessing classification predictive-modeling time-series machine-learning python feature-selection autoencoder deep-learning keras tensorflow lstm word-embeddings predictive-modeling prediction machine-learning-model machine-learning classification binary theory machine-learning neural-network time-series lstm rnn neural-network deep-learning keras tensorflow convnet computer-vision

10

Bagaimana saya bisa mendeteksi jika gambar dipotret?

Saya ingin memeriksa file JPG jika mereka dimanipulasi untuk mengubah konten. Apa yang saya anggap TIDAK photoshopped: Tanam Berputar (Penskalaan) Resolusi gambar Perubahan otomatis yang mungkin dilakukan smartphone Apa yang saya anggap photoshopping: Menambahkan gambar baru di atas bagian...

computer-vision

10

Segmentasi gambar tanpa pengawasan

Saya mencoba menerapkan algoritma di mana diberikan gambar dengan beberapa objek pada tabel bidang, yang diinginkan adalah output dari masker segmentasi untuk setiap objek. Tidak seperti di CNN, tujuannya di sini adalah untuk mendeteksi objek di lingkungan yang tidak dikenal. Apa pendekatan terbaik...

machine-learning deep-learning cnn computer-vision object-detection

9

Apakah ada studi yang meneliti dropout vs regularisasi lainnya?

Apakah ada makalah yang diterbitkan yang menunjukkan perbedaan metode regularisasi untuk jaringan saraf, lebih disukai pada domain yang berbeda (atau setidaknya set data yang berbeda)? Saya bertanya karena saat ini saya merasa bahwa kebanyakan orang tampaknya hanya menggunakan dropout untuk...

neural-network computer-vision convnet regularization dropout

9

jumlah parameter untuk lapisan konvolusi

Dalam makalah yang sangat dikutip ini , penulis memberikan diskusi berikut tentang jumlah parameter berat. Saya tidak begitu jelas mengapa ia memiliki parameter . Saya pikir itu harus 49 C karena masing-masing saluran input C berbagi filter yang sama, yang memiliki 49

machine-learning deep-learning computer-vision

8

Pengakuan manusia dalam gambar melalui deskriptor HOG dan pengklasifikasi SVM berkinerja buruk

Saya menggunakan deskriptor HOG, ditambah dengan classifier SVM, untuk mengenali manusia dalam gambar. Saya menggunakan pembungkus Python untuk OpenCV. Saya telah menggunakan tutorial yang sangat baik di pymagesearch , yang menjelaskan apa yang dilakukan algoritma dan memberikan petunjuk tentang...

python computer-vision object-recognition

8

Menggunakan Neural Networks untuk mengekstrak beberapa parameter dari gambar

Saya ingin mengekstrak parameter dari gambar menggunakan jaringan saraf. Contoh: Diberi gambar dinding bata, NN harus mengekstraksi lebar dan tinggi bata, warna dan kekasarannya. Saya dapat menghasilkan gambar untuk parameter yang diberikan untuk melatih NN dan ingin menggunakannya untuk...

neural-network deep-learning computer-vision