Mengapa RANSAC tidak digunakan secara luas dalam statistik?

26

Berasal dari bidang visi komputer, saya sering menggunakan metode RANSAC (Random Sample Consensus) untuk memasang model ke data dengan banyak outlier.

Namun, saya belum pernah melihatnya digunakan oleh ahli statistik, dan saya selalu mendapat kesan bahwa itu tidak dianggap metode "statistik-suara". Kenapa begitu? Sifatnya acak, yang membuatnya lebih sulit untuk dianalisis, tetapi begitu juga metode bootstrap.

Atau apakah hanya sebuah kasus silo akademik yang tidak berbicara satu sama lain?

Bossykena
sumber
1
Saya bertanya-tanya satu hal tentang metode visi komputer vs. metode statistik: kinerja yang pertama adalah keharusan. Mungkin ada trade-off antara kinerja dan "kebenaran", dan visi komputer dan statistik memiliki bobot yang berbeda untuk variabel-variabel tersebut.
Lucas Reis

Jawaban:

10

Saya pikir kuncinya di sini adalah membuang sebagian besar data di RANSAC.

Dalam sebagian besar aplikasi statistik, beberapa distribusi mungkin memiliki ekor yang berat, dan oleh karena itu jumlah sampel yang kecil mungkin mengacaukan estimasi statistik. Penaksir yang tangguh memecahkan masalah ini dengan menimbang data secara berbeda. RANSAC di sisi lain tidak berupaya mengakomodasi outlier, itu dibangun untuk kasus-kasus di mana titik data benar-benar tidak termasuk, tidak hanya didistribusikan secara tidak normal.

nbubis
sumber
1
Jawaban yang bagus Saya telah melihat RANSAC paling banyak digunakan di CV untuk memperkirakan homografi. Ini paling banyak digunakan ketika kita tahu bahwa beberapa pengukuran yang sesuai sangat tidak dapat diandalkan. Juga, kinerja waktu nyata dan pertimbangan lain telah membuat teknik ini cukup populer karena dapat dengan mudah diparalelkan.
Luca
7

Bagi kami, ini hanyalah satu contoh dari regresi yang kuat - saya percaya itu digunakan oleh para ahli statistik juga, tetapi mungkin tidak begitu luas karena memiliki beberapa alternatif yang lebih dikenal.


sumber
1
Bisakah Anda memberi contoh alternatif? Saya ingin melihatnya.
Bossykena
5
Yang paling dikenal dan paling sederhana adalah regresi Median-Median, yang terkenal dari kalkulator cerdas (Sigh!). Konsultasikan juga Wikipedia en.wikipedia.org/wiki/Robust_regress dan mungkin CRAN's Robust task view cran.r-project.org/web/views/Robust.html
Apakah ada alternatif untuk RANSAC yang tidak hanya memberikan Anda regresi yang tidak bias tetapi juga titik data dari mana model telah diperkirakan? Terima kasih
Valerio
2

Ini terdengar sangat mirip mengantongi yang merupakan teknik yang sering digunakan.

Zach
sumber
3
RANSAC sangat berbeda - dalam mengantongi, semua sampel diperhitungkan dalam beberapa cara. RANSAC digunakan dalam kasus di mana hingga 50% dari data harus dibuang sepenuhnya.
nbubis
1

Anda membuang data dengan RANSAC, berpotensi tanpa membenarkannya, tetapi didasarkan pada peningkatan kesesuaian model. Membuang data untuk peningkatan kecocokan biasanya dihindari karena Anda mungkin kehilangan data penting. Penghapusan pencilan tanpa pembenaran selalu bermasalah.

Tentu mungkin untuk membenarkannya. Misalnya jika Anda tahu data harus mengikuti pola yang diberikan, tetapi ada juga penyimpangan dalam data dari pola karena kesalahan dalam pengukuran.

Negatif Umpan BalikLoop
sumber