Berasal dari bidang visi komputer, saya sering menggunakan metode RANSAC (Random Sample Consensus) untuk memasang model ke data dengan banyak outlier.
Namun, saya belum pernah melihatnya digunakan oleh ahli statistik, dan saya selalu mendapat kesan bahwa itu tidak dianggap metode "statistik-suara". Kenapa begitu? Sifatnya acak, yang membuatnya lebih sulit untuk dianalisis, tetapi begitu juga metode bootstrap.
Atau apakah hanya sebuah kasus silo akademik yang tidak berbicara satu sama lain?
Jawaban:
Saya pikir kuncinya di sini adalah membuang sebagian besar data di RANSAC.
Dalam sebagian besar aplikasi statistik, beberapa distribusi mungkin memiliki ekor yang berat, dan oleh karena itu jumlah sampel yang kecil mungkin mengacaukan estimasi statistik. Penaksir yang tangguh memecahkan masalah ini dengan menimbang data secara berbeda. RANSAC di sisi lain tidak berupaya mengakomodasi outlier, itu dibangun untuk kasus-kasus di mana titik data benar-benar tidak termasuk, tidak hanya didistribusikan secara tidak normal.
sumber
Bagi kami, ini hanyalah satu contoh dari regresi yang kuat - saya percaya itu digunakan oleh para ahli statistik juga, tetapi mungkin tidak begitu luas karena memiliki beberapa alternatif yang lebih dikenal.
sumber
Ini terdengar sangat mirip mengantongi yang merupakan teknik yang sering digunakan.
sumber
Anda membuang data dengan RANSAC, berpotensi tanpa membenarkannya, tetapi didasarkan pada peningkatan kesesuaian model. Membuang data untuk peningkatan kecocokan biasanya dihindari karena Anda mungkin kehilangan data penting. Penghapusan pencilan tanpa pembenaran selalu bermasalah.
Tentu mungkin untuk membenarkannya. Misalnya jika Anda tahu data harus mengikuti pola yang diberikan, tetapi ada juga penyimpangan dalam data dari pola karena kesalahan dalam pengukuran.
sumber