Pertanyaan yang diberi tag outliers

13
Drop outlier berdasarkan “2,5 kali RMSE”

Dalam Kahneman dan Deaton (2010) , penulis menulis yang berikut:††^\dagger Regresi ini menjelaskan 37% dari varians, dengan root mean square error (RMSE) dari 0,67852. Untuk menghilangkan pencilan dan laporan pendapatan yang tidak masuk akal, kami menjatuhkan pengamatan di mana nilai absolut...

13
Memisahkan dua populasi dari sampel

Saya mencoba memisahkan dua kelompok nilai dari satu set data. Saya dapat berasumsi bahwa salah satu populasi terdistribusi secara normal dan setidaknya setengah dari ukuran sampel. Nilai yang kedua sama-sama lebih rendah atau lebih tinggi dari nilai dari yang pertama (distribusi tidak diketahui)....

13
LARS vs koordinate descent untuk laso

Apa pro dan kontra dari menggunakan LARS [1] dibandingkan menggunakan penurunan koordinat untuk menyesuaikan regresi linier yang diatur L1? Saya terutama tertarik pada aspek kinerja (masalah saya cenderung ada Ndalam ratusan ribu dan p<20.) Namun, wawasan lainnya juga akan dihargai. sunting:...

12
Deteksi outlier dalam set yang sangat kecil

Saya perlu mendapatkan seakurat mungkin nilai untuk kecerahan sumber cahaya yang stabil terutama yang diberikan dua belas nilai luminositas sampel. Sensornya tidak sempurna, dan cahayanya kadang-kadang bisa "berkedip" lebih terang atau lebih gelap, yang bisa diabaikan, karenanya saya perlu deteksi...

12
Perbedaan antara PROC Mixed dan lme / lmer dalam R - derajat kebebasan

Catatan: pertanyaan ini adalah repost, karena pertanyaan saya sebelumnya harus dihapus karena alasan hukum. Sambil membandingkan PROC CAMPURAN dari SAS dengan fungsi lmedari nlmepaket di R, saya menemukan beberapa perbedaan yang agak membingungkan. Lebih khusus lagi, derajat kebebasan dalam...

12
Bentuk yang bagus untuk menghapus outlier?

Saya sedang mengerjakan statistik untuk pembuatan perangkat lunak. Saya punya data untuk setiap build on pass / gagal dan waktu yang berlalu dan kami menghasilkan ~ 200 dari ini / minggu. Tingkat keberhasilannya mudah untuk dikumpulkan, saya dapat mengatakan bahwa 45% lulus setiap minggu. Tapi...

11
Seberapa akurat IQR untuk mendeteksi outlier

Saya sedang menulis skrip yang menganalisis waktu proses yang dijalankan. Saya tidak yakin distribusi mereka tetapi saya ingin tahu apakah suatu proses berjalan "terlalu lama". Sejauh ini saya telah menggunakan 3 standar deviasi dari waktu menjalankan terakhir (n> 30), tetapi saya diberitahu...

11
Deteksi outlier menggunakan regresi

Dapatkah regresi digunakan untuk deteksi lier. Saya mengerti bahwa ada cara untuk meningkatkan model regresi dengan menghapus outlier. Tetapi tujuan utama di sini bukan untuk mencocokkan model regresi tetapi mencari tahu liers menggunakan

11
Pemilihan fitur otomatis untuk deteksi anomali

Apa cara terbaik untuk memilih fitur secara otomatis untuk deteksi anomali? Saya biasanya memperlakukan Deteksi Anomali sebagai algoritme di mana fitur dipilih oleh para ahli manusia: yang penting adalah kisaran output (seperti pada "input abnormal - output abnormal") sehingga bahkan dengan banyak...

11
Menemukan titik GPS rata-rata

Saya perlu menulis sebuah program untuk menemukan titik GPS rata-rata dari populasi titik. Dalam praktiknya hal berikut terjadi: Setiap bulan seseorang merekam titik GPS dari aset statis yang sama. Karena sifat GPS, titik-titik ini sedikit berbeda setiap bulan. Kadang-kadang orang membuat...