Adakah yang tahu bagaimana cara menentukan apakah poin 7, 16 dan 29 adalah poin yang berpengaruh atau tidak? Saya membaca di suatu tempat bahwa karena jarak Cook lebih rendah dari 1, mereka tidak. Apakah saya benar?
Tindakan diagnostik (seperti residual atau beberapa ringkasan statistik yang dihitung dari residual) digunakan untuk mengevaluasi beberapa aspek kualitas kesesuaian model dengan data.
Adakah yang tahu bagaimana cara menentukan apakah poin 7, 16 dan 29 adalah poin yang berpengaruh atau tidak? Saya membaca di suatu tempat bahwa karena jarak Cook lebih rendah dari 1, mereka tidak. Apakah saya benar?
Saya mencari pedoman tentang cara menafsirkan plot residual model GLM. Terutama poisson, binomial negatif, model binomial. Apa yang bisa kita harapkan dari plot ini ketika modelnya "benar"? (misalnya, kami berharap varians akan tumbuh dengan meningkatnya nilai yang diprediksi, ketika berurusan...
Saya ingin melakukan demonstrasi kelas di mana saya membandingkan interval-t dengan interval bootstrap dan menghitung probabilitas cakupan keduanya. Saya ingin data berasal dari distribusi miring jadi saya memilih untuk menghasilkan data sebagai exp(rnorm(10, 0, 2)) + 1, sampel ukuran 10 dari...
Misalkan saya akan melakukan regresi logistik univariat pada beberapa variabel independen, seperti ini: mod.a <- glm(x ~ a, data=z, family=binominal("logistic")) mod.b <- glm(x ~ b, data=z, family=binominal("logistic")) Saya melakukan perbandingan model (uji rasio kemungkinan) untuk melihat...
Mengikuti pertanyaan saya untuk OLS , saya bertanya-tanya: plot diagnostik apa yang ada untuk regresi kuantil? (dan apakah ada implementasi R dari mereka?) Pencarian google cepat telah muncul dengan plot worm (yang belum pernah saya dengar sebelumnya), dan saya akan senang mengetahui lebih banyak...
Eksperimen deteksi sinyal biasanya menghadirkan pengamat (atau sistem diagnostik) dengan sinyal atau non-sinyal, dan pengamat diminta untuk melaporkan apakah menurut mereka item yang disajikan adalah sinyal atau non-sinyal. Eksperimen tersebut menghasilkan data yang mengisi matriks 2x2: Teori...
Saya menjalankan sampler Metropolis (C ++) dan ingin menggunakan sampel sebelumnya untuk memperkirakan tingkat konvergensi. Satu yang mudah untuk mengimplementasikan diagnostik yang saya temukan adalah diagnostik Geweke , yang menghitung perbedaan antara dua rata-rata sampel dibagi dengan...
Saya telah memasang model saya dan berusaha memahami apakah itu bagus. Saya telah menghitung metrik yang disarankan untuk menilainya ( / AUC / akurasi / kesalahan prediksi / dll) tetapi tidak tahu bagaimana menafsirkannya. Singkatnya, bagaimana cara mengetahui apakah model saya bagus berdasarkan...
Saya telah melihat formula di Wikipedia. yang menghubungkan jarak Mahalanobis dan Leverage: Jarak mahalanobis terkait erat dengan statistik leverage, hhh , tetapi memiliki skala yang berbeda: D2= ( N- 1 ) ( h - 1N) .D2=(N−1)(h−1N).D^2 = (N - 1)(h - \tfrac{1}{N}). Dalam artikel tertaut ,...
Saya mengetahui tes Reset Ramsey yang dapat mendeteksi dependensi nonlinear. Namun, jika Anda hanya membuang salah satu koefisien regresi (hanya dependensi linier), Anda mungkin mendapatkan bias, tergantung pada korelasinya. Ini jelas tidak terdeteksi oleh tes Reset. Saya tidak menemukan tes untuk...
Saya mengamati pola aneh dalam residu untuk data saya: [EDIT] Berikut adalah plot regresi parsial untuk dua variabel: [EDIT2] Menambahkan Plot PP Distribusi tampaknya baik-baik saja (lihat di bawah) tetapi saya tidak tahu dari mana garis lurus ini berasal. Ada ide? [UPDATE...
Dalam regresi linier sederhana seseorang sering ingin memverifikasi apakah asumsi tertentu dipenuhi untuk dapat melakukan inferensi (misalnya residu terdistribusi normal). Apakah masuk akal untuk memeriksa asumsi dengan memeriksa apakah nilai yang dipasang terdistribusi secara normal?...
Saya mulai menggali sedikit ke fungsi plot.lm , fungsi ini memberikan enam plot untuk lm, yaitu: sebidang residual terhadap nilai yang dipasang plot Skala-Lokasi sqrt (| residual |) terhadap nilai yang dipasang plot QQ Normal, plot jarak Cook versus label baris sebidang residual terhadap...
Saya sudah mendapat data permintaan setengah jam, yang merupakan rangkaian waktu multi-musiman. Aku digunakan tbatsdalam forecastpaket di R, dan mendapat hasil seperti ini: TBATS(1, {5,4}, 0.838, {<48,6>, <336,6>, <17520,5>}) Apakah ini berarti seri tidak harus menggunakan...
Apakah ada asumsi khusus mengenai kesalahan untuk regresi logistik seperti varians konstan dari istilah kesalahan dan normalitas residual? Juga biasanya ketika Anda memiliki titik yang memiliki jarak Cook lebih besar dari 4 / n, apakah Anda menghapusnya? Jika Anda menghapusnya, bagaimana Anda bisa...
Sebelum mengajukan pertanyaan ini, saya mencari di situs kami dan menemukan banyak pertanyaan serupa, (seperti di sini , di sini , dan di sini ). Tetapi saya merasa pertanyaan-pertanyaan terkait itu tidak ditanggapi atau didiskusikan dengan baik, sehingga ingin mengajukan pertanyaan ini lagi. Saya...
Pengajaran standar mengatakan bahwa sensitivitas dan spesifisitas adalah sifat dari tes ini dan tidak tergantung pada prevalensi. Tapi bukankah ini hanya asumsi? Prinsip Harrison tentang penyakit dalam 19 ed mengatakan Telah lama dinyatakan bahwa sensitivitas dan spesifisitas merupakan...
Ketika melakukan OLS regresi linier berganda, daripada memplot residual terhadap nilai-nilai pas, saya plot residual (internal) Studentized terhadap nilai-nilai pas (ditto untuk kovariat). Residu ini didefinisikan sebagai: e∗i=eis2(1−hii)−−−−−−−−−√ei∗=eis2(1−hii)\begin{equation} e^*_i =...
Saya mencoba untuk meniru apa fungsi dfbetas()tidak dalam R . dfbeta() bukan masalah ... Ini adalah sekumpulan vektor: x <- c(0.512, 0.166, -0.142, -0.614, 12.72) y <- c(0.545, -0.02, -0.137, -0.751, 1.344) Jika saya cocok dengan dua model regresi sebagai berikut: fit1 <- lm(y ~...
Pertama izinkan saya mengatakan bahwa saya memiliki satu kursus statistik di sekolah teknik 38 tahun yang lalu. Jadi saya buta di sini. Saya mendapatkan hasil dari 18 tes diagnostik terpisah untuk suatu penyakit. Setiap tes adalah biner - ya / tidak, tanpa ambang batas yang dapat disesuaikan untuk...