Dalam komentar di bawah tulisan saya , Glen_b dan saya mendiskusikan bagaimana distribusi diskrit harus memiliki mean dan varian yang berbeda.
Untuk distribusi normal masuk akal. Jika saya memberi tahu Anda, kamu belum tahu apa adalah, dan jika saya memberi tahu Anda , Anda tidak tahu apa itu. (Diedit untuk mengatasi statistik sampel, bukan parameter populasi.)
Tetapi kemudian untuk distribusi seragam diskrit, bukankah logika yang sama berlaku? Jika saya memperkirakan pusat titik akhir, saya tidak tahu skala, dan jika saya memperkirakan skala, saya tidak tahu pusat.
Apa yang salah dengan pemikiran saya?
EDIT
Saya melakukan simulasi jbowman. Kemudian saya memukulnya dengan probabilitas integral transformasi (saya pikir) untuk memeriksa hubungan tanpa pengaruh dari distribusi marjinal (isolasi kopula).
Data.mean <- Data.var <- rep(NA,20000)
for (i in 1:20000){
Data <- sample(seq(1,10,1),100,replace=T)
Data.mean[i] <- mean(Data)
Data.var[i] <- var(Data)
}
par(mfrow=c(2,1))
plot(Data.mean,Data.var,main="Observations")
plot(ecdf(Data.mean)(Data.mean),ecdf(Data.var)(Data.var),main="'Copula'")
Dalam gambar kecil yang muncul di RStudio, plot kedua sepertinya memiliki cakupan yang seragam di atas unit square, jadi independensi. Setelah memperbesar, ada pita vertikal yang berbeda. Saya pikir ini ada hubungannya dengan diskresi dan bahwa saya tidak boleh membacanya. Saya kemudian mencobanya untuk distribusi seragam berkelanjutan pada .
Data.mean <- Data.var <- rep(NA,20000)
for (i in 1:20000){
Data <- runif(100,0,10)
Data.mean[i] <- mean(Data)
Data.var[i] <- var(Data)
}
par(mfrow=c(2,1))
plot(Data.mean,Data.var)
plot(ecdf(Data.mean)(Data.mean),ecdf(Data.var)(Data.var))
Yang ini benar-benar terlihat seperti memiliki titik-titik yang terdistribusi secara seragam di seluruh unit square, jadi saya tetap skeptis bahwa dan bersifat independen.
Jawaban:
jbowman's Answer (+1) menceritakan banyak hal. Ini sedikit lagi.
(a) Untuk data dari distribusi seragam yang berkelanjutan , mean sampel dan SD tidak berkorelasi, tetapi tidak independen. 'Garis besar' plot menekankan pada ketergantungan. Di antara distribusi berkelanjutan, independensi hanya berlaku untuk normal.
(B) Seragam diskrit. Discreteness memungkinkan untuk menemukan nilaiSebuah dari mean dan nilai s SD sedemikian rupa sehingga P(X¯= a ) > 0 ,P( S= s ) > 0 ,
tapi P(X¯= a , X= s ) = 0.
(c) Distribusi normal bulat tidak normal. Discreteness menyebabkan ketergantungan.
(d) Selanjutnya ke (a), menggunakan distribusiB e t a (0,1,0,1),
dari pada B e t a (1,1)≡ U n i f( 0 , 1 ) .
menekankan batas-batas nilai yang mungkin dari mean sampel dan SD. Kami 'memencet' hypercube 5 dimensi ke 2-ruang. Gambar beberapa hyper-edge jelas. [Ref: Gambar di bawah ini mirip dengan Gambar 4.6 di Suess & Trumbo (2010), Pengantar simulasi probabilitas dan pengambilan sampel Gibbs dengan R, Springer.]
Tambahan per Komentar.
sumber
Bukan berarti mean dan varians tergantung dalam kasus distribusi diskrit, itu adalah bahwa mean sampel dan varians tergantung diberikan parameter distribusi. Mean dan varians itu sendiri adalah fungsi tetap dari parameter distribusi, dan konsep seperti "independensi" tidak berlaku untuk mereka. Akibatnya, Anda mengajukan pertanyaan hipotetis yang salah tentang diri Anda.
Dalam kasus distribusi seragam diskrit, merencanakan hasil 20.000(x¯,s2) pasangan dihitung dari sampel 100 seragam ( 1 , 2 , ... , 10 ) hasil variasi dalam:
yang menunjukkan dengan jelas bahwa mereka tidak independen; semakin tinggi nilais2 terletak secara tidak proporsional menuju pusat kisaran x¯ . (Namun, mereka tidak berkorelasi; argumen simetri sederhana harus meyakinkan kita tentang hal itu.)
Tentu saja, sebuah contoh tidak dapat membuktikan dugaan Glen di postingan yang Anda tautkan dengan tidak ada distribusi diskrit dengan mean dan varians sampel independen!
sumber