Biarkan . Kita tahu bahwa dan . Apakah ini menyiratkan bahwa mean sampel dan varians sampel saling bergantung ? Atau apakah itu hanya berarti bahwa varians populasi dapat ditulis sebagai fungsi dari mean populasi ?
sumber
Biarkan . Kita tahu bahwa dan . Apakah ini menyiratkan bahwa mean sampel dan varians sampel saling bergantung ? Atau apakah itu hanya berarti bahwa varians populasi dapat ditulis sebagai fungsi dari mean populasi ?
dan adalah variabel acak. Kita bisa mengerjakan distribusi bersama mereka. Mari kita coba kasus nontrivial yang paling sederhana, yaitu sampel ukuran dari distribusi Binomial . Hanya ada empat kemungkinan untuk sampel itu, yang dengan ini ditabulasikan bersama dengan probabilitasnya (dihitung dari independensi dua elemen sampel):
First value | Second value | Mean | Variance | Probability
0 | 0 | 0 | 0 | (1-p)^2
0 | 1 | 1/2 | 1/2 | (1-p)p
1 | 0 | 1/2 | 1/2 | p(1-p)
1 | 1 | 1 | 0 | p^2
Mean secara sempurna memprediksi varians dalam contoh ini. Jadi, asalkan semua probabilitas bukan nol (yaitu, bukan atau ), mean sampel dan varians sampel tidak independen.
Pertanyaan yang menarik adalah apakah, jika dalam keluarga distribusi mean menentukan varians, mean sampel dan varians sampel dapat independen. Jawabannya adalah ya: ambil keluarga mana pun dari distribusi Normal yang variansnya bergantung pada rata-rata seperti set semua distribusi Normal . Tidak peduli yang distribusi ini mengatur sampel, varians mean dan sampel sampel akan independen, karena itulah kasus untuk setiap distribusi normal.
Analisis ini menunjukkan bahwa pertanyaan tentang struktur keluarga distribusi (yang menyangkut , , , dan sebagainya) tidak berpengaruh pada pertanyaan independensi statistik sampel dari elemen keluarga tertentu.
R
kode ini? Terimakasih banyak.Properti yang, untuk sampel iid, mean sampel dan varians sampel independen, adalah karakterisasi dari distribusi normal: untuk tidak ada distribusi lain yang dimiliki oleh properti tersebut.
Lihat Patel, JK, & Read, CB (1982). Buku pegangan dari distribusi normal , hal. 81 dalam edisi 1 1982, dalam bab "Karakterisasi" (mungkin telah mengubah halaman dalam edisi 2 1996).
Jadi untuk distribusi lain, mean sampel dan varians sampel bergantung secara statistik.
Hasil umum mengenai mean sampel dan varians sampel dari sampel iid dari distribusi apa pun yang memiliki momen hingga 3d, adalah sebagai berikut (menggunakan estimator yang tidak bias untuk varians):
Dengan kata lain, kovarians antara mean sampel dan varians sampel sama dengan momen pusat ketiga, dibagi dengann . Konsekuensi:
1) Ketika ukuran sampel meningkat, keduanya cenderung menjadi tidak berkorelasi.
2) Untuk setiap distribusi yang memiliki momen pusat ketiga sama dengan nol, mereka tidak berkorelasi (meskipun mereka tetap bergantung, untuk semua distribusi kecuali normal). Ini tentu saja mencakup semua distribusi simetris tentang rata-rata mereka, tetapi juga distribusi lain yang tidak simetris tentang rata-rata mereka tetapi masih, memiliki momen pusat ketiga sama dengan nol , lihat utas ini .
sumber
U(0,1)
tampaknya berhasil.Kasus ekstrem adalahBernoulli( p ) = Binomial( 1 , p ) . Pertimbangkan sampel ukuran (modal) N:
Ketika keduanyan p dan n ( 1 - p ) besar, maka saya berharap mean sampel dan varians sampel akan hampir independen karena distribusi hampir normal.
sumber