Contoh distribusi di mana ukuran sampel besar diperlukan untuk teorema limit pusat

19

Beberapa buku menyatakan ukuran sampel ukuran 30 atau lebih tinggi diperlukan untuk teorema batas pusat untuk memberikan perkiraan yang baik untuk . X¯

Saya tahu ini tidak cukup untuk semua distribusi.

Saya ingin melihat beberapa contoh distribusi di mana bahkan dengan ukuran sampel yang besar (mungkin 100, atau 1000, atau lebih tinggi), distribusi rata-rata sampel masih cukup miring.

Saya tahu saya telah melihat contoh seperti itu sebelumnya, tetapi saya tidak ingat di mana dan saya tidak dapat menemukannya.

Grafik
sumber
5
Pertimbangkan distribusi Gamma dengan parameter bentuk . Ambil skala sebagai 1 (tidak masalah). Katakanlah Anda menganggap sebagai hanya "cukup normal". Kemudian distribusi yang Anda perlukan untuk mendapatkan 1000 pengamatan agar cukup normal memiliki distribusi . αGamma(α0,1)Gamma(α0/1000,1)
Glen_b -Reinstate Monica
1
@ Glen_b, mengapa tidak membuat itu jawaban resmi & mengembangkannya sedikit?
gung - Reinstate Monica
4
Distribusi apa pun yang cukup terkontaminasi akan berfungsi, sesuai dengan contoh @ Glen_b. Misalnya , ketika distribusi yang mendasarinya adalah campuran Normal (0,1) dan Normal (nilai besar, 1), dengan yang terakhir hanya memiliki kemungkinan kecil muncul, maka hal-hal menarik terjadi: (1) sebagian besar waktu , kontaminasi tidak muncul dan tidak ada bukti kemiringan; tetapi (2) terkadang kontaminasi muncul dan kemiringan dalam sampel sangat besar. Distribusi rata-rata sampel akan sangat miring tanpa memperhatikan tetapi bootstrap ( misalnya ) biasanya tidak akan mendeteksinya.
Whuber
1
@ whuber's contoh adalah instruktif, menunjukkan bahwa teorema limit pusat dapat, secara teori, sewenang-wenang menyesatkan. Dalam percobaan praktis, saya kira orang perlu bertanya pada diri sendiri apakah mungkin ada efek besar yang jarang terjadi, dan menerapkan hasil teoretis dengan sedikit kehati-hatian.
David Epstein

Jawaban:

19

Beberapa buku menyatakan ukuran sampel ukuran 30 atau lebih tinggi diperlukan untuk teorema batas pusat untuk memberikan perkiraan yang baik untuk .X¯

Aturan umum ini hampir tidak berguna sama sekali. Ada distribusi non-normal yang n = 2 akan melakukan distribusi baik-baik saja dan non-normal yang jauh lebih besar tidak mencukupi - jadi tanpa batasan eksplisit pada keadaan, aturannya menyesatkan. Bagaimanapun, bahkan jika itu benar, yang diperlukan n akan bervariasi tergantung pada apa yang Anda lakukan. Seringkali Anda mendapatkan perkiraan yang baik di dekat pusat distribusi di n kecil , tetapi perlu n lebih besar untuk mendapatkan perkiraan yang layak di bagian ekor.nnnn

Sunting: Lihat jawaban atas pertanyaan ini untuk berbagai pendapat tetapi tampaknya dengan suara bulat tentang masalah itu, dan beberapa tautan yang baik. Saya tidak akan memaksakan intinya, karena Anda sudah jelas memahaminya.

Saya ingin melihat beberapa contoh distribusi di mana bahkan dengan ukuran sampel yang besar (mungkin 100 atau 1000 atau lebih tinggi), distribusi rata-rata sampel masih cukup miring.

Contoh relatif mudah dibangun; salah satu cara mudah adalah menemukan distribusi yang dapat dibagi tanpa batas yang tidak normal dan membaginya. Jika Anda memiliki satu yang akan mendekati normal ketika Anda rata-rata atau jumlah itu, mulai pada batas 'mendekati normal' dan membaginya sebanyak yang Anda suka. Jadi misalnya:

αGamma(α0,1)Gamma(α0/1000,1)

α=20

Gamma (20) pdf

α=20α=0.02

Gamma (0,02) pdf

Rata-rata 1000 dari mereka akan memiliki bentuk pdf pertama (tetapi tidak skalanya).

σ/n

@ whuber's point tentang distribusi yang terkontaminasi adalah yang sangat bagus; mungkin membayar untuk mencoba beberapa simulasi dengan kasus itu dan melihat bagaimana hal-hal berperilaku di banyak sampel tersebut.

Glen_b -Reinstate Monica
sumber
12

σσtχ2ttn=30s2X¯

Frank Harrell
sumber
2
s2
9

Anda mungkin menemukan makalah ini bermanfaat (atau paling tidak menarik):

http://www.umass.edu/remp/Papers/Smith&Wells_NERA06.pdf

Para peneliti di UMass sebenarnya melakukan penelitian yang mirip dengan apa yang Anda tanyakan. Pada ukuran sampel apa data terdistribusi tertentu mengikuti distribusi normal karena CLT? Rupanya banyak data yang dikumpulkan untuk eksperimen psikologi tidak berada di dekat yang terdistribusi normal, sehingga disiplin sangat bergantung pada CLT untuk melakukan inferensi pada statistik mereka.

α=0.05

Table 2. Percentage of replications that departed normality based on the KS-test. 
 Sample Size 
           5   10   15   20   25  30 
Normal   100   95   70   65   60  35 
Uniform  100  100  100  100  100  95 
Bimodal  100  100  100   75   85  50

Anehnya, 65 persen dari data yang didistribusikan secara normal ditolak dengan ukuran sampel 20, dan bahkan dengan ukuran sampel 30, 35% masih ditolak.

Mereka kemudian menguji beberapa distribusi yang sangat miring yang dibuat menggunakan metode kekuatan Fleishman:

Y=aX+bX2+cX3+dX4

X mewakili nilai yang diambil dari distribusi normal sedangkan a, b, c, dan d adalah konstanta (perhatikan bahwa a = -c).

Mereka menjalankan tes dengan ukuran sampel hingga 300

Skew  Kurt   A      B      C       D 
1.75  3.75  -0.399  0.930  0.399  -0.036 
1.50  3.75  -0.221  0.866  0.221   0.027 
1.25  3.75  -0.161  0.819  0.161   0.049 
1.00  3.75  -0.119  0.789  0.119   0.062 

Mereka menemukan bahwa pada tingkat kemiringan dan kurt tertinggi (1,75 dan 3,75) bahwa ukuran sampel 300 tidak menghasilkan sampel berarti mengikuti distribusi normal.

Sayangnya, saya tidak berpikir bahwa ini adalah persis apa yang Anda cari, tetapi saya menemukan itu dan menemukan itu menarik, dan saya pikir Anda mungkin juga.

Eric Peterson
sumber
4
" Anehnya, 65 persen dari data yang didistribusikan secara normal ditolak dengan ukuran sampel 20, dan bahkan dengan ukuran sampel 30, 35% masih ditolak. " - maka sepertinya mereka menggunakan tes yang salah; sebagai uji normalitas pada data normal yang benar-benar ditentukan (untuk apa tes ini), jika mereka menggunakannya dengan benar, itu harus tepat .
Glen_b -Reinstate Monica
5
@Glen_b: Ada beberapa sumber kesalahan potensial di sini. Jika Anda membaca dokumen, Anda akan mencatat bahwa apa yang terdaftar sebagai "normal" di sini sebenarnya adalah varian acak normal dengan rata-rata 50 dan standar deviasi 10 dibulatkan ke bilangan bulat terdekat . Jadi, dalam hal itu, tes yang digunakan sudah menggunakan distribusi yang tidak ditentukan. Kedua, masih tampak mereka melakukan tes dengan salah, karena upaya replikasi saya menunjukkan bahwa untuk sampel rata-rata menggunakan 20 pengamatan seperti itu, probabilitas penolakan adalah sekitar 27%. (lanjutan)
kardinal
5
(lanjutan) Ketiga, terlepas dari hal di atas, beberapa perangkat lunak dapat menggunakan distribusi asimptotik dan bukan yang sebenarnya, meskipun pada ukuran sampel 10K ini tidak terlalu menjadi masalah (jika ikatan tidak secara buatan diinduksi pada data). Akhirnya, kami menemukan pernyataan yang agak aneh berikut di dekat bagian akhir dokumen itu: Sayangnya, sifat-sifat uji-KS di S-PLUS membatasi pekerjaan. Nilai-p untuk penelitian ini semuanya dikompilasi dengan tangan atas beberapa ulangan. Suatu program diperlukan untuk menghitung nilai-p dan membuat penilaian terhadap mereka dibandingkan dengan tingkat alpha yang dipilih.
kardinal
3
Hai @Glen_b. Saya tidak percaya pembulatan akan mengurangi tingkat penolakan di sini karena saya percaya mereka sedang menguji terhadap distribusi normal standar yang benar menggunakan data yang dibulatkan (yang saya maksudkan dengan mengatakan tes menggunakan distribusi yang salah ditentukan). (Mungkin Anda, sebaliknya, berpikir untuk menggunakan uji KS pada distribusi diskrit.) Ukuran sampel untuk uji KS adalah 10.000, bukan 20; mereka melakukan 20 replikasi dengan ukuran sampel masing-masing 10.000 untuk mendapatkan tabel. Setidaknya, itulah pemahaman saya tentang deskripsi dari membaca sekilas dokumen.
kardinal
3
@ cardinal - Anda benar, tentu saja, jadi mungkin itu bisa menjadi sumber sebagian besar penolakan pada ukuran sampel yang besar. Re: " Ukuran sampel untuk tes KS adalah 10.000, bukan 20 " ... oke, ini terdengar semakin aneh. Kita dibiarkan bertanya-tanya mengapa mereka berpikir salah satu dari kondisi-kondisi itu bernilai tinggi, daripada mengatakan sebaliknya.
Glen_b -Reinstate Monica