Referensi apa yang harus dikutip untuk mendukung penggunaan 30 sebagai ukuran sampel yang cukup besar?

41

Saya telah membaca / mendengar berkali-kali bahwa ukuran sampel setidaknya 30 unit dianggap sebagai "sampel besar" (asumsi normalitas sarana biasanya kira-kira berlaku karena CLT, ...). Karena itu, dalam percobaan saya, saya biasanya menghasilkan sampel sebanyak 30 unit. Bisakah Anda memberi saya beberapa referensi yang harus dikutip ketika menggunakan ukuran sampel 30?

Lan
sumber
2
Tanpa merujuk pada jumlah parameter yang Anda coba perkirakan, atau yang setara dengan jenis model yang Anda kerjakan, tampaknya agak sulit untuk memberi Anda jawaban yang jelas.
chl
2
Penerimaan n = 30 sebagai batas sampel kecil dan besar tidak didukung dengan baik oleh teknik statistik apa pun.
Jibol

Jawaban:

37

Pilihan n = 30 untuk batas antara sampel kecil dan besar adalah aturan praktis, hanya. Ada sejumlah besar buku yang mengutip (sekitar) nilai ini, misalnya, Probabilitas dan Inferensi Statistik Hogg dan Tanis (7e) mengatakan "lebih besar dari 25 atau 30".

Yang mengatakan, cerita yang diceritakan kepada saya adalah bahwa satu-satunya alasan 30 dianggap sebagai batas yang baik adalah karena itu membuat tabel t Student cantik di belakang buku teks agar pas di satu halaman. Itu, dan nilai kritis (antara t Student dan Normal) hanya mati kira-kira hingga 0,25, dari df = 30 ke df = infinity. Untuk perhitungan tangan, perbedaannya tidak terlalu penting.

Saat ini mudah untuk menghitung nilai kritis untuk semua jenis hal ke 15 tempat desimal. Selain itu kami memiliki metode resampling dan permutasi yang kami bahkan tidak terbatas pada distribusi populasi parametrik.

Dalam praktiknya saya tidak pernah bergantung pada n = 30. Plot datanya. Menempatkan distribusi normal, jika Anda suka. Nilai visual apakah perkiraan normal sesuai (dan tanyakan apakah perkiraan benar-benar diperlukan). Jika menghasilkan sampel untuk penelitian dan perkiraan adalah wajib, hasilkan ukuran sampel yang cukup untuk membuat perkiraan sedekat yang diinginkan (atau sedekat mungkin secara komputasi).


sumber
13
Berikut adalah halaman tentang seberapa baik perkiraan normal distribusi t untuk n = 30. johndcook.com/normal_approx_to_t.html
John D. Cook
41

Sebenarnya, "angka ajaib" 30 adalah kekeliruan. Lihat makalah Jacob's Cohen yang menyenangkan, Things I Have Learned (So Far) (Am. Psych. December 1990 45 # 12, hlm 1304-1312) . Mitos ini adalah contoh pertamanya tentang bagaimana "beberapa hal yang Anda pelajari tidak begitu".

[O] ne dari kandidat doktoral saya melakukan disertasi [dengan] sampel hanya 20 kasus per kelompok. ... [L] ater saya menemukan ... bahwa untuk perbandingan dua kelompok-independen-rata-rata dengan per kelompok pada tingkat dua ekor yang dikuduskan , probabilitas bahwa efek berukuran sedang akan diberi label sama pentingnya dengan ... uji t hanya . Dengan demikian, kira-kira flip koin apakah seseorang akan mendapatkan hasil yang signifikan, meskipun, pada kenyataannya, ukuran efeknya bermakna. ... [Teman saya] berakhir dengan hasil yang tidak signifikan - yang dengannya ia melanjutkan untuk menghancurkan cabang penting dari teori psikoanalisis.n=30.05.47

Carlos Accioly
sumber
2
Referensi yang indah - dan temukan yang relevan. Terima kasih.
whuber
1
@whuber Kamu ingat kertas yang mana itu? Tautan rusak sekarang. Mungkin ini psych.colorado.edu/~willcutt/pdfs/Cohen_1990.pdf , "Hal-hal yang Telah Saya Pelajari (Sejauh Ini)"? Tahun cocok dengan yang ada di URL tautan yang rusak.
Amoeba berkata Reinstate Monica
1
@Amoeba Saya menyimpan makalah ini ketika saya membacanya, jadi saya dapat mengkonfirmasi apa yang Anda temukan adalah yang dimaksud. Saya telah memperbarui jawaban ini untuk menyertakan kutipan bersama dengan tautan Anda.
whuber
@Carlos Accioly Saya sudah memperbaruinya dengan tautan baru karena yang sebelumnya rusak.
Akshay Bansal
9

IMO, semuanya tergantung pada apa Anda ingin menggunakan sampel Anda. Dua contoh "konyol" untuk mengilustrasikan apa yang saya maksud: Jika Anda perlu memperkirakan rata-rata, 30 pengamatan lebih dari cukup. Jika Anda perlu memperkirakan regresi linier dengan 100 prediktor, 30 pengamatan tidak akan cukup dekat.

bhm
sumber
9

Kebanyakan aturan praktis sewenang-wenang. Pernyataan ini tergantung pada sejumlah faktor untuk menjadi kenyataan. Misalnya pada distribusi data. Jika data berasal dari Cauchy misalnya, bahkan 30 ^ 30 pengamatan tidak cukup untuk memperkirakan rata-rata (dalam kasus itu bahkan jumlah pengamatan yang tidak terbatas tidak akan cukup untuk menyebabkan untuk menyatu). Angka ini (30) juga salah jika nilai yang Anda gambar tidak independen satu sama lain (sekali lagi, Anda mungkin memiliki bahwa tidak ada konvergensi sama sekali, terlepas dari ukuran sampel).μ¯(n)

Secara umum, CLT pada dasarnya membutuhkan dua pilar untuk dipegang:

  1. Bahwa variabel acak independen: Anda dapat memesan ulang pengamatan Anda tanpa kehilangan informasi apa pun *.
  2. Bahwa rv berasal dari distribusi dengan momen kedua terbatas: yang berarti bahwa penduga klasik mean dan sd cenderung bertemu ketika ukuran sampel meningkat.

(Kedua kondisi ini bisa agak melemah, tetapi perbedaannya sebagian besar bersifat teoritis)

pengguna603
sumber
6
Contoh Anda menggambarkan nilai statistik yang kuat. The median sampel memperkirakan parameter lokasi distribusi Cauchy baik. Orang bisa berargumen bahwa hubungan terlemah dalam menggunakan uji-t dengan 30 sampel adalah uji-t, bukan 30 sampel.
John D. Cook
1
John:> "Orang bisa berargumen bahwa tautan terlemah dalam menggunakan uji-t dengan 30 sampel adalah uji-t, bukan 30 sampel". Sangat benar, dan juga anggapan bahwa data tersebut iid . Juga, mediannya adalah MLE untuk variabel acak terdistribusi Cauchy (dan karenanya efisien), tetapi secara umum Anda bisa membutuhkan lebih dari 30 pengamatan.
user603
1
Tidak semua versi CLT mengandalkan distribusi yang identik, atau bahkan kemerdekaan. Yang dasar diajarkan untuk undergrads sering dilakukan, tetapi ada versi yang tidak membuat kedua asumsi misalnya CLT Lyapunov mengasumsikan independensi tetapi tidak distribusi yang identik, dan kondisi independensi juga dapat santai, misalnya lihat di sini . Hal 'menata ulang' itu juga tidak sama dengan kemerdekaan. Beberapa bentuk ketergantungan tidak bergantung pada pesanan.
Glen_b
2
Ukuran sampel 50.000 tidak cukup untuk CLT bekerja cukup baik untuk menghitung interval kepercayaan untuk rata-rata distribusi log-normal.
Frank Harrell