Apakah masuk akal untuk menghitung interval kepercayaan dan untuk menguji hipotesis ketika data dari seluruh populasi tersedia? Menurut pendapat saya, jawabannya adalah tidak, karena kita dapat secara akurat menghitung nilai sebenarnya dari parameter. Tetapi kemudian, berapa proporsi maksimal data dari populasi asli yang memungkinkan kita untuk menggunakan teknik yang disebutkan di atas?
hypothesis-testing
confidence-interval
sample-size
large-data
population
Miroslav Sabo
sumber
sumber
Jawaban:
Pertanyaan pertama adalah yang tidak memiliki jawaban yang disepakati secara umum. Pandangan saya sendiri seperti pandangan Anda, tetapi yang lain berpendapat bahwa suatu populasi dapat dilihat sebagai sampel dari "populasi super" di mana sifat pasti populasi super bervariasi tergantung pada konteks: Misalnya sensus semua orang yang tinggal di sebuah bangunan dapat dilihat sebagai sampel dari semua orang yang tinggal di bangunan serupa; sebuah sensus penduduk Amerika Serikat (bukan berarti orang bisa benar-benar lengkap) dapat dipandang sebagai sampel dari populasi super orang Amerika yang mungkin suatu hari ada (atau sesuatu seperti itu). Saya pikir ini sering menjadi alasan untuk menggunakan nilai-p; banyak ilmuwan di bidang substantif tidak nyaman jika mereka tidak memiliki nilai p. (Tapi itu pandangan saya ).
Pertanyaan kedua tampaknya agak aneh untuk dijawab secara umum. Kapan Anda mendapatkan sampel yang (katakanlah) bahkan lebih dari setengah populasi?
Masalah yang lebih besar akan menjadi bias. Kembali ke Sensus AS, masalahnya bukan hanya merindukan orang, tetapi bahwa orang yang dilewatinya bukan sampel acak dari total populasi; jadi, bahkan jika sensus mendapat jawaban dari (untuk memilih nomor) 95% dari semua orang, jika 5% yang tersisa sangat berbeda, maka hasilnya akan menjadi bias.
sumber
Misalkan hanya 2 dari 12 anggota komite adalah wanita.
Atau dapat diambil sebagai perkiraan probabilitas seorang wanita dipilih untuk menjadi panitia — properti dari proses seleksi. Anda dapat menempatkan interval kepercayaan di sekitarnya, menguji apakah itu berbeda secara signifikan dari satu-setengah (atau hipotesis nol lain yang relevan), & seterusnya. Mungkin prosesnya perlu diubah untuk membuatnya adil.
Dua pandangan, deskriptif & inferensial, tidak bertentangan, tetapi cukup berbeda.
Jawaban untuk pertanyaan kedua adalah masuk akal untuk menghitung interval kepercayaan untuk & menguji hipotesis tentang parameter populasi bahkan jika hanya satu orang saja yang tidak dicampuri. Perhatikan saja bahwa CI & tes harus memperhitungkan proporsi yang cukup besar dari populasi yang dijadikan sampel: lihat koreksi populasi terbatas .
sumber