Apakah masuk akal untuk menghitung interval kepercayaan dan untuk menguji hipotesis ketika data dari seluruh populasi tersedia?

Apakah masuk akal untuk menghitung interval kepercayaan dan untuk menguji hipotesis ketika data dari seluruh populasi tersedia? Menurut pendapat saya, jawabannya adalah tidak, karena kita dapat secara akurat menghitung nilai sebenarnya dari parameter. Tetapi kemudian, berapa proporsi maksimal data dari populasi asli yang memungkinkan kita untuk menggunakan teknik yang disebutkan di atas?

hypothesis-testing confidence-interval sample-size large-data population Miroslav Sabo
sumber

Jika Anda menggunakan metode sampel hingga yang benar, variansnya menjadi nol tepat saat sampel Anda menyentuh ukuran populasi. Artinya, tidak ada ukuran maksimal; rumus yang tepat bekerja sebagaimana mestinya, sampai ke

n = N

$n=N$

Glen_b -Reinstate Monica

Saya pikir Anda harus menyatakannya lebih jelas jika pertanyaannya tentang kasus "sampel = populasi" atau "sampel dari populasi terbatas".

ttnphns

Bagian pertama dari pertanyaan adalah tentang sampel = populasi dan kedua tentang sampel dari populasi (ketika ukuran sampel <ukuran populasi).

Miroslav Sabo

Pertanyaan yang terkait erat: Uji signifikansi dengan data yang mewakili seluruh populasi? dan Sumberdaya untuk kapan data populasi tersedia

Silverfish,

Jawaban:

Pertanyaan pertama adalah yang tidak memiliki jawaban yang disepakati secara umum. Pandangan saya sendiri seperti pandangan Anda, tetapi yang lain berpendapat bahwa suatu populasi dapat dilihat sebagai sampel dari "populasi super" di mana sifat pasti populasi super bervariasi tergantung pada konteks: Misalnya sensus semua orang yang tinggal di sebuah bangunan dapat dilihat sebagai sampel dari semua orang yang tinggal di bangunan serupa; sebuah sensus penduduk Amerika Serikat (bukan berarti orang bisa benar-benar lengkap) dapat dipandang sebagai sampel dari populasi super orang Amerika yang mungkin suatu hari ada (atau sesuatu seperti itu). Saya pikir ini sering menjadi alasan untuk menggunakan nilai-p; banyak ilmuwan di bidang substantif tidak nyaman jika mereka tidak memiliki nilai p. (Tapi itu pandangan saya ).

Pertanyaan kedua tampaknya agak aneh untuk dijawab secara umum. Kapan Anda mendapatkan sampel yang (katakanlah) bahkan lebih dari setengah populasi?

Masalah yang lebih besar akan menjadi bias. Kembali ke Sensus AS, masalahnya bukan hanya merindukan orang, tetapi bahwa orang yang dilewatinya bukan sampel acak dari total populasi; jadi, bahkan jika sensus mendapat jawaban dari (untuk memilih nomor) 95% dari semua orang, jika 5% yang tersisa sangat berbeda, maka hasilnya akan menjadi bias.

Peter Flom - Pasang kembali Monica
sumber

Saya pikir apakah Anda menghitung interval kepercayaan untuk statistik populasi tergantung pada apakah Anda ingin membuat kesimpulan pada populasi aktual atau untuk "populasi super" hipotetis. Dalam pekerjaan sebelumnya dengan departemen kesehatan negara kami melaporkan statistik tahunan seperti persentase berat badan lahir sangat rendah dan tingkat bunuh diri yang melambung dari tahun ke tahun. Ya, kami melaporkan seluruh populasi, namun akan konyol untuk menghambat kemajuan kesehatan Negara (dan pendanaan!) Pada setiap kenaikan atau penurunan indikator kesehatan ini dan lainnya sebagai perubahan menyeluruh dalam kesehatan populasi.

RobertF

Misalkan hanya 2 dari 12 anggota komite adalah wanita.

$\frac{1}{6}$

Atau dapat diambil sebagai perkiraan probabilitas seorang wanita dipilih untuk menjadi panitia — properti dari proses seleksi. Anda dapat menempatkan interval kepercayaan di sekitarnya, menguji apakah itu berbeda secara signifikan dari satu-setengah (atau hipotesis nol lain yang relevan), & seterusnya. Mungkin prosesnya perlu diubah untuk membuatnya adil.

Dua pandangan, deskriptif & inferensial, tidak bertentangan, tetapi cukup berbeda.

Jawaban untuk pertanyaan kedua adalah masuk akal untuk menghitung interval kepercayaan untuk & menguji hipotesis tentang parameter populasi bahkan jika hanya satu orang saja yang tidak dicampuri. Perhatikan saja bahwa CI & tes harus memperhitungkan proporsi yang cukup besar dari populasi yang dijadikan sampel: lihat koreksi populasi terbatas .

Scortchi - Reinstate Monica
sumber