Katakanlah Anda memiliki sampel acak besar pemain sepak bola di Eropa tetapi Anda hanya tertarik pada apa yang terjadi di Spanyol. Bisakah Anda mengurangi sampel Anda menjadi pemain di Spanyol dan masih menyebutnya sampel acak (tetapi dari populasi yang berbeda)? Jika tidak, bagaimana Anda menyebut subsampel itu dan tindakan pencegahan spesifik apa yang harus Anda ambil untuk dapat membuat kesimpulan tentang populasi pemain sepak bola Spanyol?
Perasaan saya adalah bahwa menggunakan subsampel itu akan baik-baik saja asalkan cukup besar, tapi mungkin saya kehilangan sesuatu.
sampling
sample
resampling
Antoine Vernet
sumber
sumber
Jawaban:
Secara umum, apa yang sebenarnya Anda inginkan dari sampel, adalah menjadi "representatif". Pengambilan sampel acak adalah cara yang baik untuk dilakukan karena memungkinkan semua subjek dengan probabilitas yang sama untuk dijadikan sampel; Dengan harapan bahwa semua atribut dan hubungan-atribut yang ada dalam populasi akan ada dalam sampel. Menjadikannya "representatif". Dalam kasus Anda, jika Anda yakin semua pemain Spanyol memiliki peluang sama a-priori untuk ditarik dalam sampel (sub), maka itu "acak".
Mengenai pertimbangan ukuran: Pengamatan tunggal masih bisa menjadi "sampel acak". Sampel yang lebih besar diperlukan ketika Anda menginginkan lebih presisi, dan terutama ketika Anda mencari hubungan langka dalam populasi, yang mungkin tidak hadir dalam sampel kecil.
sumber
Dengan asumsi tidak ada bias dalam teknik pengambilan sampel, ini harus baik-baik saja. Beberapa pertanyaan yang mungkin diajukan adalah:
-> Apakah survei dilakukan dalam bahasa Spanyol jika diminta? (Bias bahasa) -> Apakah survei dilakukan melalui telepon atau secara langsung? Jika melalui telepon, dan telepon seluler dikecualikan, apakah para pemain Spanyol lebih atau kurang mungkin memiliki telepon seluler daripada para pemain di seluruh Eropa, dan untuk alasan apa? -> Apakah tingkat di mana pemain Spanyol menolak untuk menjawab pertanyaan survei berbeda dari tingkat untuk pemain secara keseluruhan? -> Secara keseluruhan, berapa proporsi pemain Spanyol yang disampel?
Tanpa mengetahui komposisi data yang tepat, sulit untuk mengatakan lebih banyak. Apakah ada masalah khusus yang Anda khawatirkan?
sumber