Saya menghadapi kesulitan memahami makna "sampel acak" dan "variabel acak acak". Saya mencoba mencari tahu artinya dari beberapa sumber, tetapi semakin bingung. Saya memposting di sini apa yang saya coba dan ketahui:
Probabilitas & Statistik Degroot mengatakan:
Sampel Acak / iid / Ukuran Sampel: Pertimbangkan distribusi probabilitas yang diberikan pada garis nyata yang dapat diwakili oleh pf atau pdf . Dikatakan bahwa variabel acak membentuk sampel acak dari distribusi ini jika variabel acak ini independen dan marginal pf atau pdf masing-masing adalah . Variabel acak tersebut juga dikatakan independen dan terdistribusi secara identik, disingkat iid. Kami menyebut jumlah n variabel acak sebagai ukuran sampel.n X 1 , . . . , X n f
Tetapi salah satu buku statistik lain yang saya katakan:
Dalam Pengambilan Sampel Acak, kami menjamin bahwa setiap unit individu dalam populasi mendapatkan peluang (probabilitas) yang sama untuk dipilih.
Jadi, saya merasa bahwa iids adalah elemen yang membangun sampel acak, dan prosedur untuk memiliki sampel acak adalah pengambilan sampel acak. Apakah saya benar?
PS: Saya sangat bingung dengan topik ini, jadi saya akan menghargai jawaban yang terperinci. Terima kasih.
sumber
Jawaban:
Anda tidak mengatakan apa buku statistik lain itu, tetapi saya kira itu adalah buku (atau bagian) tentang pengambilan sampel populasi terbatas .
Ketika Anda sampel variabel acak, yaitu ketika Anda mempertimbangkan himpunan dari n variabel acak, Anda tahu bahwa jika mereka independen, f ( x 1 , ... , x n ) =X1, ... , Xn n , dan terdistribusi secara identikf( x1, ... , xn) = f( x1) ⋯ f( xn) , khususnya dan Var ( X i )E( Xsaya) = μ untuk semua i , maka:
¯ X = ∑ i X iVar ( Xsaya) = σ2 saya
dimanaσ2adalah momen sentral kedua.
Pengambilan sampel populasi yang terbatas agak berbeda. Jika populasi berukuran , dalam pengambilan sampel tanpa penggantian ada ( NN sampel yang mungkinsidari ukuranndan mereka dapat diperlengkapi:
p(si)=1( Nn) ssaya n
Misalnya, jikaN=5dann=3, ruang sampel adalah{s1,…,s10}
dan sampel yang memungkinkan adalah:
s 1 ={1,2,3}, s 2 ={1,2,4}, s 3 ={1,2,5}, s 4
Ini adalah contoh cepat tentang bagaimana sampel acak (variabel acak) dan sampel acak (populasi terbatas) dapat berbeda. Kesimpulan statistik terutama tentang pengambilan sampel variabel acak, teori pengambilan sampel adalah tentang pengambilan sampel populasi terbatas.
sumber
Saya tidak akan membuat Anda bosan dengan definisi dan formula probabilistik, yang dapat Anda ambil dengan mudah di buku teks mana pun (atau di sini adalah tempat yang baik untuk memulai)
noni . i . d. contoh: Sekarang lakukan hal yang sama, tetapi tanpa mengembalikan kartu ke tumpukan (saya harap Anda mengisi perbedaannya sekarang). Sekali lagi Anda akan memiliki 5 nilai realisasi (kartu) setelah Anda melakukan ini. Tapi jelas mereka tergantung (fakta bahwa Anda menggambar kartu as pada imbang pertama, berarti Anda tidak akan memiliki kesempatan untuk masuk pada imbang 2).
sumber
Variabel Acak biasanya ditulis X, adalah variabel yang nilainya mungkin adalah hasil numerik dari fenomena acak. Fenomena acak dapat menghasilkan hasil yang memiliki nilai numerik yang ditangkap oleh variabel acak - jumlah kepala dalam 10 kali lemparan koin atau pendapatan / ketinggian dll dalam sampel - tetapi itu tidak perlu.
Secara umum, Variabel Acak adalah fungsi yang memetakan hasil acak ke nilai numerik. Misalnya setiap hari mungkin cerah, berawan atau hujan. Kita dapat mendefinisikan Variabel Acak yang mengambil nilai 1 jika hujan, 2 jika mendung dan 3 jika cerah. Domain dari variabel acak adalah himpunan hasil yang mungkin.
Untuk menetapkan Variabel Acak harus ada proses atau eksperimen yang dikaitkan dengan kemungkinan hasil yang tidak dapat diprediksi dengan pasti.
Datang sekarang ke masalah kemerdekaan. Dua Variabel Acak bersifat independen jika nilai salah satunya tidak memengaruhi PDF yang lain. Kami tidak merevisi prediksi kami mengenai probabilitas nilai-nilai yang berbeda dari satu variabel ketika kami mengetahui sesuatu tentang variabel lainnya. Oleh karena itu dalam kasus kemerdekaan, Posterior PDF identik dengan PDF Sebelumnya. Misalnya ketika kita melempar koin yang tidak bias berulang kali, informasi yang kita miliki tentang hasil dari 5 lemparan sebelum tidak mempengaruhi prediksi kita tentang lemparan saat ini, itu akan selalu 0,5. Namun, jika bias dari koin tidak diketahui dan dimodelkan sebagai Variabel Acak, maka hasil dari 5 lemparan sebelumnya mempengaruhi prediksi kita mengenai lemparan saat ini karena memungkinkan kita untuk membuat kesimpulan mengenai bias yang tidak diketahui dari koin.
Datang sekarang ke masalah Sampling. Tujuan Sampling adalah untuk memberi tahu kami tentang sifat-sifat distribusi yang mendasarinya yang tidak diketahui dan harus disimpulkan. Ingat bahwa Distribusi mengacu pada kemungkinan relatif dari kemungkinan hasil dalam Ruang Sampel (yang mungkin juga merupakan Semesta Bersyarat). Jadi ketika kami Sampel, kami memilih sejumlah hasil terbatas dari ruang Sampel dan kami mereproduksi Ruang Sampel dalam skala yang lebih kecil dan lebih mudah dikelola. Probabilitas yang sama kemudian merujuk pada proses Pengambilan Sampel, bukan probabilitas Hasil pada Sampel. Sampling probabilitas yang sama menyiratkan bahwa Sampel akan mencerminkan proporsi hasil di Ruang Sampel asli. Misal jika kita bertanya 10, 000 orang jika mereka pernah ditangkap, besar kemungkinan sampel kita akan berakhir tidak akan mewakili Populasi - Ruang Sampel - karena orang yang ditangkap mungkin menolak untuk menjawab, oleh karena itu proporsi kemungkinan hasil (ditangkap - tidak ditangkap) akan berbeda antara sampel kami dan populasi karena alasan sistematis. Atau jika kami memilih lingkungan tertentu untuk melakukan survei, hasilnya tidak akan mewakili Kota secara keseluruhan. Jadi sampling probabilitas yang sama menyiratkan bahwa tidak ada alasan sistematis - selain dari keacakan murni - yang membuat kami percaya bahwa proporsi hasil yang mungkin dalam sampel kami berbeda dari proporsi hasil di Populasi / Ruang Sampel. oleh karena itu proporsi kemungkinan hasil (ditangkap - tidak ditangkap) akan berbeda antara sampel kami dan populasi untuk alasan sistematis. Atau jika kami memilih lingkungan tertentu untuk melakukan survei, hasilnya tidak akan mewakili Kota secara keseluruhan. Jadi sampling probabilitas yang sama menyiratkan bahwa tidak ada alasan sistematis - selain dari keacakan murni - yang membuat kami percaya bahwa proporsi hasil yang mungkin dalam sampel kami berbeda dari proporsi hasil di Populasi / Ruang Sampel. oleh karena itu proporsi kemungkinan hasil (ditangkap - tidak ditangkap) akan berbeda antara sampel kami dan populasi untuk alasan sistematis. Atau jika kami memilih lingkungan tertentu untuk melakukan survei, hasilnya tidak akan mewakili Kota secara keseluruhan. Jadi sampling probabilitas yang sama menyiratkan bahwa tidak ada alasan sistematis - selain dari keacakan murni - yang membuat kami percaya bahwa proporsi hasil yang mungkin dalam sampel kami berbeda dari proporsi hasil di Populasi / Ruang Sampel.
sumber
Sampel acak adalah realisasi dari urutan variabel acak. Variabel acak tersebut mungkin iid atau tidak.
sumber