Apakah sinonim "sampel acak" dan "variabel acak acak"?

18

Saya menghadapi kesulitan memahami makna "sampel acak" dan "variabel acak acak". Saya mencoba mencari tahu artinya dari beberapa sumber, tetapi semakin bingung. Saya memposting di sini apa yang saya coba dan ketahui:

Probabilitas & Statistik Degroot mengatakan:

Sampel Acak / iid / Ukuran Sampel: Pertimbangkan distribusi probabilitas yang diberikan pada garis nyata yang dapat diwakili oleh pf atau pdf . Dikatakan bahwa variabel acak membentuk sampel acak dari distribusi ini jika variabel acak ini independen dan marginal pf atau pdf masing-masing adalah . Variabel acak tersebut juga dikatakan independen dan terdistribusi secara identik, disingkat iid. Kami menyebut jumlah n variabel acak sebagai ukuran sampel.n X 1 , . . . , X n ffnX1,...,Xnf

Tetapi salah satu buku statistik lain yang saya katakan:

Dalam Pengambilan Sampel Acak, kami menjamin bahwa setiap unit individu dalam populasi mendapatkan peluang (probabilitas) yang sama untuk dipilih.

Jadi, saya merasa bahwa iids adalah elemen yang membangun sampel acak, dan prosedur untuk memiliki sampel acak adalah pengambilan sampel acak. Apakah saya benar?

PS: Saya sangat bingung dengan topik ini, jadi saya akan menghargai jawaban yang terperinci. Terima kasih.

Diam
sumber
6
Bagian independensi sangat penting karena kita dapat memiliki sampel di mana semua variabel terdistribusi secara identik (memiliki distribusi marjinal yang sama) tetapi tidak independen. Sampel semacam itu masih dapat dianggap sebagai sampel acak, tetapi bukan dari eksperimen yang Anda anggap sebagai sampel acak. Lihat pertanyaan ini .
Dilip Sarwate
Pertanyaan itu tampaknya tidak masuk akal secara statistik. Sampel iid dan acak adalah konsep yang jelas berbeda yang dibuat oleh para terpelajar.
Subhash C. Davar
2
@ subhashc.davar Apakah mereka? Menurut satu definisi: "Sampel acak adalah urutan variabel acak independen, terdistribusi secara identik (IID)". Jadi sepertinya sampel iid dan acak adalah hal yang sama? Paragraf yang dikutip dalam Probabilitas & Statistik Degroot pada dasarnya mengatakan hal yang sama. Saya merasa itu membingungkan karena "sampel" kadang-kadang individu atau sekelompok individu, dan kadang-kadang urutan variabel acak.
Gary Chang
@Gary Chang Definisi yang Anda kutip tentang pdf. Sampel variabel acak telah populer dalam disiplin psikometri. Secara umum, ini digunakan dengan mengacu pada estimasi reliabilitas atau validitas dan untuk analisis faktor. Psikometri tertarik untuk menetapkan kesetaraan tes untuk suatu domain. Konsep iid tampaknya berasal dari aljabar linier. Sampel dapat berasal dari populasi individu tertentu dan / atau dari populasi variabel (acak) tergantung pada tujuan penelitian. Statistik hari ini tampaknya telah meminjam dari teori pengukuran.
Subhash C. Davar

Jawaban:

9

Anda tidak mengatakan apa buku statistik lain itu, tetapi saya kira itu adalah buku (atau bagian) tentang pengambilan sampel populasi terbatas .

Ketika Anda sampel variabel acak, yaitu ketika Anda mempertimbangkan himpunan dari n variabel acak, Anda tahu bahwa jika mereka independen, f ( x 1 , ... , x n ) =X1,...,Xnn , dan terdistribusi secara identikf(x1,...,xn)=f(x1)f(xn), khususnya dan Var ( X i )E(Xsaya)=μ untuk semua i , maka: ¯ X = i X iVar(Xsaya)=σ2saya dimanaσ2adalah momen sentral kedua.

X¯=sayaXsayan,E(X¯)=μ,Var(X¯)=σ2n
σ2

Pengambilan sampel populasi yang terbatas agak berbeda. Jika populasi berukuran , dalam pengambilan sampel tanpa penggantian ada ( NN sampel yang mungkinsidari ukuranndan mereka dapat diperlengkapi: p(si)=1(Nn)ssayan Misalnya, jikaN=5dann=3, ruang sampel adalah{s1,,s10} dan sampel yang memungkinkan adalah: s 1 ={1,2,3}, s 2 ={1,2,4}, s 3 ={1,2,5}, s 4

hal(ssaya)=1(Nn)saya=1,...,(Nn)
N=5n=3{s1,...,s10} Jika Anda menghitung jumlah kemunculan masing-masing individu, Anda dapat melihat bahwa mereka adalah enam, yaitu setiap individu memiliki chanche yang sama untuk dipilih (6/10). Jadi setiapsiadalah sampel acak sesuai dengan definisi kedua. Secara kasar, ini bukan sampel acak iid karena individu bukan variabel acak: Anda dapat secara konsisten memperkirakanE[X]dengan rata-rata sampel tetapi tidak akan pernah tahu nilai pastinya, tetapi Andadapatmengetahui rata-rata populasi yang tepat jikan=N(biarkan saya ulangi: kira-kira.)
s1={1,2,3},s2={1,2,4},s3={1,2,5},s4={1,3,4},s5={1,3,5},s6={1,4,5},s7={2,3,4},s8={2,3,5},s9={2,4,5},s10={3,4,5}
ssayaE[X]n=N1

μn<Nμ

y¯s=saya=1nysaya,E(y¯s)=μ
Var(y¯s)=σ~2n(1-nN)
σ~2saya=1N(ysaya-y¯)2N-1(1-n/N)

Ini adalah contoh cepat tentang bagaimana sampel acak (variabel acak) dan sampel acak (populasi terbatas) dapat berbeda. Kesimpulan statistik terutama tentang pengambilan sampel variabel acak, teori pengambilan sampel adalah tentang pengambilan sampel populasi terbatas.


1dan intepret satu set bola lampu sebagai sampel (variabel acak). Katakan sekarang bahwa Anda menemukan sekotak 1000 bola lampu dan ingin mengetahui umur rata-rata mereka. Anda dapat memilih satu set kecil bola lampu (sampel populasi terbatas), tetapi Anda bisa memilih semuanya. Jika Anda memilih sampel kecil, ini tidak mengubah bola lampu menjadi variabel acak: variabel acak dihasilkan oleh Anda, karena pilihan antara "semua" dan "set kecil" terserah Anda. Namun, ketika populasi terbatas sangat besar (katakanlah populasi negara Anda), ketika memilih "semua" tidak layak, situasi kedua lebih baik ditangani sebagai yang pertama.

Sergio
sumber
1
Apa maksud Anda "individu bukan variabel acak?" Whuber memiliki beberapa jawaban yang sangat bagus di sini dan di sini yang menggunakan sampling populasi terbatas untuk menjelaskan konsep variabel acak.
jsk
n=N
n=N
Defensif? Anda tidak mengerti tautan itu. Seperti yang dikatakan whubner, a) model tiket-dalam-kotak-hanyalah contoh mainan untuk menghindari "ini adalah hal tingkat pascasarjana" mengeluh; b) ia menghindari memanggil "populasi" tiket dalam sebuah kotak, dan menjelaskan alasannya. Jadi tidak ada kontradiksi . Jika seseorang dapat memahami apa yang dikatakan whubner. BTW, saya bukan variabel acak, kan?
Sergio
IMHO, tentu saja.
Sergio
2

Saya tidak akan membuat Anda bosan dengan definisi dan formula probabilistik, yang dapat Anda ambil dengan mudah di buku teks mana pun (atau di sini adalah tempat yang baik untuk memulai)

saya.saya.d.sampel adalah kasus khusus dari sampel acak, sehingga setiap nilai berasal dari distribusi yang sama dengan yang lain dan nilainya tidak memiliki pengaruh terhadap nilai-nilai lainnya. Kesepakatan kemandirian denganhHaiw nilai-nilai itu dihasilkan

saya.saya.dcontoh: gambar kartu acak dari tumpukan dan kembalikan (lakukan ini 5 kali). Anda akan mendapatkan 5 nilai realisasi (kartu). Masing-masing dari nilai-nilai ini berasal dari distribusi yang seragam (ada probabilitas yang sama untuk mendapatkan masing-masing hasil) dan setiap undian tidak bergantung pada yang lain (yaitu kenyataan bahwa Anda mendapatkan kartu as sekop pada undian pertama, tidak mempengaruhi dengan cara apa pun hasil yang Anda dapatkan di undian lain).

non saya.saya.d.contoh: Sekarang lakukan hal yang sama, tetapi tanpa mengembalikan kartu ke tumpukan (saya harap Anda mengisi perbedaannya sekarang). Sekali lagi Anda akan memiliki 5 nilai realisasi (kartu) setelah Anda melakukan ini. Tapi jelas mereka tergantung (fakta bahwa Anda menggambar kartu as pada imbang pertama, berarti Anda tidak akan memiliki kesempatan untuk masuk pada imbang 2).

Alex Kreimer
sumber
1

Variabel Acak biasanya ditulis X, adalah variabel yang nilainya mungkin adalah hasil numerik dari fenomena acak. Fenomena acak dapat menghasilkan hasil yang memiliki nilai numerik yang ditangkap oleh variabel acak - jumlah kepala dalam 10 kali lemparan koin atau pendapatan / ketinggian dll dalam sampel - tetapi itu tidak perlu.
Secara umum, Variabel Acak adalah fungsi yang memetakan hasil acak ke nilai numerik. Misalnya setiap hari mungkin cerah, berawan atau hujan. Kita dapat mendefinisikan Variabel Acak yang mengambil nilai 1 jika hujan, 2 jika mendung dan 3 jika cerah. Domain dari variabel acak adalah himpunan hasil yang mungkin.
Untuk menetapkan Variabel Acak harus ada proses atau eksperimen yang dikaitkan dengan kemungkinan hasil yang tidak dapat diprediksi dengan pasti.

Datang sekarang ke masalah kemerdekaan. Dua Variabel Acak bersifat independen jika nilai salah satunya tidak memengaruhi PDF yang lain. Kami tidak merevisi prediksi kami mengenai probabilitas nilai-nilai yang berbeda dari satu variabel ketika kami mengetahui sesuatu tentang variabel lainnya. Oleh karena itu dalam kasus kemerdekaan, Posterior PDF identik dengan PDF Sebelumnya. Misalnya ketika kita melempar koin yang tidak bias berulang kali, informasi yang kita miliki tentang hasil dari 5 lemparan sebelum tidak mempengaruhi prediksi kita tentang lemparan saat ini, itu akan selalu 0,5. Namun, jika bias dari koin tidak diketahui dan dimodelkan sebagai Variabel Acak, maka hasil dari 5 lemparan sebelumnya mempengaruhi prediksi kita mengenai lemparan saat ini karena memungkinkan kita untuk membuat kesimpulan mengenai bias yang tidak diketahui dari koin.

Datang sekarang ke masalah Sampling. Tujuan Sampling adalah untuk memberi tahu kami tentang sifat-sifat distribusi yang mendasarinya yang tidak diketahui dan harus disimpulkan. Ingat bahwa Distribusi mengacu pada kemungkinan relatif dari kemungkinan hasil dalam Ruang Sampel (yang mungkin juga merupakan Semesta Bersyarat). Jadi ketika kami Sampel, kami memilih sejumlah hasil terbatas dari ruang Sampel dan kami mereproduksi Ruang Sampel dalam skala yang lebih kecil dan lebih mudah dikelola. Probabilitas yang sama kemudian merujuk pada proses Pengambilan Sampel, bukan probabilitas Hasil pada Sampel. Sampling probabilitas yang sama menyiratkan bahwa Sampel akan mencerminkan proporsi hasil di Ruang Sampel asli. Misal jika kita bertanya 10, 000 orang jika mereka pernah ditangkap, besar kemungkinan sampel kita akan berakhir tidak akan mewakili Populasi - Ruang Sampel - karena orang yang ditangkap mungkin menolak untuk menjawab, oleh karena itu proporsi kemungkinan hasil (ditangkap - tidak ditangkap) akan berbeda antara sampel kami dan populasi karena alasan sistematis. Atau jika kami memilih lingkungan tertentu untuk melakukan survei, hasilnya tidak akan mewakili Kota secara keseluruhan. Jadi sampling probabilitas yang sama menyiratkan bahwa tidak ada alasan sistematis - selain dari keacakan murni - yang membuat kami percaya bahwa proporsi hasil yang mungkin dalam sampel kami berbeda dari proporsi hasil di Populasi / Ruang Sampel. oleh karena itu proporsi kemungkinan hasil (ditangkap - tidak ditangkap) akan berbeda antara sampel kami dan populasi untuk alasan sistematis. Atau jika kami memilih lingkungan tertentu untuk melakukan survei, hasilnya tidak akan mewakili Kota secara keseluruhan. Jadi sampling probabilitas yang sama menyiratkan bahwa tidak ada alasan sistematis - selain dari keacakan murni - yang membuat kami percaya bahwa proporsi hasil yang mungkin dalam sampel kami berbeda dari proporsi hasil di Populasi / Ruang Sampel. oleh karena itu proporsi kemungkinan hasil (ditangkap - tidak ditangkap) akan berbeda antara sampel kami dan populasi untuk alasan sistematis. Atau jika kami memilih lingkungan tertentu untuk melakukan survei, hasilnya tidak akan mewakili Kota secara keseluruhan. Jadi sampling probabilitas yang sama menyiratkan bahwa tidak ada alasan sistematis - selain dari keacakan murni - yang membuat kami percaya bahwa proporsi hasil yang mungkin dalam sampel kami berbeda dari proporsi hasil di Populasi / Ruang Sampel.

rf7
sumber
-2

Sampel acak adalah realisasi dari urutan variabel acak. Variabel acak tersebut mungkin iid atau tidak.

Mohsen
sumber