Apa yang dimaksud dengan variabel acak iid?

49

Bagaimana Anda akan menjelaskan iid (independen dan didistribusikan secara identik) kepada orang-orang non-teknis?

pengguna333
sumber

Jawaban:

55

Ini berarti "Independen dan terdistribusi secara identik".

Contoh yang baik adalah suksesi melempar koin yang adil: Koin tidak memiliki memori, sehingga semua lemparan "independen".

Dan setiap lemparan adalah 50:50 (kepala: ekor), jadi koin itu dan tetap adil - distribusi dari mana setiap lemparan ditarik, sehingga untuk berbicara, adalah dan tetap sama: "didistribusikan secara identik".

Titik awal yang baik adalah halaman Wikipedia .

::SUNTING::

Ikuti tautan ini untuk mengeksplorasi konsep lebih lanjut.

vonjd
sumber
11
Saya ingin tahu apakah koin yang dilontarkan itu akan memberikan kesan keliru bahwa setiap peristiwa haruslah dapat dilengkapi ...
Michael McGowan
1
Jadi, apakah tidak perlu bahwa variabel acak IID harus seimbang? jika mereka tidak dapat dipasangkan maka bagaimana bisa "didistribusikan secara identik" dijelaskan? Terima kasih banyak sebelumnya ...
6
@Nalini "equi-probable" bukan sinonim untuk "terdistribusi secara identik." Jika dan adalah iid, ini berarti mereka diambil dari distribusi yang sama, bukan berarti semua nilai dalam distribusi itu memiliki kemungkinan yang sama (pikirkan distribusi normal). dan akan memiliki nilai yang diharapkan sama. xyxy
Jason Morgan
Jika dua variabel independen dan terdistribusi normal tetapi dengan rerata dan varian yang berbeda, apakah masih iid?
spurra
1
@ spurra Saya tidak berpikir begitu .. mereka hanya independen
user3595632
22

Penjelasan nonteknis:

Kemandirian adalah gagasan yang sangat umum. Dua peristiwa dikatakan independen jika kejadian satu tidak memberi Anda informasi, apakah peristiwa lain terjadi atau tidak. Secara khusus, probabilitas bahwa kita menganggap peristiwa kedua tidak dipengaruhi oleh pengetahuan bahwa peristiwa pertama telah terjadi.

  • Contoh acara independen, mungkin didistribusikan secara identik.
    Pertimbangkan untuk melemparkan dua koin yang berbeda satu demi satu. Dengan anggapan bahwa ibu jari Anda tidak terlalu lelah ketika membalik koin pertama, masuk akal untuk mengasumsikan bahwa mengetahui bahwa lemparan koin pertama menghasilkan Kepala sama sekali tidak mempengaruhi apa yang Anda pikirkan kemungkinan Kepala pada lemparan kedua adalah. Dua peristiwa dikatakan sebagai peristiwa independen .

    {first coin toss resulted in Heads}  and  {second coin toss resulted in Heads}
    • Jika kita tahu, atau bersikeras, bahwa kedua koin memiliki probabilitas yang berbeda untuk menghasilkan Kepala, maka peristiwa tersebut tidak terdistribusi secara identik.

    • Jika kita tahu atau berasumsi bahwa kedua koin tersebut memiliki probabilitas sama untuk muncul Kepala, maka peristiwa di atas juga terdistribusi secara identik, artinya keduanya memiliki probabilitas sama untuk terjadi. Tetapi perhatikan bahwa kecuali , probabilitas Head tidak sama dengan probabilitas Tails. Seperti dicatat dalam salah satu Komentar, "distribusi identik" tidak sama dengan "kemungkinan sama."ppp=12

  • Contoh peristiwa non-independen yang terdistribusi secara identik.
    Pertimbangkan sebuah guci dengan dua bola di dalamnya, satu hitam dan satu putih. Kami meraih ke dalamnya dan mengeluarkan dua bola satu demi satu, memilih yang pertama secara acak (dan ini tentu saja menentukan warna bola berikutnya). Dengan demikian, dua hasil yang sama-sama kemungkinan dari percobaan adalah (Putih, Hitam) dan (Hitam, Putih), dan kami melihat bahwa bola pertama sama-sama cenderung Hitam atau Putih dan begitu juga bola kedua juga sama-sama cenderung menjadi Hitam atau Putih. Dengan kata lain, peristiwa tentu didistribusikan secara identik, tetapi pasti tidak

    {first ball drawn is Black}  and  {second ball drawn is Black}
    acara independen. Memang, jika kita tahu bahwa peristiwa pertama telah terjadi, kita tahu pasti bahwa peristiwa kedua tidak dapat terjadi. Jadi, sementara evaluasi awal kami tentang probabilitas peristiwa kedua adalah , setelah kami tahu bahwa peristiwa pertama telah terjadi, kami sebaiknya merevisi penilaian kami tentang kemungkinan penarikan kedua akan menjadi hitam dari hingga .12120
Dilip Sarwate
sumber
"Seperti disebutkan dalam salah satu Komentar," distribusi identik "tidak sama dengan" kemungkinan sama. "" Apa bedanya? "sama-sama berpeluang" berarti kepala sama-sama berkemungkinan sama dengan ekor? Sedangkan "terdistribusi secara identik" berarti setiap peristiwa memiliki kemungkinan kepala yang sama?
The Red Pea
3
@TheRedPea Tidak cukup. Jika kita memiliki koin bias yang muncul H dengan probabilitas , maka peristiwa "Toss Pertama adalah H" dan acara "Toss Kedua adalah H" bersifat independen dan juga sama-sama kemungkinan (keduanya sama-sama memiliki probabilitas ). Selain itu lemparan yang identik didistribusikan: mereka berdua memiliki probabilitas yang sama ( dan masing-masing untuk H dan T) di berbagai lemparan. Tetapi peristiwa "Toss Pertama adalah H" dan "Toss Pertama adalah T" tidak mungkin sama . Mereka juga tidak mandiri. Distribusi identik = semua lemparan memiliki distribusi yang sama .p12pp1p
Dilip Sarwate
2
@TheRedPea (lanjutan) Kemungkinan sama artinya dua peristiwa memiliki probabilitas yang sama. Peristiwa dapat didefinisikan lintas lemparan seperti di atas, atau dalam satu percobaan. Model sederhana kanonik percobaan adalah ruang sampel dengan hasil di mana semua hasil memiliki probabilitas yang sama . Adalah umum untuk menggambarkan ini dengan mengatakan "koin yang adil" atau "dadu yang adil" atau mengatakan hal-hal seperti "Bola dipilih secara acak dari guci dengan 3 bola hijau dan 2 bola merah" dll. Hanya para puritan yang akan canggung dan bersikeras bahwa itu harus "mati adil" ....n1n
Dilip Sarwate
OK distribusi yang identik mengacu pada seluruh distribusi probabilitas, sedangkan probabilitas yang sama mengacu pada bagian-bagian dari distribusi probabilitas tersebut. Saya mengerti sekarang, terima kasih.
The Red Pea
Saya tidak yakin tentang contoh terakhir yang didistribusikan secara identik. Apakah dapat diperdebatkan bahwa " jika dua peristiwa tidak independen, mereka tidak dapat berasal dari distribusi yang identik"? Misalnya dalam contoh Anda, saya akan mengatakan bola-kedua memiliki distribusi yang berbeda karena acara pertama.
jiggunjer
3

Variabel acak adalah variabel yang berisi probabilitas semua peristiwa yang mungkin terjadi dalam skenario. Misalnya, mari kita buat variabel acak yang mewakili jumlah kepala dalam 100 lemparan koin. Variabel acak akan berisi kemungkinan mendapatkan 1 kepala, 2 kepala, 3 kepala ..... sampai 100 kepala. Mari kita sebut variabel acak X ini .

Jika Anda memiliki dua variabel acak maka mereka adalah IID (independen yang didistribusikan secara identik) jika:

  1. Jika mereka independen . Sebagaimana dijelaskan di atas, kemandirian berarti terjadinya satu peristiwa tidak memberikan informasi apa pun tentang peristiwa lainnya. Misalnya, jika saya mendapatkan 100 kepala setelah 100 membalik, probabilitas mendapatkan kepala atau ekor di flip berikutnya adalah sama.
  2. Jika setiap variabel acak memiliki distribusi yang sama . Sebagai contoh, mari kita variabel acak dari atas - X . Katakanlah X mewakili Obama yang akan melempar koin 100 kali. Sekarang katakanlah Y mewakili seorang Imam yang akan melempar koin 100 kali. Jika Obama dan Imam membalik koin dengan probabilitas yang sama untuk mendarat, maka X dan Y dianggap dibagikan secara identik. Jika kita sampel berulang kali dari Priest atau Obama, maka sampel tersebut dianggap terdistribusi secara identik.

Catatan: Kemandirian juga berarti Anda dapat melipatgandakan probabilitas. Katakanlah probabilitas kepala adalah p, maka probabilitas untuk mendapatkan dua kepala berturut-turut adalah p * p, atau p ^ 2.

thebajo
sumber
2

Dua variabel dependen tersebut dapat memiliki distribusi yang sama dapat ditunjukkan dengan contoh ini:

Asumsikan dua percobaan berturut-turut yang melibatkan masing-masing 100 lemparan koin bias, di mana jumlah Kepala dimodelkan sebagai variabel acak X1 untuk percobaan pertama dan X2 untuk percobaan kedua. X1 dan X2 adalah variabel acak binomial dengan parameter 100 dan p, di mana p bias koin.
Dengan demikian, mereka terdistribusi secara identik. Namun mereka tidak independen, karena nilai yang pertama cukup informatif tentang nilai yang terakhir. Itu adalah jika hasil percobaan pertama adalah 100 Kepala, ini memberi tahu kita banyak tentang bias koin dan oleh karena itu memberi kita banyak informasi baru mengenai distribusi X2.
Masih X2 dan X1 didistribusikan secara identik karena mereka berasal dari koin yang sama.

Yang juga benar adalah bahwa jika 2 variabel acak tergantung, maka posterior X2 yang diberikan X1 tidak akan pernah sama dengan yang sebelumnya dari X2 dan sebaliknya. Sementara ketika X1 dan X2 independen, posisi mereka sama dengan prior mereka. Oleh karena itu, ketika dua variabel tergantung, pengamatan salah satunya menghasilkan estimasi yang direvisi mengenai distribusi variabel kedua. Masih mungkin keduanya dari distribusi yang sama, hanya saja kita belajar lebih dalam tentang sifat distribusi ini. Jadi kembali ke percobaan melempar koin, awalnya tanpa adanya informasi kita dapat berasumsi bahwa X1 dan X2 mengikuti distribusi Binomial dengan parameter 100 dan 0,5. Tetapi setelah mengamati 100 Head berturut-turut, kami pasti akan merevisi estimasi kami tentang parameter p untuk membuatnya mendekati 1.

rf7
sumber
1

Kumpulan beberapa undian acak dari distribusi yang sama. Contohnya sedang mengeluarkan kelereng dari tas 10.000 kali dan menghitung berapa kali Anda mengeluarkan kelereng merah.

Caleb
sumber
1
Bisakah Anda memperluas bagaimana ini menambah jawaban yang ada?
mdewey
0

Jika variabel acak berasal dari populasi yang memiliki (katakanlah) distribusi normal, itu adalah pdf (probabilitas fungsi kepadatan) adalah distribusi normal, dengan rata-rata populasi dan varians populasi ( angka-angka adalah hipotetis dan hanya untuk pengertian Anda dan untuk menyederhanakan perbandingan) kita dapat menggambarkannya sebagai berikut: .Xμ=3σ2=4XN(3,4)

Sekarang jika kita memiliki variabel acak yang juga terdistribusi normal dan maka dan terdistribusi secara identik.YYN(3,4)XY

Namun demikian, didistribusikan secara identik tidak selalu menyiratkan independensi.

S Jalal
sumber
8
Anda harus memiliki kumpulan "orang nonteknis" yang menarik ketika Anda mengandalkan istilah teknis seperti "variabel acak," "distribusi normal," "pdf," "varians," dan "independensi." Saya berani mengatakan itu set kosong.
whuber
" didistribusikan secara identik tidak selalu berarti kemerdekaan ". Bagaimana ketergantungan dapat mempengaruhi dua variabel yang terdistribusi secara identik? Tampaknya bagi saya, bahwa ketergantungan menyebabkan ketidak-identikan, tetapi tidak semua ketidak-identikan disebabkan oleh ketergantungan .
jiggunjer