Paradoks data iid (setidaknya untuk saya)

24

Sejauh pengetahuan agregat (dan kelangkaan) saya tentang statistik memungkinkan, saya mengerti bahwa jika adalah variabel acak iid, maka sebagaimana istilah tersebut menyiratkan bahwa keduanya independen dan terdistribusi secara identik.X1,X2,...,Xn

Perhatian saya di sini adalah properti mantan sampel iid, yang berbunyi:

p(Xn|Xi1,Xi2,...,Xik)=p(Xn),

untuk setiap koleksi 's st . 1 i j < nij1ij<n

Namun orang tahu bahwa kumpulan sampel independen dari distribusi identik memberikan informasi tentang struktur distribusi, dan sebagai hasilnya tentang dalam kasus di atas, jadi memang seharusnya tidak menjadi kasus bahwa: p ( X n | X i 1 , X i 2 , . . . , X i k ) = p ( X n ) .Xn

p(Xn|Xi1,Xi2,...,Xik)=p(Xn).

Saya tahu bahwa saya adalah korban dari kesalahan tetapi saya tidak tahu mengapa. Tolong bantu saya untuk yang ini.

Cupitor
sumber
Apakah Anda tahu aturan Bayes? Mendengar klasik. vs statistik Bayesian? Priors?
Matius Gunn
1
Saya tidak mengikuti argumen di akhir pertanyaan Anda. Bisakah Anda lebih eksplisit?
Glen_b -Reinstate Monica
@ Glen_b apa sebenarnya yang tidak Anda ikuti? Apa yang Anda maksud pada akhirnya? Saya mencoba mengatakan dengan logika yang berbeda, baik kesetaraan dan ketidaksetaraan tampaknya masuk akal yang merupakan paradoks.
Cupitor
Tidak ada paradoks di sini - hanya kegagalan untuk menerapkan definisi yang sesuai. Anda tidak dapat mengklaim memiliki paradoks ketika Anda mengabaikan arti kata-kata yang Anda gunakan! Dalam hal ini, membandingkan definisi independen dengan probabilitas akan mengungkapkan kesalahan.
whuber
@whuber, saya berasumsi Anda telah memperhatikan secara eksplisit "(setidaknya untuk saya)" dalam judul pertanyaan saya dan juga fakta bahwa saya meminta bantuan untuk menemukan "kekeliruan" argumen saya, yang menunjukkan fakta bahwa ini memang bukan paradoks nyata.
Cupitor

Jawaban:

30

Saya pikir Anda membingungkan estimasi model distribusi dengan variabel acak . Mari kita menulis ulang asumsi independensi sebagai berikut: yang mengatakan bahwa jika Anda tahu distribusi mendasarinya (dan, misalnya, dapat mengidentifikasinya dengan seperangkat parameter ) maka distribusi tidak berubah mengingat Anda telah mengamati beberapa sampel darinya. Xnθ

(1)P(Xn|θ,Xi1,Xi2,,Xik)=P(Xn|θ)
Xnθ

Sebagai contoh, pikirkan sebagai variabel acak yang mewakili hasil lemparan ke- koin. Mengetahui probabilitas kepala dan ekor untuk koin (yang, btw, asumsikan dikodekan dalam ) sudah cukup untuk mengetahui distribusi . Secara khusus, hasil dari lemparan sebelumnya tidak mengubah probabilitas kepala atau ekor untuk lemparan ke- , dan berlaku.XnnθXnn(1)

Namun, perlu diketahui bahwa .P(θ|Xn)P(θ|Xi1,Xi2,,Xik)

Sobi
sumber
Terima kasih banyak. Cukup sampai pada intinya. Cukup lucu bahwa saya menebak jawaban seperti itu beberapa waktu yang lalu tapi saya lupa tentang itu .... Sejauh yang saya pahami, fallacy berjalan secara implisit dengan mengasumsikan "model" yang dapat parametrize distribusi variabel acak. Apakah saya benar?
Cupitor
1
@Cupitor: Saya senang itu berguna. Ya, dikondisikan pada model, variabel acak independen tidak saling mempengaruhi. Tetapi, seberapa besar kemungkinan distribusi yang diberikan menghasilkan urutan perubahan hasil ketika Anda melihat lebih banyak sampel dari distribusi yang mendasarinya (benar) (terlepas dari asumsi independensi).
Sobi
15

Jika Anda mengambil pendekatan Bayesian dan memperlakukan parameter yang menggambarkan distribusi sebagai variabel / vektor acak, maka pengamatan memang tidak independen, tetapi mereka akan tergantung secara kondisional dengan pengetahuan maka akan tahan.XθP(XnXn1,X1,θ)=P(Xnθ)

Dalam pendekatan statistik klasik, adalah bukan variabel acak. Perhitungan dilakukan seolah-olah kita tahu apa itu . Dalam beberapa hal, Anda selalu dikondisikan pada (bahkan jika Anda tidak tahu nilainya).θθθ

Ketika Anda menulis, "... berikan informasi tentang struktur distribusi, dan sebagai hasilnya tentang " Anda secara implisit mengadopsi pendekatan Bayesian tetapi tidak melakukannya dengan tepat. Anda sedang menulis properti sampel IID yang akan ditulis oleh seorang frequentist, tetapi pernyataan yang sesuai dalam pengaturan Bayesian akan melibatkan pengkondisian pada .Xnθ

Bayesian vs ahli statistik Klasik

Biarkan menjadi hasil membalik koin yang berat sebelah dan tidak adil. Kami tidak tahu probabilitas kepala koin.xi

  • Bagi ahli statistik klasik, frequentist, adalah beberapa parameter, sebut saja . Perhatikan bahwa sini adalah skalar, seperti angka 1/3. Kita mungkin tidak tahu apa angkanya, tapi itu bilangan! Itu tidak acak!P(xi=H)θθ
  • Bagi ahli statistik Bayesian, sendiri adalah variabel acak! Ini sangat berbeda!θ

Gagasan kunci di sini adalah bahwa ahli statistik Bayesian memperluas alat probabilitas untuk situasi di mana ahli statistik klasik tidak . Bagi frequentist, bukan variabel acak karena hanya memiliki satu nilai yang memungkinkan ! Berbagai hasil tidak mungkin! Namun dalam imajinasi Bayesian, berbagai nilai mungkin terjadi, dan Bayesian bersedia untuk memodelkan ketidakpastian itu (dalam pikirannya sendiri) menggunakan alat probabilitas.θθ

Kemana perginya ini?

Katakanlah kita melempar koin kali. Satu flip tidak mempengaruhi hasil yang lain. Ahli statistik klasik akan menyebut ini flip independen (dan memang benar). Kita akan memiliki: Di mana adalah beberapa yang tidak diketahui parameter. (Ingat, kami tidak tahu apa itu, tapi itu bukan variabel acak! Ini angka tertentu.)n

P(xn=Hxn1,xn2,,x1)=P(xn=H)=θ
θ

Bayesian yang jauh ke dalam probabilitas subyektif akan mengatakan bahwa yang penting adalah probabilitas dari sudut pandangnya! . Jika dia melihat 10 kepala berturut-turut, kepala ke-11 lebih mungkin karena 10 kepala berturut-turut membuat orang percaya bahwa koin itu miring demi kepala.

P(x11=Hx10=H,x9=H,,x1=H)>P(x1=H)

Apa yang terjadi di sini? Apa perbedaannya?! Memperbarui keyakinan tentang variabel acak laten ! Jika diperlakukan sebagai variabel acak, flip tidak lagi independen. Namun, flips tidak tergantung pada kondisi yang diberikan nilai .θθθ

P(x11=Hx10=H,x9=H,,x1=H,θ)=P(x1=Hθ)=θ

Pengkondisian pada dalam arti menghubungkan bagaimana Bayesian dan ahli statistik klasik memodelkan masalah. Atau dengan kata lain, sering dan statistik Bayesian akan setuju jika kondisi Bayesian pada .θθθ

Catatan selanjutnya

Saya sudah mencoba yang terbaik untuk memberikan intro singkat di sini, tetapi apa yang saya lakukan paling-paling dangkal dan konsep-konsepnya dalam arti cukup dalam. Jika Anda ingin mempelajari filosofi probabilitas, buku 1954 Savage, Foundation of Statistics adalah klasik. Google untuk bayesian vs sering dan satu ton barang akan muncul.

Cara lain untuk berpikir tentang penarikan IID adalah teorema de Finetti dan gagasan pertukaran . Dalam kerangka Bayesian, nilai tukar setara dengan independensi tergantung pada beberapa variabel acak laten (dalam hal ini, lopsidedness dari koin).

Matthew Gunn
sumber
Pada dasarnya, pendekatan bayesian akan memperlakukan pernyataan "variabel acak iid" bukan sebagai aksioma bahwa mereka harus IID tetapi hanya sebagai asumsi sebelumnya yang sangat kuat bahwa mereka begitu - dan jika bukti yang lebih kuat menunjukkan bahwa sangat tidak mungkin diberikan asumsi benar, maka "ketidakpercayaan dalam kondisi yang diberikan" ini akan tercermin dalam hasilnya.
Peteris
Terima kasih banyak atas jawaban Anda. Saya telah memutakhirkannya, tetapi saya pikir jawaban Sobi, menunjukkan secara lebih eksplisit di mana masalahnya terletak, yaitu secara implisit mengasumsikan struktur model (atau ini sejauh yang saya mengerti)
Cupitor
1
@Matthew Gunn: rapi, teliti, dan dijelaskan dengan sangat baik! Saya belajar beberapa hal dari jawaban Anda, terima kasih!
Sobi