Apa makna intuitif di balik memasukkan variabel acak ke pdf atau cdf sendiri?

9

Sebuah pdf biasanya ditulis sebagai , di mana huruf kecil diperlakukan sebagai realisasi atau hasil dari variabel acak yang memiliki pdf itu. Demikian pula, cdf ditulis sebagai , yang memiliki arti . Namun, dalam beberapa keadaan, seperti definisi fungsi skor dan derivasi ini bahwa cdf didistribusikan secara seragam , tampak bahwa variabel acak sedang terhubung ke pdf / cdf-nya sendiri; dengan melakukan itu, kita mendapatkan variabel acak baru ataux X F X ( x ) P ( X < x ) X Y = f ( X | θ ) Z = F X ( X ) F X ( X ) = P ( X < X )f(x|θ)xXFX(x)P(X<x)X Y=f(X|θ)Z=FX(X). Saya tidak berpikir kita bisa menyebutnya pdf atau cdf lagi karena sekarang variabel itu sendiri acak, dan dalam kasus terakhir, "interpretasi" sepertinya tidak masuk akal bagi saya.FX(X)=P(X<X)

Selain itu, dalam kasus terakhir di atas, saya tidak yakin saya memahami pernyataan "cdf dari variabel acak mengikuti distribusi yang seragam". Cdf adalah fungsi, bukan variabel acak, dan karena itu tidak memiliki distribusi. Sebaliknya, apa yang memiliki distribusi seragam adalah variabel acak ditransformasikan menggunakan fungsi yang mewakili cdf sendiri, tetapi saya tidak melihat mengapa transformasi ini bermakna. Hal yang sama berlaku untuk fungsi skor, di mana kita memasukkan variabel acak ke dalam fungsi yang mewakili kemungkinan log-nya sendiri.

Saya telah menghancurkan otak saya selama berminggu-minggu mencoba untuk menemukan makna intuitif di balik transformasi ini, tetapi saya terjebak. Wawasan apa pun akan sangat dihargai!

mai
sumber
4
Notasi itu mungkin membingungkan Anda. Misalnya, adalah persis seperti yang bermakna sebagai menerapkan setiap fungsi terukur untuk akan. Untuk interpretasi yang benar, Anda harus sangat jelas tentang apa variabel acak itu . Untuk variabel acak fungsi untuk jelas merupakan variabel acak dan oleh karena itu memiliki distribusi(Perhatikan dua arti berbeda dari simbol " " di " .") seragam jika dan hanya jika memiliki distribusi kontinu. X X : ohm R , Y : ω F X ( X ( ω ) ) ω ohm F Y . X F X ( X ) F Y XFX(X)XX:ΩR,
Y:ωFX(X(ω))
ωΩFY.XFX(X)FYX
whuber
1
Ini sebenarnya bukan masalah teori ukuran: untuk memahaminya, Anda dapat dengan aman mengabaikan semua referensi tentang "kemampuan mengukur." Anda mungkin mendapat manfaat dari mempelajari teori himpunan kecil di awal karir pascasarjana Anda: di situlah kebanyakan orang mempelajari apa arti terminologi dan notasi matematika yang mendasar (dan ada di mana-mana), jadi sebaiknya Anda tidak menunda mempelajarinya.
whuber
Mungkin sebuah kata mengapa seseorang harus melakukan hal gila seperti ini: memasukkan RV ke dalam kepadatannya sendiri !!?! Satu contoh: katakanlah Anda ingin memperkirakan kerapatan X maka Anda bisa mengukur seberapa baik Anda dengan mengintegrasikan lebih dari tetapi ini "tidak adil": Anda tidak akan pernah mencapai perkiraan yang baik ketika Anda tidak memiliki banyak contoh data (Yaitu kepadatan sebenarnya kecil). Oleh karena itu, evaluasi "adil" akan mempertimbangkan istilah dengan kepadatan yang sebenarnya. Ini kurang lebih efek memasukkan RV ke dalam kepadatan mereka sendiri ...f(x)fX(x)
Fabian Werner

Jawaban:

8

Seperti yang Anda katakan, setiap fungsi (terukur) variabel acak sendiri merupakan variabel acak. Lebih mudah menganggap dan sebagai "fungsi lama". Mereka kebetulan memiliki beberapa properti bagus. Misalnya, jika adalah RV eksponensial standar, maka tidak ada yang aneh tentang variabel acak Kebetulan . Fakta bahwa memiliki distribusi Uniform (mengingat bahwa adalah RV terus menerus) dapat dilihat untuk kasus umum dengan menurunkan CDF dari .F ( x ) X Y = 1 - e - X Y = F X ( X ) Y X Yf(x)F(x)X

Y=1eX
Y=FX(X)YXY

FY(y)=P(Yy)=P(FX(X)y)=P(XFX1(y))=FX(FX1(y))=y

Yang jelas merupakan CDF dari variabel acak . Catatan: Versi bukti ini mengasumsikan bahwa benar-benar meningkat dan kontinu, tetapi tidak terlalu sulit untuk menunjukkan versi yang lebih umum.U(0,1)FX(x)

Knrumsey
sumber
1
Kesimpulan Anda salah untuk sebagian besar peningkatan : Anda mengasumsikan adalah identitas - tetapi itu tidak selalu terjadi. FXFXFX1
Whuber
Ya terima kasih. Variabel acak jelas harus kontinu. Apakah saya kehilangan sesuatu sekarang? X
Knrumsey
1
FX tidak perlu bijective. Ambil contoh, kasus di mana itu sendiri memiliki distribusi yang seragam! Penutupan gambar harus seluruh interval Itu pada dasarnya definisi dari distribusi berkelanjutan. XFX[0,1].
whuber
11

Sebuah transformasi dari variabel acak dengan fungsi terukur adalah variabel lain random yang distribusi diberikan oleh probabilitas inverse transformasi untuk semua set sehingga dapat diukur di bawah distribusi .XT:XYY=T(X)

P(YA)=P(X{x;T(x)A})=defP(XT1(A))
A{x;T(x)A}X

Properti ini berlaku untuk kasus khusus ketika adalah cdf dari variabel acak : adalah variabel acak baru yang mengambil realisasinya dalam . Seperti yang terjadi, didistribusikan sebagai Uniform ketika kontinu. (Jika terputus-putus, kisaran tidak lagi . Yang selalu terjadi adalah ketika adalah Seragam , maka memiliki distribusi yang sama dengan , di manaFX:X[0,1]XY=FX(X)[0,1]YU([0,1])FXFXY=FX(X)[0,1]UU([0,1])FX(U)XFX menunjukkan kebalikan umum dari . Yang merupakan cara formal untuk (a) memahami variabel acak sebagai transformasi terukur dari fundamental sejak adalah variabel acak dengan cdf dan (b ) menghasilkan variabel acak dari distribusi yang diberikan dengan cdf .)FXωΩX(ω)=FX(ω)FXFX

Untuk memahami paradoks , ambil representasi jika adalah ukuran yang mendominasi dan kepadatan yang sesuai. Maka adalah variabel acak karena batas atas dari integral adalah acak. (Ini adalah satu-satunya bagian acak dari ekspresi.) Kontradiksi yang tampak dalam disebabkan oleh kebingungan dalam notasi. Agar dapat didefinisikan dengan benar, seseorang membutuhkan dua versi independen dari variabel acak , danP(XX)

FX(x)=P(Xx)=0xdFX(x)=0xfX(x)dλ(x)
dλfX
FX(X)=0XdFX(x)=0XfX(x)dλ(x)
P(XX)XX1X2, dalam hal ini variabel acak didefinisikan oleh probabilitas yang dihitung untuk distribusi .FX(X1)
FX(X1)=PX2(X2X1)
X2

Komentar yang sama berlaku untuk transformasi oleh densitas (pdf), , yang merupakan variabel acak baru, kecuali bahwa ia tidak memiliki distribusi tetap ketika bervariasi. Meskipun demikian berguna untuk keperluan statistik ketika mempertimbangkan misalnya rasio kemungkinan yang 2 x logaritma kira-kira variabel acak bawah beberapa kondisi.fX(X)fXfX(X|θ^(X))/fX(X|θ0)χ2

Dan hal yang sama berlaku untuk fungsi skor yang merupakan variabel acak sehingga harapannya nol ketika diambil pada nilai sebenarnya dari parameter , yaitu,

logfX(X|θ)θ
θ
Eθ0[logfX(X|θ0)θ]=logfX(x|θ0)θfX(x|θ0)dλ(x)=0

[Jawab diketik sementara @whuber dan @knrumsey mengetik jawaban masing-masing!]

Xi'an
sumber
FX(X1)=P(X2X1)
FXXFX(X)
Ya, saya setuju bahwa mereka bukan hal yang sama. Dalam contoh pertama itu bukan rv, sedangkan dalam kasus kedua itu adalah rv Apakah saya benar?
mai
XFX(X)
θθθ