Penjelasan intuitif untuk kepadatan variabel yang diubah?

37

Misalkan adalah variabel acak dengan pdf . Kemudian variabel acak memiliki pdfXfX(x)Y=X2

fY(y)={12y(fX(y)+fX(y))y00y<0

Saya mengerti kalkulus di balik ini. Tapi saya mencoba memikirkan cara untuk menjelaskannya kepada seseorang yang tidak tahu kalkulus. Secara khusus, saya mencoba menjelaskan mengapa faktor muncul di depan. Saya akan menikamnya:1y

Misalkan memiliki distribusi Gaussian. Hampir semua berat pdf adalah antara nilai-nilai, katakanlah, dan Tapi itu peta untuk 0-9 untuk . Jadi, berat berat di pdf untuk telah diperpanjang di lebih luas nilai-nilai dalam transformasi ke . Jadi, untuk menjadi pdf sejati, bobot ekstra berat harus diturunkan oleh faktor multiplikasiX33.YXYfY(y)1y

Bagaimana itu terdengar?

Kalau ada yang bisa memberikan penjelasan yang lebih baik dari mereka sendiri atau tautan ke satu di dokumen atau buku teks saya akan sangat menghargainya. Saya menemukan contoh transformasi variabel ini dalam beberapa buku probabilitas / statistik matematika intro. Tapi saya tidak pernah menemukan penjelasan intuitif dengan itu :(

lowndrul
sumber
Saya pikir penjelasan Anda benar.
highBandWidth
2
Penjelasannya benar, tetapi ini murni kualitatif: bentuk yang tepat dari faktor multiplikasi masih merupakan misteri. Kekuatan -1/2 hanya muncul secara ajaib. Jadi, pada tingkat tertentu, Anda harus melakukan hal yang sama seperti yang dilakukan Kalkulus: temukan tingkat perubahan fungsi akar kuadrat.
whuber

Jawaban:

37

PDF adalah ketinggian tetapi mereka digunakan untuk mewakili probabilitas melalui area. Karena itu membantu mengekspresikan PDF dengan cara yang mengingatkan kita bahwa area sama dengan basis kali tinggi.

Awalnya ketinggian pada nilai apa pun diberikan oleh PDF . Basis adalah segmen sangat kecil , di mana distribusi (yaitu, ukuran probabilitas yang bertentangan dengan fungsi distribusi ) sebenarnya adalah bentuk diferensial, atau "elemen probabilitas,"xfX(x)dx

PEX(x)=fX(x)dx.

Ini, bukan PDF, adalah objek yang ingin Anda kerjakan baik secara konseptual maupun praktis, karena objek ini secara eksplisit mencakup semua elemen yang diperlukan untuk mengekspresikan suatu probabilitas.

Ketika kita menyatakan kembali dalam bentuk , segmen dasar direntangkan (atau diperas): dengan mengkuadratkan kedua ujung interval dari ke kita melihat bahwa dasar dari area harus interval panjangxy=x2dxxx+dxy

dy=(x+dx)2x2=2xdx+(dx)2.

Karena produk dari dua infinitesimal dapat diabaikan dibandingkan dengan infinitesimal itu sendiri, kami menyimpulkan

dy=2xdx, whence dx=dy2x=dy2y.

Setelah menetapkan ini, perhitungannya sepele karena kami cukup mencolokkan tinggi baru dan lebar baru:

PEX(x)=fX(x)dx=fX(y)dy2y=PEY(y).

Karena basa, dalam hal , adalah , apa pun yang mengalikannya harus tinggi, yang dapat kita baca langsung dari istilah tengah sebagaiydy

12yfX(y)=fY(y).

Persamaan ini secara efektif merupakan konservasi hukum wilayah (= probabilitas).PEX(x)=PEY(y)

Dua pdf

Grafik ini secara akurat menunjukkan potongan sempit (hampir sangat kecil) dari dua PDF yang terkait dengan . Peluang diwakili oleh area yang diarsir. Karena tekanan interval melalui kuadrat, ketinggian wilayah merah ( , di sebelah kiri) harus diperluas secara proporsional agar sesuai dengan area di wilayah biru ( , di kanan).y=x2[0.32,0.45]yx

whuber
sumber
2
Saya suka sangat kecil. Ini adalah penjelasan yang luar biasa. Berpikir dalam hal , yang dapat dilihat dengan jelas muncul dari turunan dari transformasi, jauh lebih intuitif daripada berpikir dalam hal . Saya pikir di situlah titik lekat saya. 2xy
lowndrul
@whuber, saya yakin Anda baris pertama harus ? Apakah itu yang Anda maksud dengan ? PS: juga ingin tahu tentang pemikiran Anda pada jawaban saya (di bawah). pdf X ( x )P(X(x,x+dx))=fx(x)dxpdfX(x)
Carlos Cinelli
@Carlos Sedikit lebih keras untuk mengekspresikan ide dengan cara yang saya lakukan di awal: PDF adalah apa yang Anda kalikan dengan ukuran Lebesgue oleh untuk mendapatkan ukuran probabilitas yang diberikan. dx
Whuber
@whuber tetapi jika pdf adalah apa yang Anda kalikan maka itu adalah istilah , bukan produk seperti yang Anda tulis, kan? Tidak jelas mengapa Anda menyebut produk a pdf. f x ( x ) d x f X ( x ) d xfX(x)fx(x)dxfX(x)dx
Carlos Cinelli
1
@Carlos: terima kasih; sekarang saya mengerti maksud Anda. Saya melakukan beberapa pengeditan untuk mengatasinya.
whuber
11

Bagaimana, jika saya membuat objek yang selalu persegi dan saya tahu distribusi panjang sisi kotak; apa yang bisa saya katakan tentang distribusi area kotak?

Secara khusus, jika saya tahu distribusi variabel acak , apa yang bisa saya katakan tentang ? Satu hal yang bisa Anda katakan adalahY = X 2XY=X2

FY(c)=P(Yc)=P(X2c)=P(cXc)=FX(c)FX(c).

Jadi hubungan terjalin antara CDF dan CDF ; apa hubungan antara PDF mereka? Kita perlu kalkulus untuk itu. Mengambil turunan dari kedua belah pihak memberi Anda hasil yang Anda inginkan.XYX

schenectady
sumber
2
(+1) Meskipun ini bukan jawaban yang lengkap, ini memberikan cara yang baik untuk mencari dan dengan jelas menunjukkan mengapa itu adalah jumlah dari dua bagian, satu untuk setiap akar kuadrat. fY
whuber
1
Saya tidak mengerti mengapa pdf (x) = f (x) dx. Bagaimana dengan pdf (x) dx = f (x), density = prob mass/interval... apa yang salah?
Fernando
2

Bayangkan kita memiliki populasi dan Y adalah ringkasan dari populasi itu. Kemudian P(Y(y,y+Δy)) menghitung proporsi individu yang memiliki variabel dalam kisaran . Anda dapat menganggap ini sebagai "tempat sampah" berukuran dan kami menghitung berapa banyak orang di dalam tempat sampah itu.Y(y,y+Δy)Δy

Sekarang mari kita kembali mengungkapkan orang-orang dalam hal variabel lain, . Mengingat bahwa kita tahu bahwa dan terkait sebagai , peristiwa sama dengan peristiwa yang sama dengan acara . Dengan demikian, individu yang berada di tempat sampah juga harus berada di dalam nampan dan . Dengan kata lain, tempat sampah itu harus memiliki proporsi individu yang sama,XYXY=X2Y(y,y+Δy)X2(x2,(x+Δx)2)X(|x|,|x|+Δx) or X(|x|Δx,|x|)(y,y+Δy)(|x|,|x|+Δx)(|x|Δx,|x|)

P(Y(y,y+Δy))=P(X(|x|,|x|+Δx))+P(X(-|x|-Δx,-|x|))

Ok, sekarang mari kita ke kepadatan. Pertama, kita perlu mendefinisikan apa kepadatan probabilitas . Seperti namanya, ini adalah proporsi individu per area . Yaitu, kami menghitung bagian individu pada nampan itu dan membaginya dengan ukuran nampan . Karena kami telah menetapkan bahwa proporsi orang di sini sama, tetapi ukuran nampan telah berubah, kami menyimpulkan kerapatan akan berbeda. Tetapi berbeda dengan seberapa banyak?

Seperti yang kami katakan, kepadatan probabilitas adalah proporsi orang dalam nampan dibagi dengan ukuran nampan, sehingga kepadatan diberikan oleh . Secara analog, kepadatan probabilitas diberikan oleh .YfY(y): =P(Y(y,y+Δy))ΔyXfX(x): =P(X(x,x+Δx))Δx

Dari hasil kami sebelumnya bahwa populasi di setiap nampan sama dengan yang kita miliki,

fY(y): =P(Y(y,y+Δy))Δy=P(X(|x|,|x|+Δx))+P(X(-|x|-Δx,-|x|))Δy=fX(|x|)Δx+fX(-|x|)ΔxΔy=ΔxΔy(fX(|x|)+fX(-|x|))=ΔxΔy(fX(y)+fX(-y))

Yaitu, kepadatan berubah oleh faktor , yang merupakan ukuran relatif peregangan atau meremas ukuran nampan. Dalam kasus kami, karena kita memiliki . Jika cukup kecil kita dapat mengabaikan , yang menyiratkan dan , dan itulah sebabnya faktor muncul dalam transformasi.fX(y)+fX(-y)ΔxΔyy=x2y+Δy=(x+Δx)2=x2+2xΔx+Δx2ΔxΔx2Δy=2xΔxΔxΔy=12x=12y12y

Carlos Cinelli
sumber