Mengapa CDF sampel terdistribusi secara seragam

17

Saya membaca di sini bahwa diberi sampel dari distribusi kontinu dengan cdf , sampel yang sesuai dengan mengikuti distribusi seragam standar.F X U i = F X ( X i )X1,X2,...,XnFXUi=FX(Xi)

Saya telah memverifikasi ini menggunakan simulasi kualitatif dengan Python, dan saya dengan mudah dapat memverifikasi hubungan.

import matplotlib.pyplot as plt
import scipy.stats

xs = scipy.stats.norm.rvs(5, 2, 10000)

fig, axes = plt.subplots(1, 2, figsize=(9, 3))
axes[0].hist(xs, bins=50)
axes[0].set_title("Samples")
axes[1].hist(
    scipy.stats.norm.cdf(xs, 5, 2),
    bins=50
)
axes[1].set_title("CDF(samples)")

Menghasilkan plot berikut:

Plot menunjukkan sampel distribusi normal dan cdf sampel.

Saya tidak dapat memahami mengapa ini terjadi. Saya menganggap itu ada hubungannya dengan definisi CDF dan hubungannya dengan PDF, tapi saya kehilangan sesuatu ...

Saya akan sangat menghargai jika seseorang dapat mengarahkan saya ke beberapa bacaan tentang subjek atau membantu saya mendapatkan beberapa intuisi pada subjek.

EDIT: CDF terlihat seperti ini:

CDF dari distribusi sampel

Tremlay Maxime
sumber
2
Hitung cdf dari . FX(X)
Zhanxiong
2
Anda akan menemukan bukti properti ini (untuk rv berkelanjutan) dalam buku apa pun tentang simulasi karena ini adalah dasar dari metode simulasi cdf terbalik.
Xi'an
2
Coba juga google-ing probability integral transform
Zachary Blumenfeld
1
@ Xi'an Baik untuk menunjukkan kesimpulan hanya berlaku untuk variabel acak kontinu. Terkadang hasil ini keliru digunakan untuk variabel acak diskrit. Di sisi lain, perhatikan juga banyak bukti yang melibatkan langkah yang mengasumsikan monotonitas ketat dari F , yang juga merupakan asumsi yang terlalu kuat. Tautan berikut memberikan ringkasan yang ketat tentang topik ini: people.math.ethz.ch/ ~embrechtP(F(X)x)=P(XF1(x))F
ftp
@Zhanxiong satu-satunya syarat yang diperlukan untuk adalah càdlàg. F
AdamO

Jawaban:

19

Asumsikan kontinu dan meningkat. Tentukan Z = F X ( X ) dan catat bahwa Z mengambil nilai dalam [FXZ=FX(X)Z . Kemudian F Z ( x ) = P ( F X ( X ) x ) = P ( X F - 1 X ( x ) ) = F X ( F -[0,1]

FZ(x)=P(FX(X)x)=P(XFX1(x))=FX(FX1(x))=x.

U[0,1]

FU(x)=RfU(u)du=0xdu=x.

FZ(x)=FU(x)x[0,1]

Hunaphu
sumber
Apakah itu berarti Z memiliki distribusi seragam (0, 1)?
StatsSorceress
Z(0,1).
8

Secara intuitif, mungkin masuk akal untuk menganggap sebagai fungsi persentil, misalnya F ( x )F(x)F(x)FxF1x=F1(p)xpFF1=λF1F

Fa<bP(F1(a)<x<F1(b))=P(a<F(X)<b)=ba

AdamO
sumber
Y=F(X)