Diberikan dua set data bilangan real positif X dan Y, keduanya dengan ukuran yang sama, dan 0 <= Y <= X untuk setiap baris; dapatkah CDF empiris X pernah melewati CDF empiris Y?
sumber
Diberikan dua set data bilangan real positif X dan Y, keduanya dengan ukuran yang sama, dan 0 <= Y <= X untuk setiap baris; dapatkah CDF empiris X pernah melewati CDF empiris Y?
PDF empiris, adalah proporsi sampel pada atau di bawah .
Pertimbangkan memesan baris Anda dengan meningkatkan (dan pada nilai tetap , memesan dengan meningkatkan ).
Kemudian untuk setiap baris tersebut (baris , katakanlah), ketinggian setiap cdf adalah *, dan absis yang sesuai untuk sampel-x selalu di sebelah kanan absis untuk sampel-y. Langkah-fungsi dapat bertepatan, tetapi x-sample ecdf tidak akan pernah berada di atas / kiri dari y-sample ecdf.
Memang, bayangkan kita "menggambar di plot" semua lompatan vertikal di ecdf. Kemudian garis horizontal ditarik melintasi plot pada beberapa nilai akan menyerang langkah-langkah ecdf pada nilai tertentu dan yang muncul di tabel kami mencantumkan nilai sampel dalam urutan (memang, untuk nilai yang diberikan dari , mudah untuk menentukan baris mana yang akan digunakan), yang selalu memiliki .
* (ini sedikit lebih rumit ketika ada nilai duplikat, tetapi tidak dengan cara yang mengubah argumen secara substantif)
Untuk garis horizontal abu-abu di plot (), ia menyerang lompatan vertikal ecdf di dan yang terjadi di baris ke-73 tabel data ketika diurutkan seperti ditunjukkan sebelumnya.
Jawaban Glen_b benar, tapi saya pikir ada cara yang lebih sederhana untuk menunjukkan ini.
ECDF adalah sebidang (, proporsi nilai pada atau di bawah ). Kita mulai dengan mengurutkan nilai-nilai dalam urutan menaik: panggil mereka dan . Selanjutnya, dari pertanyaan Anda, kami tahu bahwa kedua vektor itu sama panjang dan untuk setiap indeks .
Sejak lebih besar atau sama dengan , harus berada di atau di sebelah kanan dan, karena mereka adalah poin terkecil dalam daftar, mereka berdua memiliki tinggi / koordinat y . Kedua kurva bergerak ke atas pada laju yang sama (per langkah) dan ke kanan. Namun sejak itu, itu kurva bergerak setidaknya sejauh ke kanan seperti kurva pada setiap langkah.
Sejak kurva dimulai pada atau keluar di sebelah kanan kurva dan setiap pembaruan yang dilakukan mendesak setidaknya sejauh ke kanan , kurva tidak pernah silang.
Hanya formalisasikan apa yang ditulis di atas:
Jika CDF emperikal ditulis sebagai dan masing-masing, lalu
dan juga .
Sekarang, untuk apa saja , kita bisa tunjukkan itu . Buktikan ini dengan kontradiksi - Misalkan ada di mana ini tidak berlaku dan menunjukkan bahwa harus ada pasangan untuk itu .
Jadi, untuk semua .
Catatan: Ada beberapa asumsi implisit dalam demonstrasi ini bahwa jumlah titik data terbatas. Saya kira dimungkinkan untuk memiliki set data tak terbatas dengan ukuran yang sama (yaitu kardinalitas). Saya cukup yakin hasilnya berlaku, tetapi jauh lebih tidak yakin tentang bukti hasil seperti itu.