Saya tertarik pada versi Cantelli satu sisi tentang ketidaksetaraan Chebyshev :
Pada dasarnya, jika Anda mengetahui mean dan varians populasi, Anda dapat menghitung batas atas pada probabilitas mengamati nilai tertentu. (Setidaknya itu adalah pemahaman saya.)
Namun, saya ingin menggunakan mean sampel dan varians sampel daripada mean populasi aktual dan varians.
Saya menduga bahwa karena ini akan menimbulkan lebih banyak ketidakpastian, batas atas akan meningkat.
Apakah ada ketidaksamaan analog dengan di atas, tetapi yang menggunakan mean dan varians sampel?
Sunting : "Sampel" analog dari Chebyshev Ketimpangan (tidak satu sisi), telah dikerjakan. The halaman Wikipedia memiliki beberapa rincian. Namun, saya tidak yakin bagaimana ini akan diterjemahkan ke satu sisi kasus yang saya miliki di atas.
Jawaban:
Ya, kita bisa mendapatkan hasil yang analog menggunakan mean sampel dan varians, dengan mungkin, beberapa kejutan kecil muncul dalam proses.
Pertama, kita perlu sedikit memperbaiki pernyataan pertanyaan dan menetapkan beberapa asumsi. Yang penting, harus jelas bahwa kita tidak bisa berharap untuk mengganti varians populasi dengan varians sampel di sisi kanan karena yang terakhir adalah acak ! Jadi, kami memfokuskan kembali perhatian kami pada ketimpangan setara Dalam hal tidak jelas bahwa ini adalah setara, perhatikan bahwa kami hanya mengganti t dengan t σ dalam ketidaksetaraan awal tanpa kehilangan secara umum.
Kedua, kita asumsikan bahwa kita memiliki sampel acak dan kami tertarik dalam batas atas untuk analog kuantitas P ( X 1 - ˉ X ≥ t S ) , di mana ˉ X adalah sampel mean dan S adalah standar deviasi sampel.X1,…,Xn P(X1−X¯≥tS) X¯ S
Setengah langkah ke depan
Versi sampel Chebyshev satu sisi
Kemudian, karena dan .
Sisi kanan adalah konstanta ( ! ), Jadi dengan mengambil ekspektasi pada hasil kedua sisi, Akhirnya, meminimalkan lebih dari , menghasilkan , yang setelah sedikit aljabar menetapkan hasilnya.
Kondisi teknis yang sial itu
Perhatikan bahwa kita harus mengasumsikan agar dapat dibagi dengan dalam analisis. Ini bukan masalah untuk distribusi yang benar-benar kontinu, tetapi menimbulkan ketidaknyamanan untuk yang terpisah. Untuk distribusi diskrit, ada beberapa kemungkinan bahwa semua pengamatan adalah sama, dalam hal ini untuk semua dan .P(S=0)=0 S2 0=Yi=tS=0 i t>0
Kita dapat menggoyangkan jalan keluar kita dengan menetapkan . Kemudian, perhitungan argumen yang cermat menunjukkan bahwa semuanya berjalan hampir tidak berubah dan kita dapatkanq=P(S=0)
Bukti . Berpisah pada acara dan . Bukti sebelumnya berlaku untuk dan case sepele.{S>0} {S=0} {S>0} {S=0}
Ketidaksetaraan sedikit lebih baik jika kita mengganti ketidaksetaraan nonstrik dalam pernyataan probabilitas dengan versi yang ketat.
Pernyataan akhir : Versi sampel ketimpangan yang diperlukan tidak ada asumsi (selain itu tidak hampir-pasti konstan dalam kasus nonstrict ketimpangan, yang versi aslinya juga diam-diam mengasumsikan), pada dasarnya, karena sampel mean dan sampel varians selalu ada apakah analog populasi mereka lakukan atau tidak.X
sumber
Ini hanyalah pelengkap jawaban cerdas @ cardinal. Samuelson Inequality , menyatakan bahwa, untuk sampel ukuran , ketika kita memiliki setidaknya tiga nilai berbeda dari terealisasi , ia menyatakan bahwa mana dihitung tanpa koreksi bias, .n xi
Kemudian, menggunakan notasi jawaban Kardinal kita dapat menyatakan itu
Karena kita memerlukan, tiga nilai berbeda, kita akan memiliki dengan asumsi. Jadi pengaturan dalam Ketidaksetaraan Cardinal (versi awal) kita dapatkanS≠0 t=n−1−−−−−√
Eq. tentu saja kompatibel dengan persamaan. . Kombinasi keduanya memberi tahu kita bahwa Ketimpangan Kardinal berguna sebagai pernyataan probabilistik untuk .[2] [1] 0<t<n−1−−−−−√
Jika Ketidaksetaraan Kardinal mengharuskan untuk dihitung bias-dikoreksi (sebut ini ) maka persamaan menjadiS S~
dan kami memilih untuk diperoleh melalui Ketimpangan Kardinalt=n−1n√
sumber