Salah satu metode naif untuk mendekati distribusi normal adalah dengan menambahkan bersama-sama mungkin variabel acak IID yang terdistribusi secara seragam pada , kemudian masuk kembali dan skala, bergantung pada Teorema Batas Pusat. ( Catatan : Ada metode yang lebih akurat seperti transformasi Box-Muller .) Jumlah variabel acak IID dikenal sebagai distribusi jumlah seragam atau distribusi Irwin-Hall .[ 0 , 1 ]
Berapa besar kesalahan dalam memperkirakan distribusi jumlah seragam dengan distribusi normal?
Kapan pun jenis pertanyaan ini muncul untuk mendekati jumlah variabel acak IID, orang-orang (termasuk saya) memunculkan Teorema Berry – Esseen , yang merupakan versi efektif dari Teorema Batas Pusat mengingat bahwa momen ketiga ada:
di mana adalah fungsi distribusi kumulatif untuk jumlah yang dihitung kembali dari variabel acak IID, adalah momen sentral ketiga mutlak, adalah standar deviasi, dan adalah konstanta absolut yang dapat dianggap 1 atau bahkan 1/2 . n ρ E | ( X - E X ) 3 | σ C 1 1 / 2
Ini tidak memuaskan. Tampak bagi saya bahwa perkiraan Berry-Esseen paling dekat dengan tajam pada distribusi binomial yang terpisah, dengan kesalahan terbesar pada untuk distribusi binomial simetris. Kesalahan terbesar terjadi pada lompatan terbesar. Namun, distribusi jumlah seragam tidak memiliki lompatan.
Tes numerik menunjukkan bahwa kesalahan menyusut lebih cepat daripada .
Menggunakan , estimasi Berry – Esseen adalah
yang untuk sekitar , , dan , masing-masing. Perbedaan maksimum sebenarnya untuk tampaknya masing-masing sekitar , , dan , yang jauh lebih kecil dan tampaknya jatuh sebagai bukannya .
sumber
Jawaban:
Misalkan menjadi iid variabel acak dan pertimbangkan jumlah dinormalisasi dan norm mana adalah distribusi .U ( - b , b ) S n = √U1, U2, ... U( - b , b ) sup δ n = sup x ∈ R | F n ( x ) - Φ ( x ) |
Lemma 1 ( Uspensky ): berikut pada memegang . δ n < 1δn
Bukti . Lihat JV Uspensky (1937), Pengantar probabilitas matematika , New York: McGraw-Hill, hal. 305.
Ini kemudian diperbaiki oleh R. Sherman sebagai berikut.
Lemma 2 ( Sherman ): Peningkatan berikut ini berlaku untuk Uspensky.
Bukti : Lihat R. Sherman, Kesalahan perkiraan normal dengan jumlah variabel acak N , Biometrika , vol. 58, tidak. 2, 396–398.
Buktinya adalah aplikasi yang cukup mudah dari ketidaksetaraan segitiga dan batas klasik pada ekor distribusi normal dan pada diterapkan pada fungsi karakteristik masing-masing dari dua distribusi.( dosax ) / x
sumber