Untuk memahami ini, Anda harus menyatakan versi pertama dari Teorema Limit Pusat. Inilah pernyataan "tipikal" dari teorema limit pusat:
Lindeberg – Lévy CLT. Misalkan X1,X2,… adalah urutan variabel acak iid dengan E[Xi]=μ dan Var[Xi]=σ2<∞ . Misalkan Sn:=X1+⋯+Xnn . Kemudian saat
nmendekati tak terhingga, variabel acakn−−√(Sn−μ)konvergen dalam distribusi kenormal(0,σ2)N(0,σ2)yaitu
n−−√((1n∑i=1nXi)−μ) →d N(0,σ2).
Jadi, bagaimana ini berbeda dari deskripsi informal, dan apa kesenjangannya? Ada beberapa perbedaan antara deskripsi informal Anda dan deskripsi ini, beberapa di antaranya telah dibahas dalam jawaban lain, tetapi tidak sepenuhnya. Jadi, kita dapat mengubahnya menjadi tiga pertanyaan spesifik:
- Apa yang terjadi jika variabel tidak terdistribusi secara identik?
- Bagaimana jika variabel memiliki varian tak terbatas, atau rata-rata tak terbatas?
- Seberapa pentingkah independensi?
Mengambil satu per satu,
Tidak terdistribusi secara identik , Hasil umum terbaik adalah versi Lindeberg dan Lyaponov dari teorema limit pusat. Pada dasarnya, selama standar deviasi tidak tumbuh terlalu liar, Anda bisa mendapatkan teorema batas pusat yang layak darinya.
Lyapunov CLT. [5] Misalkan nilai adalah urutan variabel acak independen, masing-masing dengan terbatas diharapkan μ i dan varians σ 2
Define: s 2 n = Σ n i = 1 σ 2 iX1,X2,…μiσ2s2n=∑ni=1σ2i
δ>0Xi-μi/snlimn→∞1s2+δn∑i=1nE[|Xi−μi|2+δ]=0Xi−μi/sn
1sn∑ni=1(Xi−μi) →d N(0,1).
Teorema Infinite Variance mirip dengan teorema limit pusat ada untuk variabel dengan varian infinite, tetapi kondisinya secara signifikan lebih sempit daripada teorema limit pusat biasa. Intinya, ekor dari distribusi probabilitas harus asimtotik ke untuk . Dalam hal ini, KTT berskala yang sesuai menyatu ke distribusi stabil Levy-Alpha .|x|−α−10<α<2
Pentingnya Kemandirian Ada banyak teorema limit pusat yang berbeda untuk sekuens non-independen . Mereka semua sangat kontekstual. Seperti yang ditunjukkan oleh Batman, ada satu untuk Martingales. Pertanyaan ini adalah bidang penelitian yang sedang berlangsung, dengan banyak variasi yang berbeda tergantung pada konteks minat tertentu. Pertanyaan tentang Pertukaran Matematika ini adalah pos lain yang terkait dengan pertanyaan ini.Xi
Meskipun saya cukup yakin bahwa itu telah dijawab sebelumnya, ini satu lagi:
Ada beberapa versi dari teorema limit pusat, yang paling umum adalah yang diberikan fungsi kepadatan probabilitas arbitrer, jumlah variabel akan didistribusikan secara normal dengan nilai rata-rata sama dengan jumlah nilai rata-rata, serta varians menjadi jumlah dari varian individual.
Kendala yang sangat penting dan relevan adalah bahwa mean dan varian pdf yang diberikan harus ada dan harus terbatas.
Jadi, ambil saja pdf apa pun tanpa nilai rata-rata atau varian - dan teorema batas pusat tidak akan berlaku lagi. Jadi, ambil distribusi Lorentzian misalnya.
sumber
Tidak, CLT selalu berlaku ketika asumsi itu berlaku. Kualifikasi seperti "dalam sebagian besar situasi" adalah referensi informal ke kondisi di mana CLT harus diterapkan.
Misalnya, kombinasi linear dari variabel independen dari distribusi Cauchy tidak akan bertambah hingga variabel terdistribusi normal . Salah satu alasannya adalah bahwa varians tidak terdefinisi untuk distribusi Cauchy , sementara CLT menempatkan kondisi tertentu pada varians, misalnya bahwa itu harus terbatas. Implikasi yang menarik adalah bahwa karena simulasi Monte Carlo dimotivasi oleh CLT, Anda harus berhati-hati dengan simulasi Monte Carlo ketika berhadapan dengan distribusi ekor gemuk, seperti Cauchy.
Perhatikan, bahwa ada versi umum dari CLT. Ia bekerja untuk varian tak terbatas atau tidak terdefinisi, seperti distribusi Cauchy. Tidak seperti banyak distribusi yang berperilaku baik, jumlah Cauchy yang dinormalisasi dengan benar tetap Cauchy. Itu tidak konvergen ke Gaussian.
By the way, tidak hanya Gaussian tetapi banyak distribusi lainnya memiliki lonceng berbentuk PDF, misalnya Student t. Itu sebabnya deskripsi yang Anda kutip cukup liberal dan tidak tepat, mungkin dengan sengaja.
sumber
Berikut adalah ilustrasi jawaban kerub, histogram 1e5 diambil dari sarana sampel berskala (dengan ) distribusi-t dengan dua derajat kebebasan, sehingga variansnya tidak ada .n−−√
Jika CLT berlaku, histogram untuk sebesar harus menyerupai kerapatan distribusi normal standar (yang, misalnya, memiliki kerapatan - pada puncaknya), yang ternyata tidak.n n=1000 1/2π−−√≈0.4
sumber
sd(x)
mendapatkan sesuatu yang, jika CLT berfungsi, konvergen oleh teorema Slutzky, ke varian N (0,1). Saya ingin membuat contoh sederhana, tetapi Anda tentu saja benar.Kasus sederhana di mana CLT tidak dapat menampung karena alasan yang sangat praktis, adalah ketika urutan variabel acak mendekati batas probabilitasnya secara ketat dari satu sisi . Ini ditemui misalnya dalam estimator yang memperkirakan sesuatu yang terletak pada batas.
Contoh standar di sini mungkin adalah estimasi dalam sampel iid Uniforms . Estimasi kemungkinan maksimum akan menjadi statistik urutan maksimum, dan ia akan mendekati hanya dari bawah: berpikir naif, karena batas probabilitasnya adalah , estimator tidak dapat memiliki distribusi "sekitar" - dan CLT adalah pergiU ( 0 , θ ) θ θ θθ U(0,θ) θ θ θ
Estimator yang diskalakan dengan benar memiliki distribusi terbatas - tetapi tidak dari "varietas CLT".
sumber
Anda dapat menemukan solusi cepat di sini.
Pengecualian untuk teorema batas pusat muncul
Ada beberapa pengecualian lain yang diuraikan dalam jawaban @chub.
Pertanyaan yang sama telah ditanyakan pada math.stackexchange . Anda dapat memeriksa jawabannya di sana.
sumber