Biarkan diambil iid dari distribusi t Student dengan derajat kebebasan, untuk berukuran sedang (misalkan kurang dari 100). Tentukan Apakah didistribusikan hampir sebagai chi-square dengan k derajat kebebasan? Apakah ada sesuatu seperti Central Limit Theorem untuk jumlah variabel acak kuadrat? n n T = ∑ 1 ≤ i ≤ k t 2 i T k
chi-squared
central-limit-theorem
t-distribution
shabbychef
sumber
sumber
Jawaban:
Menjawab pertanyaan pertama.
Kita bisa mulai dari fakta yang dicatat oleh mpiktas, bahwat2∼ F( 1 , n ) . Dan kemudian coba langkah yang lebih sederhana pada awalnya - cari distribusi sejumlah dua variabel acak yang didistribusikan oleh F( 1 , n ) . Ini dapat dilakukan dengan menghitung lilitan dua variabel acak, atau menghitung produk dari fungsi karakteristiknya.
The Artikel oleh PCB Phillips menunjukkan bahwa tebakan pertama saya tentang "[terimpit] fungsi hipergeometrik yang terlibat" itu memang benar. Ini berarti bahwa solusinya tidak akan sepele, dan kekuatan kasarnya rumit, tetapi kondisi yang diperlukan untuk menjawab pertanyaan Anda. Jadi karenan sudah diperbaiki dan Anda meringkas distribusi-t, kami tidak dapat mengatakan dengan pasti apa hasil akhirnya. Kecuali seseorang memiliki keterampilan bermain dengan produk-produk dari fungsi hypergeometrik konfluen.
sumber
Itu bahkan bukan perkiraan dekat. Untuk kecil , harapan sama dengan sedangkan harapan sama dengan . Ketika kecil (kurang dari 10, katakanlah) histogram dari dan bahkan tidak memiliki bentuk yang sama, yang menunjukkan bahwa menggeser dan mengubah ukuran tetap tidak akan kerja.T k nn T χ2(k)kklog(T)log(χ2(k))Tk nn - 2 χ2( k ) k k log( T) log( χ2( k ) ) T
Secara intuitif, untuk derajat kebebasan yang rendah, Student berekor berat. Mengkuadratkan itu menekankan beratnya itu. Karena itu jumlah akan lebih miring - biasanya jauh lebih miring - daripada jumlah normal kuadrat ( ). Perhitungan dan simulasi membuktikan hal ini.χ 2t χ2
Ilustrasi (seperti yang diminta)
Setiap histogram menggambarkan simulasi independen 100.000 uji coba dengan derajat kebebasan ( ) dan rangkuman ( ) yang ditentukan , distandarisasi sebagaimana dijelaskan oleh @mpiktas. Nilai di baris bawah mendekati kasus . Dengan demikian Anda dapat membandingkan dengan dengan memindai setiap kolom.n k n = 9999 χ2 T χ2
Perhatikan bahwa standardisasi tidak dimungkinkan untuk karena momen yang sesuai bahkan tidak ada. Kurangnya stabilitas bentuk (saat Anda memindai dari kiri ke kanan melintasi baris apa pun atau dari atas ke bawah ke bawah kolom apa pun) bahkan lebih ditandai untuk .n < 5 n ≤ 4
sumber
Saya akan menjawab pertanyaan kedua. Teorema batas pusat adalah untuk setiap urutan iid, kuadrat atau tidak kuadrat. Jadi dalam kasus Anda jika cukup besar yang kita milikik
di mana dan masing-masing adalah rata-rata dan varian dari distribusi t Student kuadrat dengan derajat kebebasan. Perhatikan bahwa didistribusikan sebagai distribusi F dengan derajat kebebasan dan . Jadi kita bisa mengambil rumus untuk mean dan varian dari halaman wikipedia . Hasil akhirnya adalah:Et21 Var(t21) n t21 1 n
sumber