Berapa jumlah dari varian t kuadrat?

20

Biarkan diambil iid dari distribusi t Student dengan derajat kebebasan, untuk berukuran sedang (misalkan kurang dari 100). Tentukan Apakah didistribusikan hampir sebagai chi-square dengan k derajat kebebasan? Apakah ada sesuatu seperti Central Limit Theorem untuk jumlah variabel acak kuadrat? n n T = 1 i k t 2 i T ktinn

T=1ikti2
Tk
shabbychef
sumber
@suncoolsu: ia mengatakan 'hampir' ...
shabbychef
permintaan maaf saya. tidak melihat itu.
suncoolsu

Jawaban:

14

Menjawab pertanyaan pertama.

Kita bisa mulai dari fakta yang dicatat oleh mpiktas, bahwa t2F(1,n) . Dan kemudian coba langkah yang lebih sederhana pada awalnya - cari distribusi sejumlah dua variabel acak yang didistribusikan oleh F(1,n) . Ini dapat dilakukan dengan menghitung lilitan dua variabel acak, atau menghitung produk dari fungsi karakteristiknya.

The Artikel oleh PCB Phillips menunjukkan bahwa tebakan pertama saya tentang "[terimpit] fungsi hipergeometrik yang terlibat" itu memang benar. Ini berarti bahwa solusinya tidak akan sepele, dan kekuatan kasarnya rumit, tetapi kondisi yang diperlukan untuk menjawab pertanyaan Anda. Jadi karena n sudah diperbaiki dan Anda meringkas distribusi-t, kami tidak dapat mengatakan dengan pasti apa hasil akhirnya. Kecuali seseorang memiliki keterampilan bermain dengan produk-produk dari fungsi hypergeometrik konfluen.

Dmitrij Celov
sumber
2
+1 untuk tautan, tidak tahu bahwa fungsi karakteristik distribusi F sangat rumit.
mpiktas
14

Itu bahkan bukan perkiraan dekat. Untuk kecil , harapan sama dengan sedangkan harapan sama dengan . Ketika kecil (kurang dari 10, katakanlah) histogram dari dan bahkan tidak memiliki bentuk yang sama, yang menunjukkan bahwa menggeser dan mengubah ukuran tetap tidak akan kerja.T k nnT χ2(k)kklog(T)log(χ2(k))Tknn2χ2(k)kklog(T)log(χ2(k))T

Secara intuitif, untuk derajat kebebasan yang rendah, Student berekor berat. Mengkuadratkan itu menekankan beratnya itu. Karena itu jumlah akan lebih miring - biasanya jauh lebih miring - daripada jumlah normal kuadrat ( ). Perhitungan dan simulasi membuktikan hal ini.χ 2tχ2


Ilustrasi (seperti yang diminta)

teks alternatif

Setiap histogram menggambarkan simulasi independen 100.000 uji coba dengan derajat kebebasan ( ) dan rangkuman ( ) yang ditentukan , distandarisasi sebagaimana dijelaskan oleh @mpiktas. Nilai di baris bawah mendekati kasus . Dengan demikian Anda dapat membandingkan dengan dengan memindai setiap kolom.nkn=9999χ2Tχ2

Perhatikan bahwa standardisasi tidak dimungkinkan untuk karena momen yang sesuai bahkan tidak ada. Kurangnya stabilitas bentuk (saat Anda memindai dari kiri ke kanan melintasi baris apa pun atau dari atas ke bawah ke bawah kolom apa pun) bahkan lebih ditandai untuk .n<5n4

whuber
sumber
Saya takut akan hal itu, tetapi saya berpikir bahwa penjumlahan akan menghasilkan ekor.
shabbychef
Saya juga berpikir untuk membuat semacam eksperimen Monte Carlo, mencoba melihat untuk apa dan aproksimasi bisa cukup dekat dengan , mungkin yang kita butuhkan di sini. Tetapi untuk kecil dan terutama itu akan menjadi ekor yang sangat berat. Mungkin Anda bisa menambahkan dua histogram ini di sini, hanya untuk orang malas seperti saya? nkχ2(k)k(n)kn
Dmitrij Celov
@ Dmitrij Simulasi cepat (butuh lebih banyak waktu untuk menggambar histogram), jadi saya menambahkan 12 dari mereka.
whuber
+1 untuk gambar. Ilustrasi selalu menyenangkan untuk dilihat.
Dmitrij Celov
7

Saya akan menjawab pertanyaan kedua. Teorema batas pusat adalah untuk setiap urutan iid, kuadrat atau tidak kuadrat. Jadi dalam kasus Anda jika cukup besar yang kita milikik

TkE(t1)2kVar(t12)N(0,1)

di mana dan masing-masing adalah rata-rata dan varian dari distribusi t Student kuadrat dengan derajat kebebasan. Perhatikan bahwa didistribusikan sebagai distribusi F dengan derajat kebebasan dan . Jadi kita bisa mengambil rumus untuk mean dan varian dari halaman wikipedia . Hasil akhirnya adalah:Et12Var(t12)nt121n

Tknn2k2n2(n1)(n2)2(n4)N(0,1)

mpiktas
sumber
1
T ^ 2 Hotelling: (f - d + 1) / fd T ^ 2 ∼ F (d, f + 1 - d)
DWin
1
@Din, tidak begitu yakin bahwa Hotelling benar-benar berlaku di sini. Paling tidak dari rumus dari halaman wikipedia tidak segera jelas bahwa dalam pertanyaan OP dapat direpresentasikan sebagai . Bisakah Anda menjelaskan lebih lanjut tentang ini? TT2TT2
mpiktas
akan mencari konvolusi , takut akan beberapa hal hypergeometric, tetapi harus diketahui di suatu tempat. F(1,n)+F(1,n)
Dmitrij Celov
Saya percaya itu mengurangi situasi Anda ketika matriks varians diagonal. Elemen off-diagonal dari sampel harus mendekati nol jika sampel berasal dari Normal, tetapi mungkin tidak persis nol jika dari t. Meskipun demikian, Anda meminta sesuatu perkiraan, jadi saya pikir jawabannya mungkin F di bawah ketentuan itu.
DWin
@DWin: memang terlihat seperti Hotelling dengan matriks kovarians diagonal, tapi saya agak bingung: dari prinsip pertama, sepertinya bukan jumlah RV akan didistribusikan seperti ...FF(1,n)F
shabbychef