Distribusi jumlah kuadrat dari variabel acak T-didistribusikan

11

Saya melihat distribusi jumlah kuadrat dari variabel acak T-didistribusikan, dengan eksponen ekor . Di mana X adalah rv, transformasi Fourier untuk , memberi saya solusi untuk kuadrat sebelum konvolusi . αX2F(t)F(t)n

F(t)=0exp(itx2)((αα+x2)α+12α B(α2,12))dx

Dengan , solusinya mungkin tetapi sulit dan tidak mungkin untuk melakukan invers Fourier untuk . Jadi pertanyaannya adalah: apakah pekerjaan telah dilakukan pada distribusi varians sampel atau standar deviasi variabel acak T-distributed? (Itu akan menjadi StudentT apa Chi-square adalah untuk Gaussian). Terima kasih.α=3F(t)n

(Kemungkinan Solusi) Saya menemukan bahwa adalah Fisher terdistribusi, maka akan melihat jumlah variabel terdistribusi Fisher.X2F(1,α)

(Kemungkinan Solusi) Dari Fungsi Karakteristik rata-rata dijumlahkan memiliki sama pertama dua momen dari distribusi saat yang ada ini. Maka dengan u akar kuadrat dan melakukan perubahan variabel di dalam distribusi probabilitas, kepadatan deviasi standar variabel n-sampel T dapat didekati dengan: X 2 F ( n , α ) g ( u ) = 2 α α / 2 n n / 2 u n - 1 ( α + n u 2 ) - αnX2F(n,α)

g(u)=2αα/2nn/2un1(α+nu2)α2n2B(n2,α2)
Nero
sumber
1
F F ( 1 , α )T2 adalah -distributed. Rerata dan varians dari sejumlah variabel terdistribusi bebas siap diturunkan, tetapi distribusinya tidak tersedia dalam bentuk tertutup. Lihat pertanyaan ini untuk beberapa detail. Anda mungkin menemukan kertas tertaut berguna. Fungsi karakteristik juga diberikan pada halaman wikipedia untuk F. [Varians sampel variabel t-didistribusikan adalah pertanyaan yang agak berbeda.]FF(1,α)
Glen_b -Reinstate Monica

Jawaban:

7

Klarifikasi pertanyaan Anda (bagi saya tampaknya ada dua bagian yang terkait, tetapi berbeda): Anda mencari (1) distribusi jumlah variabel kuadrat independen acak, dan (2) pengambilan sampel distribusi varians (atau deviasi standar terkait) dari sampel acak yang diambil dari distribusi (mungkin alasan Anda untuk bertanya tentang (1)).t α t αn tαtα

Distribusi Jumlah Variabel Independentα

Jika adalah variabel acak (independen) dengan df, maka itu salah bahwa (yang adalah apa yang Anda klaim dalam "solusi" kedua Anda). Ini mudah diverifikasi dengan mempertimbangkan momen pertama masing-masing (momen pertama yang terakhir adalah kali yang pertama). Titαtαi=1nTi2F(n,α)n

Klaim dalam "kemungkinan solusi" pertama Anda sudah benar: . Daripada beralih ke fungsi karakteristik, saya pikir hasil ini lebih transparan ketika mempertimbangkan karakterisasi distribusi sebagai distribusi rasio mana adalah variabel normal standar dan adalah variabel chi-squared dengan derajat kebebasan, independen . Kuadrat rasio ini kemudian rasio dua variabel chi-kuadrat independen yang diskalakan oleh derajat kebebasan masing-masing yaitu denganTi2F(1,α)tZU/αZUαZV/1U/αV=Z2, yang merupakan karakterisasi standar dari distribusi (dengan pembilang df sama dengan 1 dan penyebut df sama dengan ).F(1,α)α

Mempertimbangkan catatan yang saya buat pada saat-saat pertama pada paragraf pertama di atas, mungkin kelihatannya klaim yang lebih baik adalah [Saya punya notasi sedikit disalahgunakan di sini dengan menggunakan ekspresi yang sama untuk distribusi serta variabel acak yang memiliki distribusi itu.]. Sementara saat-saat pertama cocok, momen-momen sentral kedua tidak (untuk varian dari ekspresi pertama kurang dari varian dari ekspresi yang terakhir) - jadi klaim ini juga salah. [Dikatakan demikian, menarik untuk mengamati bahwa , yang merupakan hasil yang kita harapkan ketika menjumlahkan kuadrat (standar) varian normal.]α > 4 lim α i=1nTi2nF(n,α)α>4limαnF(n,α)=χn2

Sampling Distribusi Variance Ketika Sampling dari Distribusitα

Mempertimbangkan apa yang telah saya tulis di atas, ungkapan yang Anda peroleh untuk "kepadatan deviasi standar variabel n-sampel T" tidak benar. Namun, bahkan jika adalah distribusi yang benar, deviasi standar bukan hanya akar kuadrat dari jumlah kuadrat (seperti yang tampaknya Anda gunakan untuk sampai pada kepadatan ). Sebagai gantinya Anda akan mencari distribusi sampling (skala) dari . Dalam kasus normal, LHS dari ungkapan ini dapat ditulis ulang sebagai jumlah variabel normal kuadrat (istilah di dalam kuadrat dapat ditulis ulang sebagai kombinasi linear dari variabel normal yang sekali lagi terdistribusi normal) yang mengarah ke akrabF(n,α)g(u)i=1n(TiT¯)2=i=1nTi2nT¯2χ2 distribusi. Sayangnya, kombinasi linear dari variabel (bahkan dengan derajat kebebasan yang sama) tidak didistribusikan sebagai , sehingga pendekatan yang sama tidak dapat dieksploitasi.tt

Mungkin Anda harus mempertimbangkan kembali apa yang ingin Anda tunjukkan? Dimungkinkan untuk mencapai tujuan menggunakan beberapa simulasi, misalnya. Namun, Anda mengindikasikan contoh dengan , situasi di mana hanya momen pertama yang terbatas, sehingga simulasi tidak akan membantu dengan perhitungan momen seperti itu. α=3F(1,α)

Markus D
sumber
Mark terima kasih; memang belitannya runtuh meskipun dua momen pertama dipertahankan. Akan mencoba Chi-square dan mengembalikan.
Nero
Saya mengulangi pertanyaan saya. Atau haruskah saya memposting modifikasi di tempat lain di halaman?
Nero
Nero - perubahan pada pertanyaan Anda akan muncul di pertanyaan. Anda selalu dapat memberi sinyal bagaimana pertanyaan berubah dalam pertanyaan jika itu membantu (meskipun perlu diingat bahwa seluruh riwayat edit pertanyaan dan jawaban tersedia jika diperlukan).
Glen_b -Reinstate Monica