Statistik pesanan (mis., Minimum) koleksi tak terbatas dari varian chi-square?

11

Ini adalah pertama kalinya saya di sini, jadi tolong beri tahu saya jika saya dapat mengklarifikasi pertanyaan saya dengan cara apa pun (termasuk pemformatan, tag, dll.). (Dan mudah-mudahan saya dapat mengedit nanti!) Saya mencoba mencari referensi, dan mencoba menyelesaikan sendiri menggunakan induksi, tetapi gagal pada keduanya.

Saya mencoba menyederhanakan distribusi yang tampaknya mereduksi menjadi statistik pesanan dari serangkaian variabel independen independen tak terbatas χ2dengan derajat kebebasan yang berbeda; khusus, apa distribusi m th nilai terkecil di antara independen χ22,χ42,χ62,χ82, ?

Saya akan tertarik pada kasus khusus m=1 : berapakah distribusi minimum (independen) χ22,χ42,χ62, ?

Untuk kasus minimum, saya dapat menulis fungsi distribusi kumulatif (CDF) sebagai produk tanpa batas, tetapi tidak dapat menyederhanakannya lebih lanjut. Saya menggunakan fakta bahwa CDF χ2m2 adalah

F2m(x)=γ(m,x/2)/Γ(m)=γ(m,x/2)/(m1)!=1ex/2k=0m1xk/(2kk!).
(Denganm=1, ini mengkonfirmasi komentar kedua di bawah ini tentang ekuivalensi dengan distribusi eksponensial dengan harapan 2.) CDF minimum kemudian dapat ditulis sebagai= 1 - m = 1 ( e - x / 2 m - 1 k = 0 x k
Fmin(x)=1(1F2(x))(1F4(x))=1m=1(1F2m(x))
=1m=1(ex/2k=0m1xk2kk!).
Istilah pertama dalam produk hanyaex/2, dan istilah "terakhir" adalahex/2k=0xk/(2kk!)=1. Tetapi saya tidak tahu bagaimana (jika mungkin?) Menyederhanakannya dari sana. Atau mungkin pendekatan yang sama sekali berbeda lebih baik.

Lain pengingat berpotensi membantu: adalah sama dengan distribusi eksponensial dengan harapan 2, dan χ 2 4 adalah jumlah dari dua eksponensial seperti, dllχ22χ42

Jika ada yang ingin tahu, saya mencoba untuk menyederhanakan Teorema 1 dalam makalah ini untuk kasus regresi pada konstanta ( untuk semua i ). (Saya memiliki distribusi χ 2 alih-alih Γ karena saya telah dikalikan dengan 2 κ .)xi=1iχ2Γ2κ

David M Kaplan
sumber
Apakah ini menjawab pertanyaan Anda?
mpiktas
χ22χ42,χ62,
1
Xkλ/2k=1,2,1Fmin(λ)Xkk
1
T1,T2,Exp(1/2)1 / = P ( N ( t ) i )N(t):=sup{n:i=1nTit}1/2U1=T1U2=T2+T3U3=T4+T5+T6Uiχ2i2bersifat independen dan oleh properti kenaikan-independen stasioner dari proses Poisson, kami memiliki . P(Uit)=P(N(t)i)
kardinal
@ Cardinal Tentu saja: itu cara yang bagus untuk melihatnya. Keingintahuan tidak ada dalam hubungan antara Poissons dan Gammas; itu terletak pada deskripsi acara itu sendiri!
whuber

Jawaban:

8

Nol dari produk tanpa batas akan menjadi gabungan dari nol syarat. Komputasi ke istilah 20 menunjukkan pola umum:

plot nol kompleks

Plot angka nol dalam bidang kompleks ini membedakan kontribusi dari masing-masing istilah dalam produk dengan menggunakan simbol yang berbeda: pada setiap langkah, kurva yang terlihat diperpanjang lebih jauh dan kurva baru dimulai lebih jauh ke kiri.

Kompleksitas dari gambar ini menunjukkan tidak ada solusi bentuk-tertutup dalam hal fungsi-fungsi analisis tinggi yang terkenal (seperti gammas, thetas, fungsi hypergeometrik, dll., Serta fungsi-fungsi dasar, seperti yang disurvei dalam teks klasik seperti Whittaker & Watson ).

Dengan demikian, masalahnya mungkin lebih banyak diajukan secara berbeda : apa yang perlu Anda ketahui tentang distribusi statistik pesanan? Perkiraan fungsi karakteristiknya? Momen pesanan rendah? Perkiraan terhadap kuantil? Sesuatu yang lain

whuber
sumber
Mengapa nol dari produk itu penting? Saya merasa saya kehilangan sesuatu yang sepele.
mpiktas
2
@mp Nol dan kutub menunjukkan sesuatu tentang kompleksitas fungsi. Fungsi rasional memiliki jumlah yang terbatas. Fungsi dasar biasanya memiliki garis nol, seperti pada , integral, untuk ; fungsi "transendental" yang khas memiliki pola nol yang sedikit lebih rumit, seperti semua bilangan bulat non-positif (kebalikan dari fungsi Gamma) atau pada kisi titik (fungsi theta dan fungsi elips). Pola rumit yang diperlihatkan di sini menunjukkan bahwa akan sulit atau tidak mungkin untuk mengekspresikan CDF dalam hal fungsi-fungsi yang sudah dikenal ini. 2iπnnexp()
whuber
2
@whuber (1/2), terima kasih! Saya tidak tahu tentang berbagai kelas fungsi yang memiliki pola nol yang berbeda di bidang kompleks; kedengarannya sangat berguna, dan grafik Anda tampaknya menjawab pertanyaan saya (seperti yang diajukan).
David M Kaplan
@whuber (2/2), ini sedang memeriksa kasus khusus dari distribusi (rumit) estimator yang diberikan dalam makalah lain. Mereka menggunakan keberadaan distribusi untuk membenarkan menggunakan bootstrap; penasihat saya menyarankan agar saya mencoba memperkirakan distribusi. Sepertinya distribusi mereka mungkin tidak aktif untuk kasus khusus ini (di mana saya tahu apa yang seharusnya), jadi saya akan memeriksa bersama penasihat saya setelah batas waktu pemberiannya; tetapi berpotensi, saya akan mencoba untuk mengambil ekspansi orde tinggi dari urutan ke- (dibagi dengan ) sebagai , dalam pengaturan yang lebih rumit. Akan memposting lagi jika demikian; Terima kasih lagi! mmm
David M Kaplan
4

berapakah distribusi minimum (independen) ?χ22,χ42,χ62,

Permintaan maaf karena datang terlambat 6 tahun. Meskipun OP mungkin sekarang pindah ke masalah lain, pertanyaannya tetap segar, dan saya pikir saya mungkin menyarankan pendekatan yang berbeda.


Kita diberikan mana mana dengan pdf's :(X1,X2,X3,)XiChisquared(vi)vi=2ifi(xi)

masukkan deskripsi gambar di sini

Berikut ini adalah plot dari pdf terkait , karena ukuran sampel meningkat, untuk :i = 1  hingga  8fi(xi)i=1 to 8

masukkan deskripsi gambar di sini

Kami tertarik pada distribusi .min(X1,X2,X3,)

Setiap kali kita menambahkan istilah tambahan, pdf dari marginal last term ditambahkan bergeser semakin jauh ke kanan, sehingga efek menambahkan semakin banyak istilah menjadi tidak hanya semakin kurang relevan, tetapi setelah hanya beberapa istilah , menjadi hampir dapat diabaikan - pada minimum sampel. Ini berarti, pada dasarnya, bahwa hanya sejumlah kecil istilah yang benar-benar penting ... dan menambahkan istilah tambahan (atau keberadaan jumlah tak terbatas istilah) sebagian besar tidak relevan untuk masalah minimum sampel.

Uji

Untuk menguji ini, saya telah menghitung pdf dari menjadi 1 term, 2 term, 3 terms, 4 terms, 5 terms, 6 terms, 7 terms, 8 terms, ke 9 istilah, dan ke 10 istilah. Untuk melakukan ini, saya telah menggunakan fungsi dari mathStatica , menginstruksikannya di sini untuk menghitung pdf dari sampel minimum ( statistik urutan dalam sampel ukuran , dan di mana parameter (sebagai gantinya sedang diperbaiki) adalah :1 st j i v imin(X1,X2,X3,)OrderStatNonIdentical1stjivi

masukkan deskripsi gambar di sini masukkan deskripsi gambar di sini

Itu menjadi sedikit rumit karena jumlah persyaratan meningkat ... tapi saya telah menunjukkan output untuk 1 istilah (baris 1), 2 istilah (baris kedua), 3 istilah (baris 3) dan 4 istilah di atas.

Diagram berikut membandingkan pdf dari sampel minimum dengan 1 suku (biru), 2 suku (oranye), 3 suku, dan 10 suku (merah). Perhatikan betapa mirip hasilnya dengan hanya 3 istilah vs 10 istilah: masukkan deskripsi gambar di sini

Diagram berikut membandingkan 5 istilah (biru) dan 10 istilah (oranye) - plotnya sangat mirip, mereka saling melenyapkan, dan satu bahkan tidak dapat melihat perbedaannya:

masukkan deskripsi gambar di sini

Dengan kata lain, meningkatkan jumlah istilah dari 5 menjadi 10 hampir tidak memiliki dampak visual yang dapat dilihat pada distribusi minimum sampel.

Perkiraan Setengah-Logistik

Akhirnya, perkiraan sederhana yang sangat baik dari pdf dari sampel min adalah distribusi setengah-Logistik dengan pdf:

g(x)=2ex(ex+1)2 for x>0

Diagram berikut membandingkan solusi yang tepat dengan 10 istilah (yang tidak dapat dibedakan dari 5 istilah atau 20 istilah) dan perkiraan setengah-Logistik (putus-putus):

masukkan deskripsi gambar di sini

Meningkat menjadi 20 istilah tidak membuat perbedaan nyata.

serigala
sumber