Distribusi sampel dari jari-jari distribusi normal 2D

11

Distribusi normal bivariat dengan mean dan matriks kovarians \ Sigma dapat ditulis ulang dalam koordinat polar dengan jari-jari r dan sudut \ theta . Pertanyaan saya adalah: Apa distribusi sampling \ hat {r} , yaitu, dari jarak dari titik x ke estimasi pusat \ bar {x} diberi matriks kovarian sampel S ?μΣrr x ˉ x Sθr^xx¯S

Latar Belakang: Jarak sebenarnya r dari titik x ke mean μ mengikuti distribusi Hoyt . Dengan nilai eigen λ1,λ2 dari Σ , dan λ1>λ2 , parameter bentuknya adalah q=1(λ1+λ2)/λ2)1 , dan parameter skalanya adalah ω=λ1+λ2 . Fungsi distribusi kumulatif dikenal sebagai perbedaan simetris antara dua fungsi-Marcum.

Simulasi menunjukkan bahwa memasukkan perkiraan x¯ dan S untuk μ dan Σ ke dalam cdf yang sebenarnya berfungsi untuk sampel besar, tetapi tidak untuk sampel kecil. Diagram berikut menunjukkan hasil dari 200 kali

  • mensimulasikan 20 vektor normal 2D untuk setiap kombinasi dari q yang diberikan q( x -aksi), ω (baris), dan kuantil (kolom)
  • untuk setiap sampel, menghitung kuantil tertentu dari radius yang diamati r^ sampai x¯
  • untuk setiap sampel, menghitung kuantil dari Hoyt teoritis (2D normal) cdf, dan dari cdf Rayleigh teoritis setelah menghubungkannya dengan perkiraan sampel x¯ dan S .

masukkan deskripsi gambar di sini

Saat mendekati 1 (distribusinya menjadi melingkar), estimasi Hoyt quantiles mendekati perkiraan Rayleigh quantiles yang tidak terpengaruh oleh . Ketika tumbuh, perbedaan antara kuantil empiris dan yang diperkirakan meningkat, terutama di bagian ujung distribusi.qqω

caracal
sumber
1
Apa pertanyaannya?
John
@ John I menyoroti pertanyaan: "Berapakah distribusi sampling dari [radius] , yaitu, dari jarak dari titik ke perkiraan pusat diberi matriks convariance matrix ?" rxx¯S
caracal
Mengapa berlawanan dengan ? r^r2^
SomeEE
@ Madath hanya karena literatur yang saya tahu berkaitan dengan distribusi (true) , bukan (true) . Perhatikan bahwa ini tidak seperti situasi dengan jarak Mahalanobis yang dibahas dalam pertanyaan ini . Tentu saja, hasil untuk distribusi akan sangat disambut. rr2 r 2r^rr2r^2
caracal

Jawaban:

7

Seperti yang Anda sebutkan di pos Anda, kami tahu distribusi estimasi jika kami diberikan sehingga kami tahu distribusi estimasi dari true . μ ^ r 2 t r u e r2rtrue^μrtrue2^r2

Kami ingin menemukan distribusi mana diekspresikan sebagai vektor kolom.xi

r2^=1Ni=1N(xix¯)T(xix¯)
xi

Kami sekarang melakukan trik standar

rtrue2^=1Ni=1N(xiμ)T(xiμ)=1Ni=1N(xix¯+x¯μ)T(xix¯+x¯μ)=[1Ni=1N(xix¯)T(xix¯)]+(x¯μ)T(x¯μ)(1)=r2^+(x¯μ)T(x¯μ)
mana muncul dari persamaan dan transposnya.(1)
1Ni=1N(xix¯)T(x¯μ)=(x¯x¯)T(x¯μ)=0

Perhatikan bahwa adalah jejak dari matriks kovarian sampel dan hanya bergantung hanya pada mean sampel . Jadi kita telah menulis sebagai jumlah dari dua variabel acak independen. Kita tahu distribusi dan dan jadi kita selesai melalui trik standar menggunakan itu fungsi karakteristiknya multiplikatif.r2^S(x¯μ)T(x¯μ)x¯

rtrue2^=r2^+(x¯μ)T(x¯μ)
rtrue2^(x¯μ)T(x¯μ)

Diedit untuk menambahkan:

||xiμ||adalah Hoyt sehingga memiliki pdf mana adalah fungsi Bessel dimodifikasi dari jenis pertama .

f(ρ)=1+q2qωρe(1+q2)24q2ωρ2IO(1q44q2ωρ2)
I00th

Ini berarti pdf dari adalah ||xiμ||2

f(ρ)=121+q2qωe(1+q2)24q2ωρI0(1q44q2ωρ).

Untuk memudahkan notasi, atur , dan .a=1q44q2ωb=(1+q2)24q2ωc=121+q2qω

Fungsi penghasil momen adalah ||xiμ||2

{c(sb)2a2(sb)>a0 else

Dengan demikian fungsi penghasil momen dari adalah dan fungsi penghasil momen adalah rtrue2^

{cN((s/Nb)2a2)N/2(s/Nb)>a0else
||x¯μ||2
{Nc(sNb)2(Na)2=c(s/Nb)2a2(s/Nb)>a0 else

Ini menyiratkan bahwa fungsi pembangkit momen adalah r2^

{cN1((s/Nb)2a2)(N1)/2(s/Nb)>a0 else.

Menerapkan transformasi Laplace terbalik memberikan bahwa memiliki pdf r2^

g(ρ)=πNcN1Γ(N12)(2iaNρ)(2N)/2ebNρJN/21(iaNρ).
SomeEE
sumber
Terima kasih! Saya harus mengerjakan rinciannya sebelum menerima.
caracal
rtrue2^Hoyt , dan ? Maka fungsi karakteristik adalah produk dari dua fungsi karakteristik seperti dijelaskan di sini . Itu memang menjawab pertanyaan saya. Apakah Anda tahu bagaimana kami dapat mengubah sedemikian rupa sehingga distribusinya diketahui tanpa akses ke ? Seperti jarak Mahalanobis, atau statistik univariat ? ||x¯μ||2N(0,1NΣ)r2^r2^Σt
caracal
Saya telah mengedit jawaban saya untuk jawaban lengkap. Tolong beri tahu saya jika Anda setuju.
SomeEE
Saya tidak yakin tentang tidak diketahui . Hal yang jelas harus dilakukan adalah mencoba untuk "membagi" dengan sampel kovarian yang akan terlihat seperti jumlah jarak Mahalanobis, yaitu pertimbangkan . Sayangnya jumlah ini selalu . Σr2^S1Ni=1N(xix¯)TS1(xix¯)1
SomeEE
Terima kasih untuk terus mengerjakan jawabannya! Saya tidak yakin tentang distribusi . Saya tidak bisa melakukan kesepakatan dengan ini analitis, tetapi simulasi cepat memberikan distribusi yang berbeda dari : R kode simulasi . Meskipun bisa jadi saya tidak mengerti dengan benar parametrization . r 2 Γ ( q , ω||xiμ||2r2ΓΓ(q,ωq)Γ
caracal