Jika dan adalah dua vektor satuan acak independen di (didistribusikan secara seragam pada unit sphere), apa distribusi produk skalar mereka (produk titik) ?y R D x ⋅ y
Saya kira ketika menumbuhkan distribusi dengan cepat (?) Menjadi normal dengan rata-rata nol dan penurunan varians dalam dimensi yang lebih tinggi tetapi apakah ada rumus eksplisit untuk \ sigma ^ 2 (D) ? σ 2 (D)
Memperbarui
Saya menjalankan beberapa simulasi cepat. Pertama, menghasilkan 10.000 pasang vektor satuan acak untuk mudah untuk melihat bahwa distribusi produk titik mereka adalah Gaussian sempurna (sebenarnya sudah cukup Gaussian untuk ), lihat subplot di sebelah kiri. Kedua, untuk setiap mulai dari 1 hingga 10.000 (dengan langkah-langkah yang meningkat) saya menghasilkan 1000 pasangan dan menghitung variansnya. Log-log plot ditampilkan di sebelah kanan, dan jelas bahwa formula sangat baik didekati dengan . Perhatikan bahwa untuk dan rumus ini bahkan memberikan hasil yang tepat (tapi saya tidak yakin apa yang terjadi kemudian).
sumber
Jawaban:
Karena ( seperti yang terkenal ) distribusi seragam pada unit lingkup diperoleh dengan menormalisasi -variate distribusi normal dan titik produk vektor normalisasi adalah koefisien korelasi mereka, jawaban atas tiga pertanyaan adalah: D tSD - 1 D t
( ( D - 1 ) / 2 , ( D - 1 ) / 2 )u = ( t + 1 ) / 2 memiliki distribusi Beta .( ( D - 1 ) / 2 , ( D - 1 ) / 2 )
Varian dari sama dengan (seperti yang dispesifikasikan dalam pertanyaan).1 / Dt 1 / D
Distribusi standar mendekati normalitas pada tingkatO ( 1t O ( 1D) .
metode
The tepat distribusi produk titik vektor satuan mudah diperoleh geometris, karena ini adalah komponen dari vektor kedua arah pertama. Karena vektor kedua tidak tergantung pada yang pertama dan terdistribusi secara seragam pada unit sphere, komponennya dalam arah pertama terdistribusi sama seperti koordinat bola tersebut. (Perhatikan bahwa distribusi vektor pertama tidak masalah.)
Menemukan Kepadatan
Membiarkan koordinat itu sebagai yang terakhir, kerapatan pada karena itu sebanding dengan luas permukaan yang terletak pada ketinggian antara dan pada unit sphere. Proporsi itu terjadi dalam sabuk dengan ketinggian dan jari-jari yang pada dasarnya merupakan kerucut kerucut yang dibangun dari jari-jari dengan ketinggian , dan kemiringan . Dari mana probabilitas sebanding dengant t + d t d t √t∈[−1,1] t t+dt dt S D - 2 √1−t2−−−−−√, SD−2 dt1/ √1−t2−−−−−√, dt 1/1−t2−−−−−√
Membiarkan mencakup . Mengganti yang menjadi sebelumnya memberikan elemen probabilitas hingga konstanta normalisasi:t = 2 u - 1u=(t+1)/2∈[0,1] t=2u−1
Langsung bahwa memiliki distribusi Beta , karena (menurut definisi) kepadatannya juga sebanding dengan( ( D - 1 ) / 2 , ( D - 1 ) / 2 )u=(t+1)/2 ((D−1)/2,(D−1)/2)
Menentukan Perilaku Membatasi
Informasi tentang perilaku pembatasan mengikuti dengan mudah dari ini dengan menggunakan teknik dasar: dapat diintegrasikan untuk memperoleh konstanta proporsionalitas ; dapat diintegrasikan (menggunakan properti dari fungsi Beta, misalnya) untuk mendapatkan momen, menunjukkan bahwa variansnya adalah dan menyusut ke (dimana, menurut Teorema Chebyshev, probabilitas menjadi terkonsentrasi di dekat ); dan distribusi pembatas kemudian ditemukan dengan mempertimbangkan nilai-nilai kepadatan distribusi standar, sebanding dengan untuk nilai-nilai kecil dariΓ ( nfD tkfD(t)1/D0t=0fD(t/√Γ(n2)π√Γ(D−12) tkfD(t) 1/D 0 t = 0 tfD( t / D--√) , t :
di mana mewakili (log) konstanta integrasi. Jelas tingkat di mana ini mendekati normalitas (di mana kepadatan log sama dengan ) adalah- 1C O(1- 12t2 O ( 1D) .
Plot ini menunjukkan kerapatan produk titik untuk , sebagai standar untuk varian unit, dan kerapatan pembatasnya. Nilai meningkat dengan (dari biru hingga merah, emas, dan kemudian hijau untuk kerapatan normal standar). Kepadatan untuk tidak dapat dibedakan dari kepadatan normal pada resolusi ini.0 D D = 1000D = 4 , 6 , 10 0 D D = 1000
sumber
Mari kita cari distribusinya lalu variansnya mengikuti hasil standar. Pertimbangkan produk vektor dan tuliskan pada bentuk kosinusnya, yaitu perhatikan bahwa kita memiliki mana adalah sudut antara dan . Pada langkah terakhir saya telah menggunakannya untuk setiap kejadian danSekarang perhatikan istilah . Jelas bahwa karena dipilih secara seragam sehubungan dengan permukaan bola, tidak masalah apaθ x y A B E P ( A ∣ B ) : = E [ E [ χ
Untuk hasil yang jelas dari varians, gunakan fakta bahwa produk titik adalah nol rata-rata oleh independensi dan, seperti yang ditunjukkan di atas, didistribusikan seperti koordinat pertama . Dengan hasil ini, menemukan sama dengan menemukan . Sekarang, perhatikan bahwa per konstruksi dan jadi kita dapat menulis mana persamaan terakhir mengikuti dari mana koordinat didistribusikan secara identik. Menyatukan semuanya, kami telah menemukan bahwaVar ( x ′ y ) E x 2 1 x ′ x = 1 1 = E x ′ x = E n ∑ i = 1 x 2 i = n ∑ i = 1 E x 2 i = n E x 2 1 , x Var ( x ′ y ) = E x 2 1x Var ( x′y) E x21 x′x = 1
sumber
Untuk menjawab bagian pertama dari pertanyaan Anda, tunjukkan . Tentukan Produk dari elemen dari dan dilambangkan di sini sebagai akan didistribusikan sesuai dengan distribusi gabungan dari dan . lalu sejak ,Z=⟨X,Y⟩=∑XiYi
Untuk bagian kedua, saya berpikir bahwa jika Anda ingin mengatakan sesuatu yang menarik tentang perilaku asimtotik dari Anda harus setidaknya mengasumsikan independensi dan , dan kemudian menerapkan CLT.σ X Y
Misalnya, jika Anda mau berasumsi bahwa iid dengan dan Anda dapat katakan bahwa dan .{Z1,…,ZD} E[Zi]=μ V[Zi]=σ2 σ2(D)=σ2D limD→∞σ2(D)=0
sumber