Hyper-volume kontur dari Gaussian multivarian

8

Saya mencari assymptotic yang ( ) nilai (log dari penentu) kovarians dari % dari pengamatan dengan jarak Eucledian terkecil ke asal dalam sampel berukuran diambil dari, katakanlah , Gaussian standar bivariat.nαn

- Volume hiper-elips sebanding dengan faktor penentu matriks kovariansnya, maka judulnya--

--Dengan standar bivariat Gaussian, maksud saya mana adalah vektor 0 dengan panjang 2 dan adalah matriks identitas peringkat 2 .---N2(02,II2)02II2

Mudah dilihat dengan simulasi daripada saat sekitar :α=52/701.28

library(MASS)
n<-10000
p<-2
x<-mvrnorm(n,rep(0,p),diag(2))
h<-ceiling(0.714286*n)
p<-ncol(x)
w<-mahalanobis(x,rep(0,p),diag(p),inverted=TRUE) #These are eucledian distances, because the covariance used is the identity matrix
s<-(1:n)[order(w)][1:h]
log(det(cov(x[s,])))

tapi saya tidak ingat bagaimana mendapatkan ekspresi yang tepat (atau gagal itu, perkiraan yang lebih baik) untuk ini.

pengguna603
sumber
1
Dalam teks Anda, Anda tidak mengatakan apa-apa tentang parameter distribusi bivariat. Juga, sepertinya kode Anda adalah tentang Mahalanobis d, bukan Euclidean d.
ttnphns
1
Dengan standar gaussian yang saya maksud adalah yang berpusat pada titik asal dan dengan kovarian Identitas (saya akan mengeditnya). Jarak mahalanobis ke matriks kovarians Identitas == Jarak Eucledian.
user603
1
Jika Anda menggunakan kode, atau mencari bantuan dengan kode, harap sebutkan bahasa atau program apa yang Anda gunakan.
serigala

Jawaban:

7

Ok, pertanyaan ini sepertinya muncul dari waktu ke waktu jadi saya pikir saya akan memberikan jawaban umum.

Dalam [1], penulis menunjukkan bahwa jika dengan symmetric positive definite positive, danxxiNp(μμ,ΣΣ),i=1,,nΣSα

(0)Sα={i:(xxiμμ)Σ1(xxiμμ)qα}

untuk danqα=χp2(α),0<α1

(1)Cα=coviSαxxi

Kemudian, asimptotik, konvergen ke manaCαlαΣ

(2)lα=Fχp+22(qα)α

Perkiraan ini sangat bagus (di sini untuk alpha = 60/70):

library(MASS)
alpha<-60/70
p<-2
n<-1000000

radius<-sqrt(qchisq(alpha,df=p))
x0<-mvrnorm(n,rep(0,p),diag(p),empirical=TRUE)
Id<-which(rowSums(x0*x0)<=radius**2)
cov(x0[Id,])

qalpa<-qchisq(alpha,p)
diag(1/(alpha/(pchisq(qalpa,p+2))),p)

Jadi, akhirnya, untuk menjawab pertanyaan, penentu dari matriks kovarians dari pengamatan dengan norma Eucledian terkecil dengan asal (ini adalah kasus khusus di mana dan ) diberikan oleh:log[αn]Σ=IIpμμ=00p

(3)plogFχp+22(qα)plogα
  1. Croux C., Haesbroeck G. (1999). Pengaruh fungsi dan efisiensi estimator matriks penentu kovariansi penentu minimum. Jurnal Analisis Multivariat. 71. 161--190.
pengguna603
sumber