Bagaimana menemukan perbedaan antara titik-titik multidimensi?

12

Misalkan saya memiliki matriks X yang n oleh p, yaitu ia memiliki n pengamatan, dengan masing-masing pengamatan dalam ruang p-dimensi.

Bagaimana cara menemukan varians dari n pengamatan ini?

Dalam kasus di mana p = 1, saya hanya perlu menggunakan rumus varian biasa. Bagaimana dengan kasus di mana p> 1.

statnub
sumber

Jawaban:

18

pX=(X1,,Xp)

Var(X)=E[(XEX)(XEX)]=(Var(X1)Cov(X1,Xp)Cov(Xp,X1)Var(Xp))

Yaitu, varians dari vektor acak didefinisikan sebagai matriks yang menyimpan semua varians pada diagonal utama dan kovarian antara komponen yang berbeda dalam elemen lainnya. Matriks kovarian sampel kemudian akan dihitung dengan memasukkan sampel analog untuk variabel populasi:p×p

XijijˉXjj

1n1(i=1n(Xi1X¯1)2i=1n(Xi1X¯1)(XipX¯p)i=1n(XipX¯p)(Xi1X¯1)i=1n(XipX¯p)2)
mana menunjukkan pengamatan ke- untuk fitur dan rata-rata sampel dariXijijX¯jjfitur th. Singkatnya, varians dari vektor acak didefinisikan sebagai matriks yang berisi varians individu dan kovarian. Oleh karena itu cukup untuk menghitung varians sampel dan kovariansi untuk semua komponen vektor secara individual.
Philipp Burckhardt
sumber