Penyebut penduga varians (tidak bias) adalah karena ada pengamatan dan hanya satu parameter yang diperkirakan.
Dengan cara yang sama saya bertanya-tanya mengapa penyebut kovarians tidak menjadi ketika dua parameter diperkirakan?
Penyebut penduga varians (tidak bias) adalah karena ada pengamatan dan hanya satu parameter yang diperkirakan.
Dengan cara yang sama saya bertanya-tanya mengapa penyebut kovarians tidak menjadi ketika dua parameter diperkirakan?
Jawaban:
Varian adalah varian.
Karena dengan identitas polarisasi
penyebutnya harus sama.
sumber
Kasus khusus harus memberi Anda intuisi; pikirkan hal-hal berikut:
Anda senang bahwa yang terakhir adalah karena koreksi Bessel.∑ni=1(Xi−X¯¯¯¯¯)2n−1
Tetapi mengganti dengan X di ^ C o v ( X , Y ) untuk yang pertama memberi ∑ n i = 1 ( X i - ¯ X ) ( X i - ¯ XY X Cov^(X,Y) , jadi apa yang menurut Anda paling baik mengisi kekosongan?∑ni=1(Xi−X¯¯¯¯¯)(Xi−X¯¯¯¯¯)mystery denominator
sumber
Jawaban cepat dan kotor ... Mari kita pertimbangkan dulu ; jika Anda memiliki n pengamatan dengan nilai ekspektasi yang diketahui E ( X ) = 0 Anda akan menggunakan 1var(X) n E(X)=0 untuk memperkirakan varians.1n∑ni=1X2i
Nilai yang diharapkan tidak diketahui, Anda dapat mengubah pengamatan Anda menjadi pengamatan n - 1 dengan nilai harapan yang diketahui dengan mengambil A i = X i - X 1 untuk i = 2 , … , n . Anda akan mendapatkan formula dengan n - 1 di penyebut - namun A i tidak independen dan Anda harus mempertimbangkan ini; pada akhirnya Anda akan menemukan formula yang biasa.n n−1 Ai=Xi−X1 i=2,…,n n−1 Ai
Sekarang untuk kovarians Anda dapat menggunakan ide yang sama: jika nilai yang diharapkan dari adalah ( 0 , 0 ) , Anda akan memiliki 1(X,Y) (0,0) dalam rumus. Dengan mengurangi(X1,Y1)ke semua nilai yang diamati lainnya, Anda mendapatkann-1pengamatan dengan nilai yang diharapkan diketahui ... dan11n (X1,Y1) n−1 1n−1 dalam formula - sekali lagi, ini memperkenalkan beberapa ketergantungan untuk diperhitungkan.
PS Cara bersih untuk melakukannya adalah untuk memilih basis ortonormal dari , yaitu n - 1 vektor c 1 , ... , c n - 1 ∈ R n sehingga⟨(1,…,1)′⟩⊥ n−1 c1,…,cn−1∈Rn
You can then definen−1 variables Ai=∑jcijXj and Bi=∑jcijYj . The (Ai,Bi) are independent, have expected value (0,0) , and have same variance/covariance than the original variables.
All the point is that if you want to get rid of the unknown expectation, you drop one (and only one) observation. This works the same for both cases.
sumber
Here is a proof that the p-variate sample covariance estimator with denominator1n−1 is an unbiased estimator of the covariance matrix:
To show:E(S)=n−1nΣ
Proof:S=1n∑xix′i−x¯x¯′
Next:
(1)E(xix′i)=Σ+μμ′
(2)E(x¯x¯′)=1nΣ+μμ′
Therefore:E(S)=Σ+μμ′−(1nΣ+μμ′)=n−1nΣ
And soSu=nn−1S , with the final denominator 1n−1 , is unbiased. The off-diagonal elements of Su are your individual sample covariances.
Additional remarks:
The n draws are independent. This is used in (2) to calculate the covariance of the sample mean.
Step (1) and (2) use the fact thatCov(x)=E[xx′]−μμ′
Step (2) uses the fact thatCov(x¯)=1nΣ
sumber
I guess one way to build intuition behind using 'n-1' and not 'n-2' is - that for calculating co-variance we do not need to de-mean both X and Y, but either of the two, i.e.
sumber
1) Mulaidf= 2 n .
2) Sampel kovarians sebanding denganΣni=1(Xi−X¯)(Yi−Y¯) . Lose two df ; one from X¯ , one from Y¯ resulting in df=2(n−1) .
3) However,Σni=1(Xi−X¯)(Yi−Y¯) only contains n separate terms, one from each product. When two numbers are multiplied together the independent information from each separate number disappears.
As a trite example, consider that
and that does not include irrationals and fractions, e.g.24=26–√∗26–√ , so that when we multiply two number series together and examine their product, all we see are the df=n−1 from one number series, as we have lost half of the original information, that is, what those two numbers were before the pair-wise grouping into one number (i.e., multiplication) was performed.
In other words, without loss of generality we can write
i.e.,zi=XiYi−X¯Yi−XiY¯ , and, z¯=X¯Y¯ . From the z 's, which then clearly have df=n−1 , the covariance formula becomes
Thus, the answer to the question is that thedf are halved by grouping.
sumber
Hold
?