Turunkan total (dalam kelas + antar kelas) matriks pencar

14

Saya mengutak-atik metode PCA dan LDA dan saya terjebak pada suatu titik, saya punya perasaan bahwa itu sangat sederhana sehingga saya tidak bisa melihatnya.

Matriks sebar dalam kelas ( SW ) dan antara kelas ( SB ) didefinisikan sebagai:

SW=i=1Ct=1N(xtiμi)(xtiμi)T

SB=i=1CN(μiμ)(μiμ)T

Matriks sebar total diberikan sebagai:ST

ST=i=1Ct=1N(xtiμ)(xtiμ)T=SW+SB

di mana C adalah jumlah kelas dan N adalah jumlah sampel adalah sampel, μ i adalah rerata kelas i, μxμiμ adalah rata-rata keseluruhan.

Ketika mencoba untuk menurunkan saya sampai pada titik di mana saya memiliki:ST

(xμi)(μiμ)T+(μiμ)(xμi)T

sebagai sebuah istilah. Ini harus nol, tetapi mengapa?


Memang:

ST=i=1Ct=1N(xtiμ)(xtiμ)T=i=1Ct=1N(xtiμi+μiμ)(xtiμi+μiμ)T=SW+SB+i=1Ct=1N[(xtiμi)(μiμ)T+(μiμ)(xtiμi)T]
nimcap
sumber
2
Jawabannya adalah Anda menjumlahkan penyimpangan nilai di sekitar rata-rata dan jumlah itu nol. Tapi apa tepatnyax, m, dan msaya? Bagaimana kabarm dan msaya berhubungan dengan μ dan μsaya? Kualitas jawaban akan tergantung pada seberapa akurat kami menebak tetapi Anda memaksa kami untuk melakukan banyak tebakan!
whuber
@whuber: Anda benar sekali, saya merevisi pertanyaan saya.
nimcap

Jawaban:

8

Jika Anda menganggap

1Nt=1Nxtsaya=μsaya

Kemudian

saya=1Ct=1N(xtsaya-μsaya)(μsaya-μ)T=saya=1C(t=1N(xtsaya-μsaya))(μsaya-μ)T=0

dan formula berlaku. Anda menangani istilah kedua dengan cara yang sama.

mpiktas
sumber
2
(+1) Istilah kedua, sebagai transposisi dari yang pertama, juga harus nol :-).
whuber
@whuber, yes, that too :)
mpiktas
Hi,i don't get why the assumption holds?Can someone explain that?
Mvkt
1
@Mvkt It is not so much an assumption as the definition of μi I suppose. That is to say: μi is the mean of the observations in group i. I expect the answer uses 'assume' because the OP doesn't explain the notation, so we have to guess that the group mean is meant by μi.
Vincent