Saya melihat plot LDA (analisis diskriminan linier) dengan batas keputusan dari The Elements of Statistics Learning :
Saya mengerti bahwa data diproyeksikan ke ruang bagian dimensi yang lebih rendah. Namun, saya ingin tahu bagaimana kita mendapatkan batas keputusan dalam dimensi asli sehingga saya dapat memproyeksikan batas keputusan ke ruang bagian dimensi yang lebih rendah (seperti garis hitam pada gambar di atas).
Apakah ada rumus yang bisa saya gunakan untuk menghitung batas keputusan dalam dimensi asli (lebih tinggi)? Jika ya, lalu input apa yang dibutuhkan formula ini?
r
references
discriminant-analysis
mynameisJEFF
sumber
sumber
they (bondaries) are never computed. The plot is drawn by classifying every character cell in it, then blanking out all those surrounded by cells classified into the same category
.Jawaban:
Tokoh khusus dalam Hastie et al. diproduksi tanpa menghitung persamaan batas kelas. Alih-alih, algoritma yang diuraikan oleh @ttnphns dalam komentar digunakan, lihat catatan kaki 2 di bagian 4.3, halaman 110:
Namun, saya akan melanjutkan dengan menjelaskan cara mendapatkan persamaan batas kelas LDA.
Mari kita mulai dengan contoh 2D sederhana. Berikut adalah data dari dataset Iris ; Saya membuang pengukuran kelopak dan hanya mempertimbangkan panjang dan lebar sepal. Tiga kelas ditandai dengan warna merah, hijau dan biru:
Tiga garis berpotongan dalam satu titik, seperti yang diharapkan. Batas keputusan diberikan oleh sinar mulai dari titik persimpangan:
Lampiran
Cara Gaussian standar: jika kedua kelas dijelaskan oleh distribusi Gaussian, maka log-kemungkinan bahwa titik milik kelas k sebanding dengan ( x -x k (x−μk)⊤W−1(x−μk) 1 2 x⊤W−1(μ1−μ2)=const
Cara yang sulit tetapi intuitif. Bayangkan bahwa adalah matriks identitas, yaitu semua kelas berbentuk bola. Maka solusinya jelas: batas hanyalah ortogonal ke μ 1 -W μ1−μ2 W W=UDU⊤ S=D−1/2U⊤ S S(μ1−μ2) S−1 S⊤S(μ1−μ2) S
sumber