Bagaimana jarak Gower menghitung perbedaan antara variabel biner '?

13

Saya memiliki 17 numerik dan 5 variabel biner (0-1), dengan 73 sampel dalam dataset saya. Saya perlu menjalankan analisis kluster. Saya tahu bahwa jarak Gower adalah metrik yang baik untuk kumpulan data dengan variabel campuran. Namun, saya tidak bisa mengerti bagaimana jarak Gower menghitung perbedaan antara variabel biner . Tampak bagi saya bahwa itu tidak berbeda dengan jarak Euclidean.

Emrah Bilgiç
sumber
Pertanyaan Anda tidak begitu jelas. Apakah Anda hanya bertanya 'bagaimana jarak Gower menghitung perbedaan antara variabel biner'? Apa artinya "tidak ada perbedaan dari Euclidean"?
gung - Reinstate Monica
1
Terima kasih. Maaf, saya bertanya bagaimana Gower menghitung perbedaan antara variabel biner. Maksudku, aku tidak bisa mengerti perbedaannya. Euclidean dan Gower untuk variabel biner.
Emrah Bilgiç
Sudahkah Anda mencari situs ini Gower? stats.stackexchange.com/a/15313/3277
ttnphns
Ya saya lakukan. Jarak Euclidean adalah 0, jika kedua sampel memiliki nilai yang sama, 1 jika tidak. Bagaimana dengan Gower?
Emrah Bilgiç
4
@ EmrahBilgiç, Gower metric adalah kesamaan, bukan jarak. Itu menjadi "jarak" ketika dikurangi dari 1. Baca di bawah tautan di atas bagaimana ia memproses data biner.
ttnphns

Jawaban:

5

Bagaimana dengan atribut biner yang memiliki nilai "m" dan "f", untuk "pria" dan "wanita"?

Anda menyadari bahwa untuk variabel dicotomous semua Anda bisa keluar adalah "sama" atau "berbeda"? Perbedaan titik kunci antara jarak bukanlah jika nilainya 1 atau 0; tetapi bagaimana beberapa variabel digabungkan.

Memiliki QUIT - Anony-Mousse
sumber
3

Gower distance menggunakan Manhattan untuk menghitung jarak antara datapoints kontinyu dan Dice untuk menghitung jarak antara datapoints kategoris

Sanjeet
sumber