Pertimbangkan konteks pengelompokan dendrogram. Mari kita sebut perbedaan asli jarak antara individu. Setelah membuat dendrogram, kami mendefinisikan ketidaksamaan cophenetic antara dua individu sebagai jarak antara kelompok-kelompok di mana individu-individu ini berada.
Beberapa orang menganggap bahwa korelasi antara perbedaan asli dan perbedaan cophenetic (disebut korelasi cophenetic ) adalah "indeks kesesuaian" dari klasifikasi. Ini terdengar sangat membingungkan bagi saya. Keberatan saya tidak bergantung pada pilihan khusus dari korelasi Pearson, tetapi pada gagasan umum bahwa setiap hubungan antara perbedaan asli dan perbedaan cophenetic dapat dikaitkan dengan kesesuaian klasifikasi.
Apakah Anda setuju dengan saya, atau dapatkah Anda menyajikan beberapa argumen yang mendukung penggunaan korelasi cophenetic sebagai indeks kesesuaian untuk klasifikasi dendrogram?
sumber
general idea that any link between the original dissimilarities and the cophenetic dissimilarities could be related to the suitability of the classification
. Klasifikasi harus mencerminkan perbedaan asli. Fitur dasar klasifikasi Dendrogram untuk melakukan ini adalah melalui perbedaan cophenetic. Apakah ada sesuatu salah?Jawaban:
Bagi saya itu tidak benar jelas apa yang dimaksud dengan itu. Cara saya mendapatkannya, adalah itu
adalah ukuran struktur hirarkis di antara pengamatan , yaitu jarak mereka. Artinya perbedaan-perbedaan pada pengamatan dalam kelompok yang berbeda lebih disukai serupa. Mempertimbangkan dataset A dan B yang dikelompokkan menggunakan jarak euclidean dan hubungan lengkap ... ... bahkan tanpa melihat peta jarak cophenetic atau menghitung korelasi cophenetic, orang dapat melihat, bahwa korelasi cophenetic A lebih tinggi daripada B Dalam hierarki ada tingkatan. Jadi CC memberitahu tentang apakah jarak ke pengamatan pada tingkat yang sama (cluster) adalah serupa.
Demi kelengkapan: Korelasi cophenetic adalah CC (A) = 0,936 dan CC (B) = 0,691
sumber