Pertanyaan yang diberi tag clustering

16
Asumsi analisis kluster

Permintaan maaf untuk pertanyaan mendasar, saya baru dalam bentuk analisis ini dan memiliki pemahaman yang sangat terbatas tentang prinsip-prinsip sejauh ini. Saya hanya ingin tahu apakah banyak asumsi parametrik untuk uji multivariat / univariat yang berlaku untuk analisis Cluster? Banyak sumber...

16
Mengelompokkan data 1D

Saya memiliki dataset, saya ingin membuat kelompok data berdasarkan hanya satu variabel (tidak ada nilai yang hilang). Saya ingin membuat 3 cluster berdasarkan satu variabel itu. Algoritma pengelompokan mana yang digunakan, k-means, EM, DBSCAN dll.? Pertanyaan utama saya adalah, dalam keadaan apa...

15
Apa intuisi di balik sampel yang dapat ditukar di bawah hipotesis nol?

Tes permutasi (juga disebut tes pengacakan, uji pengacakan ulang, atau tes yang tepat) sangat berguna dan berguna ketika asumsi distribusi normal yang diperlukan misalnya, t-testtidak terpenuhi dan ketika transformasi nilai dengan peringkat dari tes non-parametrik seperti Mann-Whitney-U-testakan...

15
Bagaimana memplot output data clustering?

Saya mencoba mengelompokkan satu set data (satu set tanda) dan mendapat 2 kluster. Saya ingin menggambarkannya secara grafis. Agak bingung dengan representasi, karena saya tidak punya koordinat (x, y). Juga mencari fungsi MATLAB / Python untuk melakukannya. EDIT Saya pikir memposting data...

15
Akurasi mesin peningkat gradien menurun karena jumlah iterasi meningkat

Saya bereksperimen dengan algoritma mesin peningkat gradien melalui caretpaket di R. Menggunakan dataset penerimaan perguruan tinggi kecil, saya menjalankan kode berikut: library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ###...

15
Deret waktu dan deteksi anomali

Saya ingin menyiapkan algoritme untuk mendeteksi anomali dalam deret waktu, dan saya berencana menggunakan pengelompokan untuk itu. Mengapa saya harus menggunakan matriks jarak untuk pengelompokan dan bukan data deret waktu mentah ?, Untuk mendeteksi anomali, saya akan menggunakan pengelompokan...

15
Bagaimana cara menghitung kemurnian?

Dalam analisis kluster bagaimana kita menghitung kemurnian? Apa persamaannya? Saya tidak mencari kode untuk melakukannya untuk saya. Biarkan menjadi cluster k, dan c_j menjadi kelas j.c jωkωk\omega_kcjcjc_j Jadi apakah kemurnian bisa dibilang akurat? sepertinya menjumlahkan jumlah kelas yang...

15
Metode perbandingan multipel mana yang digunakan untuk model lmer: lsmeans atau glht?

Saya menganalisis set data menggunakan model efek campuran dengan satu efek tetap (kondisi) dan dua efek acak (peserta karena desain subjek dan pasangan dalam). Model ini dihasilkan dengan lme4paket: exp.model<-lmer(outcome~condition+(1|participant)+(1|pair),data=exp). Selanjutnya, saya...

14
k-means vs k-median?

Saya tahu ada algoritma pengelompokan k-means dan k-median. Satu yang menggunakan mean sebagai pusat cluster dan yang lainnya menggunakan median. Pertanyaan saya adalah: kapan / di mana