Pertanyaan yang diberi tag clustering

10
Metode inisialisasi K-means clustering

Saya tertarik pada kondisi terkini untuk memilih benih awal (pusat cluster) untuk K-means. Googling mengarah ke dua pilihan populer: pemilihan awal benih secara acak, dan, menggunakan teknik pemilihan KMeans ++: Arthur & Vassilvitskii 2006 k-means ++: Keuntungan Pembibitan...

10
Bagaimana cara mengelompokkan variabel longitudinal?

Saya memiliki banyak variabel yang berisi data longitudinal dari hari 0 hingga hari 7. Saya mencari pendekatan pengelompokan yang sesuai yang dapat mengelompokkan variabel-variabel longitudinal ini (bukan kasus) ke dalam kelompok yang berbeda. Saya mencoba menganalisis kumpulan data ini secara...

10
Distribusi pengelompokan

Saya memiliki beberapa distribusi (10 distribusi pada gambar di bawah). Sebenarnya ini adalah histogram: ada 70 nilai pada sumbu x yang merupakan ukuran beberapa partikel dalam larutan dan untuk setiap nilai x nilai y yang sesuai adalah proporsi partikel yang ukurannya berada di sekitar nilai...

10
Nilai variabel tersembunyi regresi linear R "bernilai"

Ini hanya contoh yang saya temui beberapa kali, jadi saya tidak punya data sampel. Menjalankan model regresi linier di R: a.lm = lm(Y ~ x1 + x2) x1adalah variabel kontinu. x2bersifat kategorikal dan memiliki tiga nilai, mis. "Rendah", "Sedang" dan "Tinggi". Namun output yang diberikan oleh R akan...

10
Mendeteksi Cluster kode sumber "mirip"

Asumsikan saya memiliki 400 siswa (yang ada di universitas besar) yang harus melakukan proyek ilmu komputer, dan bahwa mereka harus bekerja sendiri (tidak ada kelompok siswa). Contoh proyek dapat membiarkan "menerapkan algoritma transformasi fourier cepat di fortran" (Saya tahu, itu tidak terdengar...

10
Pada korelasi cophenetic untuk clustering dendrogram

Pertimbangkan konteks pengelompokan dendrogram. Mari kita sebut perbedaan asli jarak antara individu. Setelah membuat dendrogram, kami mendefinisikan ketidaksamaan cophenetic antara dua individu sebagai jarak antara kelompok-kelompok di mana individu-individu ini berada. Beberapa orang menganggap...

10
Mengapa Anova () dan drop1 () memberikan jawaban berbeda untuk GLMM?

Saya memiliki GLMM formulir: lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) Ketika saya menggunakan drop1(model, test="Chi"), saya mendapatkan hasil yang berbeda daripada jika saya menggunakan Anova(model, type="III")dari paket mobil atau...

10
Apa yang terjadi dengan Fuzzy Logic?

Logika fuzzy tampak seperti bidang aktif dalam pembelajaran mesin dan penggalian data ketika saya masih di sekolah menengah (awal 2000-an). Sistem inferensi fuzzy, fuzzy c-means, versi fuzzy dari berbagai jaringan saraf dan dukungan arsitektur mesin vektor semua diajarkan dalam kursus pascasarjana...

10
Cara mendapatkan interval kepercayaan pada perubahan populasi r-square

Demi contoh sederhana berasumsi bahwa ada dua model regresi linier Model 1 memiliki tiga prediktor, x1a, x2b, danx2c Model 2 memiliki tiga prediktor dari model 1 dan dua prediktor tambahan x2adanx2b Ada persamaan regresi populasi di mana varians populasi yang dijelaskan adalah untuk Model 1 dan...

10
Bagaimana saya harus menginterpretasikan statistik GAP?

Saya menggunakan statistik GAP untuk memperkirakan k cluster di R. Namun saya tidak yakin apakah saya menafsirkannya dengan baik. Dari plot di atas saya berasumsi bahwa saya harus menggunakan 3 cluster. Dari plot kedua saya harus memilih 6 cluster. Benarkah interpretasi statistik GAP? Saya...