Pertanyaan yang diberi tag clustering

9
Model pembelajaran dalam mana yang dapat mengklasifikasikan kategori yang tidak eksklusif satu sama lain

Contoh: Saya memiliki kalimat dalam deskripsi pekerjaan: "Java senior engineer in UK". Saya ingin menggunakan model pembelajaran yang mendalam untuk memperkirakannya sebagai 2 kategori: English dan IT jobs. Jika saya menggunakan model klasifikasi tradisional, hanya dapat memprediksi 1 label dengan...

9
Hitung kurva ROC untuk data

Jadi, saya memiliki 16 percobaan di mana saya mencoba untuk mengotentikasi seseorang dari sifat biometrik menggunakan Hamming Distance. Ambang batas saya diatur ke 3.5. Data saya di bawah dan hanya percobaan 1 yang Benar-Benar Positif: Trial Hamming Distance 1 0.34 2 0.37 3 0.34 4 0.29 5 0.55 6...

9
Memulai dengan biclustering

Saya telah melakukan beberapa penelitian internet kasual tentang biclusters. (Saya telah membaca artikel Wiki beberapa kali.) Sejauh ini, sepertinya ada beberapa definisi atau terminologi standar. Saya ingin tahu apakah ada makalah standar atau buku yang harus dibaca oleh siapa pun yang tertarik...

9
Bagaimana cara melakukan beberapa tes post-hoc chi-square pada tabel 2 X 3?

Kumpulan data saya terdiri dari angka kematian total atau kelangsungan hidup suatu organisme pada tiga tipe lokasi, inshore, midchannel, dan offshore. Angka-angka dalam tabel di bawah ini mewakili jumlah situs. 100% Mortality 100% Survival Inshore 30 31 Midchannel 10 20 Offshore 1 10 Saya...

9
Bersepeda dalam algoritma k-means

Menurut wiki kriteria konvergensi yang paling banyak digunakan adalah "tugas belum berubah". Saya bertanya-tanya apakah bersepeda dapat terjadi jika kita menggunakan kriteria konvergensi? Saya akan senang jika ada orang yang menunjuk referensi ke artikel yang memberikan contoh bersepeda atau...

9
Kriteria siku untuk menentukan jumlah cluster

Disebutkan di sini bahwa salah satu metode untuk menentukan jumlah cluster optimal dalam satu set data adalah "metode siku". Di sini persentase varians dihitung sebagai rasio varians antara-kelompok dengan total varians. Saya merasa sulit memahami perhitungan ini. Adakah yang bisa menjelaskan...

9
Clustering dengan langkah-langkah jarak asimetris

Bagaimana Anda mengelompokkan fitur dengan pengukur jarak asimetris? Sebagai contoh, katakanlah Anda mengelompokkan dataset dengan hari dalam seminggu sebagai fitur - jarak dari Senin hingga Jumat tidak sama dengan jarak dari Jumat ke Senin. Bagaimana Anda memasukkan ini ke dalam ukuran jarak...

9
Bagaimana cara membandingkan acara yang diamati dengan yang diharapkan?

Misalkan saya punya satu sampel frekuensi dari 4 peristiwa yang mungkin: Event1 - 5 E2 - 1 E3 - 0 E4 - 12 dan saya memiliki probabilitas yang diharapkan dari peristiwa saya terjadi: p1 - 0.2 p2 - 0.1 p3 - 0.1 p4 - 0.6 Dengan jumlah frekuensi yang diamati dari empat acara saya (18) saya dapat...

9
Memilih cluster untuk k-means: kasus 1 cluster

Adakah yang tahu metode yang baik untuk menentukan apakah pengelompokan menggunakan kmeans bahkan sesuai? Artinya, bagaimana jika sampel Anda sebenarnya homogen? Saya tahu sesuatu seperti model campuran (melalui mclust di R) akan memberikan statistik yang cocok untuk kasus klaster 1: k, tetapi...

9
Cara terbaik untuk mengelompokkan matriks adjacency

Saya mengalami kesulitan menafsirkan cluster yang dihasilkan dari matriks adjacency. Saya memiliki 200 matriks yang relatif besar yang mewakili mata pelajaran yang berisi korelasi parsial (skor z) dari deret waktu (data saraf). Tujuannya adalah untuk mengelompokkan 210 matriks tersebut dan...