Kapan harus menggunakan model campuran Gaussian?

9

Saya baru menggunakan GMM. Saya tidak dapat menemukan bantuan online yang sesuai. Adakah yang bisa tolong berikan saya sumber daya yang tepat pada "Bagaimana cara memutuskan apakah menggunakan GMM cocok dengan masalah saya?" atau jika ada masalah klasifikasi "Bagaimana cara memutuskan apakah saya harus menggunakan klasifikasi SVM atau klasifikasi GMM?"

Vinay
sumber
apa kumpulan data Anda dan apa masalah sebenarnya Anda? Ini digunakan ketika data mengikuti (campuran) lebih dari 1 distribusi normal. Lihat pertanyaan lain - stats.stackexchange.com/questions/236295/…
Arpit Sisodia
Anda dapat menganggapnya sebagai bentuk pengelompokan di mana Anda tidak memiliki label data & percaya pengelompokan laten normal multivarian normal.
gung - Reinstate Monica
@ arpit-sisodia, Kami sedang mengerjakan kelayakan pengaturan keyboard perangkat keras yang tampaknya memiliki fitur spesifik dan kami berencana untuk memodelkannya menggunakan GMM. Kami tidak tahu proses yang mendasarinya dan karenanya kami mencoba memodelkan menggunakan metode pembelajaran mesin. Jadi, kami tidak yakin apakah sebenarnya ada campuran gaussians dalam proses yang mendasarinya. Selain itu, ini adalah multi-dimensi dan kita tidak dapat memvisualisasikannya untuk melihat apakah itu adalah campuran dari gaussians
Vinay
@ arpit-sisodia, Tautan yang Anda berikan menyarankan lebih banyak metode coba-coba untuk melihat apakah GMM cocok dengan data saya. Apakah ada cara / aturan jempol untuk memutuskan model yang akan digunakan. Metode Trial-and-error bermain dengan lebih banyak campuran bisa cocok dengan data saya. Tetapi apakah ada cara tertentu untuk memutuskan? Seperti kita perlu memiliki keterpisahan linear data untuk klasifikasi SVM
Vinay

Jawaban:

4

Menurut pendapat saya, Anda dapat melakukan GMM ketika Anda tahu bahwa titik data adalah campuran dari distribusi Gauss. Pada dasarnya membentuk cluster dengan mean dan standar deviasi yang berbeda. Ada diagram yang bagus di situs scikit-learn. L.

Klasifikasi GMM

Suatu pendekatan adalah untuk menemukan kelompok menggunakan metode pengelompokan lunak dan kemudian melihat apakah mereka bersifat gaussian. Jika ya, Anda dapat menerapkan model GMM yang mewakili seluruh dataset.

Pembunuh
sumber
1
sering kali kita tidak tahu apakah titik data adalah Mixture of Gaussians. Jadi, ini lebih dari bermain-main dengan Gaussian dan MoG dan melihat apakah cocok. Tetapi tidak ada aturan arah / jempol untuk menggunakan GMM benar
Vinay
2
Sesuai pengalaman saya, Anda perlu menemukan pola dalam data yang merupakan model Campuran. Makalah yang bagus untuk dibaca adalah: stat.cmu.edu/~cshalizi/uADA/12/lectures/ch20.pdf
Slayer
0

GMM biasanya merupakan tempat yang baik untuk memulai jika tujuan Anda adalah (1) observasi cluster, (2) menentukan model generatif, atau (3) memperkirakan kepadatan. Bahkan, untuk pengelompokan, GMM adalah superset dari k-means.

1_e
sumber