HMM vs CRF untuk memodelkan data kekuatan seri waktu dari robot yang berinteraksi dengan lingkungan?

9

Saya memiliki serangkaian waktu data kekuatan robot yang berinteraksi dengan objek lingkungan dengan berbagai tekstur. Saya ingin mengembangkan model berbagai tekstur menggunakan data deret waktu untuk mengklasifikasikan tekstur ke dalam kategori halus, kasar, sedang, dll. Untuk tujuan ini, apakah Model Markov Tersembunyi cukup atau haruskah saya menggunakan Bidang Acak Bersyarat? Jika saya memutuskan untuk mengklasifikasikan ke dalam lebih banyak kategori dan perbedaan antara masing-masing kategori itu sangat halus, dalam hal apa pilihan yang baik? Akankah data paksa cukup untuk menangkap semua informasi yang saya butuhkan untuk mengklasifikasikan tekstur ke dalam kategori ini?

Terima kasih atas balasan Anda :)

Gilmour
sumber

Jawaban:

5

Berdasarkan uraian masalah Anda, HMM (model generatif) dan CRF (model diskriminatif) akan berfungsi. Lihat diskusi ini untuk penjelasan yang lebih mendalam tentang dua pendekatan:

Apa perbedaan antara Algoritma Generatif dan Diskriminatif?

Saran: sebelum memilih algoritme, mulailah dengan cermat melihat data numerik Anda, dengan plot MATLAB atau serupa. Jika informasinya multidimensi (mis. Nilai gaya dari beberapa sensor), mungkin beberapa kasus (mis. Sensor berbunyi) tidak mengandung informasi diskriminatif yang berguna; dalam hal ini, kompres data dengan Analisis Komponen Utama sehingga Anda akan memiliki lebih banyak fitur ringkas selama pelatihan dan klasifikasi.

Sekarang, sehubungan dengan pertanyaan Anda:

Perbedaannya adalah bahwa HMM dapat mewakili masing-masing kelas tekstur Anda dengan beberapa variabel / keadaan tersembunyi, sehingga menangkap evolusi temporal internal setiap kontak. Kita dapat mengatakan bahwa HMM lebih baik memodelkan dinamika "tingkat rendah" (intra-kelas) data Anda. Misalnya, dalam kasus Anda, HMM akan memungkinkan Anda untuk secara eksplisit memodelkan tiga fase berbeda dari setiap akuisisi data: (1) mulai kontak antara robot dan objek; (2) bagian kontak yang stabil; (3) akhir kontak dan lepaskan. Fase-fase ini dapat memiliki nilai yang berbeda dalam waktu, bahkan untuk tekstur objek yang sama, dan masuk akal untuk memisahkan mereka untuk meningkatkan hasil klasifikasi.

Di sisi lain, CRF lebih cocok untuk menangkap hubungan "tingkat tinggi" (antar kelas) dari distribusi data Anda, yang terkadang penting ketika variabilitas temporal-temporal tinggi, atau ketika fitur pengamatan sangat mirip antara dua sampel milik kelas yang berbeda.

Secara pribadi saya menemukan HMM lebih mudah digunakan dan saya akan mulai dengan itu, tetapi jarak tempuh Anda dapat bervariasi.

Jika saya memutuskan untuk mengklasifikasikan ke dalam lebih banyak kategori dan perbedaan antara masing-masing kategori itu sangat halus, dalam hal apa pilihan yang baik?

Dalam hal ini, CRF dapat menjadi pilihan yang lebih kuat (lihat di atas).

Akankah data paksa cukup untuk menangkap semua informasi yang saya butuhkan untuk mengklasifikasikan tekstur ke dalam kategori ini?

Menambahkan fitur visual (penampilan objek), terutama jika ditangkap dengan kamera resolusi tinggi, dapat membantu menentukan apakah objek memiliki tekstur kasar atau tidak.

Giovanni Saponaro
sumber
Maaf karena terlambat membalas. Komentar Anda sangat membantu. Saya sudah menerapkan HMM dan tampaknya berfungsi dengan baik. Saya tidak mengubah data menjadi representasi dimensi rendah menggunakan PCA, melainkan menggunakan HMM yang dapat mengambil data / distribusi terus menerus untuk menghindari kehilangan informasi apa pun. Tetapi karena saya tetap menggunakannya untuk klasifikasi, saya pikir menggunakan pendekatan diskriminatif mungkin memberikan hasil yang lebih baik (belum melihat dan mengkonfirmasi).
Gilmour
Senang mengetahui bahwa HMMs bekerja dengan baik untuk memodelkan data sensor gaya Anda. Saya tertarik untuk mengetahui lebih banyak tentang itu.
Giovanni Saponaro