Memprediksi banyak target atau kelas?

12

Misalkan saya sedang membangun model prediksi di mana saya mencoba untuk memprediksi beberapa peristiwa (misalnya, gulungan dadu dan lemparan koin). Sebagian besar algoritma yang saya kenal bekerja dengan hanya satu target, jadi saya bertanya-tanya apakah ada pendekatan standar untuk hal semacam ini.

Saya melihat dua opsi yang memungkinkan. Mungkin pendekatan yang paling naif adalah dengan memperlakukan mereka sebagai dua masalah yang berbeda, dan kemudian menggabungkan hasilnya. Namun, itu memiliki kelemahan serius ketika kedua target tidak independen (dan dalam banyak kasus mereka mungkin sangat tergantung).

Pendekatan yang lebih masuk akal bagi saya adalah membuat atribut target gabungan. Jadi dalam kasus mati dan koin, kita akan memiliki negara ( ( 1 , H ) , ( 1 , T ) , ( 2 , H ) , dll). Namun, ini dapat menyebabkan jumlah negara / kelas dalam target komposit menjadi agak besar lebih cepat (bagaimana jika kita memiliki 2 dadu, dll.). Lebih jauh lagi, ini tampak aneh dalam kasus bahwa satu atribut kategorikal sedangkan yang lainnya adalah numerik (misalnya jika memprediksi suhu dan jenis curah hujan).62=12(1,H),(1,T),(2,H)

Apakah ada pendekatan standar untuk hal semacam ini? Atau, apakah ada algoritma pembelajaran yang dirancang khusus untuk menangani ini?

Michael McGowan
sumber
Maksud Anda sangat tergantung pada akhir paragraf ke-2 Anda. Jika demikian, pernahkah Anda memikirkan beberapa jenis pendekatan Rantai Markov setelah variabel pertama diperkirakan?
Michelle
Ups, maksudku memang tergantung dan memperbaikinya, terima kasih. Saya belum mempertimbangkan pendekatan Rantai Markov dan saya harus berpikir jika itu masuk akal di sini; Terima kasih.
Michael McGowan

Jawaban:

5

Ini dikenal di komunitas Machine Learning sebagai "Pembelajaran Multi-Label". Ada berbagai pendekatan untuk masalah tersebut, termasuk yang Anda jelaskan dalam pertanyaan Anda. Beberapa sumber daya untuk memulai:

tdc
sumber
0

Di mana Anda memiliki dua variabel dengan prediktor yang sama, dan variabel B juga memiliki variabel A sebagai prediktor, Anda mungkin melihat masalah optimisasi, di mana Anda ingin mengoptimalkan perkiraan A dan B secara bersamaan. Tidak masuk akal untuk mengoptimalkan satu, jika Anda kemudian mendapatkan perkiraan buruk untuk yang kedua.

Ini akan menjadi masalah penelitian operasi, dan sayangnya di luar bidang keahlian saya.

Michelle
sumber