Algoritma pembelajaran mesin untuk data panel

12

Dalam pertanyaan ini - Apakah ada metode untuk membangun pohon keputusan yang memperhitungkan prediktor terstruktur / hierarkis / multilevel? - mereka menyebutkan metode data panel untuk pohon.

Apakah ada metode data panel khusus untuk mendukung Mesin Vector dan Jaringan Saraf Tiruan? Jika demikian, dapatkah Anda mengutip beberapa makalah untuk algoritme dan (jika tersedia) paket R yang mengimplementasikannya?

Carlos Cinelli
sumber
1
Saya bertanya-tanya apa yang Anda memutuskan untuk digunakan untuk ini? Mencoba memecahkan masalah serupa.
user0

Jawaban:

1

LSTM (Memori Jangka Pendek Panjang) mungkin relevan untuk Anda. Jenis model ini dapat menangani banyak fitur dalam berbagai titik waktu, yang harus sesuai dengan data panel. Berikut adalah penjelasan yang sangat bagus tentang konsep LSTM, dan di sini adalah paket yang mengimplementasikan versi R dari LSTM.

Ucapan Cantik
sumber
0

Saat Anda memiliki data panel, ada tugas berbeda yang dapat Anda coba selesaikan, misalnya klasifikasi / regresi seri waktu atau perkiraan panel. Dan untuk setiap tugas, ada banyak pendekatan untuk menyelesaikannya.

Saat Anda ingin menggunakan metode pembelajaran mesin untuk menyelesaikan perkiraan panel, ada sejumlah pendekatan:

Mengenai data input Anda (X), unit perawatan (misalnya negara, individu, dll) sebagai sampel pertama, Anda bisa

  • nampan seri waktu dan memperlakukan setiap nampan sebagai kolom terpisah, mengabaikan setiap pemesanan temporal, dengan nampan yang sama untuk semua unit, ukuran nampan tentu saja hanya bisa menjadi pengukuran time series yang diamati, atau Anda bisa meng-upample dan agregat menjadi nampan yang lebih besar, kemudian menggunakan algoritma pembelajaran mesin standar untuk data tabel,
  • atau mengekstrak fitur dari seri waktu untuk setiap unit, dan menggunakan setiap fitur yang diekstraksi sebagai kolom terpisah, sekali lagi dikombinasikan dengan algoritma tabular standar,
  • atau menggunakan algoritme regresi / klasifikasi deret waktu khusus tergantung pada apakah Anda mengamati data deret waktu kontinu atau kategoris, ini termasuk mesin vektor dukungan dengan kernel khusus yang membandingkan deret waktu dengan deret waktu.

Mengenai data output Anda (y), jika Anda ingin meramalkan beberapa titik waktu di masa mendatang, Anda bisa

  • paskan estimator untuk setiap langkah di depan yang ingin Anda ramalkan, selalu menggunakan data input yang sama,
  • atau paskan estimator tunggal untuk langkah pertama ke depan dan dalam prediksi, gulirkan data input tepat waktu, gunakan prediksi langkah pertama untuk menambahkan data input yang diamati untuk membuat prediksi langkah kedua dan seterusnya.

Semua pendekatan di atas pada dasarnya mengurangi masalah peramalan panel ke regresi deret waktu atau masalah regresi tabular. Setelah data Anda berada dalam format time series atau tabular regression, Anda juga dapat menambahkan fitur invarian waktu untuk pengguna.

Tentu saja ada opsi lain untuk menyelesaikan masalah peramalan panel, seperti misalnya menggunakan metode peramalan klasik seperti ARIMA yang disesuaikan dengan data panel atau metode pembelajaran mendalam yang memungkinkan Anda untuk secara langsung membuat urutan prediksi urutan.

mloning
sumber