Mengatasi masalah regresi, saya mulai memikirkan representasi fitur "hari dalam seminggu". Saya ingin tahu pendekatan mana yang lebih baik:
- satu fitur; nilai 1/7 untuk hari Senin; 2/7 untuk hari Selasa ...
- 7 fitur: (1, 0, 0, 0, 0, 0, 0) untuk hari Senin; (0, 1, 0, 0, 0, 0, 0) untuk hari Selasa ...
Sulit untuk mengukurnya karena perbedaan konfigurasi jaringan. (Enam fitur tambahan harus tercermin dalam jumlah node tersembunyi yang saya percaya.)
Jumlah semua fitur adalah sekitar 20. Saya menggunakan backprop sederhana untuk mempelajari jaringan saraf umpan-maju biasa.
Jawaban:
Representasi kedua Anda lebih tradisional untuk variabel kategori seperti hari dalam seminggu.
Ini juga dikenal sebagai membuat variabel dummy dan merupakan metode yang banyak digunakan untuk pengkodean variabel kategori. Jika Anda menggunakan 1-7 penyandian, Anda memberi tahu model bahwa hari 4 dan 5 sangat mirip, sedangkan hari 1 dan 7 sangat berbeda. Bahkan, hari 1 dan 7 sama seperti hari 4 dan 5. Logika yang sama berlaku untuk 0-30 penyandian untuk hari dalam sebulan.
Hari dalam sebulan sedikit lebih sulit, karena sementara setiap minggu memiliki 7 hari yang sama, tidak setiap bulan memiliki 30 hari yang sama: beberapa bulan memiliki 31 hari, dan beberapa bulan memiliki 28 hari. Karena minggu dan bulan bersifat siklis, Anda dapat menggunakan transformasi fourier untuk mengubahnya menjadi variabel linier yang lancar.
Misalnya ( menggunakan R, bahasa pemrograman pilihan saya ):
(Saya menskala variabel sinus / kosinus menjadi 0/30, daripada -1/1 sehingga grafik terlihat lebih baik)
Seperti yang Anda lihat, sementara "hari dalam variabel bulan" mentah melompat kembali ke nol pada akhir setiap bulan, transformasi sinus dan kosinus membuat transisi yang mulus yang memungkinkan model mengetahui hari-hari pada akhir satu bulan sama dengan hari pada awal bulan berikutnya.
Anda dapat menambahkan sisa istilah fourier sebagai berikut:
Setiap pasang gelombang sinus / kosinus membuat lingkaran:
Halaman ini memiliki penjelasan yang sangat berguna tentang bagaimana memanipulasi gelombang sinus dan kosinus.
sumber