Saya memiliki dataset yang berisi data tentang suhu, curah hujan, dan hasil kedelai untuk sebuah pertanian selama 10 tahun (2005 - 2014). Saya ingin memprediksi hasil untuk tahun 2015 berdasarkan data ini.
Harap dicatat bahwa dataset memiliki nilai SETIAP HARI untuk suhu dan curah hujan, tetapi hanya 1 nilai per tahun untuk hasil, karena panen tanaman terjadi pada akhir musim tanam.
Saya ingin membangun regresi atau model pembelajaran berbasis mesin lainnya untuk memprediksi hasil 2015, berdasarkan regresi / beberapa model lain yang diperoleh dengan mempelajari hubungan antara hasil dan suhu dan curah hujan di tahun-tahun sebelumnya.
Saya akrab dengan melakukan pembelajaran mesin menggunakan scikit-belajar. Namun, tidak yakin bagaimana merepresentasikan masalah ini. Bagian yang sulit di sini adalah bahwa suhu dan curah hujan setiap hari tetapi hasil hanya 1 nilai per tahun.
Bagaimana cara saya mendekati ini?
sumber
Jawaban:
Sebagai permulaan, Anda dapat memprediksi hasil untuk tahun mendatang berdasarkan data harian untuk tahun sebelumnya. Anda dapat memperkirakan parameter model dengan mempertimbangkan nilai data setiap tahun sebagai satu "titik", lalu memvalidasi model menggunakan validasi silang. Anda dapat memperpanjang model ini dengan mempertimbangkan lebih dari satu tahun terakhir, tetapi lihat ke belakang terlalu jauh dan Anda akan kesulitan memvalidasi model dan pakaian Anda.
sumber
sklearn.cross_validation
metode dengan "Label" pada namanya, seperti sklearn.cross_validation.LabelKFold .Anda dapat menggunakan Bayesian Belief Network untuk prediksi. Dia adalah tautan untuk penjelasan dasar. Jaringan Bayesian
sumber
Anda memiliki 10 titik data dengan setiap titik data memiliki dimensi 365 (suhu untuk setiap hari) + 365 (presipitasi untuk setiap hari). Idealnya, saya pertama-tama akan mengurangi dimensi melalui metode pembelajaran mesin, misalnya PCA. Kemudian gunakan metode pembelajaran mesin untuk membangun model prediksi. Namun, karena dataset kecil, saya tidak berpikir teknik pembelajaran mesin sesuai dengan masalah Anda.
sumber