Analisis eksplorasi kesalahan ramalan spatio-temporal

13

Data: Saya telah bekerja baru-baru ini menganalisis sifat stokastik dari bidang spatio-temporal dari kesalahan perkiraan produksi tenaga angin. Secara formal, dapat dikatakan suatu proses diindeks dua kali dalam waktu (dengantdanh) dan sekali dalam ruang (p) denganHmenjadi jumlah waktu melihat ke depan (sama dengan sesuatu di sekitar24, sampel secara teratur),Tmenjadi jumlah "Perkiraan waktu" (yaitu waktu di mana perkiraan dikeluarkan, sekitar 30000 dalam kasus saya, diambil sampelnya secara teratur), dannmenjadi sejumlah posisi spasial (tidak disejajarkan, sekitar 300 dalam kasus saya). Karena ini adalah proses yang berhubungan dengan cuaca, saya juga punya banyak ramalan cuaca, analisis, pengukuran meteorologi yang dapat digunakan.

(ϵt+h|thal)t=1...,T;h=1,...,H,hal=hal1,...,haln
thpH24Tn

Pertanyaan: Dapatkah Anda menggambarkan analisis eksplorasi yang akan Anda lakukan pada tipe data ini untuk memahami sifat struktur saling ketergantungan (yang mungkin tidak linier) dari proses untuk mengusulkan pemodelan yang baik dari itu.

robin girard
sumber
ini pertanyaan yang sangat menarik. Apakah mungkin untuk bermain setidaknya dengan sekumpulan data yang dianonimkan? Dan bagaimana ramalan itu dihasilkan, model seperti apa yang digunakan?
mpiktas
1
@mpikta terima kasih, Anda dapat mempertimbangkan itu telah dihasilkan dengan pemodelan AR yang cocok (satu untuk setiap wind farm), itu tidak akan banyak mengubah masalah. Maaf, ada terlalu banyak masalah kerahasiaan dengan data ini, tidak dapat memberi Anda apa pun, bahkan anonim ...
robin girard

Jawaban:

6

Tampak bagi saya bahwa Anda memiliki data yang cukup untuk memodelkan ketergantungan pada ruang-waktu dan pengaruh meteorologis dari bias kesalahan ramalan (yaitu kecenderungan untuk secara sistematis melebih-lebihkan / meremehkan [momen pertama]) dan variansnya [momen kedua].

Untuk eksplorasi bias, saya hanya akan melakukan banyak sebar plot, peta panas atau plot hexbin. Untuk eksplorasi variabilitas, saya baru saja menyelesaikan kesalahan semula dan sekali lagi melakukan banyak sebar, peta panas atau plot hexbin. Ini tentu saja tidak sepenuhnya tidak bermasalah jika Anda memiliki banyak bias, tetapi mungkin masih membantu untuk melihat pola heteroskedastisitas yang dipengaruhi kovariat.

Rmboostth, spline produk tensor untuk efek tempo-spasial atau interaksi yang mulus dari efek meteorologis, dll.) untuk momen yang berbeda dan lakukan pemilihan istilah pada saat yang sama untuk mendapatkan model yang cepat dan dapat ditafsirkan. Harapannya adalah bahwa istilah dalam model ini cukup untuk menjelaskan struktur autokorelasi spatio-temporal dari kesalahan perkiraan, tetapi Anda mungkin harus memeriksa residu dari model ini untuk autokorelasi (yaitu melihat beberapa variogram dan ACF).

orang fabian
sumber
+1 Terima kasih Fabians, Anda sepenuhnya benar, masalahnya bukan saya tidak punya cukup data. Perhatikan bahwa pertanyaan saya terutama tentang struktur saling ketergantungan. Scatterplots, heatmaps, dan hexbin plot adalah alat yang baik jika digunakan untuk tujuan yang baik. Saya pikir model aditif umum juga bisa sangat kuat ada makalah hebat dari Brillinger memberikan petunjuk yang baik tentang cara menggunakan GAM.
robin girard
5

Kami (seorang kolega dan saya) akhirnya menulis makalah tentang itu. Untuk meringkas hal-hal yang kami usulkan dua solusi untuk mengukur dan memberikan ringkasan statistik dari penyebaran (spatio-temporal) kesalahan di sepanjang Denmark dan sepanjang waktu melihat ke depan.

  • Dalam yang pertama kami menghitung korelasi antara semua pasangan ladang angin dan untuk semua pasangan waktu melihat ke depan (ini adalah fungsi dari 4 variabel). Ketika pasangan diperbaiki, kami menunjukkan bahwa fungsi korelasi memiliki maksimum lokal di sepanjang waktu, kami katakan ini adalah propagasi! Skala temporal yang terkait dengan sepasang ladang angin diberikan oleh lag temporal untuk mana maksimum lokal ini diperoleh. Merencanakan, untuk semua pasangan ladang angin maksimal korelasi lokal, kelambatan temporal yang memungkinkan untuk memperoleh itu dan vektor spasial yang bergabung dengan ladang angin memberikan sisi kanan Gambar 1.

Gambar 1

Ini dapat digunakan untuk menghitung vektor propagasi global yaitu semacam rata-rata spasial dari kecepatan propagasi antar pasangan. Bagian dari ini ditunjukkan di sebelah kiri Gambar 1, dan coba tebak kesalahan penyebaran apa adalah West East di Denamrk (ok itu bukan kejutan besar :)). Kami juga menganalisis kondisi ini untuk berbagai situasi meteorologi untuk menunjukkan hubungan antara propagasi dan angin (kecepatan, arah).

  • ttR2

Gambar 2

Dalam kasus kedua, kami mengamati bahwa kecepatan propagasi rata-rata temporal memiliki magnitute yang sama dengan yang diperoleh dengan rata-rata spasial dalam kasus pertama. Jika Anda ingin melihat karya ini dengan lebih serius, makalahnya ada di sini .

robin girard
sumber
+1 Terima kasih telah berbagi. (Maaf saya melewatkan pertanyaan ketika awalnya muncul.) Apakah Anda mempertimbangkan merencanakan lintas-variograms dengan melihat ke depan? Yang paling efektif bukanlah awan variogram directional yang dihaluskan secara tradisional; sebagai gantinya, gunakan plot dua dimensi dari kerapatan awan variogram. Anda kemudian dapat membangun cross-variograms dari mereka untuk mengeksplorasi hubungan temporal. Hasil propagasi Anda harus keluar dari analisis seperti itu secara otomatis.
whuber
@whuber Terima kasih atas komentarnya, saya hampir tidak percaya Anda melewatkan lebih dari 2 atau 3 pertanyaan di situs ini :). Gagasan Anda dengan variogram tampaknya terhubung (Saya tidak terlalu banyak menggunakan variogram, saya sering percaya bahwa segala sesuatu yang dapat diformulasikan dengan variogram memiliki padanan praktis dengan kovarian ...), saya akan memikirkannya.
robin girard
Anda benar bahwa dalam banyak aplikasi kovarian setara dengan variograms. Namun, cloud variogram menyediakan suplemen visual dan konseptual yang bekerja murni dengan fungsi kovarian tampaknya tidak menawarkan - ini agak seperti melihat scatterplot alih-alih hanya matriks korelasi: Anda kadang-kadang dapat melihat pola yang angka-angka tidak dengan jelas mengungkapkan .
whuber