Penggunaan prediktor sirkuler dalam regresi linier

19

Saya mencoba menyesuaikan model menggunakan data angin (0, 359) dan waktu hari (0, 23), tetapi saya khawatir bahwa mereka tidak akan cocok dengan regresi linier karena mereka bukan parameter linear sendiri. Saya ingin mengubahnya menggunakan Python. Saya telah melihat beberapa penyebutan penghitungan vektor dengan cara mengambil dosa dan cos dari derajat, setidaknya dalam kasus angin, tetapi tidak banyak.

Apakah ada pustaka Python atau metode yang relevan yang mungkin bisa membantu?

compguy24
sumber
1
Terima kasih telah mengajukan ini sebagai pertanyaan. Perhatikan bahwa meminta kode atau pustaka adalah di luar topik (sebagian besar pertanyaan Anda tentu saja sesuai topik), sehingga aspek tersebut mungkin atau mungkin tidak tercakup oleh jawaban di sini.
gung - Reinstate Monica
Apa variabel respon (hasil, variabel dependen) di sini? Apakah arah angin dan waktu dalam sehari keduanya merupakan prediktor?
Nick Cox
@NickCox Ya, arah angin dan waktu dalam sehari adalah prediksi. Hasilnya adalah nilai integer yang mewakili konsentrasi partikel (polusi udara). Ada juga prediktor lain lainnya, termasuk suhu, kelembaban, dll ... tetapi ini tidak perlu diubah, saya percaya.
compguy24
1
Saya telah mengambil kebebasan mengedit judul. Judul sebelumnya "Distribusi linear derajat di sekitar lingkaran" tidak menangkap pertanyaan sama sekali dalam pandangan saya.
Nick Cox

Jawaban:

24

0=360

dosa(π arah/180),cos(π arah/180)

2π=360

dosa(π waktu/12),cos(π waktu/12)

atau

dosa(π(waktu+0,5)/12),cos(π(waktu+0,5)/12)

tergantung pada bagaimana tepatnya waktu direkam atau harus ditafsirkan.

Kadang kala alam atau masyarakat berkewajiban dan ketergantungan pada variabel lingkaran mengambil bentuk beberapa arah menjadi optimal untuk respons dan arah yang berlawanan (setengah lingkaran jauhnya) menjadi pesimis. Dalam hal itu satu istilah sinus dan kosinus mungkin cukup; untuk pola yang lebih rumit, Anda mungkin perlu istilah lain. Untuk lebih detail tutorial tentang teknik ini dari regresi sirkular, Fourier, periodik, trigonometri dapat ditemukan di sini , dengan pada gilirannya referensi lebih lanjut. Kabar baiknya adalah bahwa sekali Anda telah membuat istilah sinus dan kosinus, mereka hanyalah prediktor tambahan dalam regresi Anda.

Ada literatur besar tentang statistik sirkuler, itu sendiri dilihat sebagai bagian dari statistik directional. Anehnya, teknik ini sering tidak disebutkan, karena fokus dalam literatur itu umumnya pada variabel respon melingkar. Meringkas variabel lingkaran dengan cara vektornya adalah metode deskriptif standar tetapi tidak diperlukan atau langsung membantu untuk regresi.

Beberapa perincian tentang terminologi Arah angin dan waktu dalam variabel statistik, bukan parameter, apa pun penggunaannya di cabang ilmu pengetahuan Anda.

yXββX[-1,1]

Komentar insidental Untuk variabel respons seperti konsentrasi partikel, saya berharap dapat menggunakan model linier umum dengan tautan logaritmik untuk memastikan prediksi positif.

Nick Cox
sumber