Menghasilkan variabel acak yang saling tergantung

8

Saya mencoba untuk menghasilkan set variabel acak yang terhubung secara kausal dan mulai melakukan ini dengan pendekatan monte carlo.

Baseline adalah histogram 2 dimensi yang diukur dari mana saya menggambar nilai acak.

Dalam contoh nyata saya, variabel-variabel ini adalah akselerasi adan kecepatan - jadi jelas harus ditahan.vvi+1=vi+aidt

Pendekatan naif saya saat ini adalah:

Saya mulai dengan beberapa . Kemudian saya menghasilkan acak sesuai dengan probabilitas terukur dari untuk nilai . Dengan menggunakan ini saya dapat menghitung dan seluruh prosedur dimulai lagi.v0a0av0a0v1

Jadi, ketika saya memeriksa akselerasi yang dihasilkan dalam sampah semuanya baik-baik saja. Tapi saya jelas ini sama sekali tidak menghormati distribusi marginal dari .avv

Saya agak akrab dengan metode dasar monte carlo, meskipun kurang memiliki latar belakang teoritis seperti yang Anda duga. Saya akan baik-baik saja jika dua variabel di mana hanya dihubungkan oleh beberapa matriks korelasi, tetapi hubungan sebab akibat antara keduanya memberi saya sakit kepala.

Saya tidak berhasil menemukan contoh untuk masalah semacam ini di suatu tempat - saya mungkin googl'ing istilah yang salah. Saya akan puas jika seseorang dapat mengarahkan saya ke beberapa literatur / contoh atau metode yang menjanjikan untuk memahami ini.

(Atau katakan itu tidak benar-benar mungkin diberikan masukan saya - itulah yang saya duga sesekali ...)

EDIT:

Tujuan sebenarnya dari seluruh prosedur ini: Saya memiliki satu set pengukuran dan , diwakili dalam histogram dua dimensi . Dengan masukan ini, saya ingin menghasilkan set acak dan yang mereproduksi distribusi yang diukur.avN(a,v)arvr

sebastian
sumber
1
Pertanyaan yang menarik Namun, yang kedua "jelas" (tentang tidak menghormati distribusi marjinal) sama sekali tidak jelas bagi saya. Mengapa ini jelas? Distribusi(v,a) , sebagaimana tercermin oleh "histogram dua dimensi" Anda, tergantung pada bagaimana Anda mengambil sampel variabel-variabel ini; Saya bertanya-tanya apakah ini dapat menjelaskan kemungkinan perbedaan. Jenis data apa yang diwakili oleh histogram ini dan bagaimana tepatnya Anda "mengambil nilai" darinya?
whuber
Nah, bagi saya jenisnya sudah jelas, karena adistribusi cukup simetris di sekitar nol. Jadi saat menghasilkanai tidak ada ketergantungan pada v. Kapan saat iniv berada di tepi atas marginal v distribusi, Anda akan menganggap bahwa harus ada bias terhadap negatif ai. "draw values" mengacu pada: ambil distribusi probabilitas 1-dim, membangun distribusi kumulatif, melempar angka acakr antara 0 dan 1, temukan xdimana cum. distribusi memiliki nilair. Inixadalah "nilai yang ditarik"
sebastian
Untuk kelengkapan: data berasal dari gps-logging. Saya memiliki satu set perjalanan yang dicatat dalam mobil, yang mencatat kecepatan dengan 1Hz. Jadi mereka sepasangv dan auntuk setiap titik data. Ini diisi ke dalam histogram.
sebastian
2
Komentar Anda menunjukkan bahwa Anda menganggap itu a dan vindependen. Itu tidak mungkin, karena ada keterbatasan fisik pada kecepatan: itu berarti banyak akselerasi tidak akan dialami pada kecepatan paling ekstrem. Namun, tidak mudah untuk memberikan saran yang lebih rinci karena Anda belum mengartikulasikan apa yang ingin Anda capai; sebaliknya, Anda telah menggambarkan pendekatan untuk memecahkan masalah yang tidak disebutkan. Mengapa Anda tidak mengubah pertanyaan ini dan malah bertanya tentang masalah yang perlu Anda selesaikan daripada bagaimana menerapkan solusi yang terlihat tidak valid?
whuber

Jawaban:

1

Tampaknya untuk mereproduksi distribusi bersama ρ(a,v), Anda harus memilih yang baru a tidak hanya berdasarkan v, tapi berdasarkan yang lama a juga:

ai+1ρ(ai+1|ai,vi)

Pertanyaannya (yang saya belum tahu jawabannya) adalah bagaimana menemukannya ρ yang menghasilkan ρ.

UPD: Anda harus menyelesaikan persamaan integral berikut:

ρ(a,v)=daρ(a|a,va+a2Δt)ρ(a,va+a2Δt)

Mendekati fungsi ρ dengan histogram, Anda mengubahnya menjadi sistem persamaan linear:

{ρ(a,v)=aρ(a|a,va+a2Δt)ρ(a,va+a2Δt)aρ(a|a,v)=1

Sistem ini tidak ditentukan. Anda dapat menerapkan penalti kelancaran untuk mendapatkan solusi.

pengguna31264
sumber
0

Bukankah data gps berisi posisi p? Saya akan berpikir itu, tidak hanya ituvi+1 tergantung pada vi dan ai tapi ai+1 juga akan bergantung pada pi. Pertimbangkan: di jaringan jalan apa pun ada kemacetan, batas kecepatan, sinyal, persimpangan, kemiringan curam, dll. Yang geolokasi. Jadi sesuatu seperti ensemble (distribusi) yang didefinisikan oleh:

Fa=Pr(Ai+1ai+1 | ai,vi,pi)
vi+1=vi+aidt

Untuk ansambel seperti itu, kesulitan akan terletak pada sifat data. Sangat mungkin bahwa populasi yang sebenarnya akan asimetris, non-linear (sepotong-bijaksana) dan mungkin tidak menentukan momen. Karakteristik ini mungkin tidak jelas dalam sampel yang Anda miliki.

Seperti yang dikatakan @whuber, masalahnya, yaitu apa yang ingin Anda hasilkan, belum tampak sepenuhnya dan jelas. Tidak jelas apakah Anda tertarik pada ansambel atau lebih individu.

AsymLabs
sumber
Saya pikir masalah saya agak jelas - saya memiliki distribusi terukur v dan a dan dari sini saya ingin mencicipi pseudo-random vrand, yang pada akhirnya mereproduksi input. Saya sangat menyadari poin Anda tentang apakah yang keluar itu realistis, tapi itu pertanyaan yang berbeda ...
sebastian
Paling tidak, seperti yang ditunjukkan dalam persamaan di atas, ini tidak akan menjadi efek stasioner. Saya akan berpikir bahwa langkah pertama adalah untuk bin bacaan sesuai dengan interval waktu dan kemudian membandingkannya. Saya tidak tahu berapa banyak bacaan yang Anda miliki tetapi perbandingan ini dapat dijalankan melalui sesuatu seperti Pearson's Distribution sebagai titik awal - untuk mencoba mengklasifikasikan sifat distribusi.
AsymLabs