Di mana untuk memulai: Rangkaian waktu yang tidak beraturan, dengan banyak outlier atau keacakan

8

Saya tidak benar-benar tahu apa yang mungkin, dan ingin pointer ke arah yang benar.

Saya memiliki pengukuran waktu dan posisi yang bisa apa saja dari orang yang berjalan, kendaraan di jalan, atau di tempat parkir, atau printer di kantor. Saya perlu menghitung waktu perjalanan untuk kendaraan antara dua titik. Mungkin mereka mengambil rute berkelok-kelok, atau bahkan butuh berhari-hari untuk beralih dari A ke B. Atau mereka mungkin seorang pejalan kaki, atau kendaraan dinas darurat.

Saya ingin perkiraan waktu perjalanan untuk kendaraan normal di sepanjang rute utama.

Deteksi adalah setiap kali seseorang cukup dekat ke detektor, yang memiliki radius tertentu. Terkadang ada beberapa deteksi, yang mungkin berarti jalan itu kosong dan waktu perjalanan akan baik, meskipun itu bisa menunjukkan jalan ditutup, dan waktu perjalanan akan mengerikan. Atau mungkin ada banyak deteksi yang menunjukkan lalu lintas tidak bergerak, dan itu bisa mengantri untuk mematikan jalan, tetapi kendaraan lain bepergian dengan kecepatan normal.

Plotnya terlihat seperti suara acak.

EDIT:

Saat ini saya sedang melihat dua metode:

  1. Gunakan rentang interkuartil untuk membuang pencilan
  2. Gunakan filter Kalman.

Saya pikir filter adalah cara yang salah untuk pergi karena saya tidak memiliki model untuk waktu perjalanan selain dari saat ke saat saya tidak berharap itu berubah banyak.

Peter Wood
sumber
1
Ini terlihat seperti sebuah karya yang membutuhkan kertas metodologis dalam Annals of Applied Statistics dan kertas substantif dalam Journal of Transportation Research . Anda seharusnya tidak mengharapkan masyarakat untuk menulis kedua makalah untuk Anda baik dalam jawaban maupun komentar, dan lebih suka ingin mencari kolaborasi dari ahli statistik transportasi atau ekonom. Atau lemparkan ini pada mahasiswa pascasarjana dalam statistik atau ekonomi sebagai topik disertasi.
Tugas
2
@StasK Saya tidak berharap komunitas menulis makalah untuk saya, saya meminta petunjuk ke arah yang benar. Terima kasih telah memberi tahu saya bahwa ini adalah pekerjaan yang substansial.
Peter Wood
Saya pikir itu, hanya itu yang ingin saya katakan. Jika Anda memiliki interval waktu yang tidak rata, Anda mungkin ingin mempertimbangkan untuk menggunakan pemodelan variogram dan kriging, yang umumnya dianggap sebagai alat statistik spasial.
Tugas
@StasK Saya tidak berpikir kriging dan variograms adalah yang saya butuhkan. Geometri rute antara dua titik relatif tidak diketahui, dan tidak penting dalam jenis hasil yang kami cari. Kami memiliki dua titik dengan deteksi di setiap titik, dan banyak deteksi perjalanan palsu. Kami ingin menyaring kebisingan dan mendapatkan perkiraan kondisi jalan saat ini dan historis yang baik. Terima kasih banyak atas minat Anda.
Peter Wood

Jawaban:

1

Saya tidak tahu apakah bisa memberi Anda jawaban yang diharapkan, tetapi saya pikir beberapa pendekatan Bayesian akan baik dalam kasus ini.

Anda mungkin ingin melihat pada filter partikel daripada Kalman karena saya rasa mungkin ini merupakan masalah untuk mengatur model yang benar untuk filter Kalman dalam kasus ini. Jika Anda ingin menggunakan Kalman, ada beberapa jenis filter dan beberapa di antaranya memerlukan pengetahuan yang baik tentang kesalahan kovarian, yang dapat menyebabkan masalah, tetapi beberapa dapat menghitungnya dengan Mante Carlo. Lihatlah Filter Kalman tanpa wewangian.

Anda mungkin juga menyukai http://www.udacity.com/overview/Course/cs373/CourseRev/apr2012 karena menjelaskan beberapa dasar tentang estimasi untuk kendaraan yang bergerak dan mobil self-driving google. (dan itu dalam python).

Mungkin beberapa detail dalam pertanyaan Anda akan lebih bermanfaat dan Anda bisa mendapatkan jawaban yang lebih tepat.

tomasz74
sumber