Tentukan jumlah lokasi dunia nyata yang tidak diketahui dari laporan berbasis GPS

9

Saya sedang mengerjakan beberapa perangkat lunak yang harus menentukan lokasi dunia nyata (kamera kecepatan) dari beberapa laporan berbasis GPS . Seorang pengguna akan mengemudi saat melaporkan lokasi, sehingga laporannya sangat tidak akurat. Untuk mengatasi masalah itu saya harus mengelompokkan laporan tentang lokasi yang sama dan menghitung rata-rata.

Pertanyaan saya adalah bagaimana mengelompokkan laporan-laporan itu . Saya membaca tentang algoritma Expectation-maximationation dan k-means clustering , tetapi seperti yang saya pahami, saya perlu menentukan jumlah lokasi nyata sebelumnya.

Apakah ada algoritma lain, yang tidak memerlukan jumlah persis lokasi nyata, tetapi sebaliknya menggunakan beberapa kondisi tepi (jarak minimal)?

Laporan berisi garis bujur , garis lintang , dan akurasi (dalam meter). Tidak ada nama atau apa pun yang dapat digunakan untuk mengidentifikasi duplikat.

Kendala lain bisa jadi itu akan menjadi umum, bahwa hanya ada satu laporan untuk lokasi dunia nyata. Itu membuatnya sulit untuk membedakan pencilan dari data yang baik.

Christian Strempfer
sumber
1
Saya tidak yakin apa yang Anda maksud ketika Anda mengatakan "... seperti yang saya mengerti saya akan perlu menentukan jumlah lokasi nyata di muka ..." Dengan asumsi saya mengerti Anda dengan benar, tidak ada dalam algoritma yang secara inheren membutuhkan ini. Apakah Anda mungkin berencana menambah jumlah komponen kluster berdasarkan jumlah laporan?
Pat
1
Pertanyaan 2 :). Jika laporan Anda berasal dari seseorang yang mengemudi, maka kemungkinan akan ada perubahan posisi yang signifikan di antara mereka. Apakah laporan dilengkapi dengan stempel waktu yang memberi tahu Anda saat diambil?
Pat
2
Hai Pat. Saya sedang berbicara tentang kemacetan lalu lintas atau kamera kilat untuk membuatnya lebih jelas. 1. "k" dalam k-means clustering adalah singkatan dari jumlah cluster. Dalam kasus saya, saya akan memiliki satu cluster untuk setiap lokasi, sedangkan saya tidak tahu berapa banyak lokasi yang berbeda. 2. Ya, mereka juga menyertakan stempel waktu. Tetapi saya tidak mengerti mengapa itu penting, karena saya hanya peduli dengan posisi itu.
Christian Strempfer
1
1. Ahh, begitu. Jadi, Anda memiliki jumlah lokasi yang tidak diketahui, dan setiap lokasi menghasilkan satu atau beberapa laporan. Namun, yang Anda lihat hanyalah aliran laporan. Anda ingin menyimpulkan berapa banyak lokasi yang ada, dan posisinya, berdasarkan laporan yang diamati. Sudahkah saya mendapatkannya? 2. Saya khawatir tentang cap waktu karena Anda mengatakan pengguna akan mengemudi ketika mereka memberikan laporan. Dengan demikian, kecuali jika laporan datang secara berurutan dengan sangat cepat, atau kecepatannya sangat rendah (mungkin, jika macet) maka satu lokasi akan terlihat seperti garis laporan yang tidak rata mengikuti jalan. Cap waktu mungkin dapat membantu di sini
Pat
1
1. Ya, Anda sudah mendapatkannya. 2. Ini adalah tugas manual, jadi lokasi hanya dilaporkan satu kali per pengguna selama satu perjalanan. Tapi Anda benar, saya harus menangani duplikat, ketika pengguna secara tidak sengaja mengklik dua kali, dan laporan tidak akurat saat mengemudi dengan cepat. Itu sebabnya saya menyebutkan kondisi tepi jarak minimal antara lokasi. Mari kita mengabaikan kemacetan lalu lintas, yang mungkin menyebar beberapa mil, dan menganggap bahwa lokasi sangat kecil.
Christian Strempfer

Jawaban:

1

Saya telah menemukan perangkat lunak yang mungkin dapat membantu Anda. Sepertinya seseorang memiliki masalah yang sama dengan Anda dan mereka memberinya solusi di forum ini , jadi Anda harus menggunakan ArcGIS, tetapi jika Anda mencari algoritme, mereka menyarankan makalah ini . Saya pikir makalah ini cukup rinci untuk menjadi awal yang baik untuk algoritma Anda.

eyanquenb
sumber
2
Karena semua informasi adalah jawaban ini terdapat di tautannya, dan tautan pada akhirnya membusuk, harap setidaknya meringkas apa yang posting forum dan makalah tersebut rekomendasikan.
whuber