Saya memiliki satu set lokasi dalam koordinat geografis, dan saya ingin mengelompokkan titik-titik menggunakan pengelompokan hierarkis diikuti dengan pemotongan pohon di berbagai "ketinggian" untuk menghitung sarana variabel-variabel yang bijaksana berdasarkan kelompok yang dicatat di setiap lokasi.
Saya kira pengelompokan hierarkis dari matriks jarak koordinat geografis, mungkin merupakan cara yang menyesatkan untuk membentuk kelompok karena garis lintang dan garis bujur tidak sama spasi.
Saya kemudian bisa membayangkan dua cara ke depan:
- Menggunakan jarak lingkaran besar untuk metrik jarak.
- Konversi koordinat geografis ke proyeksi dengan skala yang sama dan kemudian temukan jarak Euclidean.
Terlepas dari opsi dua yang lebih rumit untuk dilakukan, apakah pendekatan ini setara? Dan apa sebenarnya arti tinggi pemotongan pohon dalam kasus ini?
distance
clustering
peta digital
sumber
sumber
Jawaban:
Terima kasih kepada @whuber karena mengatur saya di jalur yang benar di sini. Sepertinya tidak akan ada jawaban tambahan yang akan datang, jadi akan menyelesaikan pertanyaan ini dengan memposting pengamatan saya sendiri yang mungkin berguna untuk orang lain yang belajar tentang jarak, pengelompokan, dan proyeksi.
Kode berikut R, menggunakan
geosphere
,rgdal
dansp
paket menunjukkan bahwa hati-hati memilih proyeksi yang tepat dapat memberikan matriks jarak yang akurat (di mana akurat didefinisikan sebagai jarak geodesik) ketika poin hingga 2000 km terpisah (sumbu berada di meter).Plot elemen-elemen dari tiga matriks jarak ini ditunjukkan di bawah ini. Plot di sebelah kiri menunjukkan bahwa proyeksi yang dipilih sangat berkorelasi dengan jarak geodesik melintasi rentang jarak yang digunakan di sini. Sementara plot yang tepat menunjukkan kesalahan besar yang akan diharapkan jika koordinat geografis yang tidak diproyeksikan akan digunakan.
sumber