Kualitas geocode: Nominatim vs. PostGIS Geocoder vs. Geocoder :: US 2.0
14
Saya kadang-kadang perlu melakukan geocode >> 500.000 alamat jalan AS (tidak ada fitur atau persimpangan). Saya ingin mengatur layanan geocoding secara lokal untuk menangani geocode massal ini.
Saya telah menggunakan Geocoder berbasis Tiger :: US 2.0 secara lokal di masa lalu. Pembandingan awal memberikan akurasi yang wajar terhadap alamat geocode Google, terutama ketika saya tidak mengandalkan parser Ruby dan saya meneruskan elemen alamat ke geocoder secara eksplisit.
Saya juga sudah membaca banyak tentang Geocoder PostGIS . Karena data saya sudah ada di PostGIS ini kedengarannya menarik, tetapi saya belum mengaturnya secara lokal untuk mencobanya.
Juga, seseorang merekomendasikan saya untuk mencoba Nominatim secara lokal. Saya tidak tahu banyak tentang itu kecuali bahwa itu bukan berdasarkan Tiger (sejauh yang saya tahu), dan saya bertanya-tanya apakah saya akan mendapatkan hasil yang lebih dapat diandalkan.
Pertanyaan saya kepada siapa pun yang berpengalaman dengan solusi di atas: Bagaimana ketepatan ketiga dibandingkan? Secara khusus, yang menyediakan geocode paling konsisten-andal untuk alamat jalan AS? Saya tidak terlalu khawatir dengan kecepatan atau mengatur kompleksitas.
Saya belum punya kesempatan untuk menguji geocoder Nominatim dan Geocoder AS. Pemahaman saya adalah bahwa Geocoder dan Nominatim tidak dapat dijalankan secara langsung dalam database, yang bagi saya merupakan kerugian besar karena membuat mereka sulit digunakan dalam hal-hal seperti pemicu atau untuk pembaruan batch langsung dalam database.
Geocoder PostGIS menjadi murni fungsi PostGIS / postgresql fungsi plpgsql, berjalan sepenuhnya dalam database. Saya berharap hasil geocoder US dan PostGIS Geocoder setara dan dari apa yang saya uji menggunakan barang-barang web, mereka. Google sedikit lebih baik karena mereka memanfaatkan nama tempat.
Saya pikir Nominatum karena menggunakan data OSM tidak menggunakan data harimau secara tidak langsung karena impor OSM untuk AS sebagian besar berasal dari TIGER dengan koreksi kontribusi pengguna. Saya tidak yakin apa yang vintage (tahun) Tiger OSM saat ini. Dari bermain dengan antarmuka web online, ia juga memanfaatkan nama tempat dan memiliki twist yang menarik yang memungkinkan Anda menentukan tingkat zoom geocoding yang memungkinkan geocoding lebih cepat dengan mengatur presisi zoom yang Anda butuhkan.
Pengungkapan penuh - Saya telah melakukan banyak pekerjaan di PostGIS Geocoder dan menulis manual online untuk itu. Saya akan memberi tahu Anda bug yang sedang saya kerjakan adalah saya pikir lokasi titik yang diinterpolasinya ada di sisi jalan yang salah. Saya sedang berusaha memperbaikinya. Jika Anda tidak terlalu peduli dengan sisi jalan yang mana (atau setidaknya kadang-kadang), maka itu mungkin bukan masalah bagi Anda.
Untuk kasus penggunaan saya, saya telah menemukan pemeriksaan fuzzy nominatum tidak sebagus yang dimiliki PostGIS Geocoder. Misalnya alamat jalan kesombongan saya (alamat surat) adalah 1 Devonshire Place, Boston MA. PostGIS mengembalikan jawaban yang dekat dengan yang saya ingat, Google mengembalikan jawaban, tetapi saya tidak bisa meminta Nominatim untuk mengembalikan jawaban. Agar adil bahkan catatan paket Boston tidak memiliki petunjuk di mana ini dan terdaftar dalam catatan paket sebagai washington street. PostGIS dapat menemukannya karena melakukan berbagai tingkat pemeriksaan dan persimpangan jalan-jalan dll. Saya telah menguji kasus-kasus lain di mana saya sengaja mengetikkan zip salah atau sesuatu dan PostGIS kembali dengan serangkaian opsi yang akurat. Google juga.
Komentar tambahan: Mungkin bernilai saat menguji dengan versi online yang membandingkan beberapa hasil alamat: misalnya nominatime yang dapat Anda uji di sini: open.mapquestapi.com/nominatim/v1/search.php
LR1234567
Terima kasih atas tanggapannya! Saya akan melakukan benchmarking sekitar minggu depan, tapi saya terkesan dengan pembuat kode PostGIS Tiger sejauh ini.
tigergeocoder.com menggunakan data TIGER 2013, siap menjalankan server Anda sendiri di Amazon EC2 cloud dan geocode 1.000.000+ per hari. PostGIS seperti yang Anda sebutkan, telah memuat Lingkungan Zillow juga dan mengembalikan kode FIPS untuk bagian alamat. REST API mirip dengan Google tetapi server Anda sendiri, tidak perlu kuota.
Biba
Nominatime berjalan cepat dan cenderung lebih akurat pada 2019, data harimau yang baru. Itu tidak memperkirakan area dan menebak alamat hanya lebih baik.
Andrew Scott Evans
-1
Secara teknis Anda dapat menumpuk database Tiger dan OSM ke dalam satu server raksasa dan membangunnya di dalam Nominatum OSM. Tiger dapat diimpor dengan mudah dan ini melengkapi server OSM.
Siapa pun, kualitas data yang akan Anda dapatkan kembali tidak akan menjadi atap. OSM kurang akurat untuk alamat jalan di AS. Dalam beberapa kesempatan saya telah melihatnya sejauh 90 mil dari target semula.
Basis data harimau juga tidak akurat karena algoritma interpolasi yang ditugaskan untuk memprediksi lokasi nomor jalan. Secara umum mereka akan mengimbangi target sebenarnya dari 300 kaki ke beberapa mil.
Saya pikir Anda perlu mengevaluasi waktu dan sumber daya hosting jika membangun geocoder sendiri vs menggunakan yang komersial. Dengan komersial Anda akan mendapatkan lokasi atap dan tidak khawatir tentang apa pun. Harga untuk 500 ribu akan sekitar $ 600 hingga $ 800 dengan vendor yang berbeda.
Apa hubungannya jawaban Anda dengan perusahaan Anda? Sepertinya Anda menyertakan tanda tangan dengan tautan ke situs web Anda dengan dalih, dalam hal ini, penafian yang tidak perlu, dan karenanya saya menyuntingnya. Dalam hal apa pun tolong jangan sertakan tautan dalam penafian apa pun.
Secara teknis Anda dapat menumpuk database Tiger dan OSM ke dalam satu server raksasa dan membangunnya di dalam Nominatum OSM. Tiger dapat diimpor dengan mudah dan ini melengkapi server OSM.
Siapa pun, kualitas data yang akan Anda dapatkan kembali tidak akan menjadi atap. OSM kurang akurat untuk alamat jalan di AS. Dalam beberapa kesempatan saya telah melihatnya sejauh 90 mil dari target semula.
Basis data harimau juga tidak akurat karena algoritma interpolasi yang ditugaskan untuk memprediksi lokasi nomor jalan. Secara umum mereka akan mengimbangi target sebenarnya dari 300 kaki ke beberapa mil.
Saya pikir Anda perlu mengevaluasi waktu dan sumber daya hosting jika membangun geocoder sendiri vs menggunakan yang komersial. Dengan komersial Anda akan mendapatkan lokasi atap dan tidak khawatir tentang apa pun. Harga untuk 500 ribu akan sekitar $ 600 hingga $ 800 dengan vendor yang berbeda.
sumber