Oke, jadi dengan ArcGIS 10, ESRI telah menurunkan 'Address Standarisasi' di pencari lokasi baru, saya tahu Anda masih bisa menggunakan pencari lokasi 9.3.1 untuk melakukan ini; tapi saya sangat curiga bahwa setelah versi 10.1 kita akan melihat ini semakin sedikit tersedia.
The FGDC Mengatasi Standard menempatkan nilai berat pada alamat yang baik memiliki Prefix, Prefix-Direction, Jalan-Nama, Sufiks, nilai-nilai Suffic-Direction untuk bentuk bersih yang baik. Dan agen saya memiliki kebutuhan yang sama.
Apakah ada alat lain di luar sana yang digunakan orang untuk mengambil alamat terstruktur dan menguraikannya dengan cukup andal sehingga dapat disimpan? Apakah ada yang gratis?
* Pembaruan: * Saya menemukan ini di CodePlex (US Address Parser) dan memberi saya titik lompatan yang sangat bagus. Sangat bagus dalam kode yang dikelola yang dapat saya gunakan di semua tempat dan sejauh ini telah memiliki tingkat keberhasilan yang sangat tinggi dalam memecah bagian yang akan ditinjau baris demi baris dan bagian demi bagian.
sumber
Jawaban:
Mem-parsing sebuah alamat adalah proses yang rumit, karena saya yakin Anda tahu betul.
Menggunakan data ZIP + 4 dari USPS, Anda dapat menentukan apakah ada jalan di dalam kota / negara bagian / kode pos. Anda bahkan dapat memverifikasi bahwa nomor utama (nomor rumah) berada dalam kisaran ZIP + 4 yang benar. Menyesuaikan nama kota dan nama jalan untuk memperbaiki masalah ejaan juga dimungkinkan menggunakan daftar ejaan serta pencocokan "terdengar seperti". Mengambil alamat dan mem-parsingnya ke masing-masing komponen dan kemudian membandingkannya dengan database dari alamat yang diketahui adalah satu-satunya cara untuk mengetahui bahwa parsing telah dilakukan dengan benar.
Mengetahui bahwa suatu alamat cocok dengan area yang ditugaskan dan mengetahui bahwa itu adalah alamat yang nyata dan dapat disampaikan adalah tujuan yang berbeda. Yang pertama, alamat perkiraan, adalah sesuatu yang googlemaps lakukan dengan sangat baik. Namun, hanya itu, perkiraan. Googlemaps tidak memberi tahu Anda jika alamat itu benar-benar terkirim, mereka menunjukkan di mana ia akan terletak di peta jika itu asli. Ini sangat berharga dari sudut pandang pemetaan dan mereka memiliki tingkat akurasi yang bervariasi.
Tentu saja basis data USPS memiliki kekurangan (banyak di antaranya) tetapi mereka juga tentunya lebih akurat dan benar daripada basis data tunggal lainnya dari alamat AS dan tingkat keakuratannya (dan fakta bahwa itu terus diperbarui) yang kami andalkan.
Saya juga bekerja di SmartyStreets dan ingin menambah percakapan. Jika Anda perlu memvalidasi kurang dari 250 alamat per bulan, API ini gratis. Jika organisasi Anda adalah grup nirlaba , layanan ini sepenuhnya gratis tanpa batas.
sumber
Ya ada alat, gratis akan tergantung di mana alamat Anda berada. Ada banyak scrubber alamat gratis yang dilisensikan oleh USPS. Salah satu yang saya gunakan adalah ZP4 . Saya menemukan input dan output fleksibel berdasarkan bagaimana Anda menyimpan data Anda saat ini dan bagaimana Anda ingin menyimpan data Anda di masa depan. Anda dapat memilih untuk menampilkan data, untuk alamat yang cocok dengan alamat yang dapat dikirim dalam data USPS, menjadi 7 bagian. Fragmen ini sesuai dengan nomor rumah, predireksi, nama jalan, akhiran jalan, postdirection, singkatan unit apartemen, dan nomor apartemen. Ini adalah solusi mahal yang saya temukan.
sumber
Saya bekerja di bidang verifikasi alamat, sebenarnya (sebuah perusahaan bernama SmartyStreets) - tempat kami melakukan verifikasi alamat pos (di Amerika Serikat).
Anda akan membutuhkan vendor data alamat Bersertifikat CASS. Perangkat lunak perusahaan-perusahaan ini telah disetujui oleh USPS untuk menambahkan informasi yang hilang ke alamat dan mengembalikan hasil yang akurat. Salah satu layanan tersebut adalah LiveAddress - atau jika Anda memiliki daftar alamat, ada Smartylist - yang akan memberi Anda informasi yang Anda butuhkan. Keduanya gratis sampai batas tertentu, tetapi cukup terjangkau setelah itu.
Di ArcGIS, saya percaya LiveAddress API dapat diimplementasikan secara terprogram. Atau, daftar alamat dapat diekspor ke spreadsheet atau CSV dan diunggah ke layanan scrubbing daftar.
sumber
Saya telah sangat sukses menggunakan parser pustaka alamat kami. Saya membangun alat python yang menggunakan perpustakaan untuk membuat bidang alamat yang diuraikan. https://github.com/datamade/usaddress
sumber
Opsi lain untuk alamat yang berbasis di AS adalah YAddress . Itu juga mengoreksi dan memvalidasi alamat sebelum membaginya menjadi komponen. (Saya bekerja untuk perusahaan yang membuatnya.)
sumber