Alamat Opsi Standardizer

9

Oke, jadi dengan ArcGIS 10, ESRI telah menurunkan 'Address Standarisasi' di pencari lokasi baru, saya tahu Anda masih bisa menggunakan pencari lokasi 9.3.1 untuk melakukan ini; tapi saya sangat curiga bahwa setelah versi 10.1 kita akan melihat ini semakin sedikit tersedia.

The FGDC Mengatasi Standard menempatkan nilai berat pada alamat yang baik memiliki Prefix, Prefix-Direction, Jalan-Nama, Sufiks, nilai-nilai Suffic-Direction untuk bentuk bersih yang baik. Dan agen saya memiliki kebutuhan yang sama.

Apakah ada alat lain di luar sana yang digunakan orang untuk mengambil alamat terstruktur dan menguraikannya dengan cukup andal sehingga dapat disimpan? Apakah ada yang gratis?


* Pembaruan: * Saya menemukan ini di CodePlex (US Address Parser) dan memberi saya titik lompatan yang sangat bagus. Sangat bagus dalam kode yang dikelola yang dapat saya gunakan di semua tempat dan sejauh ini telah memiliki tingkat keberhasilan yang sangat tinggi dalam memecah bagian yang akan ditinjau baris demi baris dan bagian demi bagian.

Benar
sumber
1
Instalasi ArcGIS v10 saya memiliki ArcToolBox, Alat Geocoding, Standarisasi Alamat. Input dapat berupa tabel atau kelas fitur sehingga ini harus bekerja dengan data referensi spasial dan / atau alamat mentah. Apa ini yang kamu cari?
klewis
1
Ya, tetapi ketika Anda memiliki kemampuan berjalan lama untuk mengirimkan alamat ke geocoder, kemudian mendapatkan kembali hasilnya dengan respons standar maka Anda bisa melakukan panggilan tingkat SOAP untuk satu catatan pada satu waktu. Sekarang; Anda dibiarkan membangun layanan geoprocessing, host yang terpisah dari sisa sistem geocoding. Jadi mereka membuat proses lebih kompleks dan dengan sistem saat ini mengalami masalah seperti itu; itu tidak dapat diandalkan.
DEWright

Jawaban:

6

Mem-parsing sebuah alamat adalah proses yang rumit, karena saya yakin Anda tahu betul.

Menggunakan data ZIP + 4 dari USPS, Anda dapat menentukan apakah ada jalan di dalam kota / negara bagian / kode pos. Anda bahkan dapat memverifikasi bahwa nomor utama (nomor rumah) berada dalam kisaran ZIP + 4 yang benar. Menyesuaikan nama kota dan nama jalan untuk memperbaiki masalah ejaan juga dimungkinkan menggunakan daftar ejaan serta pencocokan "terdengar seperti". Mengambil alamat dan mem-parsingnya ke masing-masing komponen dan kemudian membandingkannya dengan database dari alamat yang diketahui adalah satu-satunya cara untuk mengetahui bahwa parsing telah dilakukan dengan benar.

Mengetahui bahwa suatu alamat cocok dengan area yang ditugaskan dan mengetahui bahwa itu adalah alamat yang nyata dan dapat disampaikan adalah tujuan yang berbeda. Yang pertama, alamat perkiraan, adalah sesuatu yang googlemaps lakukan dengan sangat baik. Namun, hanya itu, perkiraan. Googlemaps tidak memberi tahu Anda jika alamat itu benar-benar terkirim, mereka menunjukkan di mana ia akan terletak di peta jika itu asli. Ini sangat berharga dari sudut pandang pemetaan dan mereka memiliki tingkat akurasi yang bervariasi.

Tentu saja basis data USPS memiliki kekurangan (banyak di antaranya) tetapi mereka juga tentunya lebih akurat dan benar daripada basis data tunggal lainnya dari alamat AS dan tingkat keakuratannya (dan fakta bahwa itu terus diperbarui) yang kami andalkan.

Saya juga bekerja di SmartyStreets dan ingin menambah percakapan. Jika Anda perlu memvalidasi kurang dari 250 alamat per bulan, API ini gratis. Jika organisasi Anda adalah grup nirlaba , layanan ini sepenuhnya gratis tanpa batas.

Jeffrey
sumber
Kami sedang membangun layanan terpisah di agen saya untuk mengerjakan bagian Geocoding; di mana akan mengumpulkan data Kabupaten dan atau Kota untuk lapisan pertama validasi; kemudian beralih ke sumber komersial seperti TomTom atau NavTeq sebelum Tiger. Di mana kami mengambil basis geocoder komposit ESRI dan menambahkan langkah atau cabang tambahan untuk membandingkan skor sumber dengan yang lain dan mengembalikan skor dua atau tiga yang lebih tinggi. Penggunaan kami AIS / AMS DBs dari USPS membantu dengan bagian 'Deliverable', ditambah dengan data County.
DEWright
Terima kasih sudah berbagi, Jeffrey. Saya akan (segera) mengedit balasan Anda agar sesuai dengan pedoman situs kami; silakan tinjau FAQ kami untuk informasi lebih lanjut.
whuber
1

Ya ada alat, gratis akan tergantung di mana alamat Anda berada. Ada banyak scrubber alamat gratis yang dilisensikan oleh USPS. Salah satu yang saya gunakan adalah ZP4 . Saya menemukan input dan output fleksibel berdasarkan bagaimana Anda menyimpan data Anda saat ini dan bagaimana Anda ingin menyimpan data Anda di masa depan. Anda dapat memilih untuk menampilkan data, untuk alamat yang cocok dengan alamat yang dapat dikirim dalam data USPS, menjadi 7 bagian. Fragmen ini sesuai dengan nomor rumah, predireksi, nama jalan, akhiran jalan, postdirection, singkatan unit apartemen, dan nomor apartemen. Ini adalah solusi mahal yang saya temukan.

ktreiche
sumber
1
Meskipun ZP4 sangat murah ($ 600 / thn), ketentuannya membuat saya sedikit waspada dan sepertinya Anda harus berhati-hati dengan cara menggunakannya.
blord-castillo
1

Saya bekerja di bidang verifikasi alamat, sebenarnya (sebuah perusahaan bernama SmartyStreets) - tempat kami melakukan verifikasi alamat pos (di Amerika Serikat).

Anda akan membutuhkan vendor data alamat Bersertifikat CASS. Perangkat lunak perusahaan-perusahaan ini telah disetujui oleh USPS untuk menambahkan informasi yang hilang ke alamat dan mengembalikan hasil yang akurat. Salah satu layanan tersebut adalah LiveAddress - atau jika Anda memiliki daftar alamat, ada Smartylist - yang akan memberi Anda informasi yang Anda butuhkan. Keduanya gratis sampai batas tertentu, tetapi cukup terjangkau setelah itu.

Di ArcGIS, saya percaya LiveAddress API dapat diimplementasikan secara terprogram. Atau, daftar alamat dapat diekspor ke spreadsheet atau CSV dan diunggah ke layanan scrubbing daftar.

Mat
sumber
Saya tidak benar-benar mencari koreksi atau sertifikasi Surat Massal yang menjadi tujuan CASS; lebih banyak untuk penguraian dan pencarian yang lebih baik untuk membantu memperbaiki alamat yang buruk. Saya sudah memiliki database USPS AIS dan AMS dan sekarang saya mulai membangun logika untuk mengurai dan meminta catatan dari sumber-sumber tersebut jika tidak sepenuhnya cocok. Saya akan melihat tautan yang Anda referensi; tapi saya menuju solusi yang dapat dibagikan untuk alamat AS paling umum dengan biaya lebih rendah. Hanya karena USPS AIS / AMS tidak menemukannya bukan berarti itu salah.
DEWright
@Benar Kamu benar. Ada alamat yang ada di luar domain USPS, tetapi sebagian besar dari mereka dapat ditemukan dalam database USPS untuk alamat yang dapat dikirim. Fedex dan UPS keduanya memiliki beberapa alamat (biasanya yang jauh) yang mereka kirim ke dan USPS tidak akan dikirimkan. Alangkah baiknya memiliki sumber otoritatif yang menggabungkan semua alamat itu. Kesulitan dengan itu adalah bahwa USPS tidak persis berbagi seluruh database mereka, dan begitu pula dengan Fedex atau UPS. Sebagian besar itu adalah data hak milik. Verifikasi alamat tidak hanya untuk mengirim surat.
Jeffrey
1

Saya telah sangat sukses menggunakan parser pustaka alamat kami. Saya membangun alat python yang menggunakan perpustakaan untuk membuat bidang alamat yang diuraikan. https://github.com/datamade/usaddress

ketar
sumber
0

Opsi lain untuk alamat yang berbasis di AS adalah YAddress . Itu juga mengoreksi dan memvalidasi alamat sebelum membaginya menjadi komponen. (Saya bekerja untuk perusahaan yang membuatnya.)

Michael Diomin
sumber