Saya punya daftar dengan beberapa juta nama tempat yang berasal dari profil Flickr. Pengguna memberikan nama tempat ini sebagai teks gratis, sehingga terlihat seperti ini:
Roma, Italy
Kennesaw, USA
Saginaw, MI
Rucker, Missouri, USA
Melbourne, Australia
Madrid, Spain
live in Sarnia / work in London, Canada
Valladolid, España
Italia
West Hollywood, United States
Saya ingin mendamaikan nama-nama tempat ini. Saya sadar bahwa dalam beberapa kasus tidak ada solusi langsung, tetapi saya bersedia untuk hidup dengan beberapa disambiguasi palsu dan dengan "tidak ada jawaban" untuk beberapa tempat. Jika nama tempat sesuai dengan nama beberapa kota, maka saya ingin menetapkan tempat itu ke kota terbesar yang terkait dengannya.
Api pencari tempat Yahoo akan menjadi solusi yang baik untuk masalah ini, tetapi saya perlu membuat terlalu banyak panggilan API untuk melewati daftar saya, jadi saya ingin solusi lokal (yaitu, yang tidak bergantung pada api jarak jauh) . Adakah yang tahu perpustakaan python yang melakukan hal semacam ini, atau solusi lokal lainnya?
(Saya juga menanyakan pertanyaan ini di stackoverflow .)