Apa metode yang digunakan oleh layanan GeoIP selain info WHOIS? [Tutup]

11

Saya hanya ingin tahu bagaimana layanan GeoIP mengumpulkan data tentang lokasi geografis IP selain memeriksa alamat IP informasi WHOIS. Misalnya saya menemukan situs web ini, yang mengatakan bahwa IP 74.207.244.221 berlokasi di Fremont, California: https://ipinfo.io/74.207.244.221

Tetapi saya tidak dapat menemukan info ini pada informasi whois IP ini. ipinfo.io menyatakan bahwa:

Awalnya API kami menggunakan data MaxMind, tetapi kami sudah sangat sibuk bekerja membuat data geolokasi kami sendiri. Kami telah membuat banyak kemajuan, dan kami sekarang menggunakan data kami sendiri untuk melayani sekitar setengah dari semua permintaan. Kami masih mundur ke data MaxMind

Dan ini membuat saya tertarik, bagaimana cara layanan seperti ipinfo.io dan MaxMind mengumpulkan data GeoIP?

Pelajar
sumber

Jawaban:

11

Layanan tersebut biasanya menggunakan 3 cara untuk melakukan geolokasi alamat IP:

  1. Pergi melalui database whois untuk mencari alamat;
  2. Melacak kueri DNS terbalik untuk mencoba dan menemukan petunjuk berdasarkan catatan nama domain atau melacak jalur paket yang dikirim ke tujuan, yang juga bisa memberikan petunjuk (misalnya menggunakan traceroute).
  3. Dan terakhir, mereka menggunakan triangulasi RTT.

Round-Trip Time (RTT) Triangulation adalah metode yang digunakan untuk mendapatkan perkiraan geolokasi alamat IP dengan mengukur latensi ping dari tiga lokasi berbeda.

Misalnya, jika Anda memiliki tiga server yang tersebar di seluruh dunia dalam bentuk segitiga, dan jika Anda melakukan ping alamat IP dari ketiganya dan mendapatkan hasil yang sama untuk latensi, maka itu berarti bahwa alamat IP terletak tepat di pusat segitiga itu. Ini cara triangulasi bekerja, namun, dalam hal ini digunakan dengan ping ICMP.

Sumber yang dapat Anda baca:
Apa itu ping? @ Wikipedia
makalah SIGCOMM tentang triangulasi RTT

Fanatique
sumber
5
Wow, saya tidak akan pernah berpikir bahwa ada triangulasi berdasarkan RTT. Menarik. Jadi, jika beberapa server ingin menghindari geolokasi, ini bisa menyebabkan lag acak dalam respons ICMP.
Learner
Saya ingin menambahkan bahwa mungkin bermanfaat untuk melihat tracert / traceroute, seperti yang ditulis di iplocation.net: "Anda dapat menggunakan perintah 'traceroute' untuk menemukan petunjuk ke lokasi alamat IP. Nama-nama router yang melaluinya paket mengalir dari host Anda ke host tujuan mungkin mengisyaratkan jalur geografis lokasi akhir. "
Learner
1
@Pelajar itu tambahan yang bagus, namun, itu sudah ada dalam jawaban saya dalam bentuk "melacak permintaan DNS terbalik". Meskipun traceroute tidak benar-benar melakukan itu, ini menunjukkan kepada Anda semua domain / alamat yang dilalui oleh kueri. Saya akan menambahkan catatan untuk membuatnya lebih jelas :)
Fanatique
5

Saya adalah pendiri IPinfo , jadi saya pasti dapat menawarkan beberapa detail tentang ini! Tidak ada satu metode tunggal yang kami gunakan, atau sumber data tunggal, untuk menghasilkan basis data geolokasi kami sendiri (atau set data kami yang lain, seperti IP ke perusahaan, atau IP ke operator). Ini adalah campuran dari sekumpulan set data yang berbeda, teknik pemrosesan data, dan pelajaran yang didapat dari melakukan ini selama beberapa tahun sekarang!

Beberapa sumber data dan teknik yang tidak sering disebutkan meliputi:

  • Umpan langsung dari ISP. Layanan kami menangani sekitar 500 juta permintaan API sehari, dan digunakan di banyak situs web profil tinggi populer. Oleh karena itu ISP diberi insentif untuk menyediakan kami dengan data geolokasi terkini yang akurat sehingga pelanggan mereka mendapatkan pengalaman hebat di web. Kami bekerja secara langsung dengan semakin banyak ISP setiap saat.

  • Data lokasi GPS. Dimungkinkan untuk mengumpulkan informasi lokasi yang tepat dengan GPS di perangkat seluler. Anda dapat memasangkannya dengan alamat IP dan beberapa kesimpulan topologi jaringan untuk mengetahui lokasi untuk rentang IP yang diberikan hanya beberapa pengukuran.

  • Pengguna mengirimkan koreksi. Ketika kami salah lokasi (atau belum diperbarui setelah perubahan), kami akan sering dengan cepat mendapatkan umpan balik dari pengguna, dan dapat memperbaiki lokasi secara manual, atau mengubah algoritme kami untuk memastikan lokasinya tepat di jalankan berikutnya jalur pemrosesan data kami.

Untuk set data IP ke perusahaan kami, kami benar-benar mengikis setiap nama domain tunggal setiap bulan, dan referensi silang data yang kami ekstrak di sana dengan informasi kepemilikan IP, catatan rwhois dan banyak lagi. Kami kemudian juga menggunakan data pengikisan domain untuk menunjukkan domain apa yang di-host pada alamat IP apa, dan juga dalam klasifikasi tipe IP kami, bersama dengan banyak sumber data lainnya, untuk menentukan kemungkinan alamat IP yang terutama digunakan sebagai ISP perumahan, bisnis, atau penyedia hosting. Kami juga menganalisis struktur link dari halaman-halaman, dan menunjukkan beberapa data ini pada host.io .

Ben Dowling
sumber
Terima kasih! Saya tidak berharap bahwa pendiri situs web ini akan menjawab pertanyaan saya :) Itu sangat menarik.
Pelajar