Kami memiliki Database yang dapat ditelusuri (DB), kami membatasi hasilnya hingga 15 per halaman dan hanya 100 hasil yang masih membuat orang mencoba untuk mengikis situs.
Kami melarang situs yang menabraknya dengan cukup cepat. Saya bertanya-tanya apakah ada hal lain yang bisa kita lakukan. Flash membuat hasilnya mungkin?
Jawaban:
Anda bisa membuatnya sedikit lebih sulit dengan mengambil catatan melalui AJAX, dan menggunakan ID otentikasi (seperti kunci API) untuk panggilan AJAX.
Tentu saja Anda dapat menyiasatinya dengan membaca ID dan kemudian membuat permintaan AJAX menggunakan itu.
Rendering dengan Flash adalah alternatif seperti yang Anda tunjukkan (meskipun masih belum 100% tidak dapat diuraikan), seperti rendering dalam PDF.
sumber
Karena jelas ada permintaan untuk basis data Anda, pernahkah Anda berpikir untuk memutarnya dan memberikan apa yang diinginkan para pencakar? Membentuk koneksi bisnis dengan para pencakar dan mendorong penggunaan yang sesuai dengan API?
sumber
Ada beberapa info bagus di Bagaimana Anda menghentikan skrip membanting situs web Anda ratusan kali per detik?
sumber
Tidak ada solusi teknologi untuk mencegah individu yang termotivasi dari menggores konten Anda yang dapat diakses publik.
Namun, Anda dapat melindungi secara hukum kekayaan intelektual Anda dengan:
sumber
Bagaimana dengan mengatur otentikasi (dan mungkin captcha), melacak penggunaan, dan membatasi akses ke sejumlah catatan atau pencarian adalah periode waktu tertentu?
sumber
Anda mungkin akan menemukan bahwa pengikis akan meningkatkan kualitasnya saat Anda menerapkan teknik yang berbeda. Mungkin ada cara untuk menganalisis perilaku pengguna yang mengikis dan menyajikan captcha atau gangguan lainnya? Mungkin Anda dapat membatasi hasil ke jumlah yang lebih kecil untuk jangka waktu tertentu untuk memaksa para pencakar menunggu selama 10 hari. Jika mereka tidak masuk di antara mereka maka anggap mereka scapers?
Apa pun yang Anda lakukan, pastikan untuk menggabungkan teknik Anda untuk memberi mereka umur panjang.
sumber
Anda perlu mempertimbangkan bahwa para pencakar mungkin tidak menggunakan halaman dan formulir web Anda, mereka mungkin hanya memanggil situs Anda pada tingkat http.
Saya pikir solusi terbaik adalah dengan membuang catchpa setelah alamat ip meminta lebih dari ambang permintaan tertentu.
Anda harus sangat berhati-hati untuk memastikan bahwa Anda tidak mempengaruhi skalabilitas aplikasi Anda untuk pengguna nyata.
Membatasi jumlah data per halaman seperti yang Anda jelaskan dalam pertanyaan hanya akan meningkatkan jumlah permintaan yang akan dilakukan klien terhadap server Anda.
sumber