Situs web saya menghitung tampilan pengunjung pada halaman tertentu. Saya perhatikan bahwa Google dan Bot lainnya "mengklik" ke situs saya seperti orang gila dan beberapa halaman mendapatkan jumlah tampilan yang tidak realistis (dibandingkan dengan yang diproduksi oleh manusia).
Saya meminta praktik terbaik untuk mengecualikan bot tersebut dari jumlah pandangan saya. Jelas "agen pengguna" sederhana yang berisi "bot" tidak akan melakukannya.
Saya tidak berpikir ada solusi untuk membuktikan peluru atau saya perlu satu.
Catatan: Saya menggunakan PHP + MySQL.
php
mysql
web-crawlers
best-practices
Eisberg
sumber
sumber
Jawaban:
Saya senang Anda tahu tidak akan ada cara antipeluru untuk mencapai ini. Itu berarti pandangan Anda setidaknya realistis.
Karena JavaScript bukan opsi, saya akan mengatakan Anda memiliki:
Periksa agen-pengguna untuk kata "bot" di dalamnya. Itu akan menangkap sebagian besar dari mereka.
Kompilasi daftar bot yang dikenal dan filter mereka berdasarkan pada beberapa jenis pengidentifikasi unik, mungkin agen pengguna mereka.
Letakkan tautan tersembunyi di footer situs web Anda yang tertaut ke halaman yang mengumpulkan agen-pengguna dan / atau alamat IP. Pengguna tidak akan melihat ini tetapi bot akan melakukannya. Jadi siapa pun yang mengunjungi halaman itu akan menjadi bot. Rekam dan kemudian blokir dari statistik Anda.
sumber
Ada tiga cara yang cukup sederhana:
PEMBARUAN: Googlebot dan beberapa bot utama melakukannya menjalankan JavaScript hari ini. Jadi menggunakan opsi # 2 saja sudah tidak layak lagi. Namun, ini berarti menggunakannya bersamaan dengan # 3 harus cukup andal, karena Anda dapat dengan mudah mengecualikan sebagian besar bot dengan menggunakan JS, kemudian di sisi server mengecualikan bot utama seperti Googlebot yang menjalankan JS.
Juga seperti yang disebutkan dalam komentar Anda dapat mencoba menggunakan API Google Analytics untuk menampilkan tampilan untuk setiap halaman.
sumber
Jika Anda menggunakan Javascript untuk menghitung tampilan maka sebagian besar bot tidak akan menjalankannya dan karenanya tidak akan dimasukkan dalam jumlah tampilan Anda. Jawaban ini mungkin mendekati apa yang Anda inginkan /programming/1973448/how-can-i-count-a-page-views
sumber
Pendekatan saya melibatkan dua lintasan:
Mozilla|Opera|PSP|Bunjalloo|wii
. Berkat agen pengguna yang melakukan spoofing, cek ini akan mendeteksi hampir semua browserbot|crawl|slurp|spider
Jadi jika langkah pertama terlewati, kami berasumsi bahwa itu adalah browser dan ada pengunjung nyata di belakangnya. Seperti yang saya ketahui meskipun beberapa bot berpura-pura
Mozilla
kompatibel dan memulai string agen pengguna mereka dengan itu. Itu sebabnya pass kedua mungkin berguna dan menghilangkannya.sumber
Saya menggunakan agen parsing pengecualian hanya pengguna sederhana. Ini menghilangkan 99% bot masuk ke halaman saya.
sumber
Anda dapat menggunakan gambar sebagai penghitung, dalam hal ini tidak akan menghitung bot dan nama halaman dilewatkan sebagai kueri dengan nama gambar
Saya menggunakan ini di img.php yang memperbarui tampilan halaman dalam database:
sumber