Bagaimana cara melawan spammer pengarah Google Analytics?

43

Bulan lalu saya memiliki banyak spammer pengarah dalam statistik GA saya. Jumlah mereka ~ 10x lebih tinggi dari jumlah pengunjung resmi (situs saya belum terlalu populer). Saya telah mengaktifkan opsi untuk menyembunyikan spammer yang dikenal dalam pengaturan GA, tetapi itu tidak membantu sama sekali. Tampaknya spammer ini menggunakan skrip untuk mengirim spam langsung ke GA (yaitu mereka tidak masuk dalam IIS saya).

Adakah yang bisa saya lakukan untuk menghentikan spammer ini?

UPD 10 bulan kemudian, dan mereka mulai melakukan spamming menggunakan nama halaman target palsu ... dan Google masih tidak melakukan apa-apa.

pengguna626528
sumber
1
Harap periksa file log Anda untuk hits dengan spam pengarah dan beri tahu kami jika Anda melihatnya. Jika Anda bisa, silakan edit pertanyaan dan sertakan spam perujuk dalam pertanyaan. Saya kira saya sudah tahu jawabannya. Saya sedang melakukan penelitian dan ada cukup banyak aktivitas pengarah akhir-akhir ini yang beberapa di antaranya saya alami sendiri. Selain itu, jika Anda telah menginstal WordPress, pastikan sudah mutakhir. Salah satu situs tampaknya juga akan mencari kerentanan WP. Juga, jangan mengunjungi situs-situs ini kecuali Anda menggunakan browser teks seperti Curl.
closetnoc
@closetnoc, spammer ini tidak masuk di server saya. Seperti yang saya tulis, mereka mengirim spam langsung ke GA. Saya tidak menggunakan WP. "sertakan spam pengarah yang dimaksud" - apa maksud Anda?
user626528
Saya tahu siapa mereka dan saya mengirim jawaban.
closetnoc
Jelas cara terbaik dan termudah untuk mencegahnya adalah dengan menggunakan: referrerspamblocker.com Ini adalah pengaturan otomatis filter di Google Analytics. Sudah menggunakannya berbulan-bulan sekarang.
Rody van Sambeek
Apakah pengaturan 'pemfilteran bot' menjadi true di pengaturan google analytics membantu menyelesaikan masalah? - lunametrics.com/blog/2014/08/07/...
sam

Jawaban:

7

Spam semakin tidak terkendali. Daftar ini bertambah dan memakan waktu dan bahkan tidak efisien untuk menambahkan filter untuk masing-masing spammer karena sebagian besar dari mereka muncul selama beberapa hari dan kemudian menghilang dan yang baru datang.

Ada banyak informasi yang salah, kesalahan paling umum adalah merekomendasikan untuk menggunakan .htaccess , file ini memblokir akses ke situs web, meskipun ada beberapa crawler (5 atau 6) daripada yang dapat diblokir, sebagian besar dari spam tidak pernah mengakses situs Anda adalah Spam Hantu.

Cara terbaik untuk menghentikan jenis spam (Hantu) ini adalah dengan membuat filter nama host yang valid , spam hantu menggunakan palsu atau tidak menyetel nama host, jadi dengan filter ini Anda tidak perlu menambahkan filter tanpa akhir, satu filter akan mengambil mengurus spam lama dan baru. . Sudah berhasil menggunakan solusi ini selama 3 bulan

Informasi lebih lanjut tentang metode ini di sini:

https://stackoverflow.com/a/28354319/3197362

Carlos Escalera Alonso
sumber
Saya senang bahwa ini adalah jawaban yang diterima, itu benar-benar harus lebih dihargai. Sebagian besar pengarah spam di Analytics adalah pengarah hantu. Ada beberapa yang perlu Anda blokir .htaccess, tetapi itu adalah pertempuran yang berkelanjutan untuk menghentikan mereka mencondongkan angka-angka (Semalt menjadi penyebab utama ini - bot yang sah Bibi Fanny saya).
GeoffAtkins
Oh Carlos, saya akan merekomendasikan panduan untuk memerangi spam di situs Anda . Saya tahu komentar ini akan dianggap sebagai cara untuk SEO / menjual tetapi tidak. Saya sangat mengagumi masukan Anda tentang panduan itu.
Ooker
35

Baik. Tanpa mengetahui situs yang dimaksud, saya akan mencoba dan menjelaskan sedikit tentang apa yang sedang terjadi dan saya hanya akan memberikan beberapa tautan.

Dari: http://www.cradlecloud.com/ban-block-blackhatworth-com-spam-referrals/

Saya mendapatkan nama domain berikut yang terkait dengan metode baru pengarah spam yang orang lihat belakangan ini.

  • BlackHatWorth.com
  • Iskalko.ru
  • Lomb.co
  • Lombia.co
  • Econom.co
  • Darodar.com
  • ILoveVitaly.Com
  • Priceg.com
  • Hulfingtonpost.com (Baru ditambahkan 16 Jan 2015)
  • Bestwebsitesawards.com (Baru ditambahkan 3 Feb 2015)
  • Ranksonic.info (Baru ditambahkan 3 Feb 2015)
  • Cenoval.ru (Baru ditambahkan 6 Feb 2015)
  • oo-6-oo.com (Baru ditambahkan 25 Februari 2015)
  • Humanorightswatch.org (Baru ditambahkan 4 Maret 2015)
  • S.click.aliexpress.com (Baru ditambahkan 17 Maret 2015 - Diduga)
  • www1.social-buttons.com (Baru ditambahkan 23 Maret 2015 - Diduga)
  • 4webmasters.org (Baru ditambahkan 26 Maret 2015 - Diduga)
  • Googlsucks.com (Baru ditambahkan April 07 2015)
  • Addons.mozilla.org (Baru ditambahkan April 07 2015 - Diduga)
  • Smallseotools.com (Baru ditambahkan 13 Apr 2015 - Diduga)
  • Theguardlan.com (Baru ditambahkan 14 Apr 2015)
  • Buy-cheap-online.info (Baru ditambahkan 16 April 2015 - Diduga)
  • Site1.free-share-buttons.com (Baru ditambahkan 29 Apr 2015 - Diduga)
  • Sanjosestartups.com (Baru ditambahkan 25 Mei 2015)
  • Trafficmonetize.org (Baru ditambahkan 3 Juni 2015 - Diduga)
  • Howtostopreferralspam.eu (Baru ditambahkan 09 Juni 2015 - Diduga)
  • Www10.free-social-buttons.com (Baru ditambahkan 16 Juni 2015 - Diduga)
  • Getitfree.us (Baru - ditambahkan 18 Juni 2015 Kepemilikan tidak dapat ditentukan. Terima kasih - Trey Copeland)
  • Www6.free-social-buttons.com (Baru ditambahkan 18 Juni 2015 - Diduga)
  • Erot.co (Baru ditambahkan 26 Juni 2015 - Diduga)
  • 3g2upl4pq6kufc4m.onion (Baru ditambahkan 4 Juli 2015 - Diduga)
  • Traffic2money.com (Baru ditambahkan 28 Juli 2015 - Diduga)

Catatan: Barang yang dicurigai- tampaknya mengikuti pola kepemilikan yang sama, dan mungkin tidak terikat dengan pelaku yang sama.

Daftar rujukan spam yang lengkap yang dikelola oleh Piwik dapat ditemukan di sini: https://github.com/piwik/referrer-spam-blacklist/blob/master/spammers.txt (Terima Kasih - user2428118)

Kutipan:

BlackHatWorth.com adalah domain yang relatif baru yang dibuat hanya pada 7 Januari 2015 yang sekarang digunakan untuk spam pengarah. Faktanya, situs web rujukan spam ini disembunyikan di balik nama mesin pencari belanja dan gambar pemandangan indah.

... alamat IP BlackHatWorth.com yang 78.110.60.230 adalah sama dengan yang terkait dengan situs web rujukan spam lainnya ...

Faktanya, domain BlackHatWorth.com dimiliki oleh orang Rusia yang sama yang memiliki domain spam rujukan lainnya seperti ILoveVitaly.com, Econom.co, dan Darodar.com. Nama pemilik domain seharusnya Vitaly A Popov dari Samara (kota), Oblast Samaraskaya (negara bagian), Rusia.

Anda tidak dapat memblokir ini!

Dari: http://www.blackmoreops.com/2014/12/19/darodar-com-referrer-spam/

Kutipan:

Inilah primer cepat tentang cara kerja Google Analytics.

Jadi, Anda mendapatkan pengaturan pada GA dan mendapatkan kode dari mereka. Kode tersebut terlihat seperti UA-nomor-1 atau semacamnya. Angka itu adalah "nomor akun" Anda di GA. Sekarang, kode ini dan sedikit javascript masuk ke halaman web Anda. Sekarang, seseorang mengunjungi halaman Anda, dan browser mereka menjalankan kode javascript itu.

Kode javascript itulah yang "mencatat" kunjungan mereka. Itu membuat browser mereka berbicara dengan Google Analytics. Secara khusus, ini membuat jenis permintaan HTTP tertentu yang dicatat oleh Google tentang informasi, dan kemudian GA menampilkan ringkasan informasi itu kepada Anda.

Cukup mendasar, bukan? Masih dengan saya? Oke, sekarang, jika semua itu Javascript ini mengirimkan "kunjungan" kepada mereka, maka siapa pun dapat memalsukan itu. Siapa saja? Yang harus saya lakukan untuk membuat GA Anda menunjukkan informasi palsu adalah mengirimkan informasi palsu saya langsung ke GA.

Saya tidak perlu mengunjungi situs Anda sama sekali. Saya tidak perlu menjalankan javascript sama sekali. Saya hanya perlu mereproduksi permintaan HTTP itu, yang bersifat publik sehingga siapa pun dapat melihatnya dan cara kerjanya. Mereka bahkan didokumentasikan dengan cukup baik, secara publik, oleh Google sendiri.

Jadi, sekarang, katakanlah saya brengsek. Saya ingin membuat orang melihat situs spam saya. Jadi apa yang saya lakukan? Saya menulis sedikit kode untuk mengirim ribuan permintaan palsu ini ke GA, dan saya cukup menggilir semua nomor UA, secara acak, apa pun. Saya mengirim kunjungan palsu, dengan pengarah palsu, dan nama domain spam saya. Dan coba tebak? Itu muncul di layar Google Analytics Anda.

Anda melihat spam ini seperti kunjungan normal lainnya. Karena sejauh menyangkut GA, itu adalah kunjungan normal. Yang mereka rekam hanyalah permintaan HTTP itu, yang biasanya berasal dari kode javascript GA. Tetapi permintaan adalah permintaan, dan membuat permintaan palsu itu sangat, sangat mudah.

Itulah yang sedang terjadi. Yang saya butuhkan adalah nomor UA Anda dan hanya dengan sedikit usaha saya dapat memalsukan kunjungan ke situs Anda tanpa pernah benar-benar terhubung ke situs Anda sama sekali. Kunjungan palsu itu dapat memiliki nama domain apa saja dan pengarah apa pun yang saya pilih.

Ini adalah serangan terhadap Google Analytics, untuk mempromosikan situs apa pun yang muncul. Anda tidak dapat memblokirnya di server Anda, karena server Anda tidak terlibat sama sekali.

Anda dapat melakukan dua hal: satu, mengatur filter seperti yang disarankan John Conde; dan dua, lihat apakah ada cara untuk memberi tahu Google. Untuk itu saya tidak punya jawaban, tetapi saya punya ide.

[Memperbarui]

Ini mulai mencapai proporsi yang luar biasa dari ratusan klik spam sehari untuk menyelesaikan iklan seperti ini:

masukkan deskripsi gambar di sini

closetnoc
sumber
2
@JohnMueller Ini saya tidak berada dalam wilayah Anda, tetapi dapatkah Anda mengirim beberapa email untuk melihat apakah G memiliki pengetahuan tentang ini? Terima kasih sebelumnya!!
closetnoc
2
@ JohnConde Terima kasih! John Mueller mungkin tidak tahu tentang ini, tetapi seseorang di G seharusnya. Bahkan jika tidak ada jawaban, setidaknya G harus memiliki kepala jika mereka belum melakukannya. Itu adalah hal yang benar untuk dilakukan bagi kita semua. Tepuk tangan!
closetnoc
1
@JohnConde BTW- Saya melihat pertanyaan tentang hal ini di situs SE lainnya (dan mungkin terkait). Saya tidak mencatat, tetapi apakah ada cara yang baik untuk menyiarkan catatan ke Mod lain? Atau haruskah saya hanya Google nama domain ini dan mencari jawaban dan memposting?
closetnoc
1
@ joelmdev Anda melewatkan titik bahwa ini tidak dapat diblokir. Ini adalah serangan langsung ke Google. Tidak ada yang memiliki kontrol selain Google. Mereka telah diberitahu dan sebagian besar berhenti.
closetnoc
2
@ Seve Saya tidak bisa melihat bahwa ada hadiah besar, namun, harus ada satu di suatu tempat. Satu orang yang disebutkan dalam jawaban membenci Google dan kemungkinan ingin paling tidak mempermalukan Google. Tetapi mereka juga jelas menggunakan spam ini untuk mengarahkan lalu lintas ke berbagai situs web yang terus terdaftar. Saya bahkan telah melihat sesuatu seperti iklan menggunakan metode ini. Sangat menyebalkan !! Ini benar-benar menyakiti orang yang tidak bersalah lebih dari Google. Saya menganggap itu berhasil ... sangat sedih.
closetnoc
5

Anda dapat mengecualikannya dengan membuat filter . Anda perlu menemukan sesuatu yang cukup spesifik sehingga Anda tidak sengaja memblokir pengunjung yang baik dan itu membosankan karena Anda harus menambahkan setiap spammer secara manual tetapi ini akan membantu.

John Conde
sumber
Apakah Anda memiliki saran IIS yang dapat membantu? Saya dapat membantu dengan Apache, tetapi OP tampaknya memiliki IIS.
closetnoc
2
Jika mereka tidak memukul situs web mereka, yang menurut saya kata mereka, maka ini bukan metode yang efektif untuk memblokir mereka. Atau apakah saya salah membaca pertanyaan?
John Conde
Saya membacanya karena OP mendapatkan hit dengan spam pengarah.
closetnoc
2
Memang, tetapi tampaknya mereka langsung memukul GA alih-alih memukul situs mereka. It seems these spammers are using scripts to spam directly to GA (i.e. they are not logged in my IIS).
John Conde
Baik. Kamu benar. Salahku!! Saya tidak yakin mengapa saya tidak mengambil ini karena saya baru saja membaca tentang ini sebelum pertanyaan ini. Saya juga terkena spam pengarah dan satu artikel menyebutkan (secara singkat) bahwa tidak ada entri dalam file log mereka. Metode baru yang menarik.
closetnoc
4

Untuk menjawab pertanyaan judul Anda secara langsung "Bagaimana cara melawan spammer pengarah", jawaban yang paling sederhana adalah dengan menjatuhkan Google Analytics dan beralih ke Piwik , yang secara otomatis memblokir semua spam pengarah secara default .

Saya menyadari Anda mungkin terbiasa dengan Google Analytics dan ingin terus menggunakannya, tetapi jika Anda melihat gambar yang lebih besar, Anda memiliki pilihan lain yang bekerja dengan sangat baik. Piwik juga dapat dikonfigurasi untuk mencatat alamat IP pengunjung jika Anda suka, dan itu tidak membocorkan data pengunjung ke perusahaan iklan pihak ketiga yang mungkin menarik bagi beberapa pengguna.

Tom Brossman
sumber
2
Ngomong-ngomong, blacklist pengarah spam yang digunakan Piwik adalah open source: github.com/piwik/referrer-spam-blacklist
Matthieu Napoli
basis data spam mereka cukup kecil. bahkan domain yang disebutkan dalam laporan analisis saya tidak ada.
Don Dilanga
1

Berikut aturan yang berfungsi pada IIS:

<rewrite>
  <rules>
    <rule name="abort referer spam requests" stopProcessing="true">
      <match url=".*" />
      <conditions>
        <add input="{HTTP_REFERER}" pattern="(semalt\.com)|(buttons\-for\-website\.com)" />
      </conditions>
      <action type="AbortRequest" />
    </rule>
    <!--The rest of your rules, if you have any-->
  </rules>
</rewrite>
Flo
sumber
2
Jawaban ini tidak ada hubungannya dengan pertanyaan OP karena spammer melakukan spam langsung ke Google Analytics dengan melewati server web OP.
Alfred Myers
@AlfredMyers Komentar Anda sebagian benar karena beberapa spammer DO menggunakan metode server web, yang lain menggunakan metode langsung seperti yang Anda sebutkan. Dalam kasus terakhir, satu-satunya solusi adalah menambahkan filter di Google Analytics untuk mendapatkan pelaporan yang bersih. Untuk mencegah hal ini, saya lebih suka Google menggunakan pengidentifikasi unik hash yang lebih lama untuk akun GA sehingga spammer tidak bisa begitu saja menelusuri nomor yang tersedia dan mem-query.
Flo
OP secara khusus menyatakan "... spammer ini menggunakan skrip untuk mengirim spam langsung ke GA (yaitu mereka tidak masuk dalam IIS saya).". Jadi untuk pertanyaan khusus ini, mereka tidak mengakses server webnya.
Alfred Myers
1

Jika Anda masih mencari solusi, dan tidak dapat memahami referensi yang dibuat, inilah Panduan Definitif untuk Menghapus Spam Referral, sekarang revisi ke-133 sejak 28 Desember 2014: http://www.analyticsedge.com/2014 / 12 / menghapus-referral-spam-google-analytics /

TL; DR:

  • filter nama host yang valid akan menghapus semua referensi hantu (Sertakan nama host mydomain.com)

  • filter pengecualian tertentu (atau pemblokiran situs web) akan menghapus daftar perayap spam yang jauh lebih pendek (semalt.com | kambasoft.com | 7makemoneyonline.com | best-seo-offer.com | best-seo-solution.com | buttons-for -website.com | buttons-for-your-website.com | -musicas * -gratis | anticrawler.org | savetubevideo.com | ranksonic)

  • Segmen Lanjutan dapat digunakan untuk menghapusnya dari laporan historis Anda.

Segmen Lanjutan dapat diimpor dari Galeri Solusi Google Analytics: https://www.google.com/analytics/gallery/#posts/search/%3F_.sort%3DDATE%26_.start%3D0%26_.type%3DADVANCED_SEGMENT % 26_.viewId% 3DGjpPQhFgS9aVzniXH4MTIg /

Mike Sullivan
sumber
0

Awal tahun lalu, saya ditugaskan mencari solusi terbaik untuk spam Google Analytics. Seperti orang lain, saya mencoba pendekatan yang direkomendasikan tetapi tampaknya tidak ada yang berhasil dengan baik. Jadi, selanjutnya saya beralih ke Google Pengelola Tag tetapi itu juga tidak banyak membantu. Karena frustrasi dan jengkel, saya memutuskan untuk membangun kembali skrip pelacakan Google Analytics, menggabungkan tindakan pencegahan terhadap bentuk-bentuk spam yang paling umum dan menjengkelkan.

Meskipun tidak sempurna, setelah ~ 1,5 tahun terus membangun, menguji, men-debug dan refactoring, saya sekarang memiliki skrip pelacakan Google Analytics yang cukup andal yang bekerja dengan baik di luar kotak dan mudah disesuaikan. Bagi mereka yang ingin memenuhi metrik, ini berfungsi seperti pesona.

https://github.com/nickolasburr/intelligent-ga-tracking

nburr
sumber