Blog WordPress saya sepenuhnya dikloning. Situs klon itu memperbarui secara real time dengan blog saya. Saya terkejut bahwa seseorang benar-benar dapat melakukan itu.
Apa yang harus saya lakukan untuk menghentikan dampak berbahaya pada peringkat mesin pencari saya? Apakah ada cara untuk memberi tahu Google agar tidak mengindeks situs itu?
wordpress
scraper-sites
Tanvir Hasan
sumber
sumber
Jawaban:
Mereka hanya memuat situs Anda melalui skrip sisi server. Yang perlu Anda lakukan adalah memblokir alamat IP server mereka melalui .htaccess. Cukup buka log akses server Anda, buka halaman yang dikloning di situs mereka, lalu lihat log Anda untuk entri baru dan Anda akan memiliki alamat IP mereka.
Juga tidak ada salahnya untuk mengirimkan permintaan DMCA ke Google, tetapi ini tidak akan benar-benar diperlukan karena konten tersebut akan langsung hilang begitu Anda memblokir alamat IP mereka.
sumber
(Selain jawaban @ John.)
Agak penasaran bahwa sementara mereka tampaknya telah mengkloning segalanya (termasuk peta situs XML Anda * 1 ), mereka belum mengkloning file robots.txt Anda. Bahkan, robots.txt pada yang situs aktif blok merangkak dari segala sesuatu! Jadi sepertinya tidak ada yang bisa dilakukan dalam hal ini. Melakukan pencarian situs di bahwa domain kembali hanya domain telanjang dan pemberitahuan yang menyatakan bahwa yang diblokir oleh robots.txt.
(Agak penasaran apa niat mereka dalam melakukan ini? Anda mungkin bisa berasumsi bahwa mereka melakukan kesalahan dengan robot.txt - dan mungkin begitu - tetapi ini lebih seperti pengecualian yang disengaja bagi saya?)
Selain itu, sementara peta situs XML Anda dikloning, mereka tidak memperbarui URL di dalamnya (seperti yang mereka lakukan di halaman situs utama), jadi mereka masih menunjuk kembali ke situs Anda.* 1 Mengenai peta situs XML. Di situs Anda "sitemap.xml" sebenarnya merupakan pengalihan ke "sitemap_index.xml" dan situs yang dikloning sebenarnya telah mengkloning pengalihan ... yang mengarahkan kembali ke situs Anda! (Tentunya kesalahan di pihak mereka.) "Sitemap_index.xml" hanyalah sebuah indeks, yang terhubung ke 4 sitemaps lainnya. Jika salah satu dari peta situs aktual ini diminta langsung di situs yang dikloning maka mereka akan dikloning dengan benar dan URL diperbarui. Namun, saya akan mengatakan bahwa peta situs ini tidak mungkin ditemukan di situs yang dikloning karena pengalihan awal "sitemap.xml". (?) Meskipun jika mereka mengirimkan "sitemap_index.xml" secara langsung maka itu jelas akan mengatasi redirect.
sumber
Jika situs menghasilkan backlink kepada Anda, penting untuk menggunakan alat Google Disavow, jika tidak algoritma akan bekerja melawan Anda.
https://www.google.com/webmasters/tools/disavow-links-main
buat file .txt dan tambahkan:
kemudian unggah ke Google melalui Alat Webmaster.
Inilah langkah-langkah tepat yang akan saya ambil untuk mengatasi masalah ini. Saya tahu bahwa banyak webmaster menghadapi masalah ini. Saya pernah mengalami masalah ini sebelumnya dan sepertinya tidak ada jawaban langsung di Google (ironisnya) (itulah sebabnya saya ingin membantu). Matt Cutts adalah pria yang seharusnya Anda dengarkan tentang masalah ini, tetapi mendengarkannya seperti mencoba memenangkan permainan catur melawan superkomputer di dalam rumah yang terbakar (tidak ada bantuan yang ditemukan).
Potongan pendek:
Jawaban pertama saya adalah menolak domain, tetapi saya lupa menyebutkan bahwa Anda harus menolak:
(Google menghitungnya sebagai dua domain terpisah).
sumber