Situs web lain adalah mirroring dan peringkat di atas situs saya di hasil pencarian

55

Ada sebuah situs reputasi buruk yang dikenal sebagai tiga puluh yang telah sepenuhnya mencerminkan situs saya dan sekarang memiliki tautan yang muncul di Google di tempat # 1 menggunakan konten saya. Saya memeriksa file-file log saya dan memperhatikan bahwa situs ini telah merayapi tambang untuk beberapa waktu, dan juga memiliki 10.000 tautan dari situs mereka ke tambang.

Saya telah memblokir akses pengguna yang dirujuk dari situs ini dan melaporkannya sebagai spam web ke Google. Saya juga menolak domain.

Bagaimana mereka mendapatkan tautan teratas di Google (bahkan mengambil alih tambang) untuk taktik jahat seperti itu? Apa langkah-langkah untuk sepenuhnya menghilangkan masalah seperti ini?

UPDATE 8/28/2014:

Saya pikir saya akan memberikan pembaruan tentang ini karena saya memiliki informasi lebih lanjut sekarang. Jadi, tiga puluh menunjuk subdomain mereka ke ip saya yang memiliki efek membuat subdomain mereka terlihat seperti situs web saya.

Selama beberapa hari ini tidak terlalu menjadi masalah karena menggunakan htaccess, saya mengalihkan semua HOSTS bukan dari domain saya, kembali ke domain saya yang pada dasarnya berarti saya mendapatkan tautan lalu lintas subdomain mereka di Google. Setelah beberapa hari tiga puluh mengubah subdomain mereka untuk kembali ke situs web mereka sehingga saya tidak lagi mendapat manfaat dari ini.

Jadi intinya adalah mereka menggunakan konten saya untuk mendapatkan peringkat teratas di Google, dan sekarang mengarahkan tautan itu kembali ke situs web mereka untuk mengarahkan lebih banyak lalu lintas ke situs mereka.

Ini adalah taktik kotor oleh situs web kotor. Harapan saya adalah bahwa Google menghukum perilaku seperti itu.

Marlboro Goodluck
sumber
3
Saya mengedit bagian di mana Anda mempertanyakan motif mereka karena itu di luar topik di sini. Tapi pertanyaan yang bagus sebaliknya.
John Conde
1
Kloning situs web tampaknya menjadi trik baru, banyak situs web yang disalahgunakan saat ini. Ada berita di Heise (Jerman) tentang topik ini. Solusi yang biasa (selain melaporkan situs palsu) tampaknya adalah, untuk memberi makan konten khusus ke alamat IP dari crawler, jadi mereka misalnya akan menunjukkan tautan ke situs Anda yang sebenarnya.
martinstoeckli
1
Kekhawatiran lain untuk masa depan - sekarang Google telah mengambil sikap keras terhadap webspam - adalah bahwa pesaing akan dengan sengaja memposting konten saya di situs-situs dengan reputasi buruk untuk merusak reputasi saya. Atau akan memposting blog yang tampak seperti spam yang mengarah ke situs saya tanpa sepengetahuan saya.
Marlboro Goodluck
3
@Jarrod Roberson: tidak juga, ada yang tahu tentang gugatan hukum, tetapi berapa banyak solusi teknis ?!
machineaddict
1
@JarrodRoberson Namun ini adalah masalah yang dihadapi secara eksklusif oleh webmaster, dan karena itu sangat sesuai topik untuk situs ini karena menanyakannya di sini akan mendapat tanggapan dari orang-orang yang juga harus menghadapinya. Tampaknya juga orang telah mengajukan beberapa solusi teknis di samping yang legal.
thanby

Jawaban:

45

Jika mereka hanya mencerminkan situs Anda dengan memberi makan situs Anda melalui skrip proksi atau memuntahkan HTML verbatum Anda, Anda dapat menambahkan URL kanonik ke halaman Anda. Ini akan membuat Google tahu konten Anda adalah sumber asli dan untuk menampilkan URL Anda di hasil pencarian, bukan milik mereka.

Kirim permintaan DMCA ke Google. Mereka agak lambat dengan mereka tetapi mereka pada akhirnya akan menghapus halaman-halaman itu dari indeks mereka.

Menolak tautan adalah langkah cerdas.

Saya tidak tahu apakah memblokir pengguna itu membantu. Mungkin menempatkan pesan di bagian atas halaman Anda agar mereka tahu Anda adalah situs asli dan yang lainnya adalah penipuan mungkin merupakan solusi yang lebih baik.

John Conde
sumber
2
URL kanonik tidak selalu membantu. Skrip yang mencerminkan situs saya mengubah URL kanonik untuk menunjuk ke situs palsu juga; jadi tidak ada gunanya.
CaptainCodeman
28

Anda dapat mengajukan keluhan DMCA dan jika Anda berada di AS, Anda dapat mengajukan gugatan hukum hak cipta.

Berikut ini tautan ke jawaban singkat yang menjelaskan bagaimana keluhan DMCA dapat membantu siapa saja:

Apakah Anda harus berada di Amerika Serikat untuk mengajukan keluhan DMCA?

... dan satu lagi yang menjelaskan lebih lanjut ...

Berapa banyak konten Anda perlu disalin sebelum Anda dapat mengajukan keluhan DMCA?

Jika Anda berada di AS, Anda dapat menyewa pengacara yang memahami masalah hak cipta dan meminta mereka mengirim surat gencatan dan penghentian. Beri mereka 10 hari (hari nyata dan bukan hari kerja meskipun hari kerja juga akan baik-baik saja) untuk menghapus konten. Anda ingin mengambil snap-shot dari situs yang menyinggung untuk bukti Anda dan snap-shot dari situs Anda juga. Jika Anda memeriksa untuk melihat apakah suatu halaman telah dihapus, periksa situs secara langsung dan bukan hasil pencarian.

Jika halaman belum dihapus dalam periode waktu, Anda dapat mengajukan kasus perdata federal yang akan mengambil setidaknya $ 10.000 untuk mempertahankan dan hampir tidak dikenakan biaya apa pun. Anda akan berada di kursi pengemudi. Sangat mungkin bahwa penyelesaian dapat dimiliki untuk setidaknya $ 10.000 dan mungkin lebih. Anda bisa mendapatkan biaya Anda kembali juga. Yang penting adalah untuk menawarkan opsi tanpa biaya untuk memperbaiki masalah karenanya surat berhenti dan berhenti. Setelah itu, Anda jelas mengajukan kasus tanpa tanggung jawab kepada terdakwa.

Satu catatan lainnya adalah Anda harus menunjukkan kerusakan jika Anda pergi ke pengadilan. Kehilangan lalu lintas pencarian adalah kerusakan. Di sini Anda akan bekerja dengan pengacara Anda untuk mengumpulkan metrik yang menggambarkan kehilangan lalu lintas dan Anda perlu memonetisasi nilai lalu lintas itu. Tentu saja Anda dapat mengasumsikan angka yang lebih tinggi di sini bahkan dengan tingkat konversi% 100. Untuk berjaga-jaga, saya akan mengumpulkan metrik tentang kehilangan lalu lintas menggunakan Google Analytics dan perangkat lunak analisis file log Anda hari ini dan di masa depan.

Perlu diketahui bahwa mengajukan kasing tidak sulit atau sangat mahal terutama dibandingkan dengan kerusakan yang Anda alami sekarang dan di masa depan. Pelanggaran hak cipta telah turun akhir-akhir ini, tetapi beberapa yang melanggar hak cipta jauh lebih berani belakangan ini. Kita perlu menghentikan orang-orang ini dan satu-satunya cara nyata adalah dengan memasukkan faktor biaya ke dalam strategi bisnis yang membuat pelanggaran hak cipta menjadi tidak menguntungkan.

closetnoc
sumber
2
Seluruh masalah yang Anda hindari adalah bahwa menemukan siapa di belakang situs itu hampir mustahil. Maksud saya, mereka akan menjadi idiot untuk membuatnya mudah melacak situs kembali ke individu yang sebenarnya.
David Mulder
1
@ Davidviduler Tidak menyingkir. Seorang pengacara dapat memanggil perusahaan untuk informasi yang mereka butuhkan. Bahkan surat yang baik saja sudah cukup. Jika informasi tidak disediakan, maka pengacara dapat meminta deposisi di pengadilan di hadapan hakim dengan hukuman penjara jika mereka tidak muncul, atau memberikan informasi yang diminta. Di AS, tidak ada persembunyian dari hukum-sipil atau lainnya. Ini masih berfungsi secara internasional dengan beberapa pengecualian.
closetnoc
@closetnoc: Perusahaan mungkin tidak ingin memberikan informasi secara bebas, atau bahkan bebas untuk melakukannya. Tidak ada kepastian bahwa pengadilan akan mengeluarkan panggilan pengadilan atau bahwa jejak akan tetap berada di yurisdiksinya. Anda mungkin menemukan diri Anda dalam pertempuran hukum yang sangat mahal dan panjang dengan pihak ketiga yang bahkan mungkin tidak tahu nama asli pelaku. Menilai dengan jawaban menyeluruh Anda, Anda pasti menyadari hambatan-hambatan ini, tetapi saya harus memihak David Mulder: Saya pikir Anda meremehkan betapa sulitnya untuk melacak situs kembali ke individu.
Marcks Thomas
@closetnoc: Ya, kecuali penyedia hosting tidak memiliki informasi yang benar. Dan pembayaran mungkin dilakukan dengan kartu kredit prabayar atau kartu prabayar lainnya, kartu kredit curian, bitcoin atau mekanisme transaksi lain yang tidak bisa dilacak. Oh, dan penyedia hosting mungkin bahkan tidak berada di AS sejak awal. Ini disebut internet, suka atau tidak.
David Mulder
@ Davidvidul Saya menghargai apa yang Anda katakan. Saya dalam bisnis keamanan terutama di bidang penelitian tentang bagaimana menemukan orang jahat. Sebagian besar yang Anda bicarakan adalah Cina, Rusia, atau Polandia. Masih ada cara untuk menentukan siapa orang-orang ini melalui pola dan semacamnya. Mereka menyerahkan diri. Ini khusus apa yang saya lakukan. Kamu harus mencoba. Anda tidak bisa begitu saja berguling. Pengacara Internet yang baik mengenal orang-orang seperti saya dan cara mendapatkan informasi. Satu utas adalah semua yang saya butuhkan dan saya biasanya mendapatkannya. Tapi itu bisa menjadi upaya nyata. Tapi itu adalah skenario terburuk.
closetnoc
27

Anda dapat melacak IP mereka (atau IP) dan mengembalikan konten yang sama sekali berbeda untuk mereka pantulkan - apa pun yang Anda suka. Dengan cara ini Anda mendapatkan ruang kosong untuk beriklan apa pun, dan Anda dapat menggunakan posisi tinggi mereka di Google untuk keuntungan Anda.

Saya pernah menggunakan ini untuk hanya menjelaskan kepada pengguna di situs web cermin bahwa ini adalah domain yang salah. Anda juga dapat memposting tajuk pengalihan HTTP sederhana.

Igor R
sumber
8
Saya sebenarnya menemukan ini sangat lucu untuk beberapa alasan. +1
Mehrdad
1
mereka mungkin tidak akan mengkloning HTTP header, tetapi Anda dapat mengirim mereka animasi javascript dan spanduk lucu gaya Marquee berteriak 'ini ripoff' dan gif animasi tua yang bagus: P
Florian Fida
juga dapat menggunakan meta tag dan pengalihan javascript, salah satu dari ketiganya hampir pasti akan berfungsi. dalam hal apa pun, ini bukan solusi yang stabil dan hanya akan berfungsi sampai mereka mengetahuinya dan mulai bekerja menentangnya. @Mehrdad, saya kira itu lucu karena ini hacky :)
Igor R
itu juga terjadi pada saya itu lucu karena penyerang sebenarnya membuka kerentanan pada dirinya sendiri, dengan membiarkan korban ke taman bermainnya (penyerang), bahkan jika dia bisa menghentikannya kapan saja. yang membuat penyerang terlihat sangat bodoh.
Igor R
Posisi tinggi mereka di Google menggantikan posisi tinggi situs web asli, jadi itu bukan "iklan gratis".
CaptainCodeman
12

Sedikit terlambat untuk Anda tetapi ide terbaik untuk melindungi situs web Anda (di masa depan) adalah: https://www.youtube.com/watch?v=I3pNLB3Cq24 (defcon 21, pertahanan dengan angka) memalsukan kode pengembalian sehingga pengguna akan melihat konten tetapi bot akan

  • membuang konten
  • merangkak dalam lingkaran
  • berhenti bekerja

ide lain yang mungkin - pastikan bahwa pengguna Anda tidak melihat ini:

  • biarkan mereka menyimpan informasi GB (sementara hanya ada beberapa kb di server Anda)
  • membuat bot membanjiri memori mereka sendiri dengan tautan palsu
  • kirim konten palsu (100% boolsh * t - Anda perlu menulis hal-hal - seperti "Obama hamil", "Spider-Man 5 - musim panas mendatang", ... sehingga pencuri Anda dapat menyimpannya ...)
  • mengirim file palsu (seperti 42.zip, jika mereka tidak memeriksa konten yang disalin pengguna mereka akan bersenang-senang -> alat AV akan menunjukkan bahwa ada sesuatu yang salah -> pengguna akan p * ss * d ...)
  • biarkan mereka menunggu lebih banyak data (ukuran file = 1-10 MB dan kirim cr * p acak dengan 1 Byte / s atau kurang)

ide lain:

  • tautan yang dilindungi oleh Javascript (lama, tidak digunakan lagi? tetapi jika tidak diubah, pengguna akan dikirimkan kepada Anda (untuk sementara waktu))
  • sampah dinamis (gunakan komentar atau barang tidak terlihat untuk membuat bot mengunduh hal-hal yang tidak dapat dilihat pengguna - bot yang baik tidak akan cocok untuk ini)
  • blokir alamat IP yang mengunduh terlalu banyak / terlalu cepat / dengan cara yang salah (bot tidak berperilaku seperti manusia 1) setiap tautan pada setiap halaman 2) ada pola atau kekacauan total dalam cara mereka memilih tautan berikutnya
  • gunakan Javascript untuk mengalihkan ke server Anda jika file tidak di-host oleh server Anda (tidak ada bantuan terhadap pencurian tetapi pencuri harus menghapusnya atau penggunanya tidak akan tetap di halaman mereka - Anda dapat mengkodekannya ke dalam rutinitas yang berbeda (seperti dekripsi konten ))
MurksVomOrk
sumber
Saya memiliki kode sendiri yang masih perlu saya sesuaikan dengan beberapa yang memblokir laba-laba. Saya akan mencari ide-ide Anda karena saya adalah tipe pria seperti ini! ;-) Kiat-kiat hebat!
closetnoc
4
Masalah dengan memblokir laba-laba dan bot adalah Anda mungkin tidak ingin semuanya diblokir. Google cukup penting, misalnya, jika Anda ingin orang lain dapat menemukan situs web Anda. (Dan karena Google memiliki situs Anda dalam cache, perayap web sebenarnya tidak perlu merayapi situs Anda untuk menggandakannya).
trlkly
Jika Anda akan dengan sengaja memberi mereka sesuatu yang alternatif - Saya lebih suka jawaban Igor menjadikannya bermanfaat bagi Anda (redirect / katakan itu salah / host iklan) daripada melawan balik.
OJFord
2

Ini disebut Google Proxy Hack, dan itu terjadi pada saya juga.

Hal pertama yang pertama:

  • Kirim keluhan DMCA ke Host Web. Gunakan tautan ini untuk membuat keluhan yang dibentuk dengan benar, dan kirimkan ke dukungan tuan rumah atau email penyalahgunaan. Jika tuan rumah ada di AS, mereka harus mencatat situs tersebut. Bahkan jika mereka tidak berbasis di AS, mereka tetap dapat memilih untuk menghapus situs tersebut. (Itu terjadi padaku sekali.)
  • Gunakan alat Google DMCA untuk meminta URL cermin dihapus dari hasil pencariannya.
  • Gunakan Google Scraper Report untuk melaporkan kegagalan dalam algoritma Google.

Namun pada dasarnya, ini merupakan kegagalan Google. Untuk semua yang mereka katakan tentang peringkat yang didasarkan pada "konten asli yang berkualitas", ini adalah contoh tandingan yang sangat sederhana dan terus terang hanya memalukan.

Mudah-mudahan jika cukup banyak orang mengeluh tentang hal itu, pada akhirnya Google akan bertindak bersama dan menulis 10 baris kode yang diperlukan untuk memeriksa bahwa suatu situs adalah cermin yang tepat dari situs yang sebelumnya dibuat.

Perlu diketahui juga bahwa menggunakan URL kanonik tidak selalu berfungsi dalam hal ini. Banyak dari skrip proksi ini mengubah URL kanonik untuk mengarah ke situs mirror, sehingga menjadikannya tidak berguna.

Terakhir, ketahuilah bahwa mereka mungkin juga telah mem-spammed situs utama Anda dengan tautan sampah untuk merusak peringkat Anda. (Ini juga terjadi pada saya.)

Jika Anda melakukan pencarian dan pemikiran kreatif, ada beberapa cara untuk melawan. Saya benar-benar tidak berpikir itu ide yang baik untuk menerbitkan daftar lengkap di sini karena itu hanya membuat hidup para peretas lebih mudah.

Kapten Kodeman
sumber
1

Seperti yang telah disebutkan orang lain, mengajukan keluhan DMCA dan gugatan hukum hak cipta mungkin merupakan opsi terbaik.

Untuk konten baru yang Anda terbitkan, Anda dapat mempertimbangkan untuk memberitahukan tentang pembaruan situs Anda di media sosial (Twitter, Facebook, dll.) Segera setelah Anda memposting. Cap waktu mencatat ada indikator yang adil yang Anda tulis terlebih dahulu jika Anda harus membuktikannya. Melalui Alat Webmaster Google, Anda dapat menerapkan pengaturan agar Googlebot sering menjelajah situs Anda . Dengan asumsi, mesin pencari populer mengindeks halaman web Anda secara teratur (gunakan operator situs, situs: example.com, untuk mencari tahu) tanggal dalam salinan yang di-cache dapat digunakan sebagai indikator kasar kapan konten diterbitkan.

Juga untuk konten baru yang Anda terbitkan, Anda dapat menanamkan tanda air di dalam gambar dan menempatkan komentar di dalam file JS yang menunjukkan bahwa Anda adalah pemilik asli dari file-file itu.

mvark
sumber
Jika ada bot yang menyalin konten, ia bisa dengan mudah memasukkan informasi kepengarangan di halaman, sehingga konten yang disalin akan berisi sesuatu seperti "Ini dibuat oleh Foo, semua hak dilindungi undang-undang" yang membuat kasus yang sangat jelas (Anda bisa misalnya menyembunyikan. bahwa dalam akrostik, tetapi sebagai bot, ini akan bekerja dalam teks biasa, dan membuat casing Anda lebih kuat).
Ángel