Bagaimana saya bisa mencegah Google secara keliru menawarkan untuk menerjemahkan suatu halaman?

37

Beberapa halaman situs saya muncul di hasil pencarian dengan di [Translate this page]sebelahnya. Ketika saya klik itu saya perlu ke Google Translate dan menerjemahkan halaman saya "dari Bahasa Katalan ke Bahasa Inggris".

Halaman-halamannya dalam bahasa Inggris tetapi memiliki beberapa kata asing (sebenarnya romanisasi Jepang, bukan Catalan) yang tampaknya membuat Google tersandung.

Beberapa minggu yang lalu saya menetapkan tag html <html lang="en">yang dari penelitian tampaknya menjadi metode terbaik untuk menentukan bahasa dokumen. Google telah membuat cache halaman dengan atribut ini tetapi masih menawarkan untuk menerjemahkan.

Penelitian lebih lanjut membawa saya ke sebuah "notranslate" atribut yang mencegah terjemahan seluruhnya: <html lang="en" class="notranslate">. Masalahnya sekarang adalah pengguna tidak dapat menerjemahkan dari bahasa Inggris ke bahasa yang mereka inginkan!

Apakah ada solusi lain yang memaksa Google untuk mem-parsing situs saya sebagai bahasa Inggris saja?

DisgruntledGoat
sumber

Jawaban:

19

Google tidak menggunakan meta-data bahasa karena kami menemukan bahwa itu umumnya salah. Menggunakan tajuk HTTP, tag meta HTML, atau atribut tingkat elemen tidak berdampak pada pengenalan bahasa Google, jadi kecuali Anda ingin melakukan itu untuk tujuan lain (mis. Pembaca layar), Anda mungkin dapat melompati itu.

Satu hal yang perlu diingat adalah bahwa Google tidak memiliki masalah mengenali banyak bahasa per halaman. Jadi, bahkan jika kita harus mengenali bahwa sebagian dari halaman tersebut mengatakan dalam bahasa Italia (mungkin ketika Anda menulis tentang hotel-hotel Italia), dan kami menampilkan tautan "translate this page" di hasil pencarian, kami mungkin masih akan dapat mengenali bahwa sebagian besar dalam bahasa Inggris. Cara sederhana untuk memeriksanya adalah dengan menggunakan opsi pencarian lanjutan untuk memilih bahasa tertentu dan melakukan situs: -meminta situs Anda.

John Mueller
sumber
1
Wawasan hebat John, terima kasih. Jadi maksud Anda tidak ada cara untuk menghentikan Google tampil [Translate this page]? Halaman saya memang muncul dalam pencarian lanjutan hanya dalam bahasa Inggris. Perhatian utama saya adalah pengguna - menunjukkan tautan terjemahan menyiratkan bahwa seluruh halaman menggunakan bahasa yang berbeda. Secara pribadi saya cenderung menghindari tautan-tautan itu ketika saya melihatnya. Ada juga situs-situs lain yang menggunakan kata-kata yang sama yang tidak mendapatkan tautan terjemahan ...
DisgruntledGoat
2
Itu benar - saat ini tidak ada cara untuk membuat tautan "Terjemahkan halaman ini" menghilang dari sisi webmaster. Saya akan meneruskan umpan balik Anda kepada tim, mungkin itu sesuatu yang dapat mereka pertimbangkan untuk masa depan.
John Mueller
2
Terima kasih @ john Masalah utama adalah bahwa Google percaya bahwa halaman-halaman itu dalam bahasa Catalan, padahal sebenarnya tidak. Saya terkejut bahwa Google sepenuhnya mengabaikan tag bahasa - mengapa setidaknya tidak menggunakannya sebagai petunjuk?
DisgruntledGoat
1
Apakah ada pembaruan tentang ini karena saya telah melihat orang-orang di sana-sini di internet mengajukan pertanyaan yang sama dan dalam beberapa kasus menyebabkan loop yang tidak pernah berakhir - superuser.com/questions/326938/…
Coops
4
Secara anekdot, saya harus menambahkan bahwa saya secara pribadi telah melihat ini (di Chrome untuk Windows) ketika saya di PHPMyAdmin di mana Google berpikir bahwa halaman tersebut dalam bahasa Italia dan menawarkan untuk menerjemahkan. Saya selalu merasa aneh mengingat saya belum pernah melihat kata-kata non-Inggris di PHPMyAdmin.
huzzah
13

gunakan meta ini untuk melewati terjemahan Google

<meta name="google" content="notranslate" />
Krish
sumber
2
Ini sebenarnya dikirim sebagai jawaban sebelumnya, lalu dihapus oleh pemilik tanpa penjelasan. @danlefree apakah ada alasan mengapa ini tidak valid? Itu masih muncul di halaman bantuan Alat Webmaster yang baru saja diperbarui.
Su '
@ Su ': menurut google webmaster terjemahan google harus dilewati. dan itu berfungsi untuk situs saya.
Krish
@ Krish tidakkah itu melakukan apa yang saya sebutkan dalam pertanyaan dan mencegah semua terjemahan oleh pengguna?
DisgruntledGoat
Ini mungkin totaliter. Jika bahasa pengguna berbeda dari tag meta bahasa konten, Anda mungkin ingin terjemahan bahasa.
chovy
Jika Anda mengklik kanan pada halaman web dalam chrome, itu masih memberi Anda opsi untuk menerjemahkan bahkan jika Anda memiliki tag meta ...
NewBie1234
12

Anda harus menambahkan tag meta

<meta http-equiv="content-language" content="en" />

Anda juga dapat mengirim header HTTP Konten-Bahasa dari server jika Anda memiliki akses ke sana.

Info lebih lanjut di http://www.w3.org/International/questions/qa-http-and-lang

Gabriele Petrioli
sumber
2
Atau atur header menggunakan Apache: Header set content-language "en"
John Conde
@ John, ya. ( Itulah yang saya maksudkan bahwa ia dapat mengirim header http dari server )
Gabriele Petrioli
Hmm, seharusnya menggunakan <html lang="en">itu lebih baik daripada meta tag itu, tetapi saya akan mencobanya dan melihat apa yang terjadi :)
DisgruntledGoat
Saya memiliki masalah yang sama dan saya telah memverifikasi ini berfungsi untuk saya di Chrome 19 dev
Olly
<html lang=en>tidak memperbaikinya untuk saya, tetapi tag meta 'konten-bahasa' melakukannya.
chovy
4

Anda mungkin dapat melihat Accept-Languageheader permintaan untuk menambahkan / menghapus class="notranslate"atribut secara dinamis ketika string bahasa termasuk en.

Menurut Web Master World, Anda hanya dapat menerapkan class="notranslate"ke konten yang terpengaruh (yaitu 'pasangan kata-kata asing') dan mudah-mudahan menghindari kotak terjemahan bahasa Inggris / Inggris.

Metalshark
sumber
Tetapi jika mereka ingin menerjemahkan dari bahasa Inggris ke bahasa lain, maka itu akan diambil oleh Google, bukan browser, dan mungkin Google akan menggunakan "Bahasa Inggris" di header bahasa terima.
Lèse majesté
Google biasanya menggunakan bahasa Inggris untuk google.com, google.co.uk, dll. Namun bagaimana dengan crawler untuk google.de, dll? Namun terlepas dari itu, penggunaan kelas secara selektif tampaknya merupakan jalan keluar terbaik dari ini.
Metalshark