Apa efek ligatur di web, terkait SEO

19

Semua desainer menyukai ligatur tetapi tipografi web vanilla hanya menyebalkan. Saya mendengar tentang smartypants yang memecahkan banyak masalah thoses, membawa kutipan seksi, ampersand cantik dan semua. Sempurna, secara visual.

Tapi saya khawatir tentang SEO. Katakanlah pada halaman web, kata itu finallymenjadi finally. Apakah mesin pencari mampu mengindeks kata itu dan mengembalikan halaman saat mencari finally(tanpa ikatan)?

TKrugg
sumber

Jawaban:

3

Ringkasan

Jika server Anda menyajikan halaman dengan pengikat (seperti halnya smartypants), mesin pencari tidak konsisten. Bing saat ini tidak mengindeks ligatur dengan benar. Saya akan mengatakan secara umum, itu meminta masalah. Karena mesin pencari berubah, ada metode di bawah ini yang dapat Anda gunakan untuk menguji bagaimana mesin pencari Anda tertarik pada pengikat indeks .

Jika server Anda mengeluarkan halaman dengan teks biasa, maka Javascript mengubahnya menjadi ligatur, itu bagus . Mesin pencari tidak menerapkan perubahan konten Javascript sebelum mengindeks halaman (meskipun diklaim bahwa ada beberapa pengecualian seperti memuat komentar Facebook ). Karena ada metode standar industri untuk memberikan konten dinamis mesin pencari dan metode ini didukung oleh Google , itu akan menjadi kejutan besar jika ini berubah di masa depan. Google menyarankan untuk meramban situs Anda menggunakan peramban teks biasa (mis. Mereka menyarankan Lynx ) untuk melihat konten Anda bagaimana mesin pencari melihatnya.


Detail lebih lanjut tentang kasus pertama (halaman disajikan dengan ligatur dalam kode) ...


Dalam teori

... seharusnya tidak ada bedanya dengan mesin pencari yang diatur dengan baik.

Pertama membantu untuk memahami perbedaan antara mesin terbang dan karakter . Ligatur adalah satu mesin terbang yang mewakili dua karakter f i. Bagaimana perangkat lunak memperlakukannya hingga perangkat lunak itu dan tergantung pada konteks dan tugas yang ada - Anda akan melihat dari contoh dalam pertanyaan terkait bahwa ketika Anda menyalin dan menempelkan mesin terbang, apa yang disisipkan akan bervariasi: kadang-kadang mesin terbang ditempelkan, kadang-kadang mesin terbang diperlakukan sebagai karakter yang terkait dan fdan iditempelkan.

Setiap pemroses teks otomatis yang dibuat dengan baik dan tertarik pada semantik teks (mesin pencari, pemeriksa ejaan, pembaca layar ...) harus memperlakukan mesin terbang identik dengan karakter yang diperlihatkannya, dan harus memperlakukannya finallyidentik finally, karena itulah yang tekstual arti mesin terbang.

Dalam praktek

Tidak semuanya dibuat dengan baik ...

Inilah cara mudah untuk menguji mesin pencari. Inilah sederetan teks dari pertanyaan lain itu:

Copy the ligature fi from Illustrator to this input box

Jika kita mengambil versi non-ligatures dari kalimat itu dan mencarinya dalam tanda kutip ganda:

(mencari di "Copy the ligature fi from Illustrator to this input box"):

  1. ... jika mesin pencari memperlakukan mesin terbang pengikat sebagai cocok untuk karakter yang mereka wakili, itu akan menemukan halaman itu (dan, ketika itu diindeks, yang ini)
  2. ... jika mesin pencari memperlakukan mesin terbang berbeda dengan karakter yang diwakilinya, itu tidak akan menemukan apa-apa sampai halaman ini diindeks, kemudian, itu hanya akan menemukan halaman ini, dan pencarian dengan versi ligatur akan menemukan halaman itu.
  3. ... jika mesin pencari panik melihat mesin terbang seperti ligatur sepenuhnya, itu tidak akan menemukan apa-apa, bahkan halaman ini, dan pencarian dengan versi ligatur juga tidak akan menemukan apa-apa

Beberapa hasil cepat untuk 5 mesin pencari teratas dunia (tautan menuju hasil pencarian):

  • Google: Bagus (tipe 1) . (Meskipun ada komentar di bawah, ini cocok dengan format unicode atau HTML)
  • Bing: Gagal ( tipe 2 ).
  • Yahoo: Gagal ( tipe 2 ) (ternyata Yahoo "Didukung oleh Bing")
  • Yandex (Rusia): Bagus (tipe 1)
  • Baidu (Cina): erm, tidak ada halaman graphicdesign.stackexchange.com tampaknya muncul dalam pencarian Baidu sama sekali ... mungkin kita dilarang di sana ...?!
user56reinstatemonica8
sumber
Nah saya baru saja mengedit jawaban saya, periksa kode sumber pada tautan itu. Semuanya unicode seperti & # xfb00; yang diabaikan oleh Algoritma Google.
Ryan
Sebenarnya Google tidak cocok dengan mereka: lihat apa yang disoroti di sini (ligatures) dan di sini (teks biasa) - keduanya cocok dengan keduanya. Tetapi saya setuju dengan saran Anda ...
user56reinstatemonica8
... (URL itu sangat besar, butuh 2 komentar), sepertinya mengundang masalah. Jika bing tidak cocok dengan pengikat, layanan penting lainnya juga tidak.
user56reinstatemonica8
Lihatlah URL tautan pertama dan kode sumber yang cocok: Anda akan melihat Google tidak (saat ini ...) memiliki masalah dengan pemformatan unicode, dan mengindeks ligatur unicode, ligatur entitas HTML, dan pasangan karakter reguler terpisah. seperti f isetara tanpa masalah. Google tampaknya dapat mengatasi masalah dengan baik - tetapi, ketidakkonsistenan antara berbagai mesin pencari (setidaknya dalam buku saya) adalah pelanggar.
user56reinstatemonica8
3

Berdasarkan satu contoh langsung yang saya lihat saya akan sangat peduli dengan penggunaan yang luas ini karena akan mempengaruhi SEO. Karakter khusus dapat diuraikan sebagai Unicode sehingga algoritma Google tidak akan membacanya. Seharusnya tidak masalah untuk menghemat penggunaan tetapi saya tidak akan gila dengan itu atau menggunakannya pada hal-hal penting seperti judul.

Berikut adalah tautan ke contoh langsung yang saya lihat: http://pages.cs.wisc.edu/~wolfson/ligatures.html

Ryan
sumber
Saya tidak berpikir mereka akan menjadi surat-surat dalam kode sumber. Sepertinya smartypants adalah hal sisi server yang mem-parsing input dan menyimpan mesin terbang ke dalam teks yang disimpan dalam database dan karenanya juga kode sumber. Yang mengatakan, saya pikir itu akan baik-baik saja untuk seo.
user56reinstatemonica8
Ah sebenarnya saya memeriksa elemen tetapi tidak benar-benar melihat sumbernya. Saya akan mengedit jawaban saya.
Ryan
1
Saya pasti setuju dengan "sangat prihatin", dukungan unicode terkenal tidak konsisten. Tetapi sebagai catatan Google dapat (saat ini ...) mengindeks unicode dan tidak (saat ini ...) cocok dengan pengikat unicode pada halaman tersebut dengan pencarian l i f idll . Tapi saya pasti tidak akan pernah mau bergantung padanya ...
user56reinstatemonica8
Bagaimana jika ligatur ditempatkan melalui javascript? Itu tidak akan mengubah dokumen html, karenanya sama sekali tidak terlihat oleh mesin pencari? Apakah itu solusi?
TKrugg
Yup, itu seharusnya bagus - mesin pencari biasanya mengindeks dokumen asli tanpa menerapkan javascript. Anda mungkin ingin memeriksa apakah itu melakukannya tidak memperlambat waktu buka halaman secara signifikan dan bahwa tidak ada sentakan yang menggelegar bagi pemirsa ketika karakter vanilla diganti dengan ligatur selama pemuatan halaman.
user56reinstatemonica8