Base64 menyandikan gambar dan ketersediaan metadata mereka untuk Googlebot

9

Jika saya menanamkan gambar ke halaman sebagai img- srcdengan data base64 URI, apakah metadata gambar (EXIF, IPTC, XMP) masih tersedia untuk imagebot Google?

Evgeniy
sumber
1
Mungkin tidak. Googlebot mungkin memerlukan URL yang dapat diurutkan dan dirujuk pengguna.
John Conde
1
Lupakan data EXIF, saya bahkan tidak yakin bahwa gambar Google bahkan akan mengindeks gambar yang tidak memiliki URL sendiri.
Stephen Ostermiller
@StephenOstermiller: itu pertanyaannya: jika ia mengindeks gambar seperti itu, maka EXIF ​​juga terbaca
Evgeniy
@Evgeniy Seperti yang ditunjukkan Stephen, data URI tidak terpisah dari dokumen yang berisi (lihat ini untuk lebih lanjut). URL indeks mesin pencari, jadi hanya dokumen yang berisi yang akan diindeks, dan apakah mereka akan mengindeks metadata yang terkandung dalam data URI (jika memang itu berisi itu, membuatnya lebih besar) adalah titik bisu. Untuk konfirmasi, Anda bisa menggunakan mesin pencari kode sumber untuk mencari data URI dan kemudian melihat apakah gambar itu diindeks dan berisi info EXIF ​​di Google. Itu tampaknya sangat mustahil.
dan
@ Evgeniy Perhatikan bahwa mem-posting-silang pertanyaan yang sama ke lebih dari satu situs Stack Exchange tidak dimaafkan.
dan

Jawaban:

6

Google tidak mengindeks data gambar URI untuk pencarian gambar Google. Google, John Mueller mengatakan demikian di sini dan di komentar di bawah. Karena data gambar URI tidak diindeks dalam pencarian gambar Google, data EXIF ​​di dalamnya tidak relevan.

Anda dapat memverifikasi bahwa gambar-gambar ini tidak diindeks. Saya mencari gambar "data uri" di Google dan memeriksa hasilnya. Semua gambar yang saya lihat adalah file gambar, bukan URI gambar yang dienkode base64. Anda akan berpikir bahwa jika Google dapat mengindeks data gambar URI, beberapa dari mereka akan muncul di hasil pencarian untuk istilah itu.

Jika Google pernah memutuskan untuk mengindeks data gambar URI, mereka harus bisa mendapatkan data EXIF ​​dari mereka. Data uri adalah seluruh file base64 yang disandikan (tanpa spasi atau baris baru) dengan data:image/png;base64,awalan. Setiap meta data dalam file masih akan hadir dalam versi URI data yang disandikan base64.

Saya menggunakan data gambar URI di salah satu situs web saya. Saya melakukannya karena pengguna biasanya hanya melihat satu halaman di situs untuk mendapatkan semua informasi yang mereka butuhkan. Termasuk semua data CSS, JS, dan gambar inline di halaman meningkatkan kinerja secara dramatis. Semua gambar kecil, sehingga teknik ini bekerja dengan sangat baik.

Situs saya mendapat cukup banyak lalu lintas dari Internet Explorer 7 dan sebelumnya yang tidak mendukung data gambar URI. Karena itu saya harus melayani mereka secara kondisional. Saya memiliki gambar di server juga dan saya memilih URL gambar biasa atau data URI berdasarkan User-Agentheader. Saya memperlakukan bot (termasuk Googlebot) sama dengan IE 7, yaitu, saya menyajikan gambar sebagai URL HTTP. Saya melakukan ini karena termasuk data uri gambar secara dramatis meningkatkan ukuran halaman. Kebanyakan bot tidak perlu mengunduh gambar, jadi itu lebih efisien untuk mereka. Saya juga memperhatikan bahwa Alat Webmaster Google melaporkan Googlebot merayapi situs saya lebih lambat dengan data gambar URI diaktifkan untuk itu. Secara teknis ini dapat dianggap sebagai penyelubungan, tetapi ini akan menjadi cara untuk mendapatkan data URI gambar Anda diindeks.

Stephen Ostermiller
sumber
2
Contoh pertama Anda diindeks di URL ini: photos.topicshow.com/... dan yang kedua di ini: images5.fanpop.com/image/photos/30600000/... Dalam semua kasus yang dapat saya temukan, ada URL http untuk gambar demikian juga.
Stephen Ostermiller
1
@StephenOstermiller string yang disandikan mungkin berisi ruang: goo.gl/RF8r07 . saya akan mengisi gambar dengan EXIF, menyandikannya, menerbitkan dan melihat, apakah itu masuk dalam indeks.
Evgeniy
3
John Mueller (dari Google) menunjukkan di sini bahwa Google umumnya tidak mengindeks gambar dari data URI. Banyak alat daring yang digunakan untuk menyandikan ini juga akan menghapus metadata, jadi itu benar-benar tergantung pada bagaimana itu disandikan, apakah info EXIF ​​dipertahankan ... tetapi mengingat bahwa mereka tidak diindeks pula, itu adalah poin yang bisa diperdebatkan. Beri tahu kami hasil Anda (pastikan tidak membiarkan URL ke gambar diindeks - Google juga menggunakan pengenalan gambar sehingga info EXIF ​​dapat digunakan dari gambar yang cocok).
dan
1
@dan terima kasih! tautan Anda ke jawaban John Muellers menghapus banyak hal sekarang sekaligus! Jika G tidak mengindeks gambar, di mana ia tidak bisa mendapatkan URI, maka orang tidak perlu mempertimbangkan apakah EXIF ​​dibiarkan di dalam atau tidak.
Evgeniy
3
Sebagaimana ditautkan di atas, kami saat ini tidak mengindeks ini sebagai gambar secara terpisah. Itu mungkin berubah di masa mendatang, tetapi setidaknya untuk saat ini Anda ingin menggunakan URL gambar terpisah jika Anda ingin gambar-gambar itu diindeks dalam Pencarian Gambar.
John Mueller
2

Meskipun Google menggunakan gambar sebagai base-encode data URI pada SERP sendiri, ia tidak mengindeks gambar seperti itu di situs web lain. Terima kasih kepada @dan, yang mengarahkan saya ke diskusi Google Groups, di mana John Mueller menjelaskan masalah ini . Ini berarti juga, bahwa pertanyaan tentang keberadaan data EXIF ​​dalam gambar tersebut tidak relevan.

Penjelasan ini memperjelas, kepada gambar mana teknik optimasi kinerja ini lebih baik untuk diterapkan: gambar kecil, seperti ikon, ikon dan tombol, dan gambar-gambar itu, yang tidak memberikan nilai tambahan apa pun untuk konten situs.

Di situs lain, jika seseorang harus menyematkan gambar DENGAN nilai konten tambahan sebagai data tersandi base64 URI, satu-satunya praktik terbaik untuk menyediakan metadata gambar adalah menggunakan markup Schema.org, di mana dimungkinkan untuk menegosiasikan data EXIF, misalnya dengan ini semacam markup.

Jenis markup lain yang menjanjikan untuk menegosiasikan data yang tampak seperti "properti: nilai", seperti EXIF ​​adalah, saat ini memiliki status proposal. Tetapi artikel dari blog Google ini menunjukkan cuplikan terstruktur, yang dapat dihasilkan oleh proposal markup yang saya tautkan di atas.

Evgeniy
sumber