Apakah mesin pencari merayapi PDF dan jika ada apakah ada aturan untuk diikuti saat membuatnya

22

Situs web yang saya kerjakan memiliki beberapa ratus PDF di dalamnya. Saya tidak berpikir saya pernah melihat salah satu dari mereka kembali dalam pencarian tetapi ada yang terhubung langsung dari situs. Mereka juga penuh dengan kata kunci karena mereka adalah dokumen produk.

Apakah ada hal khusus yang perlu kita lakukan untuk membuat Google atau mesin pencari lain merayapi mereka?

Apakah ada aturan keras dan cepat untuk membuat PDF agar Google lebih menyukainya? Misalnya saya harus menjalankannya melalui ghostscript untuk membersihkan tag PDF yang rusak yang dibuat Adobe selama pembuatan?

Ben Hoffman
sumber
Tambahkan ke sitemap xml Anda untuk memastikan mereka mengetahui mereka?
artlung

Jawaban:

17

Google pasti mengindeks file PDF dan Anda dapat mencari file PDF hanya dengan menambahkan filetype:pdfpermintaan pencarian Anda ( contoh ).

Saya akan mengatakan hal-hal utama yang harus dilakukan untuk mengoptimalkan PDF sehingga mudah diindeks adalah:

  • Berikan nama file yang berarti
  • Lengkapi semua properti metadata dokumen (judul, penulis, kata kunci, dll)
  • Pastikan PDF Anda terdiri dari teks aktual dan gambar yang tidak dipindai
  • Pastikan Anda memiliki konten yang bagus dengan penggunaan judul yang benar, seperti halnya Anda menggunakan dokumen HTML

Untuk tips lainnya, baca Mengoptimalkan Dokumen PDF dan Sebelas Tips Untuk Mengoptimalkan PDF Untuk Mesin Pencari

Dan Diplo
sumber
@Christofian Terima kasih - Saya telah memperbarui tautannya. Saya akan menyerahkan kepada pembaca untuk menghargai ironi sebuah perusahaan SEO yang mengganti nama tautan mereka tanpa memiliki pengalihan 301!
Dan Diplo
@DanDiplo dalam hal SEO file PDF Saya sarankan menambahkan tautan ke konten saat berlaku.
Anagio
1

Saya tidak yakin tentang mesin pencari lain, tetapi sejauh menyangkut Google aturan utamanya adalah untuk tidak mengecualikan mereka melalui robots.txt

Ini adalah pengumuman awal mereka untuk mendukung pencarian PDF.

intlect
sumber
1

Sama seperti membuat situs web yang sesuai tidak ada salahnya dengan SEO Anda, membuat PDF Anda dapat diakses tidak ada salahnya. Pemeriksa aksesibilitas bawaan Adobe jauh dari sempurna, tetapi setidaknya memperbaiki area-area tersebut akan membantu Anda memulai.

Saya mungkin menghabiskan 5 menit untuk masing-masing 4 atau 5, sebagian besar teks PDF yang kami pasang online. Waktu naik secara merata tergantung pada jumlah halaman, dan seberapa kompleks halaman itu.

Dengan asumsi Anda memiliki Adobe Acrobat Pro untuk melakukan pengeditan Anda:

  • Jalankan Pemeriksaan Penuh Aksesibilitas. (Pemeriksaan cepat tidak ada artinya bagi saya)
  • Perbarui informasi meta di properti dokumen (kata kunci, subjek, bahasa, dll)
  • Pastikan tag ditambahkan
  • Pastikan teks ditandai sebagai teks, gambar sebagai gambar, latar belakang sebagai latar belakang
  • Tandai bulu yang tidak berguna (seperti dekorasi atau desain) sebagai latar belakang
  • Tambahkan alt teks yang baik ke gambar
  • Pastikan dalam urutan membaca, teks tersebut dipesan dengan benar
  • Di bilah alat konten, pastikan teks tidak digandakan atau diterjemahkan secara keliru
  • Gunakan pemindai OCR pada halaman yang dipindai

Untuk mengedit lebih lanjut seperti tabel dan kesalahan Adobe yang sangat aneh, kami menggunakan plugin yang disebut CommonLook. CommonLook menyelesaikan pekerjaannya, tetapi saya membencinya hampir sama seperti saya membenci alat Adobe.

Biasakan diri dengan alat Touch Up Reading Order, bilah alat Tags, bilah alat Membaca Bilah alat dan bilah alat Konten. Pekerjaan saya memerlukan dokumen yang sepenuhnya sesuai sebelum keluar di web, tetapi siapa pun dapat mengambil manfaat dari beberapa pemberian tag dan properti dokumen sederhana.

Tuan christer
sumber
Situs kami memiliki lebih dari 5.000 PDF yang harus kami kembalikan dan bawa hingga 508 kepatuhan penuh. Butuh waktu beberapa saat untuk belajar, pelatih yang disarankan Adobe itu tidak membantu, tetapi begitu Anda mempelajarinya, Anda dapat melakukannya.
Tn. Christer