Apa yang dapat menyebabkan "Ditemukan - saat ini tidak diindeks" di GWT baru

18

GWT baru menunjukkan tautan peta situs yang dibagi ke dalam kategori baru. Dua yang membingungkan saya: 1. Ditemukan - saat ini tidak diindeks 2. Merangkak - saat ini tidak diindeks

Apa alasan yang memungkinkan untuk hal ini, dan apakah ada implikasi luas situs? Apakah ini pertanda dari Google yang harus saya pertimbangkan untuk menghapusnya?

masukkan deskripsi gambar di sini

Noam
sumber

Jawaban:

11

Itu hanya bagian dari proses. Tidak ada yang bisa Anda lakukan sampai Anda benar-benar mendapatkan kesalahan .

Untuk memahami kategori, Anda perlu memahami cara kerja pengindeksan yang merupakan sesuatu yang dilakukan cukup terus menerus:

  • Googlebot mengambil halaman yang berarti mengunduh kontennya ke server Google. Ketika ini terjadi, halaman dirayapi .
  • Ini kemudian menempatkan konten halaman yang diunduh ke dalam indeks. Ini berarti halaman diindeks .
  • Saat merayapi halaman, ia menemukan dan menempatkan mereka dalam antrian. Tautan tersebut ditemukan .

Begitu:

  • Ditemukan tidak diindeks berarti tautan telah ditambahkan ke antrian hal-hal yang akhirnya dapat dirayapi Googlebot . Karena web sebenarnya tidak terbatas dan ada prioritas, mungkin tidak pernah benar-benar sampai di sana.
  • Merangkak saat ini tidak diindeks berarti bahwa halaman itu diunduh ke server Google tetapi isinya belum dimasukkan ke dalam indeks.
Itai
sumber
1
Saya akan menambahkan bahwa Google memutuskan apa yang akan dirayapi berdasarkan PageRank. Menautkan ke laman lebih sering atau lebih menonjol (bahkan secara internal) dapat membuat Googlebot merayapi itu.
Stephen Ostermiller
3
Saya pikir "saat ini tidak diindeks" juga bisa berarti bahwa Google memilih untuk tidak mengindeksnya. Bisa jadi duplikat atau terlihat berkualitas rendah. Pagerank mungkin tidak cukup. Google mungkin berpikir itu tidak akan cocok dengan pencarian yang cukup.
Stephen Ostermiller
Inilah yang saya maksudkan dengan memprioritaskan . Ini terjadi dengan tautan yang diduga duplikat (kadang-kadang karena mereka berbeda hanya pada parameter atau cocok dengan kanonik lainnya).
Itai
Halaman masuk dan keluar dari "rayapan saat ini tidak diindeks" tanpa perhatian dari saya. Informasi ini juga meragukan. Contoh: url yang diperiksa menghasilkan pesan yang diindeks, tetapi tidak di sitemap apa pun ... halaman tersebut ada di sitemap dan telah bertahun-tahun. Pembaruan algo terbaru mengirim laporan ini ke sana-sini.
GLCoder
3

Google dapat menemukan dan menjelajah halaman Anda, tetapi itu tidak berarti bahwa itu akan selalu mengindeksnya.

Ada banyak alasan mengapa Google mungkin tidak mengindeks halaman. Mungkin menemukan duplikat konten. Mungkin tidak merasa bahwa itu menawarkan nilai yang cukup untuk permintaan pencarian tertentu. Google mungkin telah menemukan sesuatu tentang halaman Anda yang tidak disukainya.

Apa pun alasannya, Google belum memutuskan untuk mengindeks beberapa halaman yang telah ditemukan dan dirayapi di situs Anda. Cukup normal bagi sebagian halaman Anda untuk tidak diindeks. Beberapa halaman di situs saya tidak diindeks meskipun memiliki konten yang lebih baik daripada banyak halaman yang diindeks dan memiliki sejumlah besar tautan internal. Sistem pengindeksan Google adalah algoritma pembelajaran mesin. Dan mungkin memutuskan untuk tidak mengindeks beberapa halaman kadang-kadang karena berbagai alasan yang tidak diketahui.

Michael d
sumber
1
"Mungkin ia menemukan duplikat konten"> Saya ingin menambahkan bahwa Dalam kasus ini, karena pesannya adalah "Ditemukan - saat ini tidak diindeks," itu menunjukkan bahwa halaman tersebut bahkan belum diambil (atau itu akan menjadi "Dirayapi" - saat ini tidak diindeks "). Jadi pada titik ini mereka tidak tahu apa-apa tentang isinya. Jadi saya kira prioritas pada tahap ini tergantung pada URL itu sendiri, jumlah halaman yang terhubung, dan kemungkinan hal-hal lain.
Niavlys
2

Googlebot memiliki antrian sendiri, berdasarkan parameter yang berbeda. Ini adalah pesan tentang URL-URL itu yang bahkan di-antri.

masukkan deskripsi gambar di sini

Aj Cohn memiliki semacam pendapat lucu tentang makna pesan ini:

Ditemukan - saat ini tidak diindeks tampaknya menunjukkan bahwa mereka melihatnya di sitemap Anda tetapi berdasarkan pada bagaimana konten lain terlihat mereka bahkan tidak akan repot merangkak. Intinya, "Ya jelek!" Atau, mungkin itu hanya representasi dari efisiensi merangkak yang buruk.

Terus terang, saya tidak sepenuhnya yakin bahwa definisi Discovered akurat karena banyak URL sampel dalam status ini memiliki tanggal rayapan terakhir. Itu sepertinya bertentangan dengan definisi yang diberikan.

Evgeniy
sumber
2
Saya menghapus bit "baca manual". Itu tidak membantu. Terutama karena dokumentasi Google sangat buruk.
Stephen Ostermiller
0

Meskipun Google menemukan URL, itu tidak merasa cukup penting untuk menghabiskan waktu merangkak. Jika Anda ingin halaman ini menerima lalu lintas pencarian organik, pertimbangkan untuk menautkan lebih banyak dari dalam situs web Anda sendiri. Pastikan untuk mempromosikan konten ini kepada orang lain dengan harapan Anda dapat memperoleh backlink dari situs web eksternal. Tautan eksternal ke konten Anda adalah sinyal ke Google bahwa suatu halaman berharga dan dianggap dapat dipercaya, yang meningkatkan peluangnya untuk diindeks.

tsogtgerel.ts
sumber