Cara menemukan semua domain yang berisi string tertentu

11

Saya ingin tahu perbedaan apa yang pediaada.

Saya ingin daftar semua domain terdaftar, yang diakhiri dengan pedia.org, pedia.comatau pedia.info, (misalnya, WIKIpedia.orgatau Anotherpedia.info).

Kobame
sumber

Jawaban:

5

Jika Anda ingin mencapainya dengan menggunakan mesin pencari yang ada, Anda dapat menggunakan Operator Mesin Pencari Google , yang bisa sangat kuat:


Permintaan pencarian ini akan memberi Anda daftar semua domain terdaftar yang diakhiri dengan pedia.org, pedia.comatau pedia.info(tidak sekuat permintaan pencarian kedua, karena terbatas - tetapi itulah yang Anda minta):

"pedia.org" OR "pedia.com" OR "pedia.info"

Cari Operator yang digunakan:

  • Kutipan: Cari kata atau frasa yang tepat: "search query"

  • ATAU operator: Cari kata mana saja: query OR query


EDIT:

Dave Rook telah menyarankan permintaan pencarian ini: site:*pedia.*.

Masalah dengan query ini adalah bahwa untuk beberapa alasan, hanya daftar domain yang mendahului -atau .sebelum pedia, sebagai unor keluar runcing. Sepertinya bug, dan karena itu wikipedia.orgtidak akan muncul di hasil pencarian.

Namun , ada operator pencarian lain (kurang populer) yang sebenarnya sangat berguna:

  • di: Cari di dalam URL / judul halaman / badan halaman / backlink:

    inurl:query intitle:query intext:query inanchor:query

Jadi jika Anda ingin pencarian yang lebih luas (bukan membatasi diri Anda untuk .org, .com, .infositus pedia), dua query pencarian yang sangat kuat akan menjadi:

inurl:*"pedia"* intitle:*"pedia"*
inurl:*pedia* intitle:*pedia*

allin bisa lebih kuat, tapi itu tidak mungkin untuk menggabungkan dengan operator pencarian lain, dan karena itu lebih baik untuk menggunakan di sebaliknya.

Karena mencari pediadi URL dan judul, itu akan memberi Anda hanya situs pedia nyata.

amiregelz
sumber
Terima kasih. Saya mencari beberapa skrip shell yang mencetak daftar domain, tetapi pendekatan mesin pencari dapat digunakan, hanya perlu lebih banyak pekerjaan untuk menggali melalui hasil pencarian. Menerima. ;)
kobame
@kobame Saya telah menambahkan permintaan pencarian tambahan yang kuat, yang menurut Anda berguna. Lihat jawaban saya (yang diedit).
amiregelz
5

Anda perlu menggunakan wild card yang merupakan astrix di *sekitar string kueri dan kata kunci 'situs:' untuk memberi tahu Google bahwa Anda sedang mencari situs. Ketik yang berikut ke Google: (tanpa spasi dan persis seperti apa adanya)

site:*pedia.*

atau klik tautan Google.co.uk ini (yang merupakan jalan pintas untuk menampilkan Google dengan istilah pencarian di atas).

Namun, seperti yang akan Anda lihat, ini tidak hanya dilakukan pada situs gaya Wikipedia dan tidak membatasi Anda hanya pada .com, .org, dan .info.

Anda juga perlu mencatat bahwa melakukan pencarian di Google.co.uk mungkin akan memberikan hasil yang berbeda dibandingkan Google.com, Google.fr, Google.de dll

Setiap * hanya mewakili satu kata atau lebih. Google memperlakukan * sebagai pengganti untuk satu kata atau lebih dari satu kata. Misalnya, ["Google * my life"] memberi tahu Google untuk menemukan halaman yang mengandung frasa yang dimulai dengan "Google" diikuti oleh satu atau lebih kata, diikuti oleh "my life." Frasa yang sesuai dengan tagihan meliputi: "Google mengubah hidup saya," "Google menjalankan hidup saya," dan "Google adalah hidupku."

Operator anak liar Google

Dave
sumber
Terima kasih juga (+1), tetapi menerima solusi amiregelz karena hasilnya lebih konsisten. Dengan pendekatan Anda, saya mendapat lebih dari satu hasil untuk setiap domain yang ditemukan misalnya www.energy-pedia.com atau soo.
kobame
Dengan pertanyaan ini saya sama sekali tidak mendapatkan wikipedia.org. Tampaknya hanya mencantumkan domain yang mendahului " -" atau " ." sebelum " pedia".
unor
@unor Saya telah memperbarui jawaban saya dengan permintaan pencarian yang ditingkatkan, terima kasih telah menunjukkannya.
amiregelz