Temukan ketika frasa ditambahkan ke halaman Wikipedia

9

Apakah ada cara untuk mengetahui kapan kata atau frasa tertentu ditambahkan ke halaman Wikipedia? Saya ingin menemukan cara untuk mendapatkan halaman pertama yang berisi kecocokan frasa tertentu (misalnya, kejadian pertama <ref>webapps.stackexchange.com</ref>dalam riwayat revisi halaman). (Mencari riwayat revisi halaman secara manual akan sangat membosankan, jadi saya akan membutuhkan semacam solusi otomatis.)

Anderson Green
sumber
Pertanyaan ini relevan (tetapi tampaknya membahas topik yang sedikit berbeda, dan memerlukan beberapa pengetahuan tentang sistem kontrol revisi): webapps.stackexchange.com/questions/15938/…
Anderson Green
Untuk membantu orang menemukan ini melalui google: Kapan kata ditambahkan ke halaman Wikipedia?
fek
@ fNek Lihat jawaban di bawah ini: Anda dapat menggunakan WikiBlame untuk menemukan kapan sebuah kata atau frasa ditambahkan ke sebuah halaman.
Anderson Green

Jawaban:

7

Ada alat bernama WikiBlame yang memungkinkan Anda melakukan hal itu: Anda memasukkan nama halaman dan frasa untuk mencari dan akan mengarahkan Anda ke hasil edit yang menambahkannya.

Ini juga ditautkan dari halaman Sejarah setiap halaman di Wikipedia bahasa Inggris (sebagai "Pencarian riwayat revisi").

svick
sumber
Di halaman hasil pencarian, kemunculan pertama frasa pencarian ditemukan di sebelah "Penyisipan ditemukan di antara". Anda dapat mencari melalui seluruh riwayat revisi dengan mengetikkan angka besar di bidang "revisi untuk memeriksa" (misalnya, 10.000). Untuk mencari secara eksklusif untuk wikitext, pilih "paksakan mencari wikitext".
Anderson Green
Berikut ini adalah contoh spesifik dari pencarian (untuk frasa "gameplay inti" dalam artikel "Minecraft"): wikipedia.ramselehof.de/…
Anderson Green
1

Wikimedia menyediakan dump XML dari riwayat revisi lengkap untuk semua artikel Wikipedia. Dataset ini berisi versi data dari April 2010. Dataset ini tidak berisi teks lengkap dari revisi, tetapi hanya informasi meta tentang revisi, termasuk hal-hal seperti bahasa, cap waktu, artikel dan sejenisnya.

Di setiap halaman, di sudut kanan atas ada Historytombol yang akan membawa Anda ke riwayat revisi untuk halaman itu.

masukkan deskripsi gambar di sini

Sumber: Sejarah Revisi Wikipedia

abhshkdz
sumber
Bagaimana Anda bisa mendapatkan dump XML dari riwayat revisi untuk halaman tertentu?
Anderson Green
Lihat hasil edit. Itukah yang kamu cari?
abhshkdz
Saya lebih suka semacam solusi otomatis, daripada menelusuri setiap revisi dengan tangan untuk menemukan string tertentu. Apakah mungkin untuk menemukan kemunculan pertama frasa dalam riwayat revisi (tanpa mencari secara manual, yang bisa memakan waktu berjam-jam)?
Anderson Green
1
Menggunakan dump XML adalah kerja keras: Anda benar-benar tidak perlu mengunduh riwayat revisi lengkap dari semua artikel di Wikipedia hanya untuk mencari sejarah satu artikel.
svick
Jelas sekali. Saya hanya memberikan informasi apa pun yang tersedia.
abhshkdz