Bagaimana kita bisa menyalin teks dari Wikipedia tanpa bagian kutipan "[1]", "[2]", "[3]"?

9

Jika kita menyalin teks dari halaman Wikipedia , ini kira-kira yang kita dapatkan:

Spasi kalimat adalah ruang horizontal antara kalimat dalam teks typeset. Ini adalah masalah konvensi tipografi. [1] Sejak diperkenalkannya pencetakan jenis bergerak di Eropa, berbagai konvensi penspasian kalimat telah digunakan dalam bahasa dengan alfabet yang diturunkan dari bahasa Latin. [2] Ini termasuk spasi kata normal (seperti antara kata-kata dalam kalimat), spasi tunggal yang diperbesar, dua spasi penuh, dan, yang terbaru di media digital, tidak ada spasi. [3] Meskipun font digital modern dapat secara otomatis menyesuaikan satu ruang kata untuk membuat jarak yang menyenangkan secara visual dan konsisten setelah tanda baca terminal, [4] sebagian besar perdebatan adalah tentang apakah akan menyerang spasi pada keyboard sekali atau dua kali di antara kalimat. [5]

Saya tidak ingin menyalin bagian [1]dan [2]lain - lain. Ini sebenarnya yang ingin saya salin:

Spasi kalimat adalah ruang horizontal antara kalimat dalam teks typeset. Ini adalah masalah konvensi tipografi. Sejak diperkenalkannya pencetakan jenis bergerak di Eropa, berbagai konvensi spasi kalimat telah digunakan dalam bahasa dengan alfabet yang diturunkan dari bahasa Latin. Ini termasuk ruang kata normal (seperti antara kata-kata dalam kalimat), ruang tunggal yang diperbesar, dua ruang penuh, dan, yang terbaru dalam media digital, tidak ada ruang. Meskipun font digital modern dapat secara otomatis menyesuaikan satu ruang kata untuk membuat spasi yang menyenangkan secara visual dan konsisten setelah tanda baca terminal, sebagian besar debat adalah tentang apakah untuk menyerang spasi keyboard sekali atau dua kali di antara kalimat.

Jawaban yang dipilih di bawah ini menggunakan regex tetapi tidak berfungsi setiap saat . (Jika teks aktual itu sendiri berisi [dan ]regex tidak boleh menghapusnya.)

Apakah ada solusi yang lebih baik?

Pacerier
sumber
Itu adalah referensi yang mungkin penting karena sering mendukung kredibilitas informasi yang disajikan. Memasukkan referensi sangat membantu, terutama bagi para peneliti.
Randolf Richardson
@Randolf Termasuk referensi dapat membantu, terutama bagi para peneliti. bukan untuk makhluk normal yang hanya menginginkan informasi
Pacerier
Fitur pencarian dan ganti pengolah kata Anda, mungkin dipanggil dari makro, bisa berguna di sini.
Keith
Ngomong-ngomong, saya menjawab pertanyaan Anda, karena saya pikir itu pertanyaan yang bagus. Mengenai referensi, banyak orang berharap untuk melihatnya, terutama profesor di universitas (jika Anda berencana untuk menghadiri satu, Anda hampir pasti akan menemukan bahwa sebagian besar profesor akan mengharapkan referensi dimasukkan dalam setiap makalah penelitian yang Anda tulis, dan Anda mungkin akan dengar siswa lain berbicara tentang referensi dari waktu ke waktu).
Randolf Richardson
@ Randolf Maksudku, aku hanya ingin menyimpan informasi untuk dibaca dan digunakan di masa depan pribadi.
Pacerier

Jawaban:

9

Bookmarklet adalah teman Anda ...

Buat bookmark browser baru dan salin kode javascript di bawah ini ke dalamnya - ketika Anda ingin menyalin beberapa teks dari wikipedia, cukup klik terlebih dahulu dan itu akan menghapus semua contoh [n] untuk memenuhi kebutuhan Anda dalam pertanyaan.

javascript:function a (){document.body.innerHTML=document.body.innerHTML.replace(/<sup\b[^>]*>(.*?)<\/sup>/gi, "" );return;}; a();

Di belakang layar, itu hanya melakukan pencarian ekspresi reguler dan mengganti semua <sup>...</sup>tag HTML pada halaman.

Saya baru saja mencoba ini di IE7 dan berfungsi dengan baik, jadi semoga juga ok di browser lain.

Saya akan memuji utas ini dengan menunjuk saya ke arah yang benar - saya tahu bookmarklet adalah cara untuk pergi, tetapi belum pernah menulis satu pun sebelumnya.

Stuart McLaughlin
sumber
1
+1, ini satu-satunya cara saya bisa memikirkan melakukan ini. Bahkan ekstensi browser tambahan harus menggunakan semacam analisis Javascript untuk melakukan ini (dan memang sebagian besar melakukannya).
Terobosan