Saat ini, untuk mencatat alat seperti Evernote
dan Quiver
, saya dapat langsung menyalin konten HTML dari browser favorit saya dan kemudian menempelkannya ke dalam aplikasi, dengan semua tautan format + dipertahankan. Namun dalam orgmode sepertinya semua info format hilang.
Saya telah melihat seseorang menyarankan menggunakan eww
untuk menjelajah web dan menyalin konten melaluieww-org
. Namun itu sangat membosankan (saya tidak berpikir akan ada banyak orang menjelajah web menggunakan eww
browser modern saat ini. Saya harus membuka tautan itu lagi eww
dan melakukan penyalinan, belum lagi terkadang eww
tidak render isinya dengan baik).
Apakah mungkin untuk membiarkan Emacs
langsung mem-parsing HTML yang disalin saat menempel? Bahkan jika belum ada alat untuk itu, apakah layak untuk membuatnya?
Ini adalah satu-satunya hal yang menghentikan saya untuk beralih orgmode
dari dari alat pencatat lainnya.
<b>text</b>
kemudian setelah sayaCmd + C
di atasnya, dapat dikonversi ke*text*
dalamorg mode
beberapa cara ketika menempel. Atau jika tidak, setidaknya pertahankan kode HTML asli agar saya bisa melihatnya dalam format asli semula nanti. Situasi saat ini entah bagaimana hanya teks biasa yang akan ditampilkan.<p>I've seen somebody <a href="http://emacs.stackexchange.com/q/7171/115">suggest using <code>eww</code> to browse the web and copy the content via <code>eww-org</code></a>. However that is really tedious(I don't think there would be a lot of people browsing the web using <code>eww</code> instead of modern browsers nowadays. I'll have to open that link again in <code>eww</code> and do the copying, not to mention sometimes <code>eww</code> doesn't render the contents nicely). </p>
. Jika saya menyalin paragraf ini, saya ingin dapat mereproduksi pemformatannya diorgmode
.org mode
jauh lebih ramah pengguna. Sebenarnya saya lebih suka dengan pemformatan tanpa konversi RTF antara karena mempertahankan lebih banyak info. Misalnya#+BEGIN_QUOTE
dan#+BEGIN_EXAMPLE
dalam jawaban Anda tidak akan dipertahankan dengan konversi tambahan.Jawaban:
Karena ini emacs, ya .
Pendekatan saya adalah menggunakan alat pihak ke-3 yang dapat mengambil HTML dan mengonversi ke teks biasa atau bahkan langsung ke format Org. Saya pikir ini adalah peretasan yang buruk, dan mungkin ada cara yang lebih baik untuk melakukan ini, tetapi sepertinya ini berfungsi untuk kasus pengujian saya.
Sayangnya, HTML sangat kompleks sekarang - tidak lagi beberapa tag tulisan tangan sederhana. Tagging HTML yang rumit ini membutuhkan perintah shell yang rumit di atas. Ini melakukan hal berikut:
osascript
mendapatkan teks HTML dari clipboard. Itu hex disandikan, jadiPerhatikan itu
osascript
untuk MacOS. Untuk memodifikasi langkah 1-2 untuk Linux, ganti argumen shell-command-to-string denganBagaimanapun, output dari
pandoc
perintah dikembalikan ke emacs, dan dimasukkan ke dalam buffer.Bind perintah Emacs baru ke kunci yang mirip dengan "paste" tetapi itu berarti "paste-and-convert-from-html" kepada Anda, dan itu harus bekerja.
Atau, jika Anda tidak ingin memikirkan perintah tempel mana yang akan digunakan, berikut adalah versi Linux yang akan mengonversi HTML saat tersedia di clipboard dan sebaliknya akan kembali ke teks biasa:
sumber
pandoc
secara otomatis menggunakan Non-breaking space cukup banyak daripada ruang normal ketika mengkonversi teks sebaris yang diformat (cetak tebal, miring, kode dll.), Yang tidak dikenaliorgmode
secara default. Anda harus menambahkannya ()org-emphasis-regexp-components
agar teks-teks tersebut diformat dengan benarorgmode
.iconv utf-8
xclip
ada di OS X juga (mungkin hanya w / X11 dan / atau Alat Pengembang diinstal?), sehingga jawaban yang ditingkatkan dapat bekerja pada OS X juga.