Umlaut dan Salin dan tempel

4

Saya memiliki masalah dengan salin dan tempel karakter seperti "ü". Ketika saya menyalin dan menempelkan nama "Gereon Müller" dari buku ini http://langsci-press.org/catalog/book/18 (pilih tab unduhan), saya mendapatkan ü diurai menjadi dua karakter di Mac. Ini tidak terjadi pada Windows dan Linux (xpdf, acroread, sumatra), tetapi itu terjadi pada mac dengan acroread dan dengan skim. Ada ide?

Sunting: Ini adalah dua karakter: ü Dalam teks Anda dapat melihat ü, tetapi sebenarnya adalah u dengan dua titik yang digeser ke atas u. Lihat ini: ẗ (seperti yang Anda lihat, saya menulis dengan dua titik ini). Ini bukan masalah untuk membaca ü, tetapi jika saya ingin terus bekerja dengan ini ü saya mendapatkan masalah, karena LaTeX tidak menyukai karakter ini sama sekali. Dalam emacs saya dapat mengedit dua karakter ini secara terpisah.

Edit II:

Saya bermain dengan aplikasi yang berbeda dan mereka berperilaku berbeda: Word mendapat satu salin dan rekat dengan benar, sementara emacs keduanya salah.

Kata:

Kata

Emacs:

emacs

Edit III

Dan ini adalah edit teks:

masukkan deskripsi gambar di sini

Stefan Müller
sumber
2 karakter apa? dan jelaskan tempel ke mana? apa itu "skim"?
Ruskes
bagaimana dengan "Preview" pdf-reader standar Apple?
Kevin Grabher
Masalahnya juga hadir dengan pratinjau.
Stefan Müller
Wow, saya belum pernah melihat TextEdit melakukan itu, dan saya tidak bisa menduplikasinya (menyalin / menempelkan Stefan Müller dari halaman x buku itu dengan Pratinjau dan menggunakan Minion Pro). Coba boot aman (untuk memperbaiki cache yang mungkin rusak) dan lihat apakah itu membantu. support.apple.com/kb/PH14204
Tom Gewecke
Saya mencoba ini. Tidak ada perubahan. Bisakah saya menghapus cache melalui baris perintah?
Stefan Müller

Jawaban:

1

Jika memiliki karakter seperti itu dalam bentuk terurai (diwakili oleh dua codepoint, karakter dasar ditambah menggabungkan tanda aksen) adalah masalah untuk diproses lebih lanjut yang perlu Anda lakukan, maka Anda dapat menggunakan aplikasi seperti Pemeriksa Unicode untuk mengubah teks menjadi Bentuk Normalisasi Unicode C. Itu akan mengubahnya menjadi bentuk single-codepoint yang tersusun.

http://earthlingsoft.net/UnicodeChecker/

Tom Gewecke
sumber
0

Saya mereproduksi langkah Anda:

Buku ini dalam bahasa Inggris dan dalam format Adobe pdf.

Saya mengunduh pratinjau dan menemukan beberapa contoh dengan "Umlauts".

Salin dan tempel ke Catatan saya.

Güldemann Joël König

Seperti yang Anda lihat itu berfungsi dengan baik.

Sarankan Anda memeriksa dan memperbarui Adobe reader Anda ke versi XI.

Ruskes
sumber
Semua perangkat lunak mutakhir.
Stefan Müller
jadi beri tahu kami di mana Anda menyalinnya? mungkin itu masalahnya karena ia bekerja pada MBA 10.9.2 saya dengan keyboard Adobe Reader XI-Jerman!
Ruskes
Saya menyalin / menempelkan ü dari teks ke TextWrangler dan melakukan hex dump dan memverifikasi bahwa itu direpresentasikan sebagai dua karakter, ditambah kombinasi umlaut. Ini biasanya akan menampilkan OK, kecuali ada bug di font atau aplikasi.
Tom Gewecke
salin ke dalam catatan dan lihat apakah itu berfungsi di sana
Ruskes
Saya menyalin dan menempelkannya ke kata dan ke textedit dan ü keluar sebagai dua karakter. Anehnya saya bisa menyalin contoh lain ke kata tanpa masalah tetapi emacs membencinya. Saya memposting tangkapan layar dalam pertanyaan saya. Saya menonaktifkan semua font yang saya instal di fontbook saya.
Stefan Müller
0

"ü" hampir selalu direpresentasikan sebagai satu karakter dalam skema pengkodean teks, tetapi saya telah diberitahu bahwa itu juga dapat direpresentasikan sebagai dua karakter. Dalam Unicode, misalnya, "ü" direpresentasikan sebagai karakter "prekomposisi" tunggal sebagai 00FC. Namun, itu ada sebagai pengelompokan dua karakter yang kurang umum digunakan sebagai 0075 0308.

Anda menemukan bug atau ketidakcocokan yang aneh. Saya menyarankan bahwa mungkin program pengolah kata yang Anda tempelkan teks, untuk dokumen itu, untuk menggunakan jenis pengkodean karakter (lama dan usang) yang tidak benar mengenali karakter "ü". Entah itu, atau ada beberapa masalah aneh dengan cara PDF khusus yang sedang Anda kerjakan ini telah dikodekan dengan karakter.

Dengan memeriksa PDF yang Anda tautkan, saya melihat yang berikut:

Application: LaTeX with hyperref package
PDF Producer: xdvipdfmx (0.7.9)
PDF Version: 1.5 (Acrobat 6.x)

Saya tidak mengerti implikasi dari ini, tidak memiliki pengalaman dengan LaTeX, tapi mungkin ini bisa memberikan petunjuk.

Langkah selanjutnya dalam memecahkan masalah adalah menemukan beberapa PDF berbeda dari sumber berbeda dan situs web berbeda yang memiliki bahasa Jerman di dalamnya, dan lihat apakah Anda memiliki hasil yang sama ketika Anda menyalin teks dari mereka dan menempelkannya ke dalam pengolah kata apa pun Anda berada menggunakan. Jika Anda tidak dapat mereproduksi masalah, maka itu adalah masalah dengan PDF tertentu.

Maka Anda harus mencoba menempelkan teks Jerman dengan umlaut dari berbagai PDF yang berbeda ke dalam dokumen kosong baru dalam program pengolah kata yang berbeda (Apple TextEdit, Bean, Apple Pages, Microsoft Word, OpenOffice, apa pun yang Anda miliki) dan lihat apa hasil dari itu. Masalahnya mungkin masalah dalam satu program pengolah kata tertentu dan pengaturan preferensi.

Saya yakinkan Anda bahwa sangat tidak mungkin Anda mengalami masalah dengan sistem operasi Mac OS X itu sendiri. Saya secara rutin bekerja dengan menulis teks dan membuat PDF dalam beberapa bahasa dengan diakritik, termasuk Jerman, Spanyol, Italia, dan Prancis, dan saya tidak pernah menemui masalah seperti yang Anda laporkan.


sumber
OK, terima kasih, saya akan memasukkan koreksi Anda dalam jawaban saya.
-2

"Ketikkan karakter Jerman - papan ketik Jerman online", ketikkan surat Anda dan setelah selesai salin ke dokumen tempat Anda membutuhkannya (dalam kasus saya, saya salin ke email saya, tidak masalah). Papan ketik online itu tersedia dalam banyak bahasa. Lihat itu, bagus, ada di bawah German.typeit.org

Hannelore Wiese
sumber
Di mana Anda 0 suara turun "Ketik karakter Jerman - keyboard Jerman online"?
Markus