Apa itu karakter Unicode di clipboard saya?

53

Apakah ada cara cepat dan mudah untuk menemukan titik kode Unicode untuk karakter apa pun? Misalnya, saya melihat karakter lucu di halaman web, atau file PDF, atau dokumen lain.

Apa yang saya lakukan saat ini adalah menyalin karakter ke clipboard, menyimpannya ke file, dan melihat file dengan hex viewer. Atau saya dapat membuka Microsoft Word, menempel dan melakukan Alt + X. Kedua metode ini agak rumit. Apakah ada cara yang lebih mudah?

Saya menggunakan Notepad ++ jadi jika ada cara untuk melakukannya dengan Notepad ++, itu akan menjadi jawaban yang cocok (itu kurang rumit daripada harus membuka Word). Atau mungkin ada cara untuk melakukannya dengan aplikasi khusus kecil?

DodgyCodeException
sumber
5
ltg.ed.ac.uk/ ~richard/utf-8.html Alat yang bagus, layak untuk bookmark!
tkausl
Bagaimana jawaban yang diterima dapat diterima? Itu tidak menyebutkan Unicode sama sekali dan tidak bekerja dengan baik untuk Unicode. Bagaimana tepatnya hal itu menyelesaikan pertanyaan Anda? Coba 😍 dan lihat bahwa itu tidak akan berhasil. Bahkan tidak menampilkan karakter.
Thomas Weller
@ ThomasWeller Anda membuat poin yang bagus, dan saya telah mengubah jawaban yang saya terima. Tampaknya Notepad ++ hanya dapat mengatasi karakter 16-bit dan tidak mengerti poin kode lebih besar dari 0xFFFF, yang merupakan karakter contoh Anda.
DodgyCodeException
@ user202729 Umurnya belum 2 tahun. Dikatakan "tanya 15 Desember" yang berarti "15 Desember tahun ini", bukan "Desember 2015". Jadi baru berumur 3 hari. Saya tidak mengerti mengapa pertanyaan ini terus diangkat. Itu hanya pertanyaan sederhana tentang sesuatu yang sederhana yang saya ingin tahu.
DodgyCodeException
1
Alat daring adalah karakter Apa Unicode ini , babelstone.co.uk/Unicode/whatisit.html
DrMoishe Pippik

Jawaban:

32

Saya banyak bekerja dengan karakter Unicode, jadi saya telah menulis aplikasi Windows kecil khusus untuk ini:

Informator Karakter Unicode ( Dokumentasi )

Selain itu, editor teks saya, Rejbrand Text Editor , memiliki dukungan karakter Unicode yang luas.

Andreas Rejbrand
sumber
1
Terima kasih! Itu cukup berguna. Bolehkah saya menyarankan F1 harus menjadi fungsi bantuan, yang akan memunculkan jendela kecil yang berisi tautan ke halaman web dokumentasi Anda.
DodgyCodeException
6
Karena penasaran, pekerjaan apa yang sedang Anda lakukan?
Ooker
Dalam bash, saya menggunakan uniprops, yang sepertinya menampilkan info yang sama.
TRiG
FYI Saya mengunduh informan karakter unicode Anda dan perangkat lunak virus saya sangat takut karenanya. Tidak akan membiarkan saya menggunakannya kecuali saya menambahkannya ke daftar putih, jadi saya tidak akan menggunakannya. Apakah Anda memiliki salinan bebas virus? haha jk saya tahu itu mungkin tidak benar-benar memiliki virus di dalamnya - tapi tetap saja, mengapa AV saya sangat membencinya? BTW itu Symantec Endpoint Protection.
rory.ap
@ rory.ap: Saya jamin itu benar-benar bebas dari virus. Sayangnya, masalah false-positive adalah umum (mungkin terutama untuk aplikasi yang ditulis dalam Delphi). Ini adalah sesuatu yang sangat saya sadari, dan sesuatu yang memang membuat saya sedih. Saat ini sulit menjadi pengembang perangkat lunak Win32 waktu luang. Saya hanya berharap orang akan berhenti membuat malware sehingga pengembang hobi serius tidak akan terpengaruh oleh kesalahan positif ... Mungkin penandatanganan kode akan memperbaiki situasi, tetapi itu tidak gratis, dan semua perangkat lunak yang saya hasilkan saya berikan secara gratis. :(
Andreas Rejbrand
34

Notepad ++ memiliki plug-in pra-instal yang disebut Konverter yang memiliki opsi untuk Mengkonversi ASCII ke HEX dan sebaliknya. Alat ini cukup berguna untuk mengonversi file data yang dalam format HEX yang akan dikonversi ke ASCII untuk dibaca:

masukkan deskripsi gambar di sini

Begitulah cara kerjanya:

masukkan deskripsi gambar di sini

duDE
sumber
2
Terima kasih! Omong-omong, perangkat lunak apa yang Anda gunakan untuk membuat animasi gif seperti itu?
DodgyCodeException
44
Ha ha! Saya hanya memperhatikan kata "octadecimal" di kotak dialog itu. Itu berarti basis 18. Pengembang berarti oktal, tentu saja (basis 8).
DodgyCodeException
5
@DodgyCodeException Saya kira LICEcap
user11153
3
@DodgyCodeException screentogif.com bagus untuk merekam gif animasi.
David
5
Ketika saya menempelkan 😍 di sana, ia mengatakan D83D. Jadi itu hanya setengah dari thruth dan TIDAK bekerja dengan baik dengan karakter Unicode.
Thomas Weller
17

Ketika saya dihadapkan dengan masalah ini, pencarian Google cepat biasanya memberikan jawaban cepat. Misalnya, ketika saya google "😍 unicode", saya mendapatkan hasil seperti ini: Google mencari emoji "wajah tersenyum dengan mata berbentuk hati"

Saya suka metode ini karena:

  • Ia bekerja di komputer mana saja dengan internet
  • Anda tidak perlu menginstal apa pun
  • Tekanan tombol yang diperlukan ( Ctrl+ C& Ctrl+ T& Ctrl+ V& Enter) adalah tindakan memori otot bagi saya, dan mungkin untuk sebagian besar pengembang / juru ketik lainnya.
Eric Seastrand
sumber
9

Ada situs web kecil yang bagus bernama Unicode Character Inspector (dibangun oleh Tim Whitlock) yang melakukan hal itu. Saya merasa jauh lebih nyaman daripada editor teks atau program desktop.

Baptiste Candellier
sumber
3
Untuk membuatnya lebih cepat, Anda dapat mengatur pintasan mesin pencari di peramban Anda dan membawanya langsung ke halaman informasi tentang karakter yang dimasukkan. Ini berfungsi karena Anda dapat menentukan karakter sebagai parameter querystring https://apps.timwhitlock.info/unicode/inspect?s={some unicode character here}.
Eric Seastrand
9

Pada sistem mirip Unix *:

unicode -s "$(xsel -ob)"

Anda dapat alias ini atau membuat skrip untuk menjalankannya.

Outputnya terlihat seperti ini:

U+2672 UNIVERSAL RECYCLING SYMBOL
UTF-8: e2 99 b2 UTF-16BE: 2672 Decimal: ♲ Octal: \023162
♲ (♲)
Uppercase: 2672
Category: So (Symbol, Other)
Bidi: ON (Other Neutrals)

* Sepertinya poster aslinya mungkin menggunakan Windows, tetapi (a) ini tidak ditentukan, dan (b) solusi ini mungkin membantu orang lain.

wchargin
sumber
Terima kasih! Meskipun saya kebanyakan menggunakan Windows, saya juga menggunakan Linux, dan dalam hal apa pun saya mungkin dapat mengunduh port Windows dari utilitas ini (seperti GnuWin).
DodgyCodeException
6

Anda dapat menggunakan PowerShell!

[char]::ConvertToUtf32((gcb), 0)

Ini mencetak titik kode Unicode pertama dari teks pada clipboard.

Jika Anda tidak perlu khawatir tentang karakter di luar Basic Multilingual Plane (yang akan direpresentasikan dalam string .NET sebagai pengganti tinggi dan rendah), Anda dapat menggunakan ini sebagai gantinya:

[int](gcb)[0]

Jika Anda lebih suka dalam hex, Anda dapat menggunakan penentu format :

'0x{0:x}' -f [char]::ConvertToUtf32((gcb), 0)
Ben N
sumber
5

Catatan untuk setiap pengguna Emacs: Anda dapat mengetik C-u C-x =dan itu akan memberi Anda banyak informasi tentang karakter di bawah kursor, termasuk titik kode Unicode, nama dalam database Unicode dan kategori dll.

             position: 146 of 147 (99%), column: 0
            character: ♲ (displayed as ♲) (codepoint 9842, #o23162, #x2672)
    preferred charset: unicode (Unicode (ISO10646))
code point in charset: 0x2672
               script: symbol
               syntax: w    which means: word
             category: .:Base
             to input: type "C-x 8 RET 2672" or "C-x 8 RET UNIVERSAL RECYCLING SYMBOL"
          buffer code: #xE2 #x99 #xB2
            file code: #xE2 #x99 #xB2 (encoded by coding system utf-8-unix)
              display: by this font (glyph code)
    xft:-PfEd-Mensch-normal-normal-normal-*-16-*-*-*-m-0-iso10646-1 (#x985)

Character code properties: customize what to show
  name: UNIVERSAL RECYCLING SYMBOL
  general-category: So (Symbol, Other)
  decomposition: (9842) ('♲')
Neil Roberts
sumber
3

Punya Vim? Cukup tempelkan, letakkan kursor di atasnya, dan tekan ga. Saya menggunakan ini sepanjang waktu untuk karakter aneh.

SilverWolf - Pasang kembali Monica
sumber
2

Saya menggunakan http://unicode.scarfboy.com , yang sederhana dan berfungsi dengan baik.

Tidak, jangan tampilkan nama asliku
sumber
2
Harap tambahkan deskripsi singkat tentang apa yang dilakukan situs, jika ada cara khusus untuk menggunakannya, dan bagaimana ia secara khusus menjawab pertanyaan OP. Jawaban satu baris biasanya tidak cukup untuk benar-benar menjawab pertanyaan.
computercarguy
2

Saya menemukan Konverter kode Unicode Rishard Ishida (tautan github) sangat berguna untuk menemukan kode karakter unicode, di antaranya. Ini juga menyediakan terjemahan / konversi ke codepoint lain, penyandian dan misalnya escapes-sequence.

Pengubah Unicode

Anda mungkin juga ingin memeriksa laman utama Richard Ishida (rishida.net) , karena memuat (tautan ke) banyak alat dan informasi berharga, terutama jika Anda tertarik dengan internasionalisasi dan pengkodean karakter. Misalnya, alat lain yang sangat berguna yang ditautkan di sana, adalah alat Uniview- nya (tautan github) .

Uniview

Dan akhirnya, juga sangat berguna yang saya temukan, meskipun sebagian besar relevan bagi pengguna Mac, adalah Character Viewer macOS , dapat diakses melalui Menu Input , yang dapat diaktifkan di System PreferencesKeyboard

Meskipun situs web dukungan Apple terutama berfokus pada cara memasukkan emoji (...), Penampil Karakter sebenarnya sangat berguna untuk mencari karakter khusus ('khusus') dan codepoint mereka dalam beberapa pengkodean yang berbeda, serta untuk menemukan font pada systen Anda mengandung mesin terbang khusus.

Penampil Karakter

Tepuk tangan!

datang
sumber
Karakter Viewer seperti yang digambarkan di sini, saya pikir, setidaknya satu revisi utama (dari OS) lama; High Sierra memberi "Show Emoji & Symbols" yang jauh lebih tidak nyaman.
Anton Sherwood
@AntonSherwood tidak ada yang berubah yang bisa saya katakan. Anda dapat memutuskan di opsi Emoji dan Simbol "Kustomisasi Daftar" tabel mana yang akan ditampilkan. Unicode tidak terlihat secara default, saya percaya.
user0721090601
Saya dapat mengonfirmasi bahwa Sierra memiliki panel Karakter lengkap — Sierra Tinggi tidak?
SilverWolf - Reinstate Monica
Ya, kita belajar sesuatu setiap hari. Terima kasih @guifa. Saya membuatnya sedikit lebih sesuai dengan keinginan saya - tetapi tidak dapat mereproduksi screenshot yang ditampilkan.
Anton Sherwood
2

Anda juga dapat menggunakan situs berikut: https://unicode-table.com/en/ Cukup tempel karakter Anda, dan Anda juga akan mendapatkan titik kode Unicode dan kode HTML.

Alina Ladygina
sumber
1

Jika Anda memiliki Microsoft Word, rekatkan teks di sana, pilih karakter (atau klik di sebelah kanannya), dan tekan Alt+ X.

G-Man Mengatakan 'Reinstate Monica'
sumber
Ini sudah disediakan oleh pertanyaan itu sendiri.
Stephan Bijzitter
0

Saya akan menyebutkan http://amp-what.com/ karena sangat mudah digunakan dengan bidang pencarian cepat dan mendukung notasi yang berbeda (& kode, Unicode codepoints , URI mengkodekan urutan karakter).

Contoh gambar

493msi
sumber
0

Inilah satu jawaban lagi menggunakan ide dari user202729:

Bookmark URL javascript:alert(prompt().codePointAt(0).toString(16))dan gunakan browser untuk menjalankannya. (Bekerja di Chrome dan Firefox. Tampaknya tidak berfungsi di IE tetapi ini mungkin karena pengaturan keamanan.)

Tidak seperti jawaban lain, tidak ada koneksi internet yang diperlukan, tidak ada utilitas eksternal untuk mengunduh, tidak khusus untuk OS.

DodgyCodeException
sumber