Saya ingin bisa berlari
unicode-names 'abç'
dan lihat nama karakter Unicode yang sesuai:
LATIN SMALL LETTER A
LATIN SMALL LETTER B
LATIN SMALL LETTER C WITH CEDILLA
Mencetak string sebagai serangkaian nama mesin terbang Unicode akan berguna dalam beberapa kasus:
- Bedakan karakter yang mudah bingung seperti "i" dan "í".
- Jelaskan apa yang sebenarnya berisi string literal (misalnya karakter tanpa lebar yang tidak dapat dicetak atau tidak ditugaskan).
command-line
unicode
l0b0
sumber
sumber
echo -n …— | uniname -bcegpu
Saya tidak tahu cara yang baik untuk memeriksanya
bash
, tetapi Python memiliki basis data Unicode bawaan yang dapat Anda gunakan seperti pada skrip seperti ini:Anda dapat menggunakan skrip ini seperti ini (dengan asumsi Anda menyebutnya
unicode-names
):Basis data mengeluarkan
ValueError
pengecualian untuk karakter apa pun yang tidak diketahuinya, jadi kami mencetak titik kode dalam desimal (biasanya ini adalah karakter yang tidak dapat dicetak).Peringatan: skrip mengasumsikan terminal Anda dikodekan UTF-8. Jika tidak, Anda harus mengubah argumen
decode()
metode ini. Python mendukung pilihan pengkodean yang sangat luas, milik Anda pasti ada di sana.sumber
sys.getdefaultencoding()
.