Bagaimana menemukan panjang string (jumlah karakter dalam string) tanpa membaginya dalam R? Saya tahu cara menemukan panjang daftar tetapi bukan string.
Dan bagaimana dengan string Unicode? Bagaimana cara menemukan panjang (dalam byte) dan jumlah karakter (rune, simbol) dalam string Unicode?
Pertanyaan terkait:
r
string
unicode
string-length
Igor Chubin
sumber
sumber
x
.Jawaban:
Lihat
?nchar
. Sebagai contoh:sumber
nchar(NA)
NA
s. (Meskipun ini didokumentasikan demikian).stri_length
daristringi
- berfungsi baik dengan NA dan lebih cepat :) Periksa posting saya!nchar(NA) ## [1] NA
: lihat nchar RDocumentationGunakan
stringi
paket danstri_length
fungsiMengapa? Karena ini adalah solusi TERCEPAT yang disajikan :)
dan juga berfungsi baik dengan NA's
sumber
stri_length('\u0105')
panjangnya satu, tapi ...stri_numbytes('\u0105')
2 byte digunakannchar()
sekarang memiliki akun argumen untuk NA:allowNA = FALSE
Anda juga bisa menggunakan
stringr
paket:sumber
Lihat ini
sumber
Opsi keepNA = TRUE mencegah masalah dengan NA
sumber
nchar(NA) ## [1] NA
: lihat nchar RDocumentationAnda mungkin perlu mengonversi ke vektor karakter terlebih dahulu;
sumber
nchar
. Untuk input faktor,nchar
akan menimbulkan kesalahan dan karenanya Anda harus melakukan konversi terlebih dahulu seperti yang Anda tunjukkan.