Apa urutan penyortiran yang digunakan dalam Windows Explorer?
Saya secara khusus bertanya-tanya seperti apa karakter khusus setelah huruf?
Sejauh yang saya tahu (test), semua karakter khusus tampaknya diurutkan sebelum huruf. Tapi saya tidak bisa mengidentifikasi pesanan. (untuk. mis. '@' muncul setelah '%' yang tidak seperti itu di keyboard)
Apakah ada karakter khusus yang akan diurutkan setelah huruf?
Jawaban:
Saya melakukan beberapa pengujian dan pemesanan keseluruhan tampaknya sebagai berikut ...
Simbol
Latin (dipesan dengan nilai Unicode (U + xxxx))
Yunani (dipesan oleh nilai Unicode (U + xxxx))
Cyrillic (dipesan oleh nilai Unicode (U + xxxx))
Bahasa Ibrani (dipesan oleh nilai Unicode (U + xxxx))
Bahasa Arab (dipesan dengan nilai Unicode (U + xxxx))
Angka
Latin (dipesan dengan nilai Unicode (U + xxxx))
Yunani (dipesan oleh nilai Unicode (U + xxxx))
Cyrillic (dipesan oleh nilai Unicode (U + xxxx))
Bahasa Ibrani (dipesan oleh nilai Unicode (U + xxxx))
Bahasa Arab (dipesan dengan nilai Unicode (U + xxxx))
Surat
Latin (dipesan dengan nilai Unicode (U + xxxx))
Yunani (dipesan oleh nilai Unicode (U + xxxx))
Cyrillic (dipesan oleh nilai Unicode (U + xxxx))
Bahasa Ibrani (dipesan oleh nilai Unicode (U + xxxx))
Bahasa Arab (dipesan dengan nilai Unicode (U + xxxx))
Urutan Aturan Urutan vs Orde Teramati
Perlu dicatat bahwa sebenarnya ada dua cara untuk memandang ini. Pada akhirnya, apa yang Anda miliki adalah aturan penyortiran yang diterapkan dalam urutan tertentu, pada gilirannya, ini menghasilkan urutan yang diamati. Urutan aturan lama menjadi bersarang di bawah urutan aturan baru. Ini berarti bahwa aturan pertama yang diterapkan adalah aturan terakhir yang diamati, sedangkan aturan terakhir yang diterapkan adalah aturan pertama atau teratas yang diamati.
Urutan Aturan Penyortiran
1.) Sortir pada Nilai Unicode (U + xxxx)
2.) Urutkan pada budaya / bahasa
3.) Sortir pada Jenis (Simbol, Nomor, Surat)
Ordo yang Diamati
Tingkat pengelompokan tertinggi adalah dengan mengetik dalam urutan berikut ...
1.) Simbol
2.) Angka
3.) Surat
Oleh karena itu, simbol apa pun dari bahasa apa pun muncul sebelum angka apa pun dari bahasa apa pun, sementara huruf apa pun dari bahasa apa pun muncul setelah semua simbol dan angka.
Pengelompokan tingkat kedua adalah berdasarkan budaya / bahasa. Pesanan berikut tampaknya berlaku untuk ini:
Latin
Yunani
Sirilik
Ibrani
Arab
Aturan terendah yang diamati adalah urutan Unicode, sehingga item dalam grup bahasa-jenis diurutkan berdasarkan nilai Unicode (U + xxxx).
sumber
Dalam pengalaman saya, saya menggunakan tilde ~ atau yunani omega Ω untuk memaksa item ke akhir daftar.
sumber
Mereka mungkin diurutkan berdasarkan nilai yang sesuai di Tabel ASCII .
Algoritma pengurutan yang sebenarnya mungkin lebih kompleks dan juga mengambil yang lain Unicode karakter ke dalam akun. Tetapi karakter yang ditunjukkan dalam contoh Anda muncul di tabel ASCII dan nilainya (setidaknya urutannya) juga memetakan ke Unicode.
sumber
{
'masih macam sebelumnya'z
' . Saya secara khusus ingin mengetahui karakter yang akan menempatkannya setelah semua huruf.香