Jawaban untuk pertanyaan ini pada SO mengembalikan sekumpulan kurang lebih 125 nama satu hingga dua huruf: /programming/6979630/what-1-2-letter-object-names-conflict-with-existing -r-benda
[1] "Ad" "am" "ar" "as" "bc" "bd" "bp" "br" "BR" "bs" "by" "c" "C"
[14] "cc" "cd" "ch" "ci" "CJ" "ck" "Cl" "cm" "cn" "cq" "cs" "Cs" "cv"
[27] "d" "D" "dc" "dd" "de" "df" "dg" "dn" "do" "ds" "dt" "e" "E"
[40] "el" "ES" "F" "FF" "fn" "gc" "gl" "go" "H" "Hi" "hm" "I" "ic"
[53] "id" "ID" "if" "IJ" "Im" "In" "ip" "is" "J" "lh" "ll" "lm" "lo"
[66] "Lo" "ls" "lu" "m" "MH" "mn" "ms" "N" "nc" "nd" "nn" "ns" "on"
[79] "Op" "P" "pa" "pf" "pi" "Pi" "pm" "pp" "ps" "pt" "q" "qf" "qq"
[92] "qr" "qt" "r" "Re" "rf" "rk" "rl" "rm" "rt" "s" "sc" "sd" "SJ"
[105] "sn" "sp" "ss" "t" "T" "te" "tr" "ts" "tt" "tz" "ug" "UG" "UN"
[118] "V" "VA" "Vd" "vi" "Vo" "w" "W" "y"
Dan kode impor R:
nms <- c("Ad","am","ar","as","bc","bd","bp","br","BR","bs","by","c","C","cc","cd","ch","ci","CJ","ck","Cl","cm","cn","cq","cs","Cs","cv","d","D","dc","dd","de","df","dg","dn","do","ds","dt","e","E","el","ES","F","FF","fn","gc","gl","go","H","Hi","hm","I","ic","id","ID","if","IJ","Im","In","ip","is","J","lh","ll","lm","lo","Lo","ls","lu","m","MH","mn","ms","N","nc","nd","nn","ns","on","Op","P","pa","pf","pi","Pi","pm","pp","ps","pt","q","qf","qq","qr","qt","r","Re","rf","rk","rl","rm","rt","s","sc","sd","SJ","sn","sp","ss","t","T","te","tr","ts","tt","tz","ug","UG","UN","V","VA","Vd","vi","Vo","w","W","y")
Karena inti pertanyaannya adalah membuat daftar nama objek yang mudah diingat untuk dihindari, dan sebagian besar manusia tidak begitu pandai dalam memahami blok teks yang solid, saya ingin memvisualisasikannya.
Sayangnya saya tidak yakin cara terbaik untuk melakukan ini. Saya telah memikirkan sesuatu seperti plot batang dan daun, hanya karena tidak ada nilai berulang setiap "daun" ditempatkan di kolom yang sesuai daripada dibenarkan dibiarkan. Atau adaptasi gaya kata-kata di mana huruf-huruf berukuran sesuai dengan prevalensinya.
Bagaimana ini bisa divisualisasikan dengan sangat jelas dan efisien?
Visualisasi yang melakukan salah satu dari yang berikut ini sesuai dengan semangat pertanyaan ini:
Tujuan utama: Meningkatkan daya ingat himpunan nama dengan mengungkapkan pola dalam data
Sasaran alternatif: Sorot fitur menarik dari rangkaian nama (mis. Yang membantu memvisualisasikan distribusi, huruf paling umum, dll.)
Jawaban dalam R lebih disukai, tetapi semua ide menarik dipersilakan.
Mengabaikan nama huruf tunggal diperbolehkan, karena itu lebih mudah untuk diberikan sebagai daftar terpisah.
sumber
Ok, inilah saya sangat cepat mengambil visualisasi seperti "tabel periodik", berdasarkan pertanyaan SO dan komentar yang lain. Masalah utama adalah perbedaan besar dalam jumlah variabel antara paket, jenis yang menghalangi visualisasi ... Saya menyadari ini sangat kasar, jadi jangan ragu untuk mengubahnya sesuai keinginan.
Ini adalah keluaran saat ini (dari daftar paket saya)
Dan kodenya
Sekarang, kami memiliki kerangka data seperti ini:
Kami sekarang dapat membagi data berdasarkan paket
Kita dapat melihat bahwa sebagian besar variabel berasal dari paket basis dan statistik
Akhirnya, rutinitas menggambar
sumber
Berikut histogram berbasis surat. Dianggap ukuran huruf pertama dengan nomor, tetapi memutuskan karena itu sudah dikodekan dalam komponen vertikal.
sumber
Tabel Periodik untuk 100, Alex. Saya tidak punya kode untuk itu. :(
Orang mungkin berpikir bahwa paket "tabel periodik" mungkin sudah ada di CRAN. Gagasan skema pewarnaan dan tata letak data tersebut bisa menarik dan bermanfaat.
Ini bisa diwarnai oleh paket dan diurutkan secara vertikal berdasarkan frekuensi, misalnya dalam sampel kode pada CRAN atau seperti yang muncul dalam basis kode lokal seseorang.
sumber
Dua halaman pertama dalam bab 2 dari ITILA MacKay memiliki diagram yang bagus yang menunjukkan probabilitas kondisional dari semua pasangan karakter dalam bahasa Inggris. Anda mungkin menemukannya berguna.
Saya malu mengatakan bahwa saya tidak ingat program apa yang digunakan untuk memproduksinya.
sumber