Saya perlu menganalisis dengan R data dari survei medis (dengan 100+ kolom kode) yang tersedia dalam CSV. Saya akan menggunakan rattle untuk analisis awal tetapi di balik layar masih R.
Jika saya membaca.csv () file, kolom dengan kode numerik diperlakukan sebagai data numerik. Saya sadar saya bisa membuat kolom kategorikal dari mereka dengan faktor () tetapi melakukannya untuk 100+ kolom itu menyebalkan.
Saya harap ada cara yang lebih baik untuk memberitahu R untuk mengimpor kolom secara langsung sebagai faktor. Atau setidaknya untuk mengubahnya di tempat sesudahnya.
Terima kasih!
r
categorical-data
data-transformation
wishihadabettername
sumber
sumber
Jawaban:
Anda bisa menggunakan
colClasses
argumen untuk menentukan kelas kolom data Anda. Sebagai contoh:akan menetapkan angka ke kolom pertama, faktor ke kolom kedua dan ketiga. Karena Anda memiliki begitu banyak kolom, pintasan mungkin:
atau beberapa variasi semacam itu (yaitu menetapkan numerik ke kolom pertama, faktor ke 37 kolom berikutnya, lalu karakter ke yang terakhir).
sumber
atau lakukan saja setelah Anda membaca data
meskipun jenis Q ini mungkin lebih cocok untuk Stack Overflow.sunting : lihat di bawah.
sumber
'T'
dan'F'
(dikonversi menjadi logis).