Adakah yang tahu R setara dengan SAS PROC FREQ
?
Saya mencoba untuk menghasilkan statistik deskriptif ringkasan untuk beberapa variabel sekaligus.
r
descriptive-statistics
sas
z0lo
sumber
sumber
Jawaban:
Saya menggunakan
table
danprop.table
, tetapiCrossTable
dalamgmodels
paket mungkin memberi Anda hasil lebih dekat ke SAS. Lihat tautan ini .Juga, untuk menghasilkan "statistik deskriptif untuk beberapa variabel sekaligus," Anda akan menggunakan
summary
fungsi tersebut; misalnyasummary(mydata)
,.sumber
Merangkum data dalam basis R hanyalah sakit kepala. Ini adalah salah satu area di mana SAS bekerja dengan sangat baik. Untuk R, saya merekomendasikan
plyr
paket.Dalam SAS:
dengan
plyr
:sumber
Saya tidak menggunakan SAS; jadi saya tidak bisa berkomentar apakah replikasi berikut
SAS PROC FREQ
, tetapi ini adalah dua strategi cepat untuk menggambarkan variabel dalam data.frame yang sering saya gunakan:describe
inHmisc
menyediakan ringkasan variabel yang berguna termasuk data numerik dan non-numerikdescribe
dipsych
menyediakan statistik deskriptif untuk data numerikContoh R
Berikut ini adalah output dari
Hmisc
describe
:Kemudian di bawah ini adalah output dari
psych
describe
untuk variabel numerik:sumber
Saya menggunakan fungsi codebook dari {EPICALC} yang memberikan statistik ringkasan untuk variabel numerik dan tabel frekuensi dengan label level dan kode untuk faktor. http://cran.r-project.org/doc/contrib/Epicalc_Book.pdf (lihat hal.50) Selain itu, ini sangat berguna karena menyediakan sd untuk variabel kuantitatif.
Nikmati !
sumber
codebook()
memaparkan ini. Masalahnya adalahna
s dijatuhkan, yang mungkin ingin Anda sertakan dalam output Anda. 1 cara untuk berurusan dengan ini (setidaknya dengan faktor) adalah dengan menggunakan ? Recode.is.na 1st (misalnya, untuk "hilang"); untuk variabel numerik, Anda dapat membuat variabel baru segera di sebelah kiri kolom dengan nilai logis berdasarkanis.na()
, lalu jalankancodebook()
. Tapi ini agak kluge.Anda dapat memeriksa paket summarytools ( tautan CRAN ) saya yang mencakup fungsi seperti buku kode, dengan opsi pemformatan markdown dan html.
Ringkasan Bingkai Data
CO2
EDIT
Dalam versi ringkasantools yang lebih baru ,
freq()
fungsi (yang menghasilkan tabel frekuensi langsung, lebih to-the-point sehubungan dengan pertanyaan asli) menerima bingkai data serta variabel tunggal. Untuk tabulasi silang (yang juga Frekuensi proc ), lihatctable()
fungsinya.Frekuensi
CO2 $ PlantJenis : Faktor Pemesanan
CO2 $ TypeJenis : Faktor
Pengobatan CO2 $Jenis : Faktor
sumber
Terima kasih untuk semua saran semua orang. Saya akhirnya menggunakan tabel atau fungsi numSummary Rcmdr plus berlaku:
Ini bekerja dengan cukup baik dan tidak terlalu merepotkan. Namun saya pasti akan mencoba beberapa solusi lain ini!
sumber