Saya mencari korelasi antara jawaban untuk pertanyaan yang berbeda dalam survei ("umm, mari kita lihat apakah jawaban untuk pertanyaan 11 berkorelasi dengan jawaban pertanyaan 78"). Semua jawaban bersifat kategoris (sebagian besar berkisar dari "sangat tidak bahagia" hingga "sangat bahagia"), tetapi beberapa memiliki rangkaian jawaban yang berbeda. Kebanyakan dari mereka dapat dianggap ordinal jadi mari kita pertimbangkan kasus ini di sini.
Karena saya tidak memiliki akses ke program statistik komersial, saya harus menggunakan R.
Saya mencoba Rattle (paket data mining freeware untuk R, sangat bagus) tapi sayangnya tidak mendukung data kategorikal. Satu retas yang dapat saya gunakan adalah mengimpor R versi kode dari survei yang memiliki angka (1..5) alih-alih "sangat tidak bahagia" ... "bahagia" dan biarkan Rattle percaya bahwa mereka adalah data numerik.
Saya berpikir untuk melakukan plot pencar dan memiliki ukuran titik yang proporsional dengan jumlah angka untuk setiap pasangan. Setelah beberapa googling saya menemukan http://www.r-statistics.com/2010/04/correlation-scatter-plot-matrix-for-ordered-categorical-data/ tetapi tampaknya sangat rumit (bagi saya).
Saya bukan ahli statistik (tetapi seorang programmer) tetapi telah memiliki beberapa bacaan dalam masalah ini dan, jika saya mengerti dengan benar, Spearman rho akan sesuai di sini.
Jadi versi singkat dari pertanyaan untuk mereka yang terburu-buru: apakah ada cara untuk dengan cepat merencanakan rho Spearman di R ? Plot lebih disukai daripada matriks angka karena lebih mudah dilihat dan juga bisa dimasukkan dalam materi.
Terima kasih sebelumnya.
PS Saya merenung sebentar apakah akan memposting ini di situs SO utama atau di sini. Setelah mencari kedua situs untuk korelasi R, saya merasa situs ini lebih cocok untuk pertanyaan itu.
sumber
Jawaban:
Visualisasi korelasi lain yang baik ditawarkan oleh paket corrplot , memberi Anda hal-hal seperti ini:
Ini adalah paket yang bagus.
Lihat juga jawabannya di sini , mungkin ada baiknya Anda mengetahuinya.
Terakhir, jika Anda memiliki saran bagaimana kode pada pos yang Anda rujuk bisa lebih sederhana - beri tahu saya.
sumber
Beberapa ide plot tambahan adalah:
sumber