Saya sangat baru dengan R dan statistik secara umum, tetapi saya perlu membuat sebar yang saya pikir mungkin di luar kapasitas aslinya.
Saya memiliki beberapa vektor pengamatan dan saya ingin membuat sebar dengan mereka, dan masing-masing pasangan jatuh ke dalam satu dari tiga kategori. Saya ingin membuat sebar yang memisahkan setiap kategori, baik dengan warna atau simbol. Saya pikir ini akan lebih baik daripada menghasilkan tiga scatterplots yang berbeda.
Saya memiliki masalah lain dengan fakta bahwa di masing-masing kategori, ada satu kelompok besar di satu titik, tetapi kelompok itu lebih besar di satu kelompok daripada di dua lainnya.
Adakah yang tahu cara yang baik untuk melakukan ini? Paket yang harus saya instal dan pelajari cara menggunakan? Adakah yang melakukan hal serupa?
Terima kasih
Ini adalah salah satu masalah klasik untuk set data 'Iris'. Ini adalah tautan ke seluruh rangkaian proyek plot berdasarkan kumpulan data dengan kode R, yang mungkin dapat Anda adaptasi dengan masalah Anda.
Berikut adalah pendekatan yang digunakan dengan basis R daripada paket add-on.
yang menghasilkan gambar ini:
Dari sana, tergantung pada plot Anda, Anda dapat mulai mengotak-atik dengan tingkat alfa / transparansi untuk memungkinkan penempatan berlebih, dll. Tapi saya akan membangun dari grafik yang sangat mendasar terlebih dahulu.
Meskipun ada banyak alasan untuk tetap menggunakan basis R, paket lain menyederhanakan plot. Memisahkan data dengan fitur yang membedakan adalah salah satu kekuatan dari paket ggplot2 dan kisi . ggplot2 membuat plot yang secara visual menarik. Kedua paket ditunjukkan dalam jawaban oleh @cbeleites.
sumber
Atau dengan ggplot2:
Yang menghasilkan
sumber