Latar belakang: Saya bertanya kepada ratusan peserta dalam survei saya berapa banyak mereka tertarik pada bidang-bidang tertentu (dengan lima poin skala Likert dengan 1 menunjukkan "tidak tertarik" dan 5 menunjukkan "tertarik").
Lalu saya mencoba PCA. Gambar di bawah ini adalah proyeksi ke dalam dua komponen utama pertama. Warna digunakan untuk jenis kelamin dan panah PCA adalah variabel asli (yaitu minat).
Aku tahu itu:
- Titik (responden) dipisahkan cukup baik oleh komponen kedua.
- Tidak ada panah yang tersisa.
- Beberapa panah jauh lebih pendek daripada yang lain.
- Variabel cenderung membuat kelompok, tetapi bukan pengamatan.
- Tampaknya panah yang mengarah ke bawah (ke laki-laki) utamanya adalah minat laki-laki dan panah yang mengarah ke atas adalah kepentingan perempuan.
- Beberapa panah tidak menunjuk ke bawah atau ke atas.
Pertanyaan: Bagaimana mengartikan hubungan antara titik (responden), warna (jenis kelamin) dan panah (variabel) dengan benar? Apa kesimpulan lain tentang responden dan minat mereka yang dapat ditambang dari plot ini?
Data dapat ditemukan di sini .
Jawaban:
Titik adalah responden dan warna adalah jenis kelamin. Kamu tahu, ini. Sumbu utama plot Anda menunjukkan skor PC pertama dan kedua dan setiap individu diplot atas dasar itu. Seseorang di kuadran kiri bawah mendapat skor rendah pada keduanya. PC2 tampaknya menandai minat "pria" dan "wanita". Saya tidak tahu apa arti PC1, tetapi mungkin mewakili skor minat keseluruhan - orang dengan banyak minat memiliki skor tinggi. Atau mungkin itu mewakili orang-orang dengan minat yang kuat (skor 5).
Vektor adalah sistem koordinat yang diproyeksikan untuk variabel asli. Jadi, jika Anda memproyeksikan suatu titik secara tegak lurus ke, katakanlah, vektor bacaan - Anda harus mendapatkan skor bacaan dari orang itu. Posisi relatif penting di sini.
Ambil vektor "pria" seperti "olahraga adrenalin". Sekarang bayangkan Anda memproyeksikan titik merah muda ke atasnya dari tinggi di kuadran kanan atas. Koordinasi orang itu pada "olahraga adrenalin" akan negatif.
Jadi mengapa semua panah ada di bagian kanan grafik? Mengingat geometri, semakin dalam seseorang berada di sisi kiri grafik, semakin sedikit proyeksi mereka akan positif. Ini menunjukkan bahwa PC1 adalah ukuran tingkat bunga keseluruhan.
Saya tidak yakin apa lagi yang bisa Anda pelajari di sini. Anda mungkin ingin melihat PC3 dan PC4, jika PC1 dan PC2 hanya memberi tahu Anda bahwa beberapa orang memiliki minat lebih dari yang lain dan bahwa pria berbeda dari wanita.
Plot Anda tampaknya hampir simetris di sekitar poros PC1, dan simetris sehubungan dengan gender. Karena banyak laki-laki memiliki kepentingan perempuan seperti perempuan memiliki kepentingan laki-laki ... atau apakah itu benar? Saya hanya melihat titik-titiknya. Mungkin menarik untuk melihat daerah-daerah di mana peta tidak simetris: PC1 besar, PC2 cukup negatif --- sektor itu memiliki banyak aksi. Mengapa?
sumber