Tampaknya sejumlah paket statistik yang saya gunakan membungkus kedua konsep ini bersama-sama. Namun, saya bertanya-tanya apakah ada asumsi atau data 'formalitas' yang berbeda yang harus benar digunakan satu sama lain. Contoh nyata akan sangat
Tampaknya sejumlah paket statistik yang saya gunakan membungkus kedua konsep ini bersama-sama. Namun, saya bertanya-tanya apakah ada asumsi atau data 'formalitas' yang berbeda yang harus benar digunakan satu sama lain. Contoh nyata akan sangat
Apa perbedaan utama antara melakukan analisis komponen utama (PCA) pada matriks korelasi dan pada matriks kovarians? Apakah mereka memberikan hasil yang
Saya memiliki dataset yang memiliki data kontinu dan kategorikal. Saya menganalisis dengan menggunakan PCA dan saya bertanya-tanya apakah boleh memasukkan variabel kategori sebagai bagian dari analisis. Pemahaman saya adalah bahwa PCA hanya dapat diterapkan pada variabel kontinu. Apakah itu benar?...
Banyak pekerjaan statistik meminta pengalaman dengan data skala besar. Apa saja jenis keterampilan statistik dan komputasi yang akan diperlukan untuk bekerja dengan kumpulan data besar. Misalnya, bagaimana dengan membangun model regresi yang diberikan kumpulan data dengan 10 juta
Misalkan saya memiliki satu set besar data multivarian dengan setidaknya tiga variabel. Bagaimana saya bisa menemukan outlier? Scatterplots berpasangan tidak akan berfungsi karena dimungkinkan untuk pencilan yang ada dalam 3 dimensi yang bukan pencilan di salah satu dari subruang 2 dimensi. Saya...
Seseorang bertanya kepada saya pertanyaan ini dalam wawancara kerja dan saya menjawab bahwa distribusi bersama mereka selalu Gaussian. Saya pikir saya selalu bisa menulis Gaussian bivariat dengan sarana dan varians serta kovarian mereka. Saya bertanya-tanya apakah mungkin ada kasus di mana...
Inilah cara saya memahami efek acak bersarang vs. bersilangan: Efek acak bersarang terjadi ketika faktor level yang lebih rendah hanya muncul dalam level tertentu dari faktor level atas. Misalnya, siswa dalam kelas pada titik waktu tertentu. Dalam lme4saya pikir kami mewakili efek acak untuk...
Saya mulai mencoba-coba penggunaan glmnetdengan LASSO Regression di mana hasil yang saya minati menjadi dikotomis. Saya telah membuat bingkai data mock kecil di bawah ini: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- c(0.86, 0.45, 0.99, 0.84,...
Dalam konteks proposal penelitian dalam ilmu sosial, saya ditanya pertanyaan berikut: Saya selalu pergi dengan 100 + m (di mana m adalah jumlah prediktor) ketika menentukan ukuran sampel minimum untuk regresi berganda. Apakah ini tepat? Saya sering mendapat pertanyaan serupa, seringkali dengan...
Entropi Shannon adalah negatif dari jumlah probabilitas setiap hasil dikalikan dengan logaritma probabilitas untuk setiap hasil. Apa tujuan yang dilayani oleh logaritma dalam persamaan ini? Jawaban intuitif atau visual (sebagai lawan dari jawaban yang sangat matematis) akan diberikan poin...
Untuk studi simulasi saya harus membuat variabel acak yang menunjukkan korelasi (populasi) prefined ke variabel .YYY Saya melihat ke dalam Rpaket copuladan CDVineyang dapat menghasilkan distribusi multivarian acak dengan struktur ketergantungan yang diberikan. Namun, tidak mungkin untuk...
Saya memiliki 2 variabel dependen (DV) yang masing-masing skornya mungkin dipengaruhi oleh himpunan 7 variabel independen (IV). DVs adalah kontinu, sedangkan himpunan IV terdiri dari campuran variabel kode kontinu dan biner. (Dalam kode di bawah ini, variabel kontinu ditulis dalam huruf besar dan...
Saya baru mengenal Analisis Komponen Independen (ICA) dan hanya memiliki pemahaman dasar tentang metode ini. Tampak bagi saya bahwa ICA mirip dengan Analisis Faktor (FA) dengan satu pengecualian: ICA mengasumsikan bahwa variabel acak yang diamati adalah kombinasi linear dari komponen / faktor...
Saya telah mencoba mereproduksi beberapa penelitian (menggunakan PCA) dari SPSS di R. Dalam pengalaman saya, principal() fungsi dari paket psychadalah satu-satunya fungsi yang mendekati (atau jika ingatan saya benar, mati) untuk mencocokkan output. Untuk mencocokkan hasil yang sama seperti di SPSS,...
Mari kita asumsikan bahwa Anda adalah seorang peneliti ilmu sosial / ekonometrik yang mencoba menemukan prediktor yang relevan dari permintaan layanan. Anda memiliki 2 variabel hasil / dependen yang menggambarkan permintaan (menggunakan layanan ya / tidak, dan jumlah kesempatan). Anda memiliki 10...
Saya bertanya-tanya apakah itu membuat perbedaan dalam interpretasi apakah hanya dependen, baik dependen dan independen, atau hanya variabel independen yang ditransformasikan log. Pertimbangkan kasus log(DV) = Intercept + B1*IV + Error Saya bisa menafsirkan IV sebagai peningkatan persen tetapi...
Saya akui bahwa saya relatif baru dalam hal skor kecenderungan dan analisis kausal. Satu hal yang tidak jelas bagi saya sebagai pendatang baru adalah bagaimana "menyeimbangkan" menggunakan skor kecenderungan secara matematis berbeda dari apa yang terjadi ketika kita menambahkan kovariat dalam...
Pertanyaan ini sebagai jawaban atas jawaban yang diberikan oleh @Greg Snow sehubungan dengan pertanyaan yang saya ajukan mengenai analisis daya dengan regresi logistik dan SAS Proc GLMPOWER. Jika saya merancang percobaan dan akan menganalisis hasil dalam regresi logistik faktorial, bagaimana saya...
Saya ingin mengurangi dimensi sistem orde tinggi dan menangkap sebagian besar kovarian pada bidang 2 dimensi atau 1 dimensi yang lebih disukai. Saya mengerti ini bisa dilakukan melalui analisis komponen utama, dan saya telah menggunakan PCA dalam banyak skenario. Namun, saya belum pernah...
Biplot sering digunakan untuk menampilkan hasil analisis komponen utama (dan teknik terkait). Ini adalah scatterplot ganda atau overlay yang menunjukkan pemuatan komponen dan skor komponen secara bersamaan. Saya diberitahu oleh @amoeba hari ini bahwa dia telah memberikan jawaban yang berangkat dari...