Saya punya pertanyaan konsep "statistik dasar". Sebagai seorang siswa, saya ingin tahu apakah saya memikirkan hal yang salah dan mengapa, jika demikian:
Katakanlah saya secara hipotetis mencoba melihat hubungan antara "masalah manajemen kemarahan" dan katakan perceraian (ya / tidak) dalam regresi logistik dan saya memiliki opsi untuk menggunakan dua skor manajemen kemarahan yang berbeda - keduanya keluar dari 100.
Skor 1 berasal dari instrumen pemeringkat kuesioner 1 dan pilihan saya yang lain; skor 2 berasal dari kuesioner yang berbeda. Secara hipotesis, kami memiliki alasan untuk percaya dari pekerjaan sebelumnya bahwa masalah manajemen kemarahan menimbulkan perceraian.
Jika, dalam sampel saya yang berjumlah 500 orang, varian skor 1 jauh lebih tinggi daripada skor 2, apakah ada alasan untuk meyakini bahwa skor 1 akan menjadi skor yang lebih baik untuk digunakan sebagai prediktor perceraian berdasarkan variansnya?
Bagi saya, ini secara naluriah sepertinya benar, tetapi benarkah demikian?
sumber
Jawaban:
Beberapa poin cepat:
sumber
Contoh sederhana membantu kami mengidentifikasi apa yang penting.
Biarkan
di mana dan γ adalah parameter, X 1 adalah skor pada instrumen pertama (atau variabel independen), dan ε mewakili kesalahan iid yang tidak bias. Biarkan skor pada instrumen kedua terkait dengan yang pertama viaC γ X1 ε
Misalnya, skor pada instrumen kedua mungkin berkisar antara 25 hingga 75 dan skor pada instrumen pertama dari 0 hingga 100, dengan . Varian X 1 adalah α 2 kali varian X 2 . Meskipun demikian, kita dapat menulis ulangX1= 2 X2- 50 X1 α2 X2
Parameter berubah, dan varians dari variabel independen berubah , namun kemampuan prediktif model tetap tidak berubah .
sumber
Selalu periksa asumsi untuk uji statistik yang Anda gunakan!
Salah satu asumsi regresi logistik adalah independensi kesalahan yang berarti bahwa kasus data tidak boleh dikaitkan. Misalnya. Anda tidak dapat mengukur orang yang sama pada waktu yang berbeda yang saya khawatir Anda mungkin telah lakukan dengan survei manajemen kemarahan Anda.
Saya juga akan khawatir bahwa dengan 2 survei manajemen kemarahan Anda pada dasarnya mengukur hal yang sama dan analisis Anda bisa menderita multikolinearitas.
sumber