Dapatkah saya menggunakan regresi berganda ketika saya memiliki prediktor campuran kategoris dan berkelanjutan?

12

Sepertinya Anda dapat menggunakan pengkodean untuk satu variabel kategori, tetapi saya memiliki dua variabel prediktor kategori dan satu kontinu. Bisakah saya menggunakan regresi berganda untuk ini di SPSS dan jika demikian bagaimana caranya? Terima kasih!


sumber
Saya yakin Anda bisa , tetapi saya khawatir saya tidak tahu caranya !
onestop
Saya akan menyarankan mengetik sesuatu seperti regresi ke dokumentasi bantuan yang datang dengan SPSS. Harus menjadi roti dan mentega untuk paket statistik
probabilityislogic
Saya tidak tahu apa yang Anda maksud dengan pengkodean untuk satu variabel kategori. Bisakah Anda memberi contoh dalam sintaksis? Apakah variabel dependen Anda berkelanjutan atau kategorikal?
Andy W

Jawaban:

8
  1. Jika ini adalah pertanyaan sintaks SPSS, jawabannya hanya memasukkan variabel kategorikal, dikodekan dengan tepat, ke dalam daftar variabel untuk "variabel independen" bersama dengan yang kontinu.
  2. Pada statistik: Apakah variabel biner variabel Anda? Jika demikian, Anda perlu menggunakan dummy atau kode kontras yang valid lainnya. Jika bukan biner, apakah variabel kategoris Anda ordinal atau nominal? Jika nominal, sekali lagi, Anda harus menggunakan beberapa strategi kode kontras - pada dasarnya memodelkan dampak dari setiap tingkat variabel pada hasil atau variabel "tergantung". Jika variabel kategori adalah ordinal, maka kemungkinan besarhal yang masuk akal untuk dilakukan adalah memasukkannya apa adanya ke dalam model, sama seperti yang Anda lakukan dengan variabel prediktor berkelanjutan (yaitu, "independen"). Anda akan mengasumsikan, dalam hal itu, bahwa kenaikan antara level variabel prediktor kategori ("independen"); jarang ini akan menjadi kesalahan, tetapi ketika itu terjadi, Anda harus kembali menggunakan kode kontras & memodelkan dampak dari setiap level. Pertanyaan ini cukup sering muncul di forum ini - ini adalah analaysis yang bagus
  3. Menurut saya, cara menangani data yang hilang adalah masalah yang sepenuhnya terpisah. Pemahaman saya adalah bahwa penghapusan berpasangan tidak dipandang sebagai pendekatan yang valid untuk regresi multivarian. Listwise sangat umum tetapi bisa juga bias & memalukan. Beberapa imputasi adalah sesuatu yang indah.
dmk38
sumber
Saya punya pertanyaan untuk DMK38. Di atas Anda menulis bahwa tidak masalah untuk menambahkan variabel kategori ke dalam model apa adanya ketika itu adalah ordinal. Saya senang membaca ini ;-) Apakah Anda memiliki sumber yang bagus yang menyebutkannya juga sehingga saya dapat menambahkannya ke kertas saya? Terimakasih banyak atas jawaban Anda! Lilian
Lilian Jans-Beken
1
@ LilianJans-Beken: Lihat variabel dependen berkelanjutan dengan variabel independen ordinal & Regresi logistik dan variabel independen ordinal . Anda mungkin tidak ingin menggunakan metode yang lebih rumit tetapi perlu dicatat bahwa meskipun Anda senang menganggap prediktor sebagai skala-interval, membatasi untuk memiliki hubungan linier dengan respons tidak diperlukan. Dan jangan merasa berkewajiban untuk mengasumsikan interval yang sama antara level yang berdekatan jika sesuatu yang lain tampaknya lebih masuk akal.
Scortchi
1
@ LilianJans-Beken: Juga Bagaimana menangani variabel kategori ordinal sebagai variabel independen & Logit dengan variabel independen ordinal . Oh, & selamat datang di Cross Validated!
Scortchi
2

Anda pasti bisa, dengan mengikuti metode yang sama yang Anda gunakan untuk prediktor kategori pertama. Buat variabel dummy seperti yang Anda lakukan untuk variabel pertama. Tetapi seringkali lebih mudah untuk menggunakan perintah Unianova dari SPSS. Anda dapat mencarinya di Panduan Sintaks yang dicetak atau pdf, atau Anda dapat mengaksesnya melalui Analisis ... Model Linear Umum ... Univariat.

Meskipun sedikit lebih rumit, perintah Regresi memiliki sejumlah keunggulan dibandingkan Unianova. Yang utama adalah bahwa Anda dapat memilih 'hilang berpasangan' (Anda tidak harus kehilangan kasus hanya karena itu kehilangan nilai untuk satu atau dua prediktor). Anda juga bisa mendapatkan banyak diagnostik berharga seperti plot parsial dan statistik pengaruh.

rolando2
sumber
1
@ rolando - jawaban yang bagus. Karena itu, pendekatan berpasangan yang hilang cenderung membingungkan perbandingan efek, karena mereka didasarkan pada jumlah pengamatan yang berbeda. Mungkin ada sesuatu yang perlu diingat.
richiemorrisroe
Saya pikir sedikit bingung Anda, pasangan yang hilang hanya penting jika Anda menjalankan model yang sepenuhnya terpisah (seperti menggunakan prosedur pemilihan model langkah-bijaksana). Jika Anda memasukkan semua variabel ke dalam model itu masih menjatuhkan nilai yang hilang dari daftar.
Andy W
@ richiemorrisroe - saya setuju, perlu diingat. @ Andy W - Baru saja dikonfirmasi dalam SPSS bahwa, dengan menggunakan entri paksa saja, hilang secara berpasangan dan hilang dengan arah daftar memberikan hasil yang berbeda dalam segala hal, termasuk perbedaan.
rolando2
Saya masih berpikir Anda bingung, bagaimana bisa SPSS mengembalikan set hasil yang berbeda dengan menyatakan hilang berpasangan kecuali jika itu membuat nilai untuk data yang hilang? Berikut ini adalah contoh menggunakan data simulasi yang saya posting di file teks, dl.dropbox.com/u/3385251/SPSS_missing_Listwise_vs_Pairwise.txt . Saat ini saya telah menurunkan jawaban Anda, karena semua pembicaraan ini tentang bagaimana perintah regresi menangani data yang hilang membingungkan, tidak ada hubungannya dengan pertanyaan awal OP dan cenderung menyesatkan.
Andy W
1

Cara sederhana untuk mengubah variabel kategori menjadi seperangkat variabel dummy untuk digunakan dalam model di SPSS adalah menggunakan sintaks do repeat. Ini adalah yang paling sederhana untuk digunakan jika variabel kategori Anda dalam urutan numerik.

*making vector of dummy variables.
vector dummy(3,F1.0).
*looping through dummy variables using do repeat, in this example category would be the categorical variable to recode. 
do repeat dummy = dummy1 to dummy3 /#i = 1 to 3.
compute dummy = 0.
if category = #i dummy = 1.
end repeat.
execute. 

Kalau tidak, Anda hanya dapat menjalankan seperangkat pernyataan if untuk membuat variabel dummy Anda. Versi saya saat ini (16) tidak memiliki kemampuan asli untuk menentukan satu set variabel dummy secara otomatis dalam perintah regresi (seperti yang Anda dapat di Stata menggunakan perintah xi ) tetapi saya tidak akan terkejut jika ini tersedia di beberapa versi yang lebih baru. Perhatikan juga poin dmk38 # 2, skema pengkodean ini mengasumsikan kategori nominal. Jika variabel Anda ordinal, lebih banyak keleluasaan dapat digunakan.

Saya juga setuju dengan dmk38 dan pembicaraan tentang regresi menjadi lebih baik karena kemampuannya untuk menentukan data yang hilang dengan cara tertentu adalah masalah yang sepenuhnya terpisah.

Andy W
sumber