Regresi Logistik: Menafsirkan Variabel Kontinu

11

Saya punya beberapa pertanyaan tentang menafsirkan rasio odds untuk variabel kontinu dalam regresi logistik. Saya merasa seperti ini adalah pertanyaan dasar tentang regresi logistik (dan mungkin tentang regresi secara umum), dan meskipun saya sedikit malu bahwa saya tidak tahu jawabannya, saya akan menelan harga diri saya dan bertanya sehingga saya tahu mereka di masa depan!

Inilah situasi saya ... Saya sedang melihat sampel pemuda yang diadili yang, sebagai bagian dari masa percobaan mereka, terdaftar dalam program pelatihan keterampilan kerja / hidup. Saya ingin melihat sejauh mana usia mereka dilepaskan dari program memperkirakan pekerjaan enam bulan setelah rilis dari program.

(Juga, perlu diingat bahwa ada prediktor lain dalam model, tetapi saya telah mengecualikannya karena mereka tidak signifikan secara statistik dan saya ingin menjaga ini sejelas mungkin.)

Predictor: Usia pelepasan dari program pelatihan (Usia rata-rata = 17,4, SD = 1.2, Rentang 14.3-20.5)

Hasil: Dipekerjakan atau tidak (Dipekerjakan = 1, Tidak Dipekerjakan = 0)

Hasil: Odds ratio 3.01 (p <.005) (Saya sudah mengecualikan statistik goodness of fit, dll. Karena saya mencari jawaban tentang interpretasi rasio odds saja; saya merasa nyaman dengan evaluasi model fit, CI's , dll.)

Dengan kata lain: Seiring bertambahnya usia satu tahun, kemungkinan dipekerjakan enam bulan pasca-pemutusan meningkat tiga unit.

Pertanyaan:

1) Ketika saya mengatakan, "Seiring bertambahnya usia satu tahun ..." apa titik awal untuk usia?

Apakah usia mulai nol? Misalnya, "Seiring bertambahnya usia dari 0 [yaitu, usia terendah jika Anda menempatkan model ini pada grafik] ..."

Apakah usia dimulai pada usia terendah di antara rentang usia dalam sampel? Misalnya, "Seiring bertambahnya usia dari 14,3 ..."

ATAU

Apakah usia dimulai pada usia rata-rata sampel? Misalnya, "Seiring bertambahnya usia dari 17,4 ...",

2) Apakah pemusatan membantu saya menafsirkan hasil ini ATAU apakah hanya efektif dalam menafsirkan y-int? Jika itu akan membantu, saya berpikir untuk melakukan pemusatan berarti atau mengurangi usia terendah dalam kisaran dari semua usia lainnya dalam sampel. Ada saran?

3) Akhirnya, apakah pantas untuk mengatakan bahwa dibandingkan dengan seorang pemuda berusia 14 tahun, seorang pemuda berusia 17 tahun sembilan kali lebih mungkin dipekerjakan? Saya bertanya karena saya tahu bahwa regresi logistik mengasumsikan hubungan sigmoidal, dan saya ingin tahu apakah peningkatan 3 unit dalam odds ini tetap konsisten pada titik mana pun di sepanjang garis regresi.

Terima kasih banyak!

Harun

pengguna44992
sumber
1
Anda mungkin tertarik dengan ini .
tchakravarty
4
Penghapusan variabel "tidak signifikan" sangat bermasalah.
Frank Harrell
@ FrankHarrell bisa Anda jelaskan mengapa menghapus variabel tidak penting sangat bermasalah dalam kasus ini?
Mark White
Ini telah dibahas panjang lebar di situs ini. Secara singkat itu merusak kesalahan standar, nilai-P, cakupan interval kepercayaan, dll.
Frank Harrell

Jawaban:

6

1) Karena ini adalah rasio odds , tidak masalah dari mana Anda memulai. Peluang untuk anak berusia 18 tahun adalah 3 kali lipat untuk anak berusia 17 tahun. Atau peluang untuk anak berusia 17 tahun adalah 1/3 orang yang berusia 18 tahun. Hal yang sama. Jika Anda ingin mendapatkan probabilitas bahwa seseorang dengan usia tertentu akan dipekerjakan, Anda dapat menggunakan rumus dengan perkiraan parameter (bukan OR). Atau Anda bisa mendapatkan program yang Anda gunakan untuk melakukannya untuk Anda.

2) Apakah keterpusatan membantu adalah masalah pendapat. Saya tidak menemukan model yang terpusat lebih jelas, tetapi beberapa orang melakukannya.

3) Peluangnya tidak persis sama dengan "kemungkinan" (meskipun banyak orang berbicara seolah-olah mereka) dan peluang untuk seorang anak berusia 17 tahun akan menjadi 27 kali lipat orang yang berusia 14 tahun.

Akhirnya, saya akan berhati-hati dengan model ini. Model ini mengasumsikan bahwa OR adalah sama antara 14 dan 15, 15 dan 16 dan seterusnya. Itu sepertinya tidak mungkin bagi saya, berdasarkan apa yang saya ketahui tentang subjek.

Peter Flom - Pasang kembali Monica
sumber
0

Peluang rata-rata untuk mendaftar dalam masalah pelatihan untuk seseorang adalah # kali peluang untuk individu lain yang satu tahun lebih muda / lebih tua, setelah mempertahankan semua variabel lainnya konstan.

Itu pendapat saya.

Yiwan Ye
sumber
1
Bisakah Anda memperluas bagaimana ini menambah jawaban sebelumnya?
mdewey