Mengapa menggunakan peluang dan bukan probabilitas dalam regresi logistik?

8

Mengapa kita menggunakan peluang bukan probabilitas ketika melakukan regresi logistik?

regression logistic odds Kenny
sumber

22

Keuntungannya adalah bahwa peluang ditentukan $(0,\infty)$ peta untuk log-peluang aktif $(-\infty, \infty)$ , sementara ini bukan kasus probabilitas. Akibatnya, Anda dapat menggunakan persamaan regresi seperti

\log (\frac{p_{i}}{1 - p_{i}}) = β_{0} + \sum_{j = 1}^{J} β_{j} x_{i j}

$\log \left(\frac{p_i}{1-p_i}\right) = \beta_0 + \sum_{j=1}^J \beta_j x_{ij}$ untuk log-odds tanpa masalah (yaitu untuk nilai koefisien regresi dan kovariat apa pun nilai yang valid untuk peluang diprediksi). Anda akan membutuhkan batasan multi-dimensi yang sangat rumit pada koefisien regresi

β_{0}, β_{1}, \dots

$\beta_0,\beta_1,\ldots$ , jika Anda ingin melakukan hal yang sama untuk probabilitas log (dan tentu saja ini tidak akan bekerja secara langsung untuk probabilitas atau peluang yang tidak diubah, baik). Sebagai konsekuensinya, Anda mendapatkan efek seperti tidak dapat memiliki rasio risiko konstan di semua probabilitas baseline (beberapa rasio risiko akan menghasilkan probabilitas> 1), sementara ini bukan masalah dengan rasio odds.

Björn
sumber

17

Peluangnya adalah jumlah yang diharapkan dari "keberhasilan" per "kegagalan", sehingga dapat mengambil nilai kurang dari satu, satu atau lebih dari satu, tetapi nilai negatif tidak masuk akal; Anda dapat memiliki 3 keberhasilan per kegagalan, tetapi -3 keberhasilan per kegagalan tidak masuk akal. Logaritma peluang dapat mengambil nilai positif atau negatif. Regresi logistik adalah model linier untuk log (odds). Ini berfungsi karena log (odds) dapat mengambil angka positif atau negatif, sehingga model linier tidak akan menghasilkan prediksi yang mustahil. Kita dapat melakukan model linear untuk probabilitas, model probabilitas linier, tetapi itu dapat menyebabkan prediksi yang tidak mungkin karena probabilitas harus tetap antara 0 dan 1.

Maarten Buis
sumber

Mengapa menggunakan peluang dan bukan probabilitas dalam regresi logistik?

Jawaban: