Rasio dalam Regresi, alias Pertanyaan tentang Kronmal

14

Baru-baru ini, pertanyaan penelusuran acak memicu memori komentar tidak langsung dari salah satu profesor saya beberapa tahun yang lalu memperingatkan tentang penggunaan rasio dalam model regresi. Jadi saya mulai membaca tentang ini, akhirnya menuju ke Kronmal 1993.

Saya ingin memastikan bahwa saya benar menafsirkan sarannya tentang cara memodelkan ini.

  1. Untuk model dengan rasio dengan penyebut yang sama pada sisi dependen dan independen:
    Z-1Y=Z-11nβ0+Z-1XβX+βZ+Z-1ϵ

    • Regress tergantung rasio pada variabel (invers) penyebut selain rasio lainnya
    • Bobot berdasarkan variabel penyebut (terbalik)

  2. Y=β0+βXX+Z1nα0+ZXαX+Z-1ϵ

    • Regress numerator dengan variabel asli, penyebut, dan penyebut dikalikan dengan variabel asli [bagaimana dengan variabel kategori?]
    • Berat oleh penyebut (terbalik)
  3. Y=β0+XβX+Z-11nβZ-1+WβW+Z-1WβZ-1W+ϵ

    • Sertakan pembilang dan penyebut (terbalik) sebagai efek utama, rasio sebagai istilah interaksi.

Apakah interpretasi saya di sini benar?

Affine
sumber

Jawaban:

1

Anda seharusnya benar-benar telah menautkan ke kertas Kronmal (dan menjelaskan notasi Anda, yang diambil langsung dari kertas.) Pembacaan makalah Anda terlalu harfiah. Secara khusus, ia tidak memberikan saran tentang pembobotan, melainkan mengatakan bahwa pembobotan dapat dilakukan dengan cara biasa, jadi tidak perlu didiskusikan. Itu hanya disebutkan sebagai suatu kemungkinan. Baca kasus Anda lebih seperti contoh, terutama sebagai contoh cara menganalisis situasi seperti itu.

Di bagian 6 dia memang memberikan beberapa saran umum, yang akan saya kutip di sini:

Pesan dari makalah ini adalah bahwa variabel rasio hanya boleh digunakan dalam konteks model linear penuh di mana variabel yang membentuk rasio dimasukkan dan istilah intersep juga hadir. Praktik umum menggunakan rasio untuk variabel dependen atau independen dalam analisis regresi dapat mengarah pada kesimpulan yang menyesatkan, dan jarang menghasilkan keuntungan apa pun. Namun, praktik ini tersebar luas dan mengakar, dan mungkin sulit untuk meyakinkan beberapa peneliti bahwa mereka harus menyerahkan rasio atau indeks mereka yang paling berharga.

Makalah ini menggunakan contoh (fiktif) oleh Neyman tentang kelahiran dan bangau. Untuk bermain dengan contoh itu, Anda dapat mengaksesnya dari R oleh

data(stork, package="TeachingDemos")

Saya akan meninggalkan kesenangan bagi pembaca, tetapi satu plot yang menarik adalah ini coplot:

pengkondisian plot untuk contoh bangau Neyman

kjetil b halvorsen
sumber