Bagaimana cara menguji apakah kemiringan dalam model linier sama dengan nilai tetap?

9

Misalkan kita memiliki model regresi linier sederhana dan ingin menguji hipotesis nol terhadap alternatif umum.H 0 : a = b = 1Z=aX+bYH0:a=b=12

Saya pikir seseorang dapat menggunakan estimasi dan dan selanjutnya menerapkan uji- untuk mendapatkan interval kepercayaan sekitar . Apakah ini ok? SE( a )Z1a^SE(a^)Z12

Pertanyaan lain sangat terkait dengan yang ini. Misalkan kita memiliki sampel dan kami menghitung statistikχ 2{(x1,y1,z1),,(xn,yn,zn)}χ2

i=1n(zixi+yi2)2xi+yi2.
Dapatkah statistik ini digunakan untuk menguji hipotesis nol yang sama?
Lan
sumber

Jawaban:

8

Dalam regresi linier, asumsinya adalah dan bukan variabel acak. Karena itu, modelnyaYXY

Z=aX+bY+ϵ

secara aljabar sama dengan

Z12X12Y=(a12)X+(b12)Y+ϵ=αX+βY+ϵ.

Di sini, dan . Istilah kesalahan tidak terpengaruh. Sesuai model ini, perkirakan koefisien masing-masing sebagai dan , dan uji hipotesis dengan cara biasa. β=b-1α=a12 ε a β a=β=0β=b12ϵα^β^α=β=0


Statistik yang ditulis di akhir pertanyaan bukanlah statistik chi-kuadrat, meskipun memiliki kesamaan formal dengan satu. Statistik chi-kuadrat melibatkan jumlah , bukan nilai data, dan harus memiliki nilai yang diharapkan dalam penyebutnya, bukan kovariat. Dimungkinkan untuk satu atau lebih dari penyebut menjadi nol (atau mendekati itu), menunjukkan bahwa ada sesuatu yang salah dengan formulasi ini. Jika itu tidak meyakinkan, pertimbangkan bahwa satuan pengukuran , , dan bisa berupa apa saja (seperti drams, parsec, dan pecks), sehingga kombinasi linier seperti secara umum tidak ada artinya. Itu tidak menguji apa pun. ZXYzi-(xi+yi)/2xi+yi2ZXYzi(xi+yi)/2

whuber
sumber
1
Terima kasih atas jawaban anda. Itu sangat berguna. Sebenarnya, saya tidak terlalu tepat dalam perumusan bagian kedua dari pertanyaan. Bayangkan, bahwa xs dan ys adalah angka positif, diukur dalam satuan yang sama. Zs (hasil yang diamati) entah bagaimana mengukur "interaksi" dalam arti bahwa jika tidak ada interaksi seharusnya zs (x + y) / 2 (hasil yang diharapkan). Jadi dari sudut pandang saya itu sama dengan menggunakan regresi dengan hipotesis nol a = b = 1/2 atau untuk membandingkan goodness of fit menggunakan statistik chi ^ 2 Pearson. Apakah ini masuk akal? Terima kasih!
Lan
1
@Lan, saya pikir jawaban Wolfgang menggambarkan dengan baik bagaimana membuat tes yang Anda usulkan. Ini adalah contoh dari apa yang dimaksud dengan menguji hipotesis "dengan cara biasa."
whuber
9

Anda dapat menguji hipotesis ini dengan uji model penuh versus pengurangan. Inilah cara Anda melakukan ini. Pertama, model dan dapatkan residu dari model itu. Selaraskan residu dan jumlahkan. Ini adalah jumlah kesalahan kuadrat untuk model lengkap. Sebut ini . Berikutnya, menghitung di mana . Ini adalah residu Anda di bawah hipotesis nol. Susun dan jumlahkan mereka. Ini adalah jumlah kesalahan kuadrat untuk model yang dikurangi. Mari kita sebut ini .S S E f Z - Z Z = 1 / 2 * X + 1 / 2 * Y S S E rZ=aX+bYSSEfZZ^Z^=1/2X+1/2YSSEr

Sekarang hitung:

F = ,((SSErSSEf)/2)/(SSEf/(n2))

di mana adalah ukuran sampel. Di bawah , statistik F ini mengikuti distribusi-F dengan dan derajat kebebasan.H 0 2 n - 2nH02n2

Berikut ini contoh menggunakan R:

x <- rnorm(n)
y <- rnorm(n)
z <- 1/2*x + 1/2*y + rnorm(n) ### note I am simulating under H0 here

res <- lm(z ~ x + y - 1)
summary(res)
SSE.f <- sum(resid(res)^2)

zhat  <- 1/2*x + 1/2*y
SSE.r <- sum((z-zhat)^2)

F <- ((SSE.r - SSE.f) / 2) / (SSE.f / (n-2))
pf(F, 2, n-2, lower.tail=FALSE) ### this is the p-value

Tolak nol jika nilai-p di bawah .05 (jika memang .05).α

Saya menganggap Anda benar-benar bermaksud agar model Anda tidak mengandung intersep. Dengan kata lain, saya berasumsi Anda benar-benar bekerja dengan model dan bukan .Z = c + a X + b YZ=aX+bYZ=c+aX+bY

Wolfgang
sumber