Saya bertanya-tanya apa perbedaan antara uji-t dan ANOVA dalam regresi linier?
- Apakah uji-t untuk menguji apakah salah satu lereng dan intersep memiliki nilai nol, sedangkan ANOVA untuk menguji apakah semua lereng memiliki nilai nol? Apakah ini satu-satunya perbedaan di antara mereka?
- Dalam regresi linier sederhana yaitu di mana hanya ada satu variabel prediktor, hanya ada satu kemiringan untuk memperkirakan. Jadi apakah t-test dan ANOVA setara, dan jika ya, bagaimana, mengingat bahwa mereka menggunakan statistik yang berbeda (uji-t menggunakan statistik-t dan ANOVA menggunakan statistik-F)?
regression
anova
t-test
Tim
sumber
sumber
Jawaban:
Model linear umum memungkinkan kita menulis model ANOVA sebagai model regresi. Mari kita asumsikan kita memiliki dua kelompok dengan masing-masing dua pengamatan, yaitu, empat pengamatan dalam vektor . Kemudian model orisinil, overparametrized adalah , di mana adalah matriks prediktor, yaitu variabel indikator kode-dummy: E ( y ) = X ⋆ β ⋆ X ⋆ ( μ 1 μ 1 μ 2 μ 2 ) = ( 1 1 0 1 1 0 1 0 1 0 1 1 0 1 ) ( β ⋆ 0 β ⋆ 1 β ⋆ 2 )y E(y)=X⋆β⋆ X⋆
Parameter tidak dapat diidentifikasi sebagai karena memiliki peringkat 2 ( tidak dapat dibalik). Untuk mengubahnya, kami memperkenalkan batasan (kontras pengobatan), yang memberi kami model baru : X ⋆ ( X ⋆ ) ′ X ⋆ β ⋆ 1 = 0 E ( y ) = X β ( μ 1 μ 1 μ 2 μ 2 2 ) = ( 1 0 1 0 1 1 1 1((X⋆)′X⋆)−1(X⋆)′E(y) X⋆ (X⋆)′X⋆ β⋆1=0 E(y)=Xβ
Jadi , yaitu, mengambil arti dari nilai yang diharapkan dari kategori referensi kami (grup 1). , yaitu, mengambil arti perbedaan untuk kategori referensi. Karena dengan dua kelompok, hanya ada satu parameter yang terkait dengan efek kelompok, hipotesis nol ANOVA (semua parameter efek kelompok adalah 0) sama dengan bobot regresi, hipotesis nol (parameter kemiringan adalah 0). β 0 μ 2 = β 0 + β 2 β 2 μ 2 - μ 1μ1=β0 β0 μ2=β0+β2 β2 μ2−μ1
Uji - dalam model linier umum menguji kombinasi linear dari parameter terhadap nilai hipotesis bawah hipotesis nol. Memilih , dengan demikian kita dapat menguji hipotesis bahwa (tes biasa untuk parameter slope), yaitu di sini, . Estimatornya adalah , di mana adalah Estimasi OLS untuk parameter. Statistik uji umum untuk adalah:t ψ=∑cjβj ψ0 c=(0,1)′ β2=0 μ2−μ1=0 ψ^=∑cjβ^j β^=(X′X)−1X′y ψ
Dengan lebih dari dua kelompok, hipotesis ANOVA (semua secara bersamaan 0, dengan ) mengacu pada lebih dari satu parameter dan tidak dapat dinyatakan sebagai kombinasi linear , sehingga pengujian tidak setara. . 1 ≤ j ψβj 1≤j ψ
sumber
Dalam 1, ANOVA biasanya akan menguji variabel faktor dan apakah atau tidak antara varians kelompok adalah signifikan. Anda akan melihat dengan jelas perbedaannya jika perangkat lunak Anda memungkinkan variabel indikator dalam suatu regresi: untuk setiap dummy Anda akan mendapatkan nilai p yang mengatakan apakah nilai kelompok ini berbeda secara signifikan dari 0, dan sebagai konsekuensinya sangat berbeda dari kelompok referensi atau nilai referensi yang berlaku . Biasanya, Anda tidak akan melihat sampai sejauh mana indikator itu penting sampai Anda melakukan tes ANOVA.
Uji F adalah uji t kuadrat. Oleh karena itu, pada 2, itu sama.
sumber