Membandingkan dua model regresi linier

12

Saya ingin membandingkan dua model regresi linier yang mewakili tingkat degradasi mRNA dari waktu ke waktu dalam dua kondisi yang berbeda. Data untuk setiap model dikumpulkan secara independen.

Berikut ini dataset.

Waktu (jam) log (Perawatan A) log (pengobatan B)
0 2.02 1.97
0 2.04 2.06
0 1,93 1,96
2 2.02 1.91
2 2.00 1.95
2 2.07 1.82
4 1.96 1.97
4 2.02 1.99
4 2.02 1.99
6 1.94 1.90
6 1.94 1.97
6 1.86 1.88
8 1.93 1.97
8 2.12 1.99
8 2.06 1.93
12 1.71 1.70
12 1.96 1.73
12 1.71 1.76
24 1.70 1.46
24 1.83 1.41
24 1.62 1.42

Ini adalah model saya:

Exp1.A.lm<-lm(Exp1$Time~Exp1$(Treatment A))
Exp1.B.lm<-lm(Exp1$Time~Exp1$(Treatment B))
Panggilan:
lm (rumus = Exp1 $ Waktu ~ Exp1 $ (Perawatan A))

Residual:
    Min 1Q Median 3Q Maks 
-6.8950 -1.2322 0.2862 1.2494 5.2494 

Koefisien:
                   Estimasi Std. Kesalahan nilai t Pr (> | t |)    
(Intersepsi) 74.68 6.27 11.91 2.94e-10 ***
Exp1 $ (Pengobatan A) -36.14 3.38 -10.69 1.77e-09 ***
---
Signif. kode: 0 '***' 0,001 '**' 0,01 '*' 0,05 '.' 0,1 '' 1

Kesalahan standar residual: 2,97 pada 19 derajat kebebasan
Multiple R-squared: 0,8575, Adjusted R-squared: 0,85 
F-statistik: 114,3 pada 1 dan 19 DF, nilai-p: 1,772e-09

Panggilan:
lm (rumus = Exp1 $ Waktu ~ Exp1 $ (Perawatan B))

Residual:
   Min 1Q Median 3Q Maks 
-7.861 -3.278 -1.444 3.222 11.972 

Koefisien:
                      Estimasi Std. Kesalahan nilai t Pr (> | t |)    
(Intercept) 88.281 16.114 5.478 2.76e-05 ***
Exp1 $ (Perawatan B) -41.668 8.343 -4.994 8.05e-05 ***
---
Signif. kode: 0 '***' 0,001 '**' 0,01 '*' 0,05 '.' 0,1 '' 1

Kesalahan standar residual: 5,173 pada 19 derajat kebebasan
Beberapa R-kuadrat: 0,5676, Disesuaikan R-kuadrat: 0,5449 
F-statistik: 24,94 pada 1 dan 19 DF, nilai-p: 8.052e-05

Untuk membandingkan kedua model ini, saya menggunakan kode berikut ini.

anova(Exp1.A.lm,Exp1.B.lm)
Analisis Tabel Varians

Model 1: Exp1 $ Waktu ~ Exp1 $ Exp1 $ (Perawatan A)
Model 2: Exp1 $ Waktu ~ Exp1 $ Exp1 $ (Perawatan B)
  Res.Df RSS Df Jumlah Sq F Pr (> F)
1 19 167.60                      
2 19 508.48 0 -340.88

Pertanyaan saya adalah mengapa analisis ANOVA tidak menunjukkan statistik F dan p.val. Saya minta maaf jika ini pertanyaan naif.

Berdasarkan pada lereng yang berbeda, laju degradasi berbeda pada kedua model ini, tetapi saya ingin tahu seberapa signifikan perbedaan ini secara statistik. Saya harap ini masuk akal.

Rooz
sumber
2
Anda mungkin memperhatikan bahwa tabel ANOVA mencantumkan derajat kebebasan yang terkait dengan analisis sebagai 0 ; Anda memiliki jumlah variabel yang sama di kedua model, itulah alasan mengapa tidak ada nilai F atau p yang dapat dihitung.
gung - Reinstate Monica
5
Saya tidak akan repot membandingkan model-model ini sampai setelah memeriksa kelaikannya. Saya pikir Anda akan menemukan di yang kedua bahwa baik respons maupun logaritma-nya adalah fungsi linear dari waktu. Ini menyerukan (serius) pertanyaan perbandingan estimasi lereng.
whuber

Jawaban:

11

Jika Anda mengatur data dalam satu kolom panjang dengan A dan B sebagai kolom baru, Anda kemudian dapat menjalankan model regresi Anda sebagai GLM dengan variabel waktu kontinu dan variabel "percobaan" nominal (A, B). Output dari ANOVA akan memberi Anda signifikansi perbedaan antara parameter. "mencegat 'adalah mencegat umum dan faktor" percobaan "akan mencerminkan perbedaan antara intersep (sebenarnya keseluruhan berarti) antara percobaan. faktor" Waktu "akan menjadi kemiringan umum, dan interaksi adalah perbedaan antara eksperimen dengan hormat ke lereng.

Saya harus mengakui bahwa saya curang (?) Dan menjalankan model secara terpisah terlebih dahulu untuk mendapatkan dua set parameter dan kesalahan mereka dan kemudian menjalankan model gabungan untuk memperoleh perbedaan antara perawatan (dalam kasus Anda A dan B) ...

pengguna24187
sumber
3
Ini adalah pendekatan yang cerdas. Ketika Anda "menipu," apakah Anda memeriksa bahwa varian kesalahan kira-kira sama di setiap model? Dan jika mereka tampak sangat berbeda, bagaimana itu memengaruhi rekomendasi Anda?
whuber
GLM adalah pendekatan yang baik, dan untuk mengeksplorasi data, pemasangan model yang terpisah adalah cara yang baik untuk menilai varians kesalahan antara eksperimen. Jika ada yang benar-benar khawatir, mereka dapat memperluas model GLM untuk memasukkan varians kesalahan spesifik kelompok daripada asumsi implisit varians kesalahan umum untuk semua data eksperimental.
prince_of_pears
Hal lain yang terlintas dalam pikiran adalah apakah OP tertarik untuk berdagang apakah tingkat degradasi antara eksperimen hanya berbeda satu sama lain (mengabaikan tingkat absolut), atau apakah tingkat ini juga secara statistik (atau praktis) berbeda dari nol. Yang pertama adalah uji hipotesis bahwa koefisien interaksi antara perlakuan dan waktu sama dengan nol. Yang kedua adalah melakukan dua tes terpisah (atau satu tes hipotesis bersama) yang masing-masing tarif berbeda dari nol. Saya mungkin lebih tertarik untuk menguji yang kedua sebelum yang pertama.
prince_of_pears
5

Analisis ANOVA tidak menunjukkan statistik F dan nilai p karena kedua model memiliki tingkat kebebasan residual yang sama (yaitu 19) dan jika Anda mengambil perbedaan maka itu akan menjadi nol! Harus ada setidaknya satu derajat kebebasan setelah Anda mengambil perbedaan untuk melakukan uji-F.

Stat
sumber
Saya tidak yakin apakah saya mengerti jawaban Anda. Apakah ada alasan bahwa derajat kebebasan residual adalah sama? Adakah saran tentang pendekatan alternatif untuk membandingkan lereng?
Rooz
n=21(TreatmentA)orExp1dfT=n1=20dfT=dferror+dfregressorsdferror=19
Ada banyak cara untuk membandingkannya selain dari F-test. Yang paling mudah adalah menggunakan Multiple R-squared dan Adjusted R-squared seperti yang Anda miliki dalam ringkasan. Model dengan R-squared yang lebih tinggi atau Adjusted R-squared lebih baik. Di sini model yang lebih baik tampaknya adalah model dengan Exp1 $ (Perawatan A). Tetapi ingat, bahwa Anda harus memeriksa residu model Anda untuk memeriksa kecukupan model yang dipasang. Saya pribadi tidak merekomendasikan untuk hanya mengandalkan kriteria R-squared dan Anda harus memeriksa asumsi lain dalam model linier juga. Terutama melihat apakah residu tersebut berkorelasi otomatis atau tidak.
Stat