(PEMBARUAN: Saya mempelajari lebih dalam tentang ini dan memposting hasilnya di sini )
Daftar tes statistik bernama sangat besar. Banyak tes umum mengandalkan inferensi dari model linier sederhana, misalnya uji satu sampel hanya y = β + ε yang diuji terhadap model nol y = μ + ε yaitu β = μ di mana μ adalah beberapa nol nilai - biasanya μ = 0.
Saya menemukan ini menjadi sedikit lebih instruktif untuk tujuan pengajaran daripada model pembelajaran hafalan bernama, kapan harus menggunakannya, dan asumsi mereka seolah-olah mereka tidak ada hubungannya dengan satu sama lain. Pendekatan yang dipromosikan tidak mempromosikan pemahaman. Namun, saya tidak dapat menemukan sumber yang bagus untuk mengumpulkan ini. Saya lebih tertarik pada kesetaraan antara model yang mendasarinya daripada metode inferensi dari mereka. Meskipun, sejauh yang saya bisa lihat, uji rasio kemungkinan pada semua model linier ini menghasilkan hasil yang sama dengan inferensi "klasik".
Berikut adalah persamaan yang telah saya pelajari sejauh ini, dengan mengabaikan istilah kesalahan dan dengan asumsi bahwa semua hipotesis nol adalah tidak adanya efek:
Uji satu sampel: .
Uji-berpasangan-sampel:
Ini identik dengan uji-satu sampel pada perbedaan berpasangan.
Uji-t dua sampel:
di mana x adalah indikator (0 atau 1).
Korelasi Pearson:
Perhatikan kemiripan dengan uji-t dua sampel yang hanya regresi pada sumbu x biner.
Korelasi Spearman:
Ini identik dengan korelasi Pearson pada pangkat-bertransformasi x dan y.
ANOVA satu arah:
di mana adalah indikator yang memilih relevan (satu adalah 1; yang lain adalah 0). Model ini mungkin bisa ditulis dalam bentuk matriks sebagai sebagai .
ANOVA dua arah:
untuk dua faktor dua tingkat. Di sini adalah vektor beta di mana seseorang dipilih oleh vektor indikator . The ditampilkan di sini adalah efek interaksi.
Bisakah kita menambahkan lebih banyak "tes bernama" ke daftar model linier ini? Misalnya, regresi multivariat, tes "non-parametrik" lainnya, tes binomial, atau RM-ANOVA?
PEMBARUAN: pertanyaan telah diajukan dan dijawab tentang ANOVA dan uji-t sebagai model linier di SO. Lihat pertanyaan ini dan tandai pertanyaan terkait .
sumber
x = rnorm(100); y = rnorm(100); summary(lm(rank(x) ~ rank(y))); cor.test(x, y, method='spearman')
Jawaban:
Bukan daftar lengkap tetapi jika Anda memasukkan model linier umum , cakupan masalah ini menjadi jauh lebih besar.
Contohnya:
Juga uji-t untuk varian yang tidak sama didekati dengan baik dengan menggunakan estimasi kesalahan kuat Huber White.
sumber