Bisakah kemungkinan -2 Log dihitung dengan hanya satu model?

9

Saya menggunakan glmfitfungsi di MATLAB. Fungsi hanya mengembalikan penyimpangan dan bukan kemungkinan log. Saya mengerti bahwa penyimpangan pada dasarnya adalah dua kali perbedaan antara kemungkinan log dari model tetapi apa yang saya tidak dapatkan adalah saya hanya menggunakan glmfituntuk membuat satu model, tetapi entah bagaimana saya mendapatkan penyimpangan.

  • Tidakkah perhitungan kemungkinan log -2 membutuhkan 2 model?
  • Bagaimana penyimpangan dapat dianalisis ketika hanya ada satu model?

Pertanyaan lain yang saya miliki adalah mengatakan saya memang memiliki dua model dan bahwa saya membandingkannya dengan menggunakan tes kemungkinan log. Hipotesis nol akan menjadi model pertama dan hipotesis alternatif akan menjadi model kedua. Setelah mendapatkan statistik uji log kemungkinan apakah saya akan memeriksanya terhadap chi kuadrat cdf untuk menentukan nilai-p? Apakah saya benar bahwa jika kurang dari tingkat alpha saya akan menolak nol dan jika lebih besar saya akan gagal menolak nol?

shiu6rewgu
sumber
2
Untuk pertanyaan pertama Anda. Ya ada 2 model. Yang lain adalah model yang sempurna dengan log likelihood = 0. Dengan cara ini penyimpangan Anda sama dengan kemungkinan log model Anda.
FMZ
1
apakah itu model yang sempurna - model saya, atau model saya - model sempurna? Dan akan membaginya dengan -2 benar-benar memberi saya kemungkinan log model dan saya bisa menggunakannya untuk melakukan tes kemungkinan log?
shiu6rewgu

Jawaban:

13

Penyimpangan istilah statistik dilemparkan sekitar terlalu banyak. Sebagian besar waktu, program mengembalikan penyimpangan mana adalah perkiraan parameter Anda dari model fitting dan adalah beberapa kejadian yang berpotensi diamati / diamati dari kuantitas acak yang bersangkutan.

D(y)=-2catatan{hal(y|θ^)},
θ^y

Penyimpangan yang lebih umum yang Anda rujuk akan memperlakukan penyimpangan di atas sebagai fungsi dari dua variabel, baik data dan parameter yang dipasang: dan jadi jika Anda memiliki satu nilai tetapi dua nilai parameter yang saling bersaing, dan , maka Anda akan mendapatkan penyimpangan yang Anda sebutkan dari Anda dapat membaca tentang fungsi Matlab yang Anda sebutkan , ditautkan di sini . Diskusi tentang penyimpangan yang lebih bermanfaat, meskipun lebih singkat, terkait di sini .

D(y,θ^)=-2catatan{hal(y|θ^)}
yθ^1θ^2
-2(catatan{hal(y|θ^1)}-catatan{hal(y|θ^2)}).
glmfit()

Statistik penyimpangan secara implisit mengasumsikan dua model: yang pertama adalah model pas Anda, dikembalikan oleh glmfit(), panggil vektor parameter ini . Yang kedua adalah "model penuh" (juga disebut "model jenuh"), yang merupakan model di mana ada variabel bebas untuk setiap titik data, sebut vektor parameter ini . Memiliki begitu banyak variabel bebas jelas merupakan hal yang bodoh untuk dilakukan, tetapi hal itu memungkinkan Anda untuk mencocokkan data itu dengan tepat.θ^1θ^s

Jadi, statistik penyimpangan dihitung sebagai perbedaan antara kemungkinan log dihitung pada model pas dan model jenuh. Biarkan menjadi kumpulan titik data N. Kemudian:Y={y1,y2,,yN}

DEV(θ^1,Y)=-2[catatanhal(Y|θ^1)-catatanhal(Y|θ^s)].
Istilah di atas akan diperluas menjadi penjumlahan atas masing-masing poin data dengan asumsi independensi. Jika Anda ingin menggunakan perhitungan ini untuk menghitung log-likelihood dari model, maka Anda harus terlebih dahulu menghitung log-likelihood dari model jenuh. Berikut adalah tautan yang menjelaskan beberapa ide untuk menghitung ini ... tetapi masalahnya adalah bahwa dalam hal apa pun, Anda harus menuliskan fungsi yang menghitung kemungkinan log untuk tipe data Anda, dan dalam hal ini mungkin lebih baik untuk membuat fungsi Anda sendiri yang menghitung log-likelihood Anda sendiri, daripada mundur dari perhitungan penyimpangan.ysaya

Lihat Bab 6 dari Analisis Data Bayesian untuk beberapa diskusi yang baik tentang penyimpangan.

Adapun poin kedua Anda tentang statistik uji kemungkinan, ya sepertinya Anda pada dasarnya tahu hal yang benar untuk dilakukan. Tetapi dalam banyak kasus, Anda akan menganggap hipotesis nol sebagai sesuatu yang ahli, pengetahuan eksternal memungkinkan Anda menebak sebelumnya (seperti beberapa koefisien sama dengan nol). Ini belum tentu sesuatu yang datang sebagai hasil dari melakukan pemasangan model.

Ely
sumber
EMS terima kasih! Anda benar-benar membantu saya memahami apa yang banyak menyimpang! Saya masih memiliki beberapa pertanyaan, tetapi saya tidak yakin bagaimana cara menanyakannya. Setelah saya mencari tahu bagaimana mengucapkannya, saya pasti akan membalas di sini.
shiu6rewgu
Ok pertanyaan pertama, bagaimana saya mengekstrak kemungkinan log untuk model yang saya buat dari penyimpangan mengingat matlab hanya memberi saya penyimpangan? Juga, (saya tahu ini membuat saya terlihat cukup bodoh tetapi) untuk p (y | θˆ2) apakah itu kemungkinan mendapatkan nilai y tertentu dari kumpulan data hasil atau variabel independen yang diberikan parameter yang dipasang
shiu6rewgu
Tampaknya saya salah tentang metode Matlab. Itu menghitung penyimpangan dengan melihat dua model, dan saya telah mengedit jawaban di atas untuk mencerminkan ini.
ely
+1, ini adalah jawaban yang sangat bagus. Saya berharap untuk melihat lebih banyak dari mereka di masa depan.
gung - Pasang kembali Monica
1
@SibbsGambling Dalam tautan ini ada contoh dengan data pohon coolibah yang menunjukkan model "penuh" atau "jenuh" di mana kemungkinan log tidak nol. Saya percaya ada situasi tertentu di mana model jenuh harus memiliki kemungkinan satu menurut definisi, tetapi tidak dalam semua situasi.
ely