Dalam Pemodelan Statistik: Dua Budaya Leo Breiman menulis
Praktik yang diterapkan saat ini adalah untuk memeriksa model data yang sesuai dengan menggunakan uji goodness-of-fit dan analisis residual. Pada satu titik, beberapa tahun yang lalu, saya membuat masalah regresi disimulasikan dalam tujuh dimensi dengan jumlah nonlinier yang terkontrol. Tes standar good-of-fit tidak menolak linearitas sampai nonlinier ekstrem.
Breiman tidak memberikan detail simulasi itu. Dia merujuk makalah yang menurutnya memberikan pembenaran teoretis untuk pengamatannya, tetapi makalah itu tidak diterbitkan.
Adakah yang melihat hasil simulasi yang dipublikasikan atau makalah teoretis untuk mendukung klaim Brieman?
regression
goodness-of-fit
John D. Cook
sumber
sumber
Jawaban:
Saya membuat simulasi yang akan menjawab deskripsi Breiman dan hanya menemukan yang jelas: hasilnya tergantung pada konteks dan pada apa yang dimaksud dengan "ekstrim."
Banyak hal yang bisa dikatakan, tetapi izinkan saya membatasinya hanya pada satu contoh yang dilakukan dengan menggunakan
R
kode yang mudah dimodifikasi untuk digunakan pembaca yang berminat dalam penyelidikan mereka sendiri. Kode ini dimulai dengan menyiapkan matriks desain yang terdiri dari nilai-nilai independen yang terdistribusi secara merata yang kira-kira ortogonal (sehingga kita tidak masuk ke masalah multikolinieritas). Ini menghitung interaksi kuadratik tunggal (yaitu, nonlinier) antara dua variabel pertama: ini hanya salah satu dari banyak jenis "nonlinier" yang dapat dipelajari, tetapi setidaknya itu adalah yang umum, yang dipahami dengan baik. Kemudian ia menstandarkan semuanya sehingga koefisien akan sebanding:Untuk model OLS dasar (tanpa nonlinier) kita harus menentukan beberapa koefisien dan standar deviasi dari kesalahan residual. Berikut adalah sekumpulan koefisien satuan dan SD yang sebanding:
Daripada mengarungi semua output di sini, mari kita lihat data ini menggunakan output dari
plot
perintah:Jejak lowess pada segitiga bawah pada dasarnya tidak menunjukkan hubungan linear antara interaksi (
x.12
) dan variabel dependen (y
) dan hubungan linear sederhana antara variabel lain dany
. Hasil OLS mengkonfirmasi bahwa; interaksi ini hampir tidak signifikan:Saya akan mengambil nilai p dari istilah interaksi sebagai tes nonlinier: ketika nilai p ini cukup rendah (Anda dapat memilih seberapa rendah), kami akan mendeteksi nonlinieritas.
(Ada kehalusan di sini tentang apa yang sebenarnya kita cari. Dalam praktiknya kita mungkin perlu memeriksa semua 7 * 6/2 = 21 kemungkinan interaksi kuadratik tersebut, serta mungkin 7 istilah kuadratik yang lain, daripada berfokus pada satu istilah tunggal seperti yang dilakukan di sini. Kami ingin membuat koreksi untuk 28 tes yang saling terkait ini. Saya tidak secara eksplisit membuat koreksi ini di sini, karena sebaliknya saya menampilkan distribusi simulasi nilai-p. Anda dapat membaca tingkat deteksi langsung dari yang histogram pada akhir berdasarkan Anda ambang batas signifikansi.)
Tetapi jangan hanya melakukan analisis ini sekali saja; mari kita lakukan berkali-kali, menghasilkan nilai-nilai baru
y
di setiap iterasi sesuai dengan model yang sama dan matriks desain yang sama. Untuk mencapai ini, kami menggunakan fungsi untuk melakukan satu iterasi dan mengembalikan nilai p dari istilah interaksi:Saya memilih untuk menyajikan hasil simulasi sebagai histogram nilai-p, memvariasikan koefisien standar
gamma
dari istilah interaksi. Pertama, histogram:Sekarang untuk melakukan pekerjaan. Dibutuhkan beberapa detik untuk 1000 percobaan per simulasi (dan empat simulasi independen, dimulai dengan nilai yang diberikan dari istilah interaksi dan secara bertahap membagi dua setiap kali):
Hasil:
x
sd
beta
gamma
x
sd
beta
sd
Singkatnya, simulasi seperti ini dapat membuktikan apa pun yang Anda suka jika Anda hanya mengaturnya dan menafsirkannya dengan cara yang benar. Itu menunjukkan ahli statistik individu harus melakukan eksplorasi mereka sendiri, sesuai dengan masalah khusus yang mereka hadapi, untuk sampai pada pemahaman pribadi dan mendalam tentang kemampuan dan kelemahan prosedur yang mereka gunakan.
sumber
R
dan selalu menghargai petunjuk seperti itu.Tidak yakin itu memberikan jawaban akhir untuk pertanyaan itu, tetapi saya akan memberikan ini . Terutama poin 2. Lihat juga diskusi dalam lampiran A2 dari makalah ini .
sumber