Saya menyadari masalah pemilihan stepwise / forward / backward dalam model regresi. Ada banyak kasus para peneliti yang mengecam metode ini dan menunjukkan alternatif yang lebih baik. Saya penasaran apakah ada cerita yang ada tempat analisis statistiknya:
- telah menggunakan regresi bertahap;
- membuat beberapa kesimpulan penting berdasarkan model akhir
- kesimpulannya salah, menghasilkan konsekuensi negatif bagi individu, penelitian, atau organisasi mereka
Pemikiran saya tentang ini jika metode bertahap buruk, maka harus ada konsekuensi di "dunia nyata" untuk menggunakannya.
regression
stepwise-regression
history
probabilityislogic
sumber
sumber
Jawaban:
Ada lebih dari satu pertanyaan yang diajukan. Yang paling sempit adalah menanyakan contoh kapan regresi bertahap menyebabkan kerugian karena dilakukan bertahap. Hal ini tentu saja benar, tetapi hanya dapat ditetapkan secara tegas ketika data yang digunakan untuk regresi bertahap juga dipublikasikan, dan seseorang menganalisis ulang dan menerbitkan koreksi yang ditinjau oleh sejawat dengan pencabutan penulis utama yang diterbitkan. Untuk membuat tuduhan dalam konteks lain berisiko tindakan hukum, dan, jika kami menggunakan kumpulan data yang berbeda, kami dapat menduga bahwa kesalahan telah dibuat, tetapi "statistik tidak pernah membuktikan apa pun" dan kami tidak akan dapat menetapkan bahwa kesalahan itu terbuat; "Di luar keraguan yang masuk akal".
Sebagai fakta, orang sering mendapatkan hasil yang berbeda tergantung pada apakah orang melakukan penghapusan bertahap atau penumpukan bertahap dari persamaan regresi, yang menunjukkan kepada kita bahwa tidak ada pendekatan yang cukup benar untuk merekomendasikan penggunaannya. Jelas, sesuatu yang lain sedang terjadi, dan itu membawa kita ke pertanyaan yang lebih luas, juga ditanyakan di atas, tetapi dalam bentuk peluru, sebesar "Apa masalah dengan regresi bertahap, bagaimanapun? Itu adalah pertanyaan yang lebih berguna untuk dijawab dan memiliki menambahkan manfaat bahwa saya tidak akan mengajukan gugatan terhadap saya karena menjawabnya.
Melakukannya dengan benar untuk MLR bertahap, berarti menggunakan 1) unit yang benar secara fisik (lihat di bawah), dan 2) transformasi variabel yang sesuai untuk korelasi terbaik dan tipe distribusi kesalahan (untuk homoseksualitas dan fisik), dan 3) menggunakan semua permutasi kombinasi variabel, tidak langkah-bijaksana, semuanya , dan 4) jika seseorang melakukan diagnostik regresi lengkap maka seseorang menghindari hilangnya kombinasi variabel VIF (collinearity) tinggi yang jika tidak akan menyesatkan, maka hadiahnya adalah regresi yang lebih baik.
Seperti yang dijanjikan untuk # 1 di atas, kita selanjutnya mengeksplorasi unit yang benar untuk sistem fisik. Karena hasil yang baik dari regresi bergantung pada perlakuan variabel yang benar, kita perlu memperhatikan dimensi unit fisik yang biasa dan menyeimbangkan persamaan kita dengan tepat. Juga, untuk aplikasi biologis, diperlukan kesadaran dan perhitungan untuk dimensi penskalaan alometrik .
Silakan baca contoh penyelidikan fisik sistem biologis ini untuk cara memperluas penyeimbangan unit ke biologi. Dalam makalah itu, langkah 1) hingga 4) di atas diikuti dan formula terbaik ditemukan menggunakan analisis regresi yang luas yaitu, , di mana adalah laju filtrasi glomerulus , penanda katabolisme, di mana unit dipahami menggunakan geometri fraktal sehingga , berat adalah konstruksi geometri fraktal empat dimensi , dan V, volume, disebut Euclidean, atau variabel tiga dimensi. Kemudian G F R W 1 = 1G FR = k ∗ W1 / 4V2 / 3 G FR W GFR1 = 1443+ 23 . Sehingga formulanya konsisten secara dimensi dengan metabolisme. Itu bukan pernyataan yang mudah dipahami. Pertimbangkan bahwa 1) Secara umum tidak dihargai (tidak diketahui) bahwa adalah penanda metabolisme. 2) Geometri fraktal hanya jarang diajarkan dan interpretasi fisik dari rumus yang disajikan sulit dipahami bahkan untuk seseorang yang memiliki pelatihan matematika.G FR
sumber