Apakah saya mencari distribusi berperilaku lebih baik untuk variabel independen yang bersangkutan, atau untuk mengurangi efek pencilan, atau yang
Strategi Pemodelan Regresi
Apakah saya mencari distribusi berperilaku lebih baik untuk variabel independen yang bersangkutan, atau untuk mengurangi efek pencilan, atau yang
Saya bertanya-tanya apa nilainya dalam mengambil variabel prediktor kontinu dan memecahnya (misalnya, menjadi kuintil), sebelum menggunakannya dalam model. Sepertinya saya bahwa dengan binning variabel kita kehilangan informasi. Apakah ini hanya agar kita dapat memodelkan efek non-linear? Jika...
Karena RF dapat menangani non-linearitas tetapi tidak dapat memberikan koefisien, akankah bijaksana untuk menggunakan hutan acak untuk mengumpulkan fitur-fitur yang paling penting dan kemudian memasukkan fitur-fitur tersebut ke dalam model regresi linier berganda untuk mendapatkan koefisien mereka?...
Apakah mungkin untuk mengenakan model regresi logistik? Saya melihat video yang mengatakan bahwa jika area saya di bawah kurva ROC lebih tinggi dari 95%, maka kemungkinan besar akan terlalu pas, tetapi apakah mungkin untuk mengenakan model regresi
Saya merenungkan diskusi seputar pertanyaan ini dan khususnya komentar Frank Harrell bahwa estimasi untuk varians dalam model yang dikurangi (yaitu satu dari mana sejumlah variabel penjelas telah diuji dan ditolak) harus menggunakan Tingkat Kemerdekaan Umum Ye . Profesor Harrell menunjukkan ini...
Seperti kita ketahui, ada 2 metode untuk mengevaluasi model regresi logistik dan mereka menguji hal-hal yang sangat berbeda Kekuatan prediksi: Dapatkan statistik yang mengukur seberapa baik Anda dapat memprediksi variabel dependen berdasarkan variabel independen. Pseudo R ^ 2 yang terkenal...
Misalkan saya melatih beberapa model pada set pelatihan, pilih yang terbaik menggunakan set validasi silang dan kinerja yang diukur pada set tes. Jadi sekarang saya punya satu model terbaik akhir. Haruskah saya melatihnya pada semua data saya yang tersedia atau solusi pengiriman yang hanya dilatih...
Terlepas dari beberapa keadaan unik di mana kita benar-benar harus memahami hubungan rata-rata bersyarat, apa situasi di mana seorang peneliti harus memilih OLS daripada Regresi Kuantil? Saya tidak ingin jawabannya menjadi "jika tidak ada gunanya memahami hubungan ekor", karena kita bisa...
Saya telah mencurahkan banyak waktu untuk pengembangan metode dan perangkat lunak untuk memvalidasi model prediktif dalam domain statistik frequentist tradisional. Dalam menerapkan lebih banyak gagasan Bayes ke dalam praktik dan pengajaran, saya melihat beberapa perbedaan utama yang harus dianut....
Metode pemilihan variabel algoritmik bertahap cenderung memilih model yang bias kurang lebih setiap perkiraan dalam model regresi ( s dan UK, nilai- p , statistik F , dll.), Dan hampir sama dengan mengecualikan prediktor sejati sebagai termasuk prediktor palsu menurut literatur simulasi yang cukup...
Frank Harrell telah memulai blog ( Statistik Berpikir) . Dalam pos utamanya , ia mencantumkan beberapa fitur utama filosofi statistiknya. Di antara barang-barang lainnya, itu termasuk: Jadikan ukuran sampel sebagai variabel acak jika memungkinkan Apa artinya "menjadikan ukuran sampel...
Ini adalah posting pertama saya di StackExchange, tetapi saya telah menggunakannya sebagai sumber daya selama beberapa waktu, saya akan melakukan yang terbaik untuk menggunakan format yang sesuai dan melakukan pengeditan yang sesuai. Juga, ini adalah pertanyaan multi-bagian. Saya tidak yakin apakah...
Dalam analisis diskriminan, variabel dependen adalah kategorikal, tetapi dapatkah saya menggunakan variabel kategorikal (misalnya status perumahan: pedesaan, perkotaan) bersama dengan beberapa variabel kontinu lainnya sebagai variabel independen dalam analisis diskriminan
Setelah mencari klarifikasi tentang koefisien model linier di sini saya punya pertanyaan lanjutan tentang non-signfikan (nilai p tinggi) untuk koefisien tingkat faktor. Contoh: Jika model linier saya menyertakan faktor dengan 10 level, dan hanya 3 level tersebut yang memiliki nilai p signifikan...
Menggunakan data ini: head(USArrests) nrow(USArrests) Saya dapat melakukan PCA sebagai berikut: plot(USArrests) otherPCA <- princomp(USArrests) Saya bisa mendapatkan komponen baru otherPCA$scores dan proporsi varian dijelaskan oleh komponen dengan summary(otherPCA) Tetapi bagaimana...
Saya bingung dengan asumsi linearitas terhadap logit untuk variabel prediktor kontinu dalam analisis regresi logistik. Apakah kita perlu memeriksa hubungan linier sambil menyaring prediktor potensial menggunakan analisis regresi logistik univariabel? Dalam kasus saya, saya menggunakan analisis...
Pencocokan skor kecenderungan digunakan untuk membuat kesimpulan kausal dalam studi observasional (lihat makalah Rosenbaum / Rubin ). Apa intuisi sederhana di balik mengapa ia bekerja? Dengan kata lain, mengapa jika kita memastikan probabilitas untuk berpartisipasi dalam pengobatan adalah sama...
Misalkan kita memiliki kovariat x 1 , ... , x n dan variabel hasil biner ynnnx1,…,xnx1,…,xnx_1, \dots, x_nyyy . Beberapa kovariat ini termasuk kategori dengan banyak tingkatan. Lainnya kontinu. Bagaimana Anda memilih model "terbaik"? Dengan kata lain, bagaimana Anda memilih kovariat mana yang akan...
Salah satu asumsi regresi logistik adalah linearitas dalam logit. Jadi begitu saya mendapatkan model saya dan menjalankan saya menguji nonlinier menggunakan uji Box-Tidwell. Salah satu prediktor kontinu saya (X) telah diuji positif untuk nonlinier. Apa yang harus saya lakukan selanjutnya? Karena...
Saat ini saya sedang belajar sendiri bagaimana melakukan klasifikasi, dan secara khusus saya melihat tiga metode: mendukung mesin vektor, jaringan saraf, dan regresi logistik. Apa yang saya coba pahami adalah mengapa regresi logistik akan berkinerja lebih baik daripada dua lainnya. Dari pemahaman...