Saya mengambil kursus tentang model regresi dan salah satu properti yang disediakan untuk regresi linier adalah bahwa residual selalu berjumlah nol ketika intersep dimasukkan. Adakah yang bisa memberikan penjelasan yang baik mengapa ini terjadi?
Saya mengambil kursus tentang model regresi dan salah satu properti yang disediakan untuk regresi linier adalah bahwa residual selalu berjumlah nol ketika intersep dimasukkan. Adakah yang bisa memberikan penjelasan yang baik mengapa ini terjadi?
Dalam regresi ridge, fungsi tujuan harus diminimalkan adalah: RSS+λ∑β2j.RSS+λ∑βj2.\text{RSS}+\lambda \sum\beta_j^2. Bisakah ini dioptimalkan menggunakan metode pengali Lagrange? Atau apakah itu diferensiasi
Saya memiliki beberapa data yang ingin saya smoothkan sehingga poin yang dihaluskan menurun secara monoton. Data saya menurun tajam dan kemudian mulai naik. Berikut ini contoh menggunakan R df <- data.frame(x=1:10, y=c(100,41,22,10,6,7,2,1,3,1)) ggplot(df, aes(x=x, y=y))+geom_line() Apa...
Catatan: SSTSSTSST = Jumlah Total Kuadrat, SSESSESSE = Jumlah Kesalahan Kuadrat, dan SSRSSRSSR = Jumlah Regresi Kuadrat. Persamaan dalam judul sering ditulis sebagai: ∑i=1n(yi−y¯)2=∑i=1n(yi−y^i)2+∑i=1n(y^i−y¯)2∑i=1n(yi−y¯)2=∑i=1n(yi−y^i)2+∑i=1n(y^i−y¯)2\sum_{i=1}^n (y_i-\bar y)^2=\sum_{i=1}^n...
Saya telah mengambil kursus pembelajaran mesin di kampus saya. Di salah satu quize, pertanyaan ini diajukan. Model 1: y=θx+ϵy=θx+ϵ y = \theta x + \epsilon Model 2: y=θx+θ2x+ϵy=θx+θ2x+ϵ y = \theta x + \theta^2 x + \epsilon Manakah dari model di atas yang lebih cocok dengan data? (anggap...
Saya benar-benar bingung tentang perbedaan makna mengenai konteks regresi linier dari istilah-istilah berikut: F statistik R kuadrat Kesalahan standar residual Saya menemukan webstie ini yang memberi saya wawasan luas dalam berbagai istilah yang terlibat dalam regresi linier, namun istilah yang...
Saya suka memahami perbedaan antara dengan atau tanpa model intersep dalam regresi logistik Apakah ada perbedaan di antara mereka kecuali bahwa dengan intersep koefisien menganggap log (odds ratio) relatif terhadap kelompok baseline dan tanpa intersep mereka menganggap log (odds)? dari apa yang...
Ini mungkin pertanyaan yang aneh sama sekali tetapi sebagai seorang pemula untuk subjek saya bertanya-tanya mengapa kita menggunakan regresi untuk menentukan deret waktu jika salah satu asumsi regresi adalah data yang harus ditampung sedangkan data yang digunakan regresi adalah bukan...
Mengapa regresi linier dan Model Umum memiliki asumsi yang tidak konsisten? Dalam regresi linier, kita asumsikan residual berasal dari Gaussian Dalam regresi lain (regresi logistik, regresi racun), kami menganggap respons datang dari beberapa distribusi (binomial, poission dll). Mengapa...
Saya mengerti artinya bahwa model tersebut buruk dalam memprediksi titik data individu tetapi telah membentuk tren yang kuat (misalnya, y naik ketika x
Katakanlah kita memiliki input (prediktor) dan output (respons) titik data A, B, C, D, E dan kami ingin menyesuaikan garis melalui titik-titik tersebut. Ini adalah masalah sederhana untuk menggambarkan pertanyaan, tetapi dapat diperluas ke dimensi yang lebih tinggi juga. Pernyataan...
Baru-baru ini, saya tertarik untuk mengimplementasikan model regresi beta, untuk hasil yang proporsional. Perhatikan bahwa hasil ini tidak akan masuk ke dalam konteks binomial, karena tidak ada konsep yang bermakna dari "kesuksesan" diskrit dalam konteks ini. Bahkan, hasilnya sebenarnya adalah...
Saya menyadari ini mungkin pertanyaan yang berpotensi luas, tetapi saya bertanya-tanya apakah ada asumsi yang dapat digeneralisasi yang mengindikasikan penggunaan GAM (Generalized additive model) di atas GLM (Generalized linear model)? Seseorang baru-baru ini mengatakan kepada saya bahwa GAM hanya...
Saya punya beberapa data yang sesuai dengan garis linear: Ketika saya melakukan regresi linier dari nilai-nilai ini, saya mendapatkan persamaan linear: y= 0,997 x - 0,0136y=0,997x-0,0136y = 0.997x-0.0136 Dalam dunia yang ideal, persamaan harus menjadi y= xy=xy = x . Jelas, nilai linear saya...
Teorema Gauss-Markov memberi tahu kita bahwa penaksir OLS adalah penaksir tidak bias linier terbaik untuk model regresi linier. Tapi seandainya saya tidak peduli tentang linearitas dan ketidakberpihakan. Lalu apakah ada beberapa penaksir (kemungkinan nonlinier / bias) lainnya untuk model regresi...
Saya memiliki regresi multivarian, yang mencakup interaksi. Misalnya, untuk mendapatkan perkiraan efek pengobatan untuk kuintil termiskin, saya perlu menambahkan koefisien dari regressor pengobatan ke koefisien dari variabel interaksi (yang berinteraksi dengan pengobatan dan kuintil 1). Saat...
Salah satu asumsi regresi logistik adalah linearitas dalam logit. Jadi begitu saya mendapatkan model saya dan menjalankan saya menguji nonlinier menggunakan uji Box-Tidwell. Salah satu prediktor kontinu saya (X) telah diuji positif untuk nonlinier. Apa yang harus saya lakukan selanjutnya? Karena...
Apa pro dan kontra dari menggunakan LARS [1] dibandingkan menggunakan penurunan koordinat untuk menyesuaikan regresi linier yang diatur L1? Saya terutama tertarik pada aspek kinerja (masalah saya cenderung ada Ndalam ratusan ribu dan p<20.) Namun, wawasan lainnya juga akan dihargai. sunting:...
Saya menyesuaikan regresi logistik bertahap pada satu set data di SPSS. Dalam prosedur, saya menyesuaikan model saya ke subset acak yang kira-kira. 60% dari total sampel, yaitu sekitar 330 kasus. Apa yang saya temukan menarik adalah bahwa setiap kali saya sampel ulang data saya, saya mendapatkan...
Saya ingin mendapatkan koefisien untuk masalah LASSO ||Y−Xβ||+λ||β||1.||Y−Xβ||+λ||β||1.||Y-X\beta||+\lambda ||\beta||_1. Masalahnya adalah fungsi glmnet dan lars memberikan jawaban yang berbeda. Untuk fungsi glmnet, saya meminta koefisien bukan hanya λ , tapi saya masih mendapatkan jawaban yang...