Adakah yang tahu bagaimana cara menentukan apakah poin 7, 16 dan 29 adalah poin yang berpengaruh atau tidak? Saya membaca di suatu tempat bahwa karena jarak Cook lebih rendah dari 1, mereka tidak. Apakah saya benar?
Adakah yang tahu bagaimana cara menentukan apakah poin 7, 16 dan 29 adalah poin yang berpengaruh atau tidak? Saya membaca di suatu tempat bahwa karena jarak Cook lebih rendah dari 1, mereka tidak. Apakah saya benar?
Saya mengalami beberapa masalah dengan derivasi solusi untuk regresi ridge. Saya tahu solusi regresi tanpa ketentuan regularisasi: β=(XTX)−1XTy.β=(XTX)−1XTy.\beta = (X^TX)^{-1}X^Ty. Tetapi setelah menambahkan istilah L2 ke fungsi biaya, mengapa solusinya
Saya memiliki beberapa kovariat dalam perhitungan saya untuk sebuah model, dan tidak semuanya signifikan secara statistik. Haruskah saya menghapus yang bukan? Pertanyaan ini membahas fenomena tersebut, tetapi tidak menjawab pertanyaan saya: Bagaimana menafsirkan efek non-signifikan dari kovariat...
Regresi sudut terkecil dan laso cenderung menghasilkan jalur regularisasi yang sangat mirip (identik kecuali ketika koefisien melintasi nol.) Keduanya cocok secara efisien dengan algoritma yang hampir identik. Adakah alasan praktis untuk lebih menyukai satu metode daripada yang
Pertanyaan saya adalah apakah kita perlu menstandarkan set data untuk memastikan semua variabel memiliki skala yang sama, antara [0,1], sebelum menyesuaikan regresi logistik. Rumusnya adalah: xsaya- mnt ( xsaya)maks ( xsaya) - min (
Saya perhatikan bahwa dalam regresi R, Poisson dan negatif binomial (NB) selalu cocok dengan koefisien yang sama untuk prediktor kategoris, tetapi tidak kontinu. Misalnya, berikut ini adalah regresi dengan prediktor kategori: data(warpbreaks) library(MASS) rs1 = glm(breaks ~ tension,...
Saya mencoba menjalankan regresi OLS: DV: Perubahan berat badan lebih dari setahun (berat awal - berat akhir) IV: Apakah Anda berolahraga atau tidak. Namun, tampaknya masuk akal bahwa orang yang lebih berat akan menurunkan lebih banyak berat badan per unit olahraga daripada orang yang lebih...
Estimator regresi kuantil bersyarat oleh Koenker dan Basset (1978) untuk kuantil didefinisikan sebagaiβ Qτt hτth\tau^{th} βˆQR=minb∑i=1nρτ(yi−X′ibτ)β^QR=minb∑i=1nρτ(yi−Xi′bτ) \widehat{\beta}_{QR} = \min_{b} \sum^{n}_{i=1} \rho_\tau (y_i - X'_i b_\tau) mana adalah fungsi pembobotan ulang (disebut...
Jika regresi polinomial memodelkan hubungan nonlinear, bagaimana hal itu dapat dianggap sebagai kasus khusus dari regresi linier berganda? Wikipedia mencatat bahwa "Meskipun regresi polinomial cocok dengan model nonlinier untuk data, sebagai masalah estimasi statistik linear, dalam arti bahwa...
Saya melakukan regresi Cox multivarian, saya memiliki variabel independen dan nilai beta yang signifikan. Model ini cocok dengan data saya dengan sangat baik. Sekarang, saya ingin menggunakan model saya dan memprediksi kelangsungan hidup pengamatan baru. Saya tidak jelas bagaimana melakukan ini...
Saya cukup baru dalam hal ini dengan tes data binomial, tetapi perlu melakukan satu dan sekarang saya tidak yakin bagaimana menafsirkan hasilnya. Variabel y, variabel respons, adalah binomial dan faktor penjelasnya adalah kontinu. Inilah yang saya dapatkan ketika merangkum hasilnya: glm(formula =...
Bisakah seseorang tolong beri saya intuisi kapan harus memilih SVM atau LR? Saya ingin memahami intuisi di balik apa perbedaan antara kriteria optimasi belajar hyperplane keduanya, di mana tujuan masing-masing adalah sebagai berikut: SVM: Cobalah untuk memaksimalkan margin antara vektor dukungan...
Pada halaman 223 dalam Pengantar Pembelajaran Statistik , penulis merangkum perbedaan antara regresi ridge dan laso. Mereka memberikan contoh (Gambar 6.9) ketika "laso cenderung mengungguli regresi ridge dalam hal bias, varians, dan MSE". Saya mengerti mengapa laso diinginkan: ini menghasilkan...
TL, DR: Tampaknya, bertentangan dengan saran yang sering diulang, validasi silang tinggalkan-satu-keluar (LOO-CV) - yaitu,lipat CV dengan(jumlah lipatan) sama dengan(angka pengamatan pelatihan) - menghasilkan perkiraan kesalahan generalisasi yang merupakanvariabel terkecil untuk setiap, bukan...
Saya bertanya-tanya apa perbedaan dan hubungan antara perkiraan dan prediksi? Terutama dalam deret waktu dan regresi? Sebagai contoh, apakah saya benar bahwa: Dalam deret waktu, peramalan tampaknya berarti memperkirakan nilai masa depan yang diberikan nilai lampau dari deret waktu. Dalam...
Untuk plot 1, saya dapat menguji hubungan antara x dan y dengan melakukan korelasi sederhana. Untuk plot 2, di mana hubungannya nonlinear namun ada hubungan yang jelas antara x dan y, bagaimana saya bisa menguji asosiasi dan label sifatnya?
Saya punya 2 pertanyaan sederhana tentang regresi linier: Kapan disarankan untuk membakukan variabel penjelas? Setelah estimasi dilakukan dengan nilai-nilai terstandarisasi, bagaimana seseorang dapat memprediksi dengan nilai-nilai baru (bagaimana seseorang harus membuat standar nilai-nilai baru)?...
Saya saat ini menggunakan paket R lme4 . Saya menggunakan model efek campuran linier dengan efek acak: library(lme4) mod1 <- lmer(r1 ~ (1 | site), data = sample_set) #Only random effects mod2 <- lmer(r1 ~ p1 + (1 | site), data = sample_set) #One fixed effect + # random effects mod3 <-...
Saya ingin berasumsi bahwa suhu permukaan laut dari Laut Baltik adalah tahun yang sama tahun demi tahun, dan kemudian menggambarkannya dengan model fungsi / linier. Gagasan yang saya miliki adalah hanya memasukkan tahun sebagai angka desimal (atau num_months / 12) dan keluar berapa suhu yang...
Saya membaca buku tentang regresi linier dan mengalami kesulitan memahami matriks varians-kovarians dari :bb\mathbf{b} Item diagonal cukup mudah, tetapi item off-diagonal sedikit lebih sulit, yang membingungkan saya adalah σ( b0, b1) = E( b0b1) - E( b0) E( b1) = E( b0b1) -