Statistik dan Big Data

11
Seberapa dapat dipertahankan untuk memilih

Ketika saya menentukan lambda saya melalui validasi silang, semua koefisien menjadi nol. Tapi saya punya beberapa petunjuk dari literatur bahwa beberapa prediktor pasti akan mempengaruhi hasilnya. Apakah itu sampah untuk secara sewenang-wenang memilih lambda sehingga hanya ada sesedikit yang...

11
Ridge dan LASSO diberi struktur kovarians?

Setelah membaca Bab 3 dalam Elemen Pembelajaran Statistik (Hastie, Tibshrani & Friedman), saya bertanya-tanya apakah mungkin untuk menerapkan metode penyusutan terkenal yang dikutip pada judul pertanyaan ini diberikan struktur kovarian, yaitu, meminimalkan (mungkin lebih umum) )...

11
Parameter dispersi dalam output GLM

Saya telah menjalankan glm di R, dan di dekat bagian bawah summary()output, ia menyatakan (Dispersion parameter for gaussian family taken to be 28.35031) Saya telah melakukan beberapa pencarian di Google dan mengetahui bahwa parameter dispersi digunakan agar sesuai dengan kesalahan standar. Saya...

11
Residu Schoenfeld

Dalam model bahaya proporsional Cox dengan banyak variabel, jika residu Schoenfeld tidak rata untuk salah satu variabel, apakah ini membatalkan seluruh model atau dapatkah hanya variabel yang berkinerja buruk diabaikan? Artinya, tafsirkan koefisien untuk variabel lain, tetapi jangan menafsirkan...

11
Studi simulasi: bagaimana memilih jumlah iterasi?

Saya ingin menghasilkan data dengan "Model 1" dan cocok dengan "Model 2". Gagasan yang mendasarinya adalah untuk menyelidiki sifat ketahanan dari "Model 2". Saya sangat tertarik pada tingkat cakupan interval kepercayaan 95% (berdasarkan perkiraan normal). Bagaimana cara mengatur jumlah iterasi...

11
Mencoba menghitung indeks Gini di distribusi reputasi StackOverflow?

Saya mencoba menghitung indeks Gini pada distribusi reputasi SO menggunakan SO Data Explorer. Persamaan yang saya coba terapkan adalah ini: Di mana: = jumlah pengguna di situs; = nomor seri pengguna (1 - 1.225.000); = reputasi pengguna .niyiiG ( S) = 1n - 1( n + 1 - 2 ( ∑ni = 1( N + 1 - i )...

11
Buku bagus tentang penambangan teks?

Hai Saya ingin tahu apakah ada beberapa buku bagus tentang penggalian dan klasifikasi teks dengan beberapa studi kasus ?. Jika tidak beberapa makalah / jurnal dapat diakses oleh publik akan melakukannya. Jika mereka menggambarkan contoh mereka dengan R lebih baik. Saya tidak mencari langkah demi...