Statistik dan Big Data

24
Contoh PCA di mana PC dengan varian rendah "berguna"

Biasanya dalam analisis komponen utama (PCA) beberapa PC pertama digunakan dan PC varians rendah dijatuhkan, karena mereka tidak menjelaskan banyak variasi dalam data. Namun, adakah contoh di mana PC dengan variasi rendah bermanfaat (yaitu menggunakan dalam konteks data, memiliki penjelasan...

24
Bayesian laso vs laso biasa

Perangkat lunak implementasi yang berbeda tersedia untuk laso . Saya tahu banyak membahas tentang pendekatan bayesian vs pendekatan frequentist di berbagai forum. Pertanyaan saya sangat spesifik untuk laso - Apa perbedaan atau kelebihan dari baysian laso vs laso biasa ? Berikut adalah dua contoh...

24
Apa itu 'koefisien alias'?

Saat membangun model regresi dalam R ( lm), saya sering mendapatkan pesan ini "there are aliased coefficients in the model" Apa sebenarnya artinya? Juga, karena ini predict()juga memberi peringatan. Meskipun ini hanya peringatan, saya ingin tahu bagaimana kita bisa mendeteksi / menghapus...

24
Mengapa lambda “dalam satu kesalahan standar dari minimum” adalah nilai yang direkomendasikan untuk lambda dalam regresi jaring elastis?

Saya mengerti apa peran lambda dalam regresi elastis-bersih. Dan saya bisa mengerti mengapa orang akan memilih lambda.min, nilai lambda yang meminimalkan kesalahan divalidasi silang. Pertanyaan saya adalah Di mana dalam literatur statistik direkomendasikan untuk menggunakan lambda.1se, yaitu nilai...