Statistik dan Big Data

39
Mereplikasi opsi "kuat" Stata di R

Saya telah mencoba untuk mereplikasi hasil opsi Stata robustdi R. Saya telah menggunakan rlmperintah dari paket MASS dan juga perintah lmrobdari paket "robustbase". Dalam kedua kasus hasilnya sangat berbeda dari opsi "kuat" di Stata. Adakah yang bisa menyarankan sesuatu dalam konteks ini? Berikut...

39
Apakah ada kasus di mana PCA lebih cocok daripada t-SNE?

Saya ingin melihat bagaimana 7 ukuran perilaku koreksi teks (waktu yang dihabiskan untuk memperbaiki teks, jumlah penekanan tombol, dll.) Saling berhubungan. Ukurannya berkorelasi. Saya menjalankan PCA untuk melihat bagaimana langkah-langkah diproyeksikan ke PC1 dan PC2, yang menghindari tumpang...

38
Pembelajaran online vs offline?

Apa perbedaan antara pembelajaran offline dan online ? Apakah ini hanya masalah mempelajari seluruh dataset (offline) vs belajar secara bertahap (satu contoh pada satu waktu)? Apa contoh algoritma yang digunakan di

38
Rangkaian waktu 'pengelompokan' di R

Saya memiliki satu set data deret waktu. Setiap seri mencakup periode yang sama, meskipun tanggal sebenarnya dalam setiap seri waktu mungkin tidak semuanya 'berbaris' persis. Dengan kata lain, jika seri Time harus dibaca ke dalam matriks 2D, itu akan terlihat seperti ini: date T1 T2 T3 .......

38
Apa yang dimaksud dengan pengidentifikasian model?

Saya tahu bahwa dengan model yang tidak dapat diidentifikasi, data dapat dikatakan dihasilkan oleh beberapa penugasan berbeda ke parameter model. Saya tahu bahwa kadang-kadang dimungkinkan untuk membatasi parameter sehingga semua dapat diidentifikasi, seperti dalam contoh di Cassella & Berger...