Statistik dan Big Data

10
Mengapa distribusi penting?

Ini mungkin juga turun sebagai pertanyaan paling konyol yang pernah diajukan di forum ini, tetapi setelah menerima jawaban yang masuk akal dan bermakna untuk pertanyaan sebelumnya, saya pikir saya akan merentangkan keberuntungan saya lagi. Saya telah sangat bingung selama beberapa waktu tentang...

10
REML vs ML stepAIC

Saya merasa kewalahan setelah mencoba menggali literatur tentang bagaimana menjalankan analisis model campuran saya dengan menggunakan AIC untuk memilih model atau model terbaik. Saya tidak berpikir bahwa data saya serumit itu, tetapi saya mencari konfirmasi bahwa apa yang telah saya lakukan adalah...

10
Apa perbedaan point-wise?

Saat membaca Elemen Pembelajaran Statistik , saya telah menjumpai istilah "varians point-wise" beberapa kali. Sementara saya memiliki gagasan yang kabur tentang apa artinya itu, saya bersyukur mengetahui Bagaimana cara mendefinisikannya? Bagaimana ini

10
Bisakah saya menggunakan bootstrap, mengapa atau mengapa tidak?

Saat ini saya sedang mengerjakan estimasi biomassa menggunakan citra satelit. Saya akan dengan cepat menentukan latar belakang pertanyaan saya, dan kemudian menjelaskan pertanyaan statistik yang saya kerjakan. Latar Belakang Masalah Saya mencoba memperkirakan biomassa di suatu daerah di...

10
Model saran untuk regresi Cox dengan kovariat bergantung waktu

Saya memodelkan efek kehamilan pada hasil suatu penyakit (mati-hidup). Kira-kira 40% dari pasien memang hamil setelah waktu diagnosis-tetapi pada titik yang berbeda dalam waktu. Sejauh ini saya sudah melakukan plot KM yang menunjukkan efek perlindungan yang jelas dari kehamilan pada kelangsungan...

10
Perbedaan R dan EViews dalam estimasi AR (1)

Utama masalah adalah: Saya tidak dapat memperoleh estimasi parameter yang sama dengan EViews dan R. Untuk alasan yang saya sendiri tidak tahu, saya perlu memperkirakan parameter untuk data tertentu menggunakan EViews. Ini dilakukan dengan memilih opsi NLS (nonlinear least square) dan menggunakan...

10
Apakah Multivariate Central Limit Theorem (CLT) berlaku ketika variabel menunjukkan ketergantungan kontemporer sempurna?

Xi∽iidN(0,1)Xi∽iidN(0,1)X_i \overset{iid}{\backsim} \mathcal{N}(0, 1)i=1,...,ni=1,...,ni = 1, ..., nSn=1n∑i=1nXiSn=1n∑i=1nXi\begin{equation} S_n = \frac{1}{n} \sum_{i=1}^n X_i \end{equation}Tn=1n∑i=1n(X2i−1)Tn=1n∑i=1n(Xi2−1)\begin{equation} T_n = \frac{1}{n} \sum_{i=1}^n (X_i^2 -...

10
Memilih sejumlah komponen utama untuk dipertahankan

Salah satu metode yang disarankan kepada saya adalah dengan melihat plot scree dan memeriksa "siku" untuk menentukan jumlah PC yang tepat untuk digunakan. Tetapi jika plotnya tidak jelas, apakah R memiliki perhitungan untuk menentukan angka? fit <- princomp(mydata,