Statistik dan Big Data

8
Fungsi kemungkinan data terpotong

Saya mengalami sedikit kesulitan memahami konsep dan derivasi dari kemungkinan data terpotong. Misalnya, jika saya ingin menemukan fungsi kemungkinan berdasarkan sampel dari distribusi, tetapi ketika mengambil sampel dari distribusi, saya mengamati nilai terpotong (di mana ada cut-off dari MMM,...

8
Penyebab singularitas dalam matriks untuk regresi kuantil

Saya melakukan regresi kuantil dalam R menggunakan paket quantreg. Dataset saya mencakup 12.328 pengamatan mulai dari 0,12 hingga 330. Titik waktu untuk data saya tidak sepenuhnya berkelanjutan; semua data masuk ke dalam satu dari beberapa lusin tempat sampah mulai dari 73 hingga 397. Ketika saya...

8
Uji chi-squared dengan 0 nilai yang diharapkan

Tabel kontingensi saya: heterozygous homozygous.minor homozygous.major observed 2 0 3 expected 0 0 5 Populasi yang diharapkan hanya terdiri dari genotipe AA, tetapi dalam populasi yang diamati kami mengamati 2 genotipe AB. Untuk menghitung Chi-sq untuk ini saya hanya akan mengabaikan dua kasus...

8
Menjelaskan dekomposisi beveridge nelson

Adakah yang bisa menjelaskan cara kerja Dekomposisi Beveridge-Nelson? Sejauh ini yang saya tahu adalah memperkirakan siklus tren dalam data deret waktu non stasioner. Saya melihat beberapa artikel jurnal dan saya masih bingung tentang cara kerjanya

8
Kurtosis distribusi dibuat-buat

Lihatlah gambar di bawah ini. Garis biru menunjukkan pdf normal standar. Zona merah seharusnya sama dengan jumlah area abu-abu (maaf untuk gambar yang mengerikan). Saya ingin tahu, bisakah kita membuat distribusi baru dengan puncak yang lebih tinggi dengan menggeser zona abu-abu ke atas (zona...

8
Star Coordinates vs. analisis komponen utama

Saat ini saya sedang mempersiapkan presentasi untuk kursus universitas di "Analisis Data Visual". Dan salah satu topik saya adalah visualisasi "Koordinat Bintang". Koordinat Bintang Ketika Star Coordinates melakukan transformasi data dimensi tinggi, dan teknik PCA yang terkenal juga melakukannya,...

8
Gridsearch untuk estimasi parameter SVM

Saat ini saya sedang bereksperimen dengan gridsearch untuk melatih mesin vektor dukungan. Saya mengerti bahwa, jika saya memiliki parameter gamma dan C, fungsi R tune.svm melakukan validasi silang 10 kali lipat untuk semua kombinasi dari 2 parameter ini. Karena saya tidak tahu bagaimana...