Statistik dan Big Data

11
Hutan acak pada data yang dikelompokkan

Saya menggunakan hutan acak pada data kelompok berdimensi tinggi (50 variabel input numerik) yang memiliki struktur hierarki. Data dikumpulkan dengan 6 replikasi pada 30 posisi dari 70 objek berbeda yang menghasilkan 12600 titik data, yang tidak independen. Tampaknya hutan acak terlalu pas data,...

11
Merencanakan Acara pada Garis Waktu di R

Apakah ada pustaka plot untuk R yang bisa mengubah kerangka data waktu mulai dan berhenti menjadi alur waktu seperti di bawah ini: Makna sumbu Y hanya adalah bahwa ia bertumpuk dengan konkurensi, tetapi tidak selalu mewakili konkurensi (lihat celah di tengah). Setiap kotak abu-abu adalah acara -...

11
Koefisien dan batas kesalahan gini

Saya memiliki serangkaian waktu data dengan N = 14 jumlah pada setiap titik waktu, dan saya ingin menghitung koefisien Gini dan kesalahan standar untuk perkiraan ini pada setiap titik waktu. Karena saya hanya memiliki N = 14 hitungan pada setiap titik waktu saya melanjutkan dengan menghitung...

11
Menilai perkiraan rentetan waktu

Misalkan saya memiliki lebih dari 20.000 seri waktu bulanan mulai dari Jan'05 hingga Dec'11. Masing-masing mewakili data penjualan global untuk produk yang berbeda. Bagaimana jika, alih-alih menghitung perkiraan untuk masing-masing, saya hanya ingin fokus pada sejumlah kecil produk yang...