Sebuah koin yang adil dilemparkan sampai sebuah kepala muncul untuk pertama kalinya. Probabilitas ini terjadi pada jumlah undian ganjil? Bagaimana saya mendekati masalah
Sebuah koin yang adil dilemparkan sampai sebuah kepala muncul untuk pertama kalinya. Probabilitas ini terjadi pada jumlah undian ganjil? Bagaimana saya mendekati masalah
Situasi saya: ukuran sampel kecil: 116 variabel hasil biner daftar panjang variabel penjelas: 44 variabel penjelas tidak datang dari atas kepala saya; pilihan mereka didasarkan pada literatur. kebanyakan kasus dalam sampel dan sebagian besar variabel memiliki nilai yang hilang. Pendekatan...
Distribusi yang stabil tidak berubah-ubah berdasarkan konvolusi. Apa sub-keluarga dari distribusi stabil juga ditutup dengan perkalian? Dalam arti bahwa jika dan , maka fungsi kepadatan probabilitas produk, (hingga konstanta normalisasi) juga termasuk dalam ?f ∈ F g ∈ F f ⋅ g FFFFf∈Ff∈Ff\in...
Saya cukup baru dalam hal statistik dan R. Saya ingin mengetahui proses untuk menentukan parameter ARIMA untuk dataset saya. Bisakah Anda membantu saya mencari tahu menggunakan R yang sama dan secara teoritis (jika mungkin)? Rentang data dari Jan-12 hingga Mar-14 dan menggambarkan penjualan...
Saya bekerja dengan beberapa data dunia nyata dan model regresi menghasilkan beberapa hasil yang berlawanan dengan intuisi. Biasanya saya mempercayai statistik tetapi pada kenyataannya beberapa hal ini tidak benar. Masalah utama yang saya lihat adalah bahwa peningkatan dalam satu variabel...
Saya memiliki sampel 1,449 titik data yang tidak berkorelasi (r-squared 0,006). Ketika menganalisis data, saya menemukan bahwa dengan memecah nilai-nilai variabel independen menjadi kelompok-kelompok positif dan negatif, tampaknya ada perbedaan yang signifikan dalam rata-rata variabel dependen...
Jadi misalnya di sini adalah definisi yang saya dapatkan dari buku teks standar Variabel - karakteristik populasi atau sampel. ex. Harga suatu saham atau nilai pada suatu tes Data - nilai aktual yang diamati Jadi untuk laporan dua kolom [Nama | Penghasilan] nama kolom akan menjadi variabel dan...
Saya sedang mengerjakan tesis saya di mana saya memeriksa seberapa kuat emosi orang-orang terhadap berbagai peristiwa. Masalah saya adalah (1) saya memiliki pengalaman yang SANGAT kecil dengan statistik dan matematika, jadi saya agak bingung dengan semua metode yang berbeda dan akan sangat senang...
Saya telah memikirkan kembali jawaban yang saya berikan pada pertanyaan beberapa minggu yang lalu Hold-out cross-validation menghasilkan satu set tes yang dapat digunakan berulang kali untuk demonstrasi. Kita semua tampaknya setuju bahwa ini dalam banyak hal adalah fitur negatif, karena satu set...
Apa pentingnya matriks topi, H=X(X′X)−1X′H=X(X′X)−1X′H=X(X^{\prime}X )^{-1}X^{\prime} , dalam analisis regresi? Apakah hanya untuk perhitungan yang lebih
Saya menggunakan ccfuntuk menemukan korelasi antara 2 seri waktu. Saya mendapatkan plot yang terlihat seperti itu: Perhatikan bahwa saya terutama tertarik pada korelasi untuk lag = 0. Pertanyaan: Apakah mengartikannya dengan benar bahwa ada korelasi silang untuk lag = 0, karena untuk lag ini...
Saya mengalami kesulitan memahami bagaimana varImpfungsi ini bekerja untuk model randomForest dengan caretpaket. Pada contoh di bawah ini, fitur var3 sama pentingnya dengan varImpfungsi caret , tetapi model final randomForest yang mendasarinya memiliki kepentingan nol untuk fitur var3. Mengapa...
Saya telah membaca banyak tentang Dynamic Time Warping (DTW) belakangan ini. Saya sangat terkejut bahwa tidak ada literatur sama sekali tentang penerapan DTW ke seri waktu yang tidak teratur, atau setidaknya saya tidak dapat menemukannya. Adakah yang bisa memberi saya referensi ke sesuatu yang...
Bagging adalah proses menciptakan N pelajar pada N sampel bootstrap yang berbeda, kemudian mengambil rata-rata prediksi mereka. Pertanyaan saya adalah: Mengapa tidak menggunakan jenis sampling lainnya? Mengapa menggunakan sampel
Saya mengerti bahwa jika saya memiliki dua model A dan B dan A bersarang di B maka, diberikan beberapa data, saya dapat menyesuaikan parameter A dan B menggunakan MLE dan menerapkan tes rasio kemungkinan log umum. Secara khusus, distribusi uji harus dengan n derajat kebebasan di mana n adalah...
Ketika melakukan analisis intervensi dengan data deret waktu (alias Rangkaian Waktu Terputus) seperti yang dibahas di sini misalnya, salah satu persyaratan yang saya miliki adalah memperkirakan total keuntungan (atau kerugian) akibat intervensi - yaitu jumlah unit yang diperoleh atau hilang...
Saya memiliki matriks korelasi AAA , yang saya peroleh dengan menggunakan koefisien korelasi linear Pearson melalui corrcoef () Matlab . Matriks korelasi dimensi 100x100, yaitu saya menghitung matriks korelasi pada 100 variabel acak. Di antara 100 variabel acak ini, saya ingin menemukan 10...
Saya menggunakan kernel Squared Exponential (SE) untuk Regresi Proses Gaussian. Kelebihan dari kernel ini adalah: 1) sederhana: hanya 3 hiperparameter; 2) smooth: kernel ini adalah Gaussian. Mengapa orang sangat menyukai 'kehalusan'? Saya tahu bahwa kernel Gaussian terdiferensiasi tanpa batas,...
Pertanyaan saya muncul dari membaca bacaan Minka "Memperkirakan Distribusi Dirichlet" , yang menyatakan berikut tanpa bukti dalam konteks memperoleh penduga kemungkinan maksimum untuk distribusi Dirichlet berdasarkan pengamatan vektor acak: Seperti biasa dengan keluarga eksponensial, ketika...
Saya menulis fungsi sederhana dengan Python untuk menghitung rata-rata tertimbang secara eksponensial: def test(): x = [1,2,3,4,5] alpha = 0.98 s_old = x[0] for i in range(1, len(x)): s = alpha * x[i] + (1- alpha) * s_old s_old = s return s Namun, bagaimana saya bisa menghitung SD yang...