Adakah yang tahu buku / halaman web yang bagus untuk mulai mempelajari teknik validasi
Adakah yang tahu buku / halaman web yang bagus untuk mulai mempelajari teknik validasi
Sistem persamaan linear sangat luas dalam statistik komputasi. Satu sistem khusus yang saya temui (misalnya, dalam analisis faktor) adalah sistem Ax=bAx=bAx=b di mana Di sini adalah matriks diagonal dengan diagonal yang benar-benar positif, adalah (dengan ) matriks semi-pasti positif simetris...
Masalah Saya menulis fungsi R yang melakukan analisis Bayesian untuk memperkirakan kepadatan posterior yang diberikan informasi sebelumnya dan data. Saya ingin fungsi mengirim peringatan jika pengguna perlu mempertimbangkan kembali sebelumnya. Dalam pertanyaan ini, saya tertarik mempelajari cara...
Saya tahu ad.test () dapat digunakan untuk menguji normalitas. Apakah mungkin untuk mendapatkan ad.test untuk membandingkan distribusi dari dua sampel data? x <- rnorm(1000) y <- rgev(2000) ad.test(x,y) Bagaimana saya bisa melakukan uji Anderson-Darling pada 2
Ketika saya mengambil kursus dalam statistik teoritis sebagai sarjana 10 tahun yang lalu, kami menggunakan Statistik Matematika Modern oleh Dudewicz dan Mishra. Saya menemukan diri saya merujuk kembali ke buku sekarang dan saya diingatkan beberapa contoh kode dalam perakitan untuk IBM 370. Meskipun...
Ketika melakukan validasi silang 5 kali lipat (misalnya), biasanya menghitung kurva ROC terpisah untuk masing-masing dari 5 lipatan dan sering kali kurva ROC rata-rata dengan std. dev. ditampilkan sebagai ketebalan kurva. Namun, untuk LOO cross-validation, di mana hanya ada satu titik data...
Apakah ada paket perangkat lunak untuk menyelesaikan regresi linier dengan tujuan meminimalkan norma
Tampaknya universal bahwa statistik demografis diberikan dalam hal 100.000 penduduk per tahun. Misalnya, tingkat bunuh diri, tingkat pembunuhan, tahun kehidupan yang disesuaikan dengan disabilitas, daftarnya berlanjut. Mengapa? Jika kita berbicara tentang kimia, bagian per juta (ppm) adalah umum....
Saya selalu percaya bahwa waktu tidak boleh digunakan sebagai prediktor dalam regresi (termasuk gam) karena, maka, orang hanya akan "menggambarkan" tren itu sendiri. Jika tujuan dari sebuah penelitian adalah untuk menemukan parameter lingkungan seperti suhu dll yang menjelaskan perbedaan dalam,...
Saya memiliki tiga set data deret waktu yang ingin saya bandingkan. Mereka telah diambil dalam 3 periode terpisah sekitar 12 hari. Mereka adalah rata-rata, maksimum dan minimum jumlah kepala yang diambil di perpustakaan perguruan tinggi selama minggu-minggu final. Saya harus melakukan mean, max dan...
Saya ingin memproses gambar mikroskop yang tersegmentasi secara otomatis untuk mendeteksi gambar yang salah dan / atau segmentasi yang salah, sebagai bagian dari pipa pencitraan throughput tinggi. Ada sejumlah parameter yang dapat dihitung untuk setiap gambar mentah dan segmentasi, dan itu menjadi...
Saya ingin mempelajari data mining. Apakah ada kuliah video gratis di luar sana yang menjelaskan proses penambangan data secara
Diberikan sampel pertama dari distribusi gaussian dan penaksir-M, , properti apa di yang cukup untuk menjamin dalam probabilitas? Apakah menjadi cembung dan ketat meningkat cukup?X1,...,Xn∼N(μ,σ)X1,...,Xn∼N(μ,σ)X_1,...,X_n \sim N(\mu,\sigma) μm=argmina∑ρ(|Xi−a|)μm=argmina∑ρ(|Xi−a|)\mu_m =...
Saya memiliki serangkaian fungsi, masing-masing seharusnya mewakili kepadatan variabel acak di seluruh agen. Setiap fungsi juga memiliki domain, yang menggambarkan nilai variabel acak apa yang valid. Sekarang, jika saya ingat kelas statistik saya dengan benar, jika saya mengambil integral dari...
Saya tidak begitu terbiasa dengan literatur ini, jadi tolong maafkan saya jika ini adalah pertanyaan yang jelas. Karena AIC dan BIC bergantung pada memaksimalkan kemungkinan, tampaknya mereka hanya dapat digunakan untuk membuat perbandingan relatif antara satu set model yang mencoba menyesuaikan...
Adakah yang bisa menjelaskan secara detail: Apa yang dimaksud dengan menolak menyimpulkan? Bagaimana ini dapat digunakan untuk meningkatkan akurasi model saya? Saya memang memiliki gagasan untuk menolak menyimpulkan dalam aplikasi kartu kredit tetapi berjuang dengan pemikiran menggunakannya...
Saya mengerjakan banyak pemodelan statistik, seperti Hidden Markov Models dan Gaussian Mixture Models. Saya melihat bahwa melatih model-model yang baik dalam setiap kasus ini membutuhkan sejumlah besar (> 20.000 kalimat untuk HMM) data yang diambil dari lingkungan yang sama dengan penggunaan...
Saya telah menghitung matriks korelasi dari kumpulan data yang berisi 455 titik data, setiap titik data mengandung 14 karakteristik. Jadi dimensi matriks korelasi adalah 14 x 14. Saya bertanya-tanya apakah ada ambang batas untuk nilai koefisien korelasi yang menunjukkan bahwa ada korelasi yang...
Kita tahu dari teori ukuran bahwa ada peristiwa yang tidak dapat diukur, yaitu mereka tidak bisa diukur. Apa yang kita sebut peristiwa dengan probabilitas bahwa ukuran probabilitas tidak didefinisikan? Apa jenis pernyataan yang akan kita buat tentang peristiwa semacam
Saya menggunakan paket randomForest dalam R untuk mengembangkan model hutan acak untuk mencoba menjelaskan hasil yang berkelanjutan dalam dataset "lebar" dengan lebih banyak prediktor daripada sampel. Secara khusus, saya memasang satu model RF yang memungkinkan prosedur untuk memilih dari...