Statistik dan Big Data

9
Ratakan rangkaian waktu melingkar / periodik

Saya memiliki data kecelakaan kendaraan bermotor menurut jam sehari. Seperti yang Anda harapkan, mereka tinggi di tengah hari dan puncaknya pada jam sibuk. Geom_density default ggplot2 memuluskannya dengan baik Subset dari data, untuk crash terkait drive-minum, tinggi di kedua ujung hari (malam...

9
Definisi matematis kausalitas

Biarkan dan menjadi variabel acak. adalah mean bersyarat dari diberikan . Kami mengatakan tidak terkait dengan jika tidak bergantung pada , yang berarti sama dengan . Sekarang, mari kita ikuti definisi kausalitas ini sebentar. Menurut hukum ekspektasi berulang, . Ini berarti bahwa jika tidak...

9
Menghasilkan seragam diskrit dari membalik koin

Misalkan Anda memiliki koin yang adil yang dapat Anda balikkan sebanyak yang Anda inginkan (mungkin tak terhitung jumlahnya). Apakah mungkin untuk menghasilkan distribusi seragam diskrit pada , di mana BUKAN kekuatan 2? Bagaimana Anda melakukannya?(1,2,...,k)(1,2,...,k)(1,2,...,k)kkk Jika ini...

9
Buku tentang ekologi statistik?

Saya tahu pertanyaan ini ditanyakan sebelumnya: Buku referensi untuk studi ekologi tetapi bukan yang saya cari. Apa yang saya cari adalah apakah ada yang bisa merekomendasikan buku yang bagus (atau referensi kanonik) tentang ekologi statistik? Saya memiliki pemahaman yang sangat baik tentang...

9
Mengapa Teorema Bayes bekerja secara grafis?

Dari sudut pandang matematika Teorema Bayes sangat masuk akal bagi saya (yaitu, menurunkan dan membuktikan), tetapi yang saya tidak tahu adalah apakah ada argumen geometris atau grafis yang bagus yang dapat ditunjukkan untuk menjelaskan Teorema Bayes. Saya mencoba mencari di Google untuk jawaban...

9
Plot Ketergantungan Sebagian dan peningkatan Gradien (paket GBM)

Apakah mungkin untuk memplot plot dependensi parsial untuk menampilkan probabilitas kelas dan memperkirakan efek prediktor untuk model GBM ? Sesuatu yang mirip dengan partialPlotdari randomForestpaket. Menurut artikel ini , sebagian plot dapat dilakukan dengan gbm. Terima kasih sebelumnya atas...

9
Pemodelan untuk skor sepakbola

Dalam Dixon, Coles ( 1997 ), mereka telah menggunakan estimasi kemungkinan maksimum untuk dua model Poisson independen yang dimodifikasi dalam (4.3) untuk memodelkan skor dalam sepak bola. Saya mencoba menggunakan R untuk "mereproduksi" alfa dan beta serta parameter efek rumah (hal 274, Tabel 4)...