Statistik dan Big Data

9
R mendeteksi tren peningkatan / penurunan deret waktu

Saya memiliki banyak rangkaian waktu dengan periode: hari, minggu atau bulan. Dengan stl()fungsi atau dengan loess(x ~ y)saya dapat melihat bagaimana tren seri waktu tertentu terlihat. Saya perlu mendeteksi apakah tren deret waktu meningkat atau menurun. Bagaimana saya bisa mengaturnya? Saya...

9
Nilai batas jarak Cook

Saya telah membaca tentang jarak juru masak untuk mengidentifikasi outlier yang memiliki pengaruh besar pada regresi saya. Dalam penelitian asli Cook, ia mengatakan bahwa tingkat cut-off 1 harus sebanding dengan mengidentifikasi influencer. Namun, berbagai penelitian lain menggunakan...

9
Mengapa 0,05 <p <0,95 hasil disebut false positive?

Sunting: Basis pertanyaan saya cacat, dan saya perlu meluangkan waktu mencari tahu apakah itu bisa masuk akal. Sunting 2: Mengklarifikasi bahwa saya mengakui bahwa nilai-p bukan ukuran langsung dari probabilitas hipotesis nol, tetapi bahwa saya berasumsi bahwa semakin dekat nilai-p ke 1, semakin...

9
Bias optimisme - perkiraan kesalahan prediksi

Buku Elemen Pembelajaran Statistik (tersedia dalam PDF online) membahas bias optimisim (7.21, halaman 229). Ini menyatakan bahwa bias optimisme adalah perbedaan antara kesalahan pelatihan dan kesalahan dalam sampel (kesalahan diamati jika kita sampel nilai-nilai hasil baru di masing-masing poin...

9
Kesetaraan AIC dan nilai-p dalam pemilihan model

Dalam komentar untuk jawaban pertanyaan ini , dinyatakan bahwa menggunakan AIC dalam pemilihan model setara dengan menggunakan p-value 0,154. Saya mencobanya di R, di mana saya menggunakan algoritma seleksi subset "terbelakang" untuk membuang variabel dari spesifikasi lengkap. Pertama, dengan...