Statistik dan Big Data

14
Apakah ada cara sederhana untuk mendeteksi outlier?

Saya bertanya-tanya apakah ada cara sederhana untuk mendeteksi outlier. Untuk salah satu proyek saya, yang pada dasarnya merupakan korelasi antara berapa kali responden berpartisipasi dalam aktivitas fisik dalam seminggu dan berapa kali mereka makan di luar rumah (makanan cepat saji) dalam...

14
Bagaimana cara mengukur bentuk cluster?

Saya tahu bahwa pertanyaan ini tidak didefinisikan dengan baik, tetapi beberapa cluster cenderung berbentuk elips atau terletak di ruang dimensi yang lebih rendah sementara yang lain memiliki bentuk nonlinear (dalam contoh 2D atau 3D). Apakah ada ukuran nonlinier (atau "bentuk") dari...

14
Kesalahan LME () - batas iterasi tercapai

Dalam menentukan model efek campuran silang, saya mencoba memasukkan interaksi. Namun, saya mendapatkan pesan kesalahan berikut: Error in lme.formula(rate ~ nozzle, random = ~nozzle | operator, data = Flow) : nlminb problem, convergence error code = 1 message = iteration limit reached without...

14
Pro dan kontra dari meta-analisis

Saya telah mempertimbangkan melakukan beberapa meta-analisis untuk bidang studi tertentu dalam evolusi, tetapi sebelum saya melangkah lebih jauh saya ingin tahu; apa positif dan negatif dari proses tersebut? Misalnya, tidak perlu eksperimen praktis adalah keuntungan (waktu & uang) tetapi akan...

14
Apakah pengunjung unik ke situs web mengikuti hukum yang kuat?

Misalkan saya memiliki vektor yang dipesan di mana elemen pertama adalah jumlah kunjungan ke situs web dalam periode waktu tertentu oleh IP unik dengan jumlah kunjungan tertinggi, elemen kedua adalah jumlah kunjungan oleh IP unik dengan yang kedua. jumlah kunjungan tertinggi, dan sebagainya. Saya...

14
Apa fungsi biaya dalam cv.glm dalam paket boot R?

Saya sedang melakukan validasi silang menggunakan metode leave-one-out. Saya memiliki respons biner dan saya menggunakan paket boot untuk R, dan fungsi cv.glm . Masalah saya adalah saya tidak sepenuhnya memahami bagian "biaya" dalam fungsi ini. Dari apa yang saya mengerti ini adalah fungsi yang...

14
Autokorelasi spasial versus stasioneritas spasial

Anggaplah kita memiliki titik dalam ruang dua dimensi, dan kita ingin mengukur efek atribut pada atribut . Model regresi linier yang khas tentu saja XXXyyyy=Xβ+ϵy=Xβ+ϵy= X\beta + \epsilon Ada dua masalah di sini: yang pertama adalah bahwa istilah mungkin berkorelasi spasial (melanggar asumsi...