Statistik dan Big Data

15
Apa itu proses analisis data yang praktis bagus?

Saya ingin tahu, atau memiliki referensi tentang, proses analisis yang sebagian besar dilalui oleh analis data statistik untuk setiap proyek analisis data. Jika saya membuat "daftar", untuk menyelesaikan proyek analisis data, seorang analis harus: pertama mengumpulkan persyaratan untuk proyek,...

15
Klasifikasi dengan data tinggi lemak

Saya perlu melatih classifier linier pada laptop saya dengan ratusan ribu titik data dan sekitar sepuluh ribu fitur. Apa saja pilihan saya? Bagaimana keadaan seni untuk jenis masalah ini? Sepertinya penurunan gradien stokastik adalah arah yang menjanjikan, dan menurut saya ini adalah yang...

15
Apakah para ahli berbahaya?

Saya membaca "Peran Catur dalam Penelitian Kecerdasan Buatan" ( pdf ) dan yang menarik, ia mengatakan: Pengalaman [...] menunjukkan bahwa input dari para pakar catur, meskipun secara umum bermanfaat, tidak dapat dipercaya sepenuhnya. Contoh yang baik dari ini adalah fungsi evaluasi Pemikiran...

15
Bahasa apa yang digunakan untuk pemrograman genetika

Sebagai bagian dari tugas saya harus menulis algoritma pemrograman genetika yang melakukan prediksi tingkat polusi atmosfer. Karena saya tidak punya pengalaman, siapa pun bisa mengarahkan saya ke proposisi bahasa pemrograman di mana program yang dikembangkan akan ditulis . Klarifikasi: Saya tidak...

15
Bagaimana saya mengevaluasi standar deviasi?

Saya telah mengumpulkan tanggapan dari 85 orang tentang kemampuan mereka untuk melakukan tugas-tugas tertentu. Responsnya ada pada skala Likert lima poin: 5 = Sangat Bagus, 4 = Bagus, 3 = Rata-rata, 2 = Buruk, 1 = Sangat Buruk, Nilai rata-rata adalah 2,8 dan standar deviasi adalah 0,54. Saya...

15
Crash course dalam estimasi rata-rata yang kuat

Saya memiliki banyak perkiraan (sekitar 1000) dan semuanya seharusnya merupakan perkiraan elastisitas jangka panjang. Sedikit lebih dari setengahnya diperkirakan menggunakan metode A dan sisanya menggunakan metode B. Di suatu tempat saya membaca sesuatu seperti "Saya pikir metode B memperkirakan...

15
Notasi penaksir (tilde vs. hat)

1. Apakah ada konvensi penamaan mengenai topi dan simbol tilde dalam statistik? Saya menemukan β menggambarkan sebuah estimator untuk β ( Wikipedia ) Tapi saya juga menemukan ~ β menggambarkan sebuah estimator untuk β ( Wolfram ). Apakah ada perbedaan artinya? Di web saya menemukan beberapa...

15
Bagaimana cara mendapatkan R-kuadrat untuk fit loess?

Bagaimana cara menghitung statistik R-squared ( ) dalam R untuk dan / atau fungsi output? Misalnya untuk data ini:r2r2r^2loesspredict cars.lo <- loess(dist ~ speed, cars) cars.lp <- predict(cars.lo, data.frame(speed = seq(5, 30, 1)), se = TRUE) cars.lpmemiliki dua larik fituntuk model dan...

15
Cara memperluas bingkai data di R

Terkunci . Pertanyaan ini dan jawabannya dikunci karena pertanyaannya di luar topik tetapi memiliki makna historis. Saat ini tidak menerima jawaban atau interaksi baru. Saya mengalami masalah saat melakukan beberapa analisis dengan R. Saya memiliki kerangka data seperti...

15
Bagaimana cara memilih antara berbagai formula Adjusted

Saya telah memikirkan formula R-squared yang disesuaikan yang diusulkan oleh: Yehezkiel (1930), yang saya percaya adalah yang saat ini digunakan dalam SPSS. R2adjusted=1−(N−1)(N−p−1)(1−R2)Radjusted2=1−(N−1)(N−p−1)(1−R2)R^2_{\rm adjusted} = 1 - \frac{(N-1)}{(N-p-1)} (1-R^2) Olkin dan Pratt...