Statistik dan Big Data

16
Mengelompokkan data 1D

Saya memiliki dataset, saya ingin membuat kelompok data berdasarkan hanya satu variabel (tidak ada nilai yang hilang). Saya ingin membuat 3 cluster berdasarkan satu variabel itu. Algoritma pengelompokan mana yang digunakan, k-means, EM, DBSCAN dll.? Pertanyaan utama saya adalah, dalam keadaan apa...

16
Cara memulai dan belajar R?

Saya telah mencoba beberapa kali untuk "melakukannya sendiri" - tetapi dengan keberhasilan yang terbatas. Saya adalah pengguna SPSS biasa dan memiliki pengalaman SAS. Akan menghargai satu atau dua pointer dari seseorang yang memiliki latar belakang yang sama dan sekarang menggunakan...

16
Membuat taruhan besar, pintar (er)

Saya sudah mencoba kode algoritma untuk menyarankan taruhan di 1X2 (game berbobot). Pada dasarnya, setiap pertandingan memiliki serangkaian pertandingan (tim kandang vs tim tamu): 1: rumah menang X: seri 2: kemenangan tandang Untuk setiap pertandingan dan simbol ( 1, Xdan 2), saya akan...

16
Apa justifikasi statistik interpolasi?

Misalkan kita memiliki dua titik (gambar berikut: lingkaran hitam) dan kami ingin menemukan nilai untuk titik ketiga di antara mereka (silang). Memang kita akan memperkirakannya berdasarkan hasil percobaan kita, titik hitam. Kasus paling sederhana adalah menggambar garis dan kemudian menemukan...

16
Model linier klasik - pemilihan model

Saya memiliki model linier klasik, dengan 5 kemungkinan regresi. Mereka tidak berkorelasi satu sama lain, dan memiliki korelasi yang cukup rendah dengan respons. Saya telah sampai pada model di mana 3 dari regressor memiliki koefisien signifikan untuk statistik t mereka (p <0,05). Menambahkan...

16
Menafsirkan exp (B) dalam regresi logistik multinomial

Ini agak pertanyaan pemula, tetapi bagaimana seseorang menginterpretasikan hasil exp (B) dari 6.012 dalam model regresi logistik multinomial? 1) apakah 6.012-1.0 = 5.012 = peningkatan risiko 5012%? atau 2) 6.012 / (1 + 6.012) = 0.857 = peningkatan risiko 85.7%? Jika kedua alternatif tidak...

16
Di mana menemukan corpus teks besar? [Tutup]

Tutup. Pertanyaan ini di luar topik . Saat ini tidak menerima jawaban. Ingin meningkatkan pertanyaan ini? Perbarui pertanyaan sehingga sesuai topik untuk Cross Validated. Ditutup 6 tahun yang lalu . Saya mencari korpus teks besar (> 1000) untuk...

16
Kecepatan komputasi dalam R?

Saya telah ditugaskan untuk memindahkan salah satu model stokastik besar kami saat ini dari SAS dan ke bahasa baru. Secara pribadi, saya lebih suka bahasa kompilasi tradisional, tetapi PI ingin saya memeriksa R, yang saya tidak pernah gunakan. Motivasi kami untuk mengeluarkan model dari SAS adalah...

16
Intuisi di balik distribusi kuasa hukum

Saya tahu bahwa pdf dari distribusi hukum kuasa adalahp(x)=α−1xmin(xxmin)−αp(x)=α−1xmin(xxmin)−α p(x) = \frac{\alpha-1}{x_{\text{min}}} \left(\frac{x}{x_{\text{min}}} \right)^{-\alpha} Tapi apa artinya secara intuitif jika, misalnya, harga saham mengikuti distribusi kuasa hukum? Apakah ini berarti...