Statistik dan Big Data

11
Haruskah saya menjalankan regresi terpisah untuk setiap komunitas, atau bisakah komunitas hanya menjadi variabel pengendali dalam model agregat?

Saya menjalankan model OLS dengan variabel indeks aset berkelanjutan sebagai DV. Data saya dikumpulkan dari tiga komunitas serupa dalam kedekatan geografis yang dekat satu sama lain. Meskipun demikian, saya pikir penting untuk menggunakan komunitas sebagai variabel kontrol. Ternyata, masyarakat...

11
Paradoks tahanan

Saya diberi latihan, dan saya tidak bisa mengetahuinya. Paradox TahananTiga tahanan di sel isolasi, A, B dan C, telah dijatuhi hukuman mati pada hari yang sama tetapi, karena ada hari libur nasional, gubernur memutuskan bahwa seseorang akan diberikan grasi. Para tahanan diberitahu tentang hal...

11
Bagaimana cara membuat grafik wafel di R?

Terkunci . Pertanyaan ini dan jawabannya dikunci karena pertanyaannya di luar topik tetapi memiliki signifikansi historis. Saat ini tidak menerima jawaban atau interaksi baru. Bagaimana saya bisa melakukan plot grafik wafel sebagai alternatif untuk menggunakan piecharts...

11
Model klasifikasi untuk prediksi peringkat film

Saya agak baru dalam penambangan data, dan saya sedang mengerjakan model klasifikasi untuk prediksi peringkat film. Saya telah mengumpulkan set data dari IMDB, dan saya berencana untuk menggunakan pohon keputusan dan pendekatan tetangga terdekat untuk model saya. Saya ingin tahu alat penambangan...

11
Berapa banyak istilah terbesar dalam

Pertimbangkan ∑Ni=1|Xi|∑i=1N|Xi|\sum_{i=1}^N |X_i| di mana X1,…,XNX1,…,XNX_1, \ldots, X_N adalah id dan CLT berlaku. Berapa banyak istilah terbesar yang menambahkan hingga setengah jumlah total? Misalnya, 10 + 9 + 8 ≈≈\approx (10 + 9 + 8 ……\dots + 1) / 2: 30% dari persyaratan mencapai sekitar...