Saya memiliki kotak 2D, dan saya memiliki satu set poin di dalamnya, katakanlah, 1000 poin. Saya perlu cara untuk melihat apakah distribusi titik di dalam alun-alun tersebar (atau kurang lebih terdistribusi secara merata) atau apakah mereka cenderung berkumpul bersama di beberapa tempat di dalam alun-alun.
Saya perlu cara matematika / statistik (bukan pemrograman) untuk menentukan ini. Saya mencari di Google, menemukan sesuatu seperti kebaikan, Kolmogorov, dll, dan hanya ingin tahu apakah ada pendekatan lain untuk mencapai ini. Perlu ini untuk kertas kelas.
Input: kotak 2D, dan 1000 poin. Output: ya / tidak (yes = tersebar merata, tidak = berkumpul bersama di beberapa tempat).
distributions
probability
spatial
point-process
mobil van
sumber
sumber
R
, ada banyak alat untuk tugas ini .Jawaban:
Saya pikir ide @John tentang uji chi = square adalah salah satu cara untuk pergi.
Anda ingin patch pada 2-d, tetapi Anda ingin mengujinya menggunakan uji chi-square 1 arah; yaitu, nilai yang diharapkan untuk sel adalah1000N mana N adalah jumlah sel.
Tetapi mungkin saja jumlah sel yang berbeda akan memberikan kesimpulan yang berbeda.
Kemungkinan lain adalah untuk menghitung jarak rata-rata antara titik dan kemudian membandingkannya dengan hasil simulasi dari rata-rata itu. Itu menghindari masalah jumlah sel yang berubah-ubah.
EDIT (lebih banyak tentang jarak rata-rata)
Dengan 1000 poin, ada1000 ∗ 9992 jarak berpasangan antar titik. Ini masing-masing dapat dihitung (menggunakan, katakanlah, jarak Euclidean). Jarak ini bisa dirata-rata.
Kemudian Anda dapat menghasilkan N (sejumlah besar) set 1000 poin yang didistribusikan secara seragam. Masing-masing set N juga memiliki jarak rata-rata di antara titik-titik.
Bandingkan hasil untuk poin aktual dengan poin simulasi, baik untuk mendapatkan nilai p atau hanya untuk melihat di mana mereka jatuh.
sumber
Kemungkinan lain adalah tes Chi-Squared. Bagi kuadrat menjadi tambalan tidak tumpang tindih yang berukuran sama, dan dan uji jumlah poin yang jatuh ke tambalan terhadap jumlah yang diharapkan di bawah hipotesis keseragaman (harapan untuk patch adalah total_points / total_patches jika semuanya berukuran sama) , dan menerapkan uji chi-squared. Untuk 1000 poin, 9 tambalan harus cukup, tetapi Anda mungkin ingin menggunakan lebih banyak rincian tergantung pada seperti apa data Anda.
sumber
Mengapa tidak menggunakan tes Kolmogorov-Smirnov? Itulah yang akan saya lakukan, terutama mengingat ukuran sampel Anda cukup besar untuk mengimbangi kekurangan daya.
Atau, Anda bisa melakukan beberapa simulasi. Ini tidak ketat, tetapi memberikan beberapa bukti apakah data terdistribusi secara seragam.
@whuber Perpanjangan 2 dimensi dari KS sudah dikenal (lihat di sini ). Dalam hal ini, kami sedang menyelidiki apakah 1000 undian ini (koordinat (x, y)) dapat diambil dari distribusi seragam bersama 2-dimensi - setidaknya itulah yang saya baca "tersebar merata". @ John, saya mungkin telah mengekspresikan diri saya dengan canggung (baik matematika maupun bahasa Inggris bukanlah bahasa pertama saya). Yang saya maksudkan adalah bahwa nilai-p yang tepat dapat dihitung dengan menggunakan tes seperti KS, sedangkan nilai-p (atau apa pun yang Anda sebut setara) hanya cenderung asimtotik saat melakukan simulasi.
sumber