Saya sedang mengerjakan buku ESL Hastie, dan saya mengalami kesulitan dengan Pertanyaan 2.3. Pertanyaannya adalah sebagai berikut:
Kami sedang mempertimbangkan perkiraan tetangga terdekat di titik asal, dan jarak median dari titik asal ke titik data terdekat diberikan oleh persamaan ini. Saya tidak tahu harus mulai dari mana dalam hal mencoba menurunkan ini.
Saya tahu bahwa sebagian besar titik data lebih dekat ke batas ruang sampel, daripada ke titik data lainnya (kutukan dimensi), tetapi saya mengalami kesulitan menerjemahkan ini ke dalam aljabar Linear / Kemungkinan probabilitas.
Terima kasih!
Jawaban:
Biarkan menjadi jarak dari titik asal, dan biarkan V 0 [ p ] menjadi volume unit hypersphere dalam dimensi p . Kemudian volume yang terkandung dalam jari-jari r adalahr V0[p] p r
Menurut definisi median, kita memiliki yang kita dapat tulis ulang sebagai yang setara dengan hasil yang diinginkan.(1-dp)n=1
EDIT: Mencoba di " ELI5 " -tanggapan gaya, dalam tiga bagian.
Untuk kasus 1D dengan satu titik, jaraknya terdistribusi secara merata di atas , sehingga median akan menjadi .1[0,1] 12
Dalam 1D, distribusi untuk minimum lebih dari poin adalah kasus pertama dengan kekuatan ke- .nn n
Dalam dimensi , jarak tidak terdistribusi secara seragam, tetapi .r r pp r rp
sumber