Dapatkah seseorang menjelaskan seperti saya berusia 5 tahun tentang masalah ini dari Buku ESL Hastie?

9

Saya sedang mengerjakan buku ESL Hastie, dan saya mengalami kesulitan dengan Pertanyaan 2.3. Pertanyaannya adalah sebagai berikut:

masukkan deskripsi gambar di sini

Kami sedang mempertimbangkan perkiraan tetangga terdekat di titik asal, dan jarak median dari titik asal ke titik data terdekat diberikan oleh persamaan ini. Saya tidak tahu harus mulai dari mana dalam hal mencoba menurunkan ini.

Saya tahu bahwa sebagian besar titik data lebih dekat ke batas ruang sampel, daripada ke titik data lainnya (kutukan dimensi), tetapi saya mengalami kesulitan menerjemahkan ini ke dalam aljabar Linear / Kemungkinan probabilitas.

Terima kasih!

Gary
sumber
4
Apa arti "ELI5" dalam judul? Jika Anda ingin menurunkan persamaan itu, Anda harus mulai dengan model probabilitas untuk poin dalam bola: model apa itu? (Tolong jangan
minta
3
@whuber saya setuju - Akronim adalah skema hashing yang mengerikan.
Sycorax mengatakan Reinstate Monica
14
Umurmu lima tahun. Semua kredit untuk Anda karena ingin memahami ESL, tetapi Anda harus menunggu sampai Anda berusia enam tahun. Ini buku untuk anak laki-laki dan perempuan besar.
Nick Cox
4
Anak berusia lima tahun mungkin mulai dengan melihat kasus satu dimensi (p = 1). Dan sekali itu ada di tangan, ambillah dari sana.
Mark L. Stone
3
Jika kita ingin ELI5 dijabarkan bagaimana dengan ESL?
mdewey

Jawaban:

15

Biarkan menjadi jarak dari titik asal, dan biarkan V 0 [ p ] menjadi volume unit hypersphere dalam dimensi p . Kemudian volume yang terkandung dalam jari-jari r adalahrV0[p]pr

V[r]=V0[p]rp

P=V[r]/V0[p]R=rp

P[R]=R

0R1RRp[R]=P[R]=1p

RPr[Rρ]=P[ρ]Pr[Rρ]=1P[ρ]Rminn

Pr[Rminρ]=Pr[Rρ]n=(1ρ)n

Menurut definisi median, kita memiliki yang kita dapat tulis ulang sebagai yang setara dengan hasil yang diinginkan.(1-dp)n=1

12=Pr[(Rmin)medR]=(1R)n
(1dp)n=12

EDIT: Mencoba di " ELI5 " -tanggapan gaya, dalam tiga bagian.

  1. Untuk kasus 1D dengan satu titik, jaraknya terdistribusi secara merata di atas , sehingga median akan menjadi .1[0,1]12

  2. Dalam 1D, distribusi untuk minimum lebih dari poin adalah kasus pertama dengan kekuatan ke- .nnn

  3. Dalam dimensi , jarak tidak terdistribusi secara seragam, tetapi .r r pprrp

GeoMatt22
sumber
1
Ha ha, saya memberi komentar bahwa anak berusia 5 tahun mungkin mulai dengan melihat p = 1 case. Saya berpikir untuk menambahkan komentar bahwa anak berusia 4 tahun mungkin tidak hanya memulai dengan kasus p = 1, tetapi juga n = 1. Tapi saya pikir saya akan membiarkan angka 5 tahun itu keluar.
Mark L. Stone
1
Perhatikan bahwa ketika saya menjawab pertanyaan, itu setelah diklarifikasi oleh @fcop untuk membaca: "Pertimbangkan titik data N yang terdistribusi secara seragam dalam satuan bola p-dimensi yang berpusat di titik asal. Tunjukkan bahwa jarak median dari titik asal ke titik titik data terdekat diberikan oleh ... ". Jadi bola satuan sehubungan dengan norma dalam ruang dimensi. Setelah ini, pertanyaan itu digulirkan kembali ke aslinya, yang berbeda dan tidak begitu jelas. (Lihat rantai komentar di bawah pertanyaan awal.) pL2p
GeoMatt22