Pertanyaan ini berasal dari pertanyaan ini tentang ".632 Rule." Saya menulis dengan referensi khusus untuk jawaban / notasi user60 sejauh itu menyederhanakan masalah.
Jawaban itu dimulai dengan sampel ukuran dengan penggantian, dari item berbeda dalam koleksi (panggil) n. Probabilitas bahwa sampel berbeda dari elemen N saat itu
Dalam jawaban itu semua elemen N memiliki peluang yang sama untuk ditarik secara acak.
Pertanyaan saya adalah ini: anggap sebagai gantinya dalam pertanyaan di atas item yang akan ditarik sedemikian rupa sehingga mereka didistribusikan secara normal. Yaitu, kami membagi kurva normal standar dari ke menjadi (katakanlah) 100 sub-panjang sama panjang. Masing-masing dari 100 item dalam N memiliki kemungkinan ditarik yang sama dengan area yang digantikan oleh kurva dalam interval masing-masing.
Pemikiran saya adalah sebagai berikut:
Alasannya mirip dengan yang ada di jawaban terkait yang saya pikir. Probabilitas bahwa , dengan elemen N, adalah di mana adalah probabilitas menggambarm P ( s i ≠ m ) = ( 1 - F i ) F i s i .
Probabilitas bahwa elemen m tertentu dalam sampel S ukuran n adalah
= 1 - n ∏ 1 ( 1 - F i ) .
Sebuah perhitungan tampaknya menunjukkan bahwa ketika panjang subinterval semakin kecil, jawabannya menyatu dengan angka yang sama seperti pada kasus pertama (probabilitas semuanya sama).
Ini tampaknya berlawanan dengan intuisi (bagi saya) karena konstruksinya tampaknya memasukkan unsur-unsur N yang langka, jadi saya perkirakan jumlahnya lebih kecil dari 0,632.
Juga, jika ini benar, saya kira kita akan melakukannya
yang saya belum tahu benar atau salah.
Sunting: Jika itu benar mungkin akan menggeneralisasi beberapa.
Terima kasih atas wawasannya.
sumber
Jawaban:
Pertanyaannya adalah tentang perilaku membatasi
ketika tumbuh dan secara seragam menyusut sedemikian rupa sehingga (a) semuanya non-negatif dan (b) semuanya berjumlah satu. (Ini mengikuti dari konstruksi dan aksioma probabilitas.)n Fi Fi
Menurut definisi, produk ini adalah eksponensial dari logaritma-nya:
Teorema Taylor (dengan bentuk Lagrange sisanya) , diterapkan ke , menetapkan itulog
untuk beberapa dalam interval . Dengan kata lain, logaritma ini sama dengan hingga istilah yang paling banyak kali . Tetapi ketika cukup besar untuk memastikan bahwa semua lebih kecil dari beberapa yang diberikan (kondisi yang dijamin oleh penyusutan seragam ), maka (b) menyiratkan dan oleh karena ituϕi [0,Fi] −Fi 1/2 F2i n Fi ϵ>0 Fi nϵ>∑Fi=1
Karena itu
meremas logaritma antara dua urutan konvergen ke . Karena kontinu, produk menyatu dengan eksponensial dari batas ini, . Karena itu−1 exp ∏ni=1(1−Fi) exp(−1)
QED .
Melihat lebih dekat pada analisis ini menetapkan bahwa kesalahan dalam perkiraan ini (yang akan selalu menjadi batas bawah ) tidak lebih besar dari Misalnya, pembagian distribusi Normal standar menjadi irisan antara dan menghasilkan maksimum dekat mode , di mana kira-kira akan sama dengan luas persegi panjang di sana, . Batas di atas menetapkan nilai rumus akan berada dalam dari nilai pembatasnya. Kesalahan sebenarnya adalah urutan besarnya kurang,
R
(yang dapat kami percayai karena tidak ada yang benar-benar kecil relatif terhadap ):Memang,0.6331615… 1−exp(−1) 0.6321206…
1 - prod(1-f)
adalah sedangkan adalah .sumber