Saya memiliki informasi tentang distribusi dimensi antropometrik (seperti rentang bahu) untuk anak-anak dari berbagai usia. Untuk setiap usia dan dimensi, maksud saya, standar deviasi. (Saya juga punya delapan kuantil, tetapi saya pikir saya tidak akan bisa mendapatkan yang saya inginkan dari mereka.)
Untuk setiap dimensi, saya ingin memperkirakan kuantil tertentu dari distribusi panjang. Jika saya berasumsi bahwa masing-masing dimensi terdistribusi normal, saya dapat melakukan ini dengan cara dan standar deviasi. Apakah ada rumus cantik yang bisa saya gunakan untuk mendapatkan nilai yang terkait dengan kuantil tertentu dari distribusi?
Kebalikannya cukup mudah: Untuk nilai tertentu, dapatkan area di sebelah kanan nilai untuk setiap distribusi normal (usia). Jumlahkan hasilnya dan bagi dengan jumlah distribusi.
Pembaruan : Ini pertanyaan yang sama dalam bentuk grafik. Asumsikan bahwa masing-masing distribusi berwarna terdistribusi secara normal.
Juga, saya jelas dapat mencoba sekelompok panjang yang berbeda dan terus mengubahnya sampai saya mendapatkan yang cukup dekat dengan jumlah yang diinginkan untuk ketepatan saya. Saya bertanya-tanya apakah ada cara yang lebih baik dari ini. Dan jika ini adalah pendekatan yang tepat, apakah ada nama untuk itu?
sumber
Jawaban:
Sayangnya, standar normal (dari mana semua yang lain dapat ditentukan, karena normal adalah keluarga skala lokasi) fungsi kuantil tidak mengakui bentuk tertutup (yaitu 'rumus cantik'). Hal terdekat dengan bentuk tertutup adalah bahwa fungsi kuantil normal standar adalah fungsi, , yang memenuhi persamaan diferensialw
dan kondisi awal dan . Di sebagian besar lingkungan komputasi ada fungsi yang secara numerik menghitung fungsi kuantil normal. Di R, Anda akan mengetikw ( 1 / 2 ) = 0 w′(1/2)=2π−−√
untuk mendapatkan kuantil dari distribusi .p N(μ,σ2)
Sunting: Dengan pemahaman yang dimodifikasi tentang masalah, data dihasilkan dari campuran normals, sehingga kepadatan data yang diamati adalah:
di mana dan setiap adalah kepadatan normal dengan rata-rata dan standar deviasi . Oleh karena itu CDF dari data yang diamati adalah∑iwi=1 pi(x) μi σi
di mana adalah CDF normal dengan mean dan standar deviasi . Integrasi dan penjumlahan dapat dipertukarkan karena integral ini terbatas. CDF ini kontinu dan cukup mudah untuk dihitung pada komputer, sehingga CDF terbalik, , juga dikenal sebagai fungsi kuantil, dapat dihitung dengan melakukan pencarian garis. Saya default untuk opsi ini karena tidak ada rumus sederhana untuk fungsi kuantil dari campuran normal, sebagai fungsi dari kuantil dari distribusi konstituen, datang ke pikiran.μ i σ i F - 1Fi(x) μi σi F−1
Kode R berikut secara numerik menghitung menggunakan pembagian dua untuk pencarian baris. Fungsi F_inv () adalah fungsi kuantil, Anda harus menyediakan vektor yang berisi setiap dan quantile yang harus dipecahkan untuk, . w i , μ i , σ i pF−1 wi,μi,σi p
sumber