Kira-kira

11

Apa cara terbaik untuk memperkirakan untuk dua bilangan bulat m , n ketika Anda mengetahui rata-rata μ , varian σ 2 , skewness γ 1 dan kelebihan kurtosis γ 2 dari distribusi diskrit X , dan itu adalah jelas dari ukuran (non-nol) bentuk γ 1 dan γ 2 bahwa perkiraan normal tidak sesuai?Pr[nXm]m,nμσ2γ1γ2Xγ1γ2

Biasanya, saya akan menggunakan perkiraan normal dengan koreksi integer ...

Pr[(n-½)X(m+½)]=Pr[(n-½)-μσZ(m+½)-μσ]=Φ((m+½)-μσ)-Φ((n-½)-μσ)

... jika skewness dan kelebihan kurtosis (mendekati) 0, tapi bukan itu masalahnya.

Saya harus melakukan beberapa perkiraan untuk distribusi diskrit yang berbeda dengan nilai dan γ 2 yang berbeda . Jadi saya tertarik untuk mencari tahu apakah ada prosedur yang ditetapkan yang menggunakan γ 1 dan γ 2 untuk memilih perkiraan yang lebih baik daripada perkiraan normal.γ1γ2γ1γ2

kjetil b halvorsen
sumber

Jawaban:

4

Ini adalah pertanyaan yang menarik, yang tidak benar-benar memiliki solusi yang baik. Ada beberapa cara berbeda untuk mengatasi masalah ini.

  1. Asumsikan distribusi yang mendasari dan momen cocok - seperti yang disarankan dalam jawaban oleh @ivant dan @onestop. Salah satu kelemahannya adalah bahwa generalisasi multivarian mungkin tidak jelas.

  2. Perkiraan saddlepoint. Dalam makalah ini:

    Gillespie, CS dan Renshaw, E. Sebuah pendekatan saddlepoint ditingkatkan. Biosains Matematika , 2007.

    Kami melihat memulihkan pdf / pmf ketika hanya diberikan beberapa saat pertama. Kami menemukan bahwa pendekatan ini berfungsi ketika kemiringan tidak terlalu besar.

  3. Ekspansi Laguerre:

    Mustapha, H. dan Dimitrakopoulosa, R. Generalized Laguerre ekspansi kepadatan probabilitas multivariat dengan momen . Komputer & Matematika dengan Aplikasi , 2010.

    Hasil dalam makalah ini tampaknya lebih menjanjikan, tetapi saya belum membuat kode.

csgillespie
sumber
4

Menyesuaikan distribusi dengan data menggunakan empat momen pertama adalah persis seperti apa Karl Pearson menyusun keluarga Pearson untuk distribusi probabilitas berkesinambungan (tentu saja, kemungkinan maksimum jauh lebih populer akhir-akhir ini). Harus mudah untuk menyesuaikan anggota keluarga yang relevan kemudian gunakan jenis koreksi kontinuitas yang sama seperti yang Anda berikan di atas untuk distribusi normal.

Saya berasumsi Anda harus memiliki ukuran sampel yang sangat besar? Kalau tidak, sampel perkiraan kemiringan dan terutama kurtosis sering kali sangat tidak tepat, serta sangat sensitif terhadap pencilan. Dalam kasus apa pun, saya sangat menyarankan Anda melihat momen-L sebagai alternatif yang memiliki beberapa keunggulan dibandingkan momen biasa yang dapat menguntungkan untuk pemasangan distribusi ke data.

onestop
sumber
2

Anda bisa mencoba menggunakan distribusi bias normal dan melihat apakah kelebihan kurtosis untuk kumpulan data khusus Anda cukup dekat dengan kelebihan kurtosis distribusi untuk kemiringan tertentu. Jika ya, Anda dapat menggunakan cdf distribusi normal condong untuk memperkirakan probabilitas. Jika tidak, Anda harus membuat transformasi ke pdf normal / condong mirip dengan yang digunakan untuk distribusi normal condong, yang akan memberi Anda kontrol atas skewness dan kelebihan kurtosis.

Ivan Tarasov
sumber