Kami memiliki sampel N, , dari distribusi seragam mana tidak diketahui. Perkirakan dari data.
Jadi, aturan Bayes ...
dan kemungkinannya adalah:
(edit: ketika untuk semua , dan 0 sebaliknya - terima kasih whuber)
tetapi tanpa informasi lain tentang , sepertinya prior harus sebanding dengan (yaitu seragam) atau ke (prior Jeffreys?) pada tetapi kemudian integral saya tidak akan bertemu, dan saya tidak yakin bagaimana untuk melanjutkan. Ada ide?
Jawaban:
Ini telah menghasilkan beberapa debat yang menarik, tetapi perhatikan bahwa itu benar-benar tidak membuat banyak perbedaan dengan pertanyaan yang menarik. Secara pribadi saya pikir itu karena adalah parameter skala, argumen grup transformasi sesuai, yang mengarah ke sebelumθ
Distribusi ini memiliki bentuk yang sama di bawah penyelamatan masalah (kemungkinan juga tetap "invarian" di bawah penyelamatan). Kernel dari sebelumnya ini, dapat diturunkan dengan menyelesaikan persamaan fungsional . Nilai bergantung pada masalah, dan benar-benar hanya masalah jika ukuran sampel sangat kecil (seperti 1 atau 2). Posterior adalah pareto terpotong, diberikan oleh:f( y) = y- 1 a f( a y) = f( y) L , U
Tapi sekarang anggaplah kita menggunakan prior yang lebih umum, yang diberikan oleh (perhatikan bahwa kita menjaga batas untuk memastikan semuanya benar - tidak ada matematika tunggal kemudian ). Posterior kemudian sama seperti di atas, tetapi dengan diganti dengan - asalkan . Mengulangi perhitungan di atas, kami rata-rata posterior disederhanakanp ( θ | c I) ∝ θ- c - 1 L , U N c + N c + N≥ 0
Jadi seragam sebelumnya ( ) akan memberikan perkiraan asalkan (rata-rata tidak terbatas untuk ). Ini menunjukkan bahwa perdebatan di sini agak seperti apakah menggunakan atau sebagai pembagi dalam estimasi varians.c = - 1 N- 1N- 2X( N) N≥ 2 N= 2 N N- 1
Salah satu argumen yang menentang penggunaan seragam yang tidak tepat sebelum dalam kasus ini adalah bahwa posterior tidak tepat ketika , karena sebanding dengan . Tapi ini hanya masalah jika atau sangat kecil.N= 1 θ- 1 N= 1
sumber
Karena tujuan di sini mungkin untuk mendapatkan beberapa estimasi valid dan berguna , distribusi sebelumnya harus konsisten dengan spesifikasi distribusi populasi dari mana sampel berasal. Ini TIDAK berarti bahwa kami "menghitung" sebelum menggunakan sampel itu sendiri - ini akan membatalkan validitas seluruh prosedur. Kita tahu bahwa populasi dari mana sampel berasal adalah populasi dari variabel acak seragam iid masing-masing berkisar pada . Ini adalah asumsi yang dipertahankan dan merupakan bagian dari informasi sebelumnya yang kami miliki (dan tidak ada hubungannya dengan sampel , yaitu dengan realisasi spesifik dari subset dari variabel acak ini).[ 0 , θ ]θ [0,θ]
Sekarang asumsikan bahwa populasi ini terdiri dari variabel acak, (sedangkan sampel kami terdiri dari realisasi dari variabel acak). Asumsi yang dipertahankan memberitahu kita bahwa n < m n max i = 1 , . . . , N { X i } ≤ max j = 1 , . . . , m { X j } ≤ θm n<m n
untuk kekompakan . Kemudian kita memiliki yang juga dapat ditulis θ ≥ X ∗ θ = c X ∗maxi=1,...,n{Xi}≡X∗ θ≥X∗
Fungsi densitas dari of iid Uniform rv berkisar pada adalah N [ 0 , θ ] f X ∗ ( x ∗ ) = N ( x ∗ ) N - 1max N [0,θ]
untuk dukungan , dan nol di tempat lain. Kemudian dengan menggunakan dan menerapkan rumus perubahan variabel kami memperoleh distribusi sebelumnya untuk yang konsisten dengan asumsi yang dipertahankan: θ = c X * θ f p ( θ ) = N ( θ[0,θ] θ=cX∗ θ
yang mungkin tidak tepat jika kita tidak menentukan konstanta sesuai. Tetapi minat kami terletak pada memiliki posterior yang tepat untuk , dan juga, kami tidak ingin membatasi nilai-nilai yang mungkin dari (di luar batasan yang tersirat oleh asumsi yang dipertahankan). Jadi kita meninggalkan tidak ditentukan. Kemudian tulis posteriornyaq q c X = { x 1 , . . , x n }c θ θ c
X={x1, . . , xn}
untuk beberapa konstanta normalisasi A. Kami ingin
Memasukkan ke dalam posterior
Perhatikan bahwa konstanta tidak ditentukan dari distribusi sebelumnya telah dengan mudah dibatalkan.c
Posterior merangkum semua informasi yang dapat diberikan sampel spesifik tentang nilai . Jika kita ingin mendapatkan nilai spesifik untuk kita dapat dengan mudah menghitung nilai yang diharapkan dari posterior, θ E ( θ ∣ X ) = ∫ ∞ x ∗ θ N ( x ∗ ) N θ - ( N + 1 ) d θ = - Nθ θ
Apakah ada intuisi dalam hasil ini? Nah, ketika jumlah meningkat, semakin besar kemungkinan bahwa realisasi maksimum di antara mereka akan semakin dekat dengan batas atas mereka, - yang persis seperti nilai rata-rata posterior mencerminkan: jika, katakanlah , , tetapi jika . Ini menunjukkan bahwa taktik kami mengenai pemilihan sebelumnya adalah masuk akal dan konsisten dengan masalah yang ada, tetapi belum tentu "optimal" dalam arti tertentu.θ θ N = 2 ⇒ E ( θX θ θ N= 2 ⇒ E( θ ∣ X ) = 2 x∗ N= 10 ⇒ E( θ ∣ X ) = 109x∗
sumber
Teorema Distribusi Sebelum Seragam (case interval):
"Jika totalitas informasi Anda tentang eksternal ke data ditangkap oleh proposisi tunggal maka satu-satunya spesifikasi sebelumnya yang mungkin secara logis-konsisten-internal Anda adalahθ D
Dengan demikian, Anda spesifikasi sebelumnya harus sesuai dengan prior Jeffrey jika Anda benar-benar percaya pada teorema di atas. "
Bukan bagian dari Teorema Distribusi Seragam Sebelumnya:
Atau Anda dapat menentukan distribusi sebelumnya sebagai distribusi Pareto, yang merupakan distribusi konjugat untuk seragam, mengetahui bahwa Anda distribusi posterior harus menjadi distribusi seragam lain dengan konjugasi. Namun, jika Anda menggunakan distribusi Pareto, maka Anda perlu menentukan parameter distribusi Pareto dalam beberapa cara.f( θ )
sumber