Distribusi beta muncul di bawah dua parameter (atau di sini )
atau yang tampaknya lebih sering digunakan
Tetapi mengapa sebenarnya ada " " dalam formula kedua?
Formulasi pertama secara intuitif tampaknya lebih langsung berhubungan dengan distribusi binomial
tetapi "dilihat" dari sudut pandang . Hal ini terutama jelas dalam Model beta-binomial di mana dapat dipahami sebagai sebelum sejumlah keberhasilan dan adalah sebelum sejumlah kegagalan.
Jadi mengapa sebenarnya bentuk kedua mendapatkan popularitas dan apa alasan di baliknya? Apa itu konsekuensi menggunakan salah satu parametrization (misalnya untuk koneksi dengan distribusi binomial)?
Akan lebih bagus jika seseorang juga bisa menunjukkan asal pilihan dan argumen awal untuk itu, tetapi itu bukan keharusan bagi saya.
Jawaban:
Ini adalah kisah tentang derajat kebebasan dan parameter statistik dan mengapa baik bahwa keduanya memiliki koneksi langsung yang sederhana.
Secara historis, "−1 " muncul dalam studi Euler tentang fungsi Beta. Dia menggunakan parameterisasi itu pada 1763, dan begitu juga Adrien-Marie Legendre: penggunaannya membentuk konvensi matematika berikutnya. Karya ini mendahului semua aplikasi statistik yang dikenal.
Teori matematika modern memberikan banyak indikasi, melalui banyak aplikasi dalam analisis, teori bilangan, dan geometri, bahwa istilah " " sebenarnya memiliki beberapa makna. Saya telah membuat sketsa beberapa alasan dalam komentar untuk pertanyaan itu.−1
Yang lebih menarik adalah parameterisasi statistik "benar" seharusnya. Itu tidak begitu jelas dan tidak harus sama dengan konvensi matematika. Ada jaringan besar distribusi probabilitas yang umum digunakan, terkenal, dan saling terkait. Dengan demikian, konvensi yang digunakan untuk memberi nama (yaitu, parameterisasi) satu keluarga biasanya menyiratkan konvensi terkait untuk menyebutkan keluarga terkait. Ubah satu parameterisasi dan Anda ingin mengubahnya semuanya. Karena itu kita mungkin melihat hubungan ini sebagai petunjuk.
Hanya sedikit orang yang tidak setuju bahwa keluarga distribusi paling penting berasal dari keluarga Normal. Ingat bahwa variabel acak dikatakan "Biasanya didistribusikan" ketika ( X - μ ) / σ memiliki kepadatan probabilitas f ( x ) sebanding dengan exp ( - x 2 / 2 ) . Ketika σ = 1 dan μ = 0 , X dikatakan memiliki standarX (X−μ)/σ f(x) exp(−x2/2) σ=1 μ=0 X distribusi normal .
Banyak dataset dipelajari menggunakan statistik yang relatif sederhana yang melibatkan kombinasi rasional data dan kekuatan rendah (biasanya kuadrat). Bila data yang dimodelkan sebagai sampel acak dari distribusi normal - sehingga setiap x i dipandang sebagai realisasi dari variabel normal X i , semua X i berbagi distribusi umum, dan independen - distribusi statistik tersebut ditentukan oleh distribusi Normal itu. Yang paling sering muncul dalam praktik adalahx1,x2,…,xn xi Xi Xi
,distribusi t Studentdengan ν = n - 1 "derajat kebebasan." Ini adalah distribusi statistik t = ˉ Xtν t ν=n−1 mana ˉ X =(X1+X2+⋯+Xn)/nmemodelkan rata-rata data danse(X)=(1/√
,yang χ 2 (chi-squared) distribusidengan ν "derajat kebebasan" (df). Ini adalah distribusi jumlah kuadrat darivariabel normal standar ν independen. Distribusi rata-rata kuadrat dari variabel-variabel ini karena itu akan menjadidistribusi χ 2 yang diskalakan oleh 1 / ν : Saya akan merujuk ini sebagaidistribusi"dinormalisasi" χ 2 .χ2ν χ2 ν ν χ2 1/ν χ2
,yang F distribusi rasio dengan parameter ( ν 1 , ν 2 ) adalah rasio dari dua independen normalisasi χ 2 distribusi dengan ν 1 dan ν 2 derajat kebebasan.Fν1,ν2 F (ν1,ν2) χ2 ν1 ν2
Perhitungan matematis menunjukkan bahwa ketiga distribusi ini memiliki kepadatan. Yang penting, kepadatan distribusi sebanding dengan integrand dalam definisi integral Euler tentang fungsi Gamma ( Γ ). Mari kita bandingkan mereka:χ2ν Γ
Ini menunjukkan bahwa dua kali variabel memiliki distribusi Gamma dengan parameter ν / 2 . Faktor setengahnya cukup merepotkan, tetapi mengurangi 1 akan membuat hubungan jauh lebih buruk. Ini sudah memasok jawaban yang menarik untuk pertanyaan: jika kita ingin parameter dari χ 2 distribusi untuk menghitung jumlah variabel normal kuadrat yang memproduksinya (sampai faktor 1 / 2χ2ν ν/2 1 χ2 1/2 ), maka eksponen dalam fungsi densitas keharusan menjadi kurang dari setengah hitungan itu.
Mengapa faktor kurang merepotkan daripada perbedaan dari 1 ? Alasannya adalah bahwa faktor tersebut akan tetap konsisten ketika kita menambahkan sesuatu. Jika jumlah kuadrat dari n Standar normal independen sebanding dengan distribusi Gamma dengan parameter n (kali beberapa faktor), maka jumlah kuadrat dari m standar normal independen sebanding dengan distribusi Gamma dengan parameter m (kali faktor yang sama) , di mana jumlah kuadrat dari semua variabel n + m sebanding dengan distribusi Gamma dengan parameter m + n (masih kali faktor yang sama).1/2 1 n n m m n+m m+n Fakta bahwa menambahkan parameter yang sangat mirip dengan menambahkan jumlah sangat membantu.
Namun, jika kita harus menghapus " " yang tampak sial dari rumus matematika, hubungan baik ini akan menjadi lebih rumit. Misalnya, jika kita mengubah parameterisasi distribusi Gamma untuk merujuk pada kekuatan aktual x dalam rumus, sehingga distribusi χ 2 1 akan terkait dengan distribusi "Gamma ( 0 ) " (karena kekuatan x dalam PDF adalah 1 - 1 = 0 ), maka jumlah dari tiga χ 2 1 distribusi harus disebut "Gamma ( 2 )−1 x χ21 (0) x 1−1=0 χ21 (2) " distribution. In short, the close additive relationship between degrees of freedom and the parameter in Gamma distributions would be lost by removing the −1 from the formula and absorbing it in the parameter.
Similarly, the probability function of anF ratio distribution is closely related to Beta distributions. Indeed, when Y has an F ratio distribution, the distribution of Z=ν1Y/(ν1Y+ν2) has a Beta(ν1/2,ν2/2) distribution. Its density function is proportional to
Furthermore--taking these ideas full circle--the square of a Studentt distribution with ν d.f. has an F ratio distribution with parameters (1,ν) . Once more it is apparent that keeping the conventional parameterization maintains a clear relationship with the underlying counts that contribute to the degrees of freedom.
From a statistical point of view, then, it would be most natural and simplest to use a variation of the conventional mathematical parameterizations ofΓ and Beta distributions: we should prefer calling a Γ(α) distribution a "Γ(2α) distribution" and the Beta(α,β) distribution ought to be called a "Beta(2α,2β) distribution." In fact, we have already done that: this is precisely why we continue to use the names "Chi-squared" and "F Ratio" distribution instead of "Gamma" and "Beta". Regardless, in no case would we want to remove the "−1 " terms that appear in the mathematical formulas for their densities. If we did that, we would lose the direct connection between the parameters in the densities and the data counts with which they are associated: we would always be off by one.
sumber
The notation is misleading you. There is a "hidden−1 " in your formula (1) , because in (1) , α and β must be bigger than −1 (the second link you provided in your question says this explicitly). The α 's and β 's in the two formulas are not the same parameters; they have different ranges: in (1) , α,β>−1 , and in (2) , α,β>0 α β (1) α=−1 (or less) and β=0 , then try to integrate the (kernel of the) density between 0 and 1 . Equivalently, try the same in (2) for α=0 (or less) and β=1 .
sumber
For me, the existence of -1 in the exponent is related with the develpment of the Gamma function. The motivation of the Gamma function is to find a smooth curve to connect the points of a factorialx! . Since it is not possible to compute x! directly if x is not integer, the idea was to find a function for any x≥0 that satisfies the recurrence relation defined by the factorial, namely
Solution was by means of the convergence of an integral. For the function defined as
integration by parts provides the following:
So, the function above satisfies this property, and the -1 in the exponent derives from the procedure of integration by parts. See the Wikipedia article https://en.wikipedia.org/wiki/Gamma_function .
Edit: I apologise if my post is not fully clear; I am just trying to point that, in my idea, the existence of -1 in the beta distribution comes from the generalisation of the factorial by means of the Gamma function. There are two conditions:f(1)=1 and f(x+1)=x⋅f(x) . We have Γ(x)=(x−1)! , therefore it satisfies Γ(x+1)=x⋅Γ(x)=x⋅(x−1)!=x! . In addition, we have Γ(1)=(1−1)!=0!=1 . As for the beta distribution with parameters α,β , generalisation of the Binomial coefficient is Γ(α+β)Γ(α)⋅Γ(β)=(α+β−1)!(α−1)!⋅(β−1)! . There we have the -1 in the denominator, for both parameters.
sumber