Apa penduga kemungkinan maksimum untuk parameter t-distribusi Student? Apakah mereka ada dalam bentuk tertutup? Pencarian Google cepat tidak memberi saya hasil apa pun.
Hari ini saya tertarik pada kasus univariat, tetapi mungkin saya harus memperluas model ke beberapa dimensi.
EDIT: Saya sebenarnya lebih tertarik pada parameter lokasi dan skala. Untuk saat ini saya dapat berasumsi bahwa parameter derajat kebebasan sudah diperbaiki, dan mungkin menggunakan beberapa skema numerik untuk menemukan nilai optimal nanti.
Jawaban:
Bentuk tertutup tidak ada untuk T, tetapi pendekatan yang sangat intuitif dan stabil adalah melalui algoritma EM. Sekarang karena siswa adalah campuran skala normals, Anda dapat menulis model Anda sebagai
dimana dan w i ∼ G a ( νei|σ,wi∼N(0,σ2w−1i) . Ini berarti bahwa bersyarat padawiyang MLE hanya tertimbang rata-rata dan standar deviasi. Ini adalah langkah "M"wi∼Ga(ν2,ν2) wi
σ 2=Σiwi(yi - μ )2
Sekarang "E" Langkah Menggantikan dengan harapan yang diberikan semua data. Ini diberikan sebagai:wi
jadi Anda cukup mengulangi dua langkah di atas, mengganti "sisi kanan" dari setiap persamaan dengan estimasi parameter saat ini.
Ini sangat mudah menunjukkan sifat ketahanan distribusi t sebagai pengamatan dengan residu besar menerima bobot lebih sedikit dalam perhitungan untuk lokasi , dan pengaruh terikat dalam perhitungan σ 2 . Dengan "pengaruh terbatas" yang saya maksudkan bahwa kontribusi terhadap estimasi untuk σ 2 dari pengamatan ke-i tidak dapat melebihi ambang batas yang diberikan (ini ( ν + 1 ) σ 2 o l d dalam algoritma EM). Juga ν adalah parameter "kekokohan" dalam peningkatan (penurunan) ν akan menghasilkan lebih banyak (kurang) bobot yang seragam dan karenanya lebih (kurang) sensitivitas terhadap pencilan.μ σ2 σ2 (ν+1)σ2old ν ν
Satu hal yang perlu diperhatikan adalah bahwa fungsi log likelihood mungkin memiliki lebih dari satu titik stasioner, sehingga algoritma EM dapat konvergen ke mode lokal alih-alih mode global. Mode lokal cenderung ditemukan ketika parameter lokasi dimulai terlalu dekat dengan pencilan. Jadi, mulai dari median adalah cara yang baik untuk menghindari ini.
sumber
Makalah berikut membahas persis masalah yang Anda posting.
Liu C. dan Rubin DB 1995. "Perkiraan ML distribusi t menggunakan EM dan ekstensi, ECM dan ECME." Statistica Sinica 5: 19–39.
Ini memberikan estimasi parameter t-distribusi multivariat umum, dengan atau tanpa pengetahuan tentang derajat kebebasan. Prosedur ini dapat ditemukan di Bagian 4, dan sangat mirip dengan probabilityislogic untuk 1-dimensi.
sumber
sumber
I have recently discovered a closed-form estimator for the scale of the Student's t distribution. To the best of my knowledge, this is a new contribution, but I would welcome comments suggesting any related results. The paper describes the method in the context of a family of "coupled exponential" distributions. The Student's t is referred to as the Coupled Gaussian, where the coupling term is the reciprocal of the degree of freedom. The closed-form statistic is the geometric mean of the samples. Assuming a value of the coupling or degree of freedom, an estimate of the scale is determined by multiplying the geometric mean of the samples by a function involving the coupling and a harmonic number.
https://arxiv.org/abs/1804.03989 Use of the geometric mean as a statistic for the scale of the coupled Gaussian distributions, Kenric P. Nelson, Mark A. Kon, Sabir R. Umarov
sumber