Intuisi di balik fungsi kepadatan distribusi-t

12

Saya sedang mempelajari tentang distribusi-t Student dan saya mulai bertanya-tanya, bagaimana cara mendapatkan fungsi kepadatan distribusi-t (dari wikipedia, http://en.wikipedia.org/wiki/Student%27s_t-distribution ):

f(t)=Γ(v+12)vπΓ(v2)(1+t2v)v+12

di mana adalah derajat kebebasan dan Γ adalah fungsi gamma. Apa intuisi dari fungsi ini? Maksudku, jika aku melihat fungsi massa probabilitas distribusi binomial, masuk akal bagiku. Tetapi fungsi kepadatan distribusi-t tidak masuk akal sama sekali bagi saya ... itu tidak intuitif sama sekali pada pandangan pertama. Atau apakah intuisi itu hanya memiliki kurva berbentuk lonceng dan melayani kebutuhan kita?vΓ

Terima kasih atas bantuannya :)

jjepsuomi
sumber
3
Distribusi ini memiliki interpretasi geometris yang sederhana (dan cantik). Memang, meskipun Student (1908) pertama kali menurunkan bentuk PDF ini melalui tebakan cerdas (didukung oleh simulasi Monte-Carlo), Fisher (sekitar 1920) pertama kali mendapatkannya dengan argumen geometris. Esensinya adalah bahwa menggambarkan distribusi rasio ketinggian a (titik terdistribusi seragam) pada bola ν + 1 dan jari - jarinya (jarak dari sumbu): dengan kata lain, garis singgung garis lintangnya. Salah satu akun ini disediakan di evolvedmicmic.com/Literature/GeometricTDistribution.pdf . fν+1
whuber

Jawaban:

9

Jika Anda memiliki variabel acak normal standar, , dan variabel acak chi-square independen Q dengan ν df, makaZQν

T=Z/Q/ν

memiliki distribusi dengan ν df. (Saya tidak yakin apa yang didistribusikan Z / Q , tetapi tidak t .)tνZ/Qt

Derivasi aktual adalah hasil yang cukup standar. Alecos melakukannya beberapa cara di sini .

ν

masukkan deskripsi gambar di sini

Q/νtZQ/νtZtZ

tQ/νt

masukkan deskripsi gambar di sini

('relatif lebih memuncak' menghasilkan puncak yang sedikit lebih tajam relatif terhadap penyebaran, tetapi varians yang lebih besar menarik pusat ke bawah, yang berarti bahwa puncaknya sedikit lebih rendah dengan df lebih rendah)

t

Glen_b -Reinstate Monica
sumber
1
Saya agak ceroboh dalam penjelasan saya. Tentu saja itu adalah akar kuadrat dari variabel acak terdistribusi Chi-square dibagi dengan derajat kebebasannya.
Analis
@Analyst Saya sudah melakukan hal yang sama sendiri, lebih dari sekali.
Glen_b -Reinstate Monica
9

Jawaban oleh Glen adalah jawaban yang benar, tetapi dari sudut pandang Bayesian juga bermanfaat untuk memikirkan distribusi-t sebagai campuran terus menerus dari distribusi normal dengan varian yang berbeda. Anda dapat menemukan derivasi di sini:

Siswa t sebagai campuran gaussian

Saya merasa bahwa pendekatan ini membantu intuisi Anda karena menjelaskan bagaimana distribusi-t muncul ketika Anda tidak tahu variabilitas yang tepat dari populasi Anda.

Erik
sumber
2
Saya telah membuat animasi distribusi t sebagai campuran dari distribusi normal di sini: sumsar.net/blog/2013/12/t-as-a-mixture-of-normals
Rasmus Bååth