Apa distribusi perbedaan dua-t-distribusi

19

... dan mengapa ?

Dengan asumsi , adalah variabel acak independen dengan mean dan varians masing-masing. Buku statistik dasar saya memberi tahu saya bahwa distribusi memiliki properti berikut:X 2 μ 1 , μ 2 σ 2 1 , σ 2 2 X 1 - X 2X1X2μ1,μ2σ12,σ22X1-X2

  • E(X1-X2)=μ1-μ2
  • VSebuahr(X1-X2)=σ12+σ22

Sekarang katakanlah , adalah distribusi-t dengan , derajat kebebasan. Apa distribusi ?X1X2n1-1n2-2X1-X2

Pertanyaan ini telah diedit: Pertanyaan aslinya adalah "Apa tingkat kebebasan dari perbedaan dua distribusi-t?" . mpiktas telah menunjukkan bahwa ini tidak masuk akal karena tidak didistribusikan, tidak peduli seberapa normal (yaitu df tinggi) mungkin.X1-X2X1,X2

steffen
sumber
1
ini adalah pertanyaan terkait yang mungkin menarik.
mpiktas
2
Google uji-Satterthwaite, uji-CABF (perkiraan Cochran terhadap Behrens-Fisher), dan masalah Behrens-Fisher.
Whuber
3
Untuk kasus khusus di mana derajat kebebasan adalah 1 (distribusi Cauchy) jawaban untuk pertanyaan asli adalah 1. Jumlah (atau perbedaan) dari dua variabel acak Cauchy yang didistribusikan secara independen adalah Cauchy dengan parameter skala , tetapi sekali lagi, Distribusi Cauchy bahkan tidak memiliki nilai rata-rata. 2
NRH
1
Anda perlu memeriksa distribusi Behrens – Fisher
Wis

Jawaban:

15

Jumlah dari dua variabel acak independen tidak terdistribusi t tidak terdistribusi. Karenanya Anda tidak dapat berbicara tentang derajat kebebasan dari distribusi ini, karena distribusi yang dihasilkan tidak memiliki derajat kebebasan dalam arti yang dimiliki distribusi-t.

mpiktas
sumber
@mpiktas: Pertanyaan bodoh. Jika t-distribusi dengan n-1 df dapat diturunkan dari jumlah n distribusi normal yang independen (lihat wikipedia) dan diberikan df cukup tinggi sehingga distribusi t mendekati distribusi normal, tidak berasal dari jumlah distribusi t lagi distribusi t?
steffen
@mpiktas: Bagaimana dengan uji statistik dari uji-t, yang tampaknya berasal dari perbedaan dua distribusi-t?
steffen
1
@steffen, tidak. Ini akan menjadi sekitar normal, karena Anda akan menambahkan dua variabel normal yang didistribusikan normal. distribusi t dengan df tinggi kira-kira normal, tetapi kira-kira normal belum tentu distribusi t dengan df tinggi.
mpiktas
1
@steffen, statistik uji-t berasal dari selisih dua normals bukan dua distribusi-t. Perhatikan bahwa definisi distribusi t adalah sebagian kecil dari akar normal dan kuadrat dari chi-square.
mpiktas
1
@steffen, saya sering berkata kepada murid-murid saya tidak ada pertanyaan bodoh, hanya orang bodoh yang tidak mengajukan pertanyaan. Saya bukan guru yang sangat populer, saya harus menambahkan :)
mpiktas
4

Setuju dengan jawaban di atas, perbedaan dua variabel acak t-didistribusikan independen tidak t terdistribusi. Tetapi saya ingin menambahkan beberapa cara menghitung ini.

  1. Cara termudah untuk menghitung ini adalah menggunakan metode Monte Carlo. Dalam R, misalnya, Anda sampel acak angka 100.000 dari distribusi t pertama, lalu Anda sampel acak angka 100.000 lainnya dari distribusi t kedua. Anda membiarkan set pertama angka 100.000 dikurangi set kedua angka 100.000. 100.000 angka baru yang diperoleh adalah sampel acak dari distribusi perbedaan antara dua distribusi. Anda dapat menghitung mean dan varians hanya dengan menggunakan mean()dan var().

    1. Ini disebut distribusi Behrens-Fisher. Anda dapat merujuk ke halaman Wiki: https://en.wikipedia.org/wiki/Behrens%E2%80%93Fisher_distribution . CI yang diberikan oleh distribusi ini disebut "interval fidusia", ini bukan CI .

    2. Integrasi numerik mungkin berfungsi. Ini diteruskan sebagai poin-poin 2. Anda bisa merujuk ke Bagian 2.5.2 dalam Bayesian Inference in Analysis Analysis oleh Box, George EP, Tiao, George C. Ini memiliki langkah-langkah integrasi yang terperinci, dan bagaimana hal ini diperkirakan menjadi distribusi Behrens – Fisher.

Shijia Bian
sumber
1
Tampak bagi saya bahwa distribusi Behrens-Fisher berlaku di mana varian dari dua distribusi-t tidak sama. Dapatkah hal yang sama dikatakan jika varian dari kedua distribusi tersebut sama?
Ian Sudbery
1
Maaf, tekan enter dua lebih awal? Untuk melanjutkan ... Misalnya katakanlah kita memiliki dua distribusi normal dengan varian yang sama tetapi tidak diketahui, tetapi artinya berbeda. Kami mengambil dua sampel dari masing-masing distribusi ini. Perbedaan rata-rata antara dua sampel dari distribusi yang sama akan mengikuti t-distribusi, tetapi apa distribusi perbedaan perbedaan.
Ian Sudbery