Penjelasan untuk derajat kebebasan non-integer dalam uji t dengan varian yang tidak sama

15

Prosedur t-Tes SPSS melaporkan 2 analisis ketika membandingkan 2 cara independen, satu analisis dengan varians sama diasumsikan dan satu dengan varians sama tidak diasumsikan. Derajat kebebasan (df) ketika varians yang sama diasumsikan selalu nilai integer (dan sama dengan n-2). Df ketika varians yang sama tidak diasumsikan adalah non-integer (misalnya, 11,467) dan tidak jauh dari n-2. Saya mencari penjelasan tentang logika dan metode yang digunakan untuk menghitung df non-integer ini.

Joel W.
sumber
3
Presentasi University of Florida PowerPoint berisi akun yang baik tentang bagaimana perkiraan untuk distribusi sampling dari statistik t Student ini diturunkan untuk kasus varians yang tidak sama.
whuber
Apakah uji-t Welch selalu lebih akurat? Apakah ada kerugian menggunakan pendekatan Welch?
Joel W.
Jika Welch dan uji-t asli menghasilkan nilai p yang berbeda secara dramatis, yang mana yang harus saya ikuti? Bagaimana jika nilai p untuk perbedaan varian hanya 0,06, tetapi perbedaan dalam nilai p dari dua uji-t adalah 0,000 dan 0,121? (Ini terjadi ketika satu kelompok 2 tidak memiliki varian dan kelompok 25 lainnya memiliki varian 70.000.)
Joel W.
2
Jangan memilih di antara mereka berdasarkan nilai . Kecuali Anda memiliki alasan yang bagus (bahkan sebelum Anda melihat data) untuk menganggap varians yang sama, jangan membuat asumsi itu. p
Glen_b -Reinstate Monica
1
Semua pertanyaan berhubungan dengan kapan harus menggunakan tes Welch. Pertanyaan ini telah diposting di stats.stackexchange.com/questions/116610/…
Joel W.

Jawaban:

11

Df Welch-Satterthwaite dapat ditunjukkan sebagai rata-rata harmonik tertimbang skala dari dua derajat kebebasan, dengan bobot sebanding dengan standar deviasi yang sesuai.

Ekspresi aslinya berbunyi:

νW=(s12n1+s22n2)2s14n12ν1+s24n22ν2

Perhatikan bahwa adalah varians yang diestimasi dari mean sampel ke- i atau kuadrat dari kesalahan standar ke- i dari mean . Misalkan r = r 1 / r 2 (rasio estimasi varians rata-rata sampel), jadiri=si2/niithir=r1/r2

νW=(r1+r2)2r12ν1+r22ν2=(r1+r2)2r12+r22r12+r22r12ν1+r22ν2=(r+1)2r2+1r12+r22r12ν1+r22ν2

1+sech(log(r))1r=02r=11r=logr

Faktor kedua adalah rata-rata harmonik tertimbang :

H(x_)=i=1nwii=1nwixi.

wi=ri2

r1/r2ν1r1/r20ν2r1=r2s12=s22νW

-

Dengan uji-t sama-varians, jika asumsi berlaku, kuadrat penyebut adalah kali konstan variasi chi-kuadrat.

Kuadrat penyebut uji-Welch bukan (waktu konstan) chi-kuadrat; Namun, sering kali perkiraannya tidak terlalu buruk. Diskusi yang relevan dapat ditemukan di sini .

Derivasi gaya buku yang lebih banyak dapat ditemukan di sini .

Glen_b -Reinstate Monica
sumber
1
Wawasan hebat tentang rata-rata harmonik, yang lebih tepat daripada rata-rata aritmatika untuk rasio rata-rata.
Felipe G. Nievinski
10

Yang Anda maksud adalah koreksi Welch-Satterthwaite ke tingkat kebebasan. Itut-test ketika koreksi WS diterapkan sering disebut Welcht-test . (Kebetulan, ini tidak ada hubungannya dengan SPSS, semua perangkat lunak statistik akan dapat melakukan Welcht-test, mereka biasanya tidak melaporkan kedua sisi berdampingan secara default, jadi Anda tidak perlu diminta untuk memikirkan masalah ini.) Persamaan untuk koreksi sangat jelek, tetapi dapat dilihat di halaman Wikipedia; kecuali jika Anda sangat paham matematika atau rakus untuk hukuman, saya tidak merekomendasikan mencoba untuk melewatinya untuk memahami ide. Namun, dari sudut pandang konseptual yang longgar, idenya relatif mudah: biasat-Tes mengasumsikan varians sama dalam dua kelompok. Jika tidak, maka tes seharusnya tidak mendapat manfaat dari asumsi itu. Karena kekuatant-test can be seen as a function of the residual degrees of freedom, one way to adjust for this is to 'shrink' the df somewhat. The appropriate df must be somewhere between the full df and the df of the smaller group. (As @Glen_b notes below, it depends on the relative sizes of s12/n1 vs s22/n2; if the larger n is associated with a sufficiently smaller variance, the combined df can be lower than the larger of the two df.) The WS correction finds the right proportion of way from the former to the latter to adjust the df. Then the test statistic is assessed against a t-distribution with that df.

gung - Reinstate Monica
sumber
For one t-test, SPSS reports the df as 26.608 but the n's for the two groups are 22 and 104. Are you sure about " The appropriate df must be somewhere between the full df and the df of the larger group"? (The standard deviations are 10.5 and 8.1 for the smaller and larger groups, respectively.)
Joel W.
2
It depends on the relative sizes of s12/n1 vs s22/n2. If the larger n is associated with a sufficiently larger variance, the combined d.f. can be lower than the larger of the two d.f. Note that the Welch t-test is only approximate, since the squared denominator is not actually a (scaled) chi-square random variate. However in practice it does quite well.
Glen_b -Reinstate Monica
I think I'll expand on the relationship between the relative sizes of the (si2/ni) and the Welch d.f. in an answer (since it won't fit in a comment).
Glen_b -Reinstate Monica
1
@Glen_b, I'm sure that will be of great value here.
gung - Reinstate Monica