Melaporkan derajat kebebasan untuk uji-Welch

14

Uji t Welch untuk varian yang tidak sama (juga dikenal sebagai Welch-Satterthwaite atau Welch-Aspin) umumnya memiliki derajat kebebasan yang tidak bilangan bulat . Bagaimana seharusnya tingkat kebebasan ini dikutip ketika melaporkan hasil tes?

"Adalah konvensional untuk membulatkan ke bilangan bulat terdekat sebelum berkonsultasi dengan tabel t standar" menurut berbagai sumber * - yang masuk akal karena arah pembulatan ini konservatif. ** Beberapa perangkat lunak statistik lama akan melakukan ini juga (misalnya Prisma Graphpad sebelum versi 6 ) dan beberapa kalkulator online masih melakukannya. Jika prosedur ini telah digunakan, melaporkan derajat kebebasan yang dibulatkan tampaknya tepat. (Meskipun menggunakan beberapa perangkat lunak yang lebih baik mungkin lebih tepat!)

Tetapi sebagian besar paket modern menggunakan bagian pecahan sehingga dalam hal ini tampaknya bagian pecahan harus dikutip. Saya tidak bisa melihatnya mengutip di lebih dari dua tempat desimal, karena seperseribu derajat kebebasan hanya akan berdampak kecil pada nilai- p .

Melihat-lihat Google scholar, saya bisa melihat makalah yang mengutip df sebagai angka keseluruhan, dengan satu tempat desimal, atau dengan dua tempat desimal. Apakah ada pedoman tentang seberapa akurat untuk digunakan? Juga, jika perangkat lunak yang digunakan bagian pecahan penuh, harus dikutip df dibulatkan ke bawah ke nomor yang diinginkan tokoh (misalnya ke 1 dp atau 7 sebagai nomor keseluruhan) seperti sesuai dengan perhitungan konservatif , atau yang tampaknya lebih masuk akal bagi saya, dibulatkan secara konvensional ( ke yang terdekat ) sehingga 7.5845 ... 7,6 hingga 1 dp atau 8 ke keseluruhan terdekat?7.5845...7.577.5845...7.68

Sunting: selain mengetahui cara yang paling baik secara teoritis untuk melaporkan non-integer df, juga baik untuk mengetahui apa yang dilakukan orang dalam praktiknya . Agaknya jurnal dan panduan gaya memiliki persyaratannya sendiri. Saya ingin tahu panduan gaya apa yang dibutuhkan oleh APA. Dari apa yang saya dapat membedakan (manualnya tidak tersedia secara online secara gratis), APA memiliki preferensi umum bahwa hampir semuanya akan muncul di dua tempat desimal, kecuali p -values ​​(yang mungkin dua atau tiga dp) dan persentase (dibulatkan ke persen terdekat) - yang mencakup kemiringan regresi, statistik t , statistik F , χ2statistik dan sebagainya. Ini sangat tidak logis, mengingat bahwa tempat desimal kedua menempati angka signifikan yang sangat berbeda, dan menunjukkan ketepatan yang sangat berbeda, pada 2,47 dibandingkan pada 982,47, tetapi mungkin menjelaskan jumlah Welch df dengan dua tempat desimal yang saya lihat dalam sampel tidak ilmiah saya. .

misalnya Ruxton, GD Uji t varians yang tidak sama adalah alternatif yang kurang digunakan untuk uji-t Student dan uji Mann-Whitney U , Behavioral Ecology (Juli / Agustus 2006) 17 (4): 688-690 doi: 10.1093 / beheco / ark016

Meskipun pendekatan Welch-Satterthwaite itu sendiri mungkin atau mungkin tidak konservatif, dan dalam kasus di mana tidak konservatif, menurunkan derajat kebebasan tidak ada jaminan kompensasi secara keseluruhan.

Gegat
sumber
1
Saya belum mempelajari praktik yang sebenarnya - itulah sebabnya ini adalah komentar dan bukan jawaban - tetapi saya berharap ini didasarkan pada penilaian yang terkait dengan pelaporan angka-angka penting. Untuk df yang relatif tinggi, seringkali perubahan di tempat desimal pertama tidak akan mengubah nilai p sama sekali (ke tingkat presisi yang dilaporkan), jadi pembulatan ke bilangan bulat baik-baik saja. Untuk df sangat rendah dan nilai ekstrim t , turunan | νtdapat melebihi0,01, menunjukkan dalam kasus-kasus seperti itu bahwaνharus dilaporkan hanya satu angka kurang signifikan daripitu sendiri. |νFν(t)|0.01νp
whuber
@whuber Itu memang pengamatan yang berguna, terutama ketika diambil bersama dengan jawaban Glen_b. Seberapa rendah "sangat rendah" untuk ? (Kecurigaan saya terhadap sampel makalah yang saya temui adalah banyak "praktik nyata" mungkin tidak sama dengan "praktik yang baik"! Saya menduga robot mengikuti pedoman memiliki efek sebanyak penilaian, yang mengapa itu akan menarik untuk mengetahui pedoman pelaporan yang umum.)ν
Silverfish,

Jawaban:

10

Saya belum mempelajari praktik yang sebenarnya, jadi jawaban ini tidak dapat menjawab aspek pertanyaan itu. Sebagai prinsip umum, saya berharap perlakuan angka-angka penting dalam pelaporan derajat kebebasan didasarkan pada penilaian yang terkait dengan angka-angka penting.

Prinsipnya adalah konsisten : gunakan presisi dalam satu kuantitas yang sesuai dengan presisi yang digunakan pada kuantitas lain yang terkait dengannya. Khususnya, ketika melaporkan nilai dan y = f ( x ) ketika x diberikan kepada kelipatan terdekat dari nilai kecil h (seperti h = 1xy=f(x)xhuntuk enam tempat setelah titik desimal), presisi relatif dalamysebagaimana dimediasi oleh fungsifadalahh=12×106yf

suphkh|f(x+k)f(x)|h|ddxf(x)|.

Perkiraan ini berlaku ketika secara terus menerus dapat dibedakan pada interval [ x - h , x + h ] .f[xh,x+h]

Dalam aplikasi ini, adalah p -value, x adalah derajat kebebasan ν , danypxν

y=f(x)=f(ν)=Fν(t)

di mana adalah statistik Welch-Satterthwaite dan F ν adalah CDF dari distribusi t Student dengan ν derajat kebebasan.tFνtν

Untuk df relatif tinggi , sering perubahan dalam desimal pertama tidak akan mengubah p-nilai sama sekali (ke tingkat presisi yang dilaporkan), sehingga pembulatan ke integer baik-baik saja ( h = 1 / 2 tapi h | dνh=1/2sangat kecil). Untuk nilai df dan ekstremtstatistik yang sangat rendah, besarnya turunan| h|ddxf(x)|tdapat melebihi0,01, menunjukkan dalam kasus-kasus seperti itu bahwaνharus dilaporkan hanya ke satu tempat kurang desimal daripadapitu sendiri.|νFν(t)|0.01νp

Lihat sendiri dengan plot kontur berlabel ini besarnya turunan untuk df terendah dan kisaran itu akan menarik (karena mereka dapat menyebabkan nilai-p rendah).|t|

Angka

Label menunjukkan basis-10 logaritma derivatif. Dengan demikian, pada titik-titik antara dan - ( k + 1 ) pada plot ini, mengubah df dilaporkan dalam j th tempat setelah titik desimal kemungkinan akan mengubah dilaporkan p-value hanya di ( j + k ) th dan kemudian tempat Misalnya, Anda membulatkan nilai p ke 10 - 6 (enam tempat desimal). Pertimbangkan statistik ν = 2.5 dan t = 8 . Ini terletak di dekat - 3k(k+1)jth(j+k)th106ν=2.5t=83kontur log. Oleh karena itu, harus dilaporkan ke 6 + ( - 3 ) = 3 tempat desimal.ν6+(3)=3

Area biru muda, untuk terbesar , adalah yang menjadi perhatian, karena mereka menunjukkan di mana perubahan kecil dalam ν memiliki efek terbesar pada nilai-p.kν

Bandingkan ini dengan situasi untuk df lebih tinggi (dari hingga 30 diperlihatkan):430

Gambar 2

Pengaruh pada ketepatan p cepat berkurang dengan meningkatnya ν .νpν

whuber
sumber
1
Ini adalah kontribusi yang sangat membantu untuk dibangun dengan prinsip apa yang harus dibulatkan oleh derajat kebebasan (+50!); Saya berharap penjawab nanti dapat mengisi kesenjangan tentang praktik yang sebenarnya.
Silverfish
7

Adalah konvensional untuk membulatkan ke bilangan bulat terdekat sebelum berkonsultasi dengan tabel t standar

Alasan itu adalah konvensi adalah karena tabel tidak memiliki df noninteger. Tidak ada alasan untuk melakukannya.

yang masuk akal karena penyesuaian ini konservatif.

Nah, statistik sebenarnya tidak memiliki distribusi-t, karena ia kuadratkan penyebut tidak benar-benar memiliki distribusi chi-kuadrat yang diperkecil. Ini adalah perkiraan yang mungkin atau mungkin tidak konservatif dalam beberapa contoh tertentu - pembulatan ke bawah mungkin tidak pasti menjadi konservatif ketika kita mempertimbangkan distribusi statistik yang tepat dalam contoh tertentu.

(dengan interpolasi atau dengan benar-benar menghitung angka untuk distribusi-t dengan df itu?)

nilai p dari distribusi t (menerapkan cdf ke statistik t) dapat dihitung dengan berbagai perkiraan yang cukup akurat, sehingga mereka dihitung secara efektif daripada diinterpolasi.

Saya tidak bisa melihatnya mengutip di lebih dari dua tempat desimal

Saya setuju.

Apakah ada pedoman tentang seberapa akurat untuk digunakan?

Satu kemungkinan mungkin untuk menyelidiki seberapa akurat perkiraan Welch-Satterthwaite untuk nilai-p adalah dalam wilayah umum rasio varians dan tidak mengutip akurasi relatif lebih substansial daripada yang akan menyarankan berada di df (dengan mengingat bahwa df pada chi-squared di kuadrat penyebut hanya memberikan perkiraan untuk sesuatu yang tidak chi-squared).

Glen_b -Reinstate Monica
sumber
1
Saya harus mengklarifikasi kembali "pembulatan adalah konservatif". Perkiraan Welch-Satterthwaite itu sendiri mungkin atau mungkin tidak konservatif. Tetapi proses pembulatan ke bawah pasti - jika perkiraan itu tidak konservatif untuk memulai, itu setidaknya kurang buruk setelah pembulatan ke bawah. Sebaliknya, pembulatan ke atas (mis. "7,5845 putaran terdekat dengan 8") jelas bukan penyesuaian konservatif. Saya bisa melakukan dengan menemukan cara yang lebih baik untuk ungkapan ini, tapi saya harap poin saya jelas!
Silverfish
"Satu kemungkinan mungkin untuk menyelidiki seberapa akurat perkiraan Welch-Satterthwaite untuk nilai-p adalah dalam wilayah umum rasio varian" - ini sangat masuk akal dan tampaknya menjadi pendekatan berprinsip. Apakah ini sesuatu yang biasa dilakukan? Beberapa petunjuk untuk implementasi akan menyenangkan. Dalam praktiknya saya curiga pedoman gaya jurnal sering kali memiliki pendapat final tentang masalah ini! Tapi saya tidak tahu apa yang mereka katakan - pasti ada berbagai latihan di koran pencarian saya muncul.
Silverfish
Untuk menghindari kebingungan kepada pembaca di masa depan, saya telah berusaha untuk mengklarifikasi pembulatan konservatif di badan pertanyaan. Terima kasih telah mengambilnya.
Silverfish
Saya tidak berpikir hal seperti itu biasa dilakukan, tetapi saya tidak berpikir itu berarti tidak boleh. Seberapa banyak menjelaskan mengapa satu putaran / terpotong ke titik tertentu masuk ke kertas jelas akan tergantung pada jurnal / editor / wasit.
Glen_b -Reinstate Monica