Uji t Welch untuk varian yang tidak sama (juga dikenal sebagai Welch-Satterthwaite atau Welch-Aspin) umumnya memiliki derajat kebebasan yang tidak bilangan bulat . Bagaimana seharusnya tingkat kebebasan ini dikutip ketika melaporkan hasil tes?
"Adalah konvensional untuk membulatkan ke bilangan bulat terdekat sebelum berkonsultasi dengan tabel t standar" menurut berbagai sumber * - yang masuk akal karena arah pembulatan ini konservatif. ** Beberapa perangkat lunak statistik lama akan melakukan ini juga (misalnya Prisma Graphpad sebelum versi 6 ) dan beberapa kalkulator online masih melakukannya. Jika prosedur ini telah digunakan, melaporkan derajat kebebasan yang dibulatkan tampaknya tepat. (Meskipun menggunakan beberapa perangkat lunak yang lebih baik mungkin lebih tepat!)
Tetapi sebagian besar paket modern menggunakan bagian pecahan sehingga dalam hal ini tampaknya bagian pecahan harus dikutip. Saya tidak bisa melihatnya mengutip di lebih dari dua tempat desimal, karena seperseribu derajat kebebasan hanya akan berdampak kecil pada nilai- p .
Melihat-lihat Google scholar, saya bisa melihat makalah yang mengutip df sebagai angka keseluruhan, dengan satu tempat desimal, atau dengan dua tempat desimal. Apakah ada pedoman tentang seberapa akurat untuk digunakan? Juga, jika perangkat lunak yang digunakan bagian pecahan penuh, harus dikutip df dibulatkan ke bawah ke nomor yang diinginkan tokoh (misalnya ke 1 dp atau → 7 sebagai nomor keseluruhan) seperti sesuai dengan perhitungan konservatif , atau yang tampaknya lebih masuk akal bagi saya, dibulatkan secara konvensional ( ke yang terdekat ) sehingga 7.5845 ... → 7,6 hingga 1 dp atau → 8 ke keseluruhan terdekat?
Sunting: selain mengetahui cara yang paling baik secara teoritis untuk melaporkan non-integer df, juga baik untuk mengetahui apa yang dilakukan orang dalam praktiknya . Agaknya jurnal dan panduan gaya memiliki persyaratannya sendiri. Saya ingin tahu panduan gaya apa yang dibutuhkan oleh APA. Dari apa yang saya dapat membedakan (manualnya tidak tersedia secara online secara gratis), APA memiliki preferensi umum bahwa hampir semuanya akan muncul di dua tempat desimal, kecuali p -values (yang mungkin dua atau tiga dp) dan persentase (dibulatkan ke persen terdekat) - yang mencakup kemiringan regresi, statistik t , statistik F , statistik dan sebagainya. Ini sangat tidak logis, mengingat bahwa tempat desimal kedua menempati angka signifikan yang sangat berbeda, dan menunjukkan ketepatan yang sangat berbeda, pada 2,47 dibandingkan pada 982,47, tetapi mungkin menjelaskan jumlah Welch df dengan dua tempat desimal yang saya lihat dalam sampel tidak ilmiah saya. .
misalnya Ruxton, GD Uji t varians yang tidak sama adalah alternatif yang kurang digunakan untuk uji-t Student dan uji Mann-Whitney U , Behavioral Ecology (Juli / Agustus 2006) 17 (4): 688-690 doi: 10.1093 / beheco / ark016
Meskipun pendekatan Welch-Satterthwaite itu sendiri mungkin atau mungkin tidak konservatif, dan dalam kasus di mana tidak konservatif, menurunkan derajat kebebasan tidak ada jaminan kompensasi secara keseluruhan.
Jawaban:
Saya belum mempelajari praktik yang sebenarnya, jadi jawaban ini tidak dapat menjawab aspek pertanyaan itu. Sebagai prinsip umum, saya berharap perlakuan angka-angka penting dalam pelaporan derajat kebebasan didasarkan pada penilaian yang terkait dengan angka-angka penting.
Prinsipnya adalah konsisten : gunakan presisi dalam satu kuantitas yang sesuai dengan presisi yang digunakan pada kuantitas lain yang terkait dengannya. Khususnya, ketika melaporkan nilai dan y = f ( x ) ketika x diberikan kepada kelipatan terdekat dari nilai kecil h (seperti h = 1x y=f(x) x h untuk enam tempat setelah titik desimal), presisi relatif dalamysebagaimana dimediasi oleh fungsifadalahh=12×10−6 y f
Perkiraan ini berlaku ketika secara terus menerus dapat dibedakan pada interval [ x - h , x + h ] .f [x−h,x+h]
Dalam aplikasi ini, adalah p -value, x adalah derajat kebebasan ν , dany p x ν
di mana adalah statistik Welch-Satterthwaite dan F ν adalah CDF dari distribusi t Student dengan ν derajat kebebasan.t Fν t ν
Untuk df relatif tinggi , sering perubahan dalam desimal pertama tidak akan mengubah p-nilai sama sekali (ke tingkat presisi yang dilaporkan), sehingga pembulatan ke integer baik-baik saja ( h = 1 / 2 tapi h | dν h=1/2 sangat kecil). Untuk nilai df dan ekstremtstatistik yang sangat rendah, besarnya turunan| ∂h|ddxf(x)| t dapat melebihi0,01, menunjukkan dalam kasus-kasus seperti itu bahwaνharus dilaporkan hanya ke satu tempat kurang desimal daripadapitu sendiri.|∂∂νFν(t)| 0.01 ν p
Lihat sendiri dengan plot kontur berlabel ini besarnya turunan untuk df terendah dan kisaran itu akan menarik (karena mereka dapat menyebabkan nilai-p rendah).|t|
Label menunjukkan basis-10 logaritma derivatif. Dengan demikian, pada titik-titik antara dan - ( k + 1 ) pada plot ini, mengubah df dilaporkan dalam j th tempat setelah titik desimal kemungkinan akan mengubah dilaporkan p-value hanya di ( j + k ) th dan kemudian tempat Misalnya, Anda membulatkan nilai p ke 10 - 6 (enam tempat desimal). Pertimbangkan statistik ν = 2.5 dan t = 8 . Ini terletak di dekat - 3−k −(k+1) jth (j+k)th 10−6 ν=2.5 t=8 −3 kontur log. Oleh karena itu, harus dilaporkan ke 6 + ( - 3 ) = 3 tempat desimal.ν 6+(−3)=3
Area biru muda, untuk terbesar , adalah yang menjadi perhatian, karena mereka menunjukkan di mana perubahan kecil dalam ν memiliki efek terbesar pada nilai-p.k ν
Bandingkan ini dengan situasi untuk df lebih tinggi (dari hingga 30 diperlihatkan):4 30
Pengaruh pada ketepatan p cepat berkurang dengan meningkatnya ν .ν p ν
sumber
Alasan itu adalah konvensi adalah karena tabel tidak memiliki df noninteger. Tidak ada alasan untuk melakukannya.
Nah, statistik sebenarnya tidak memiliki distribusi-t, karena ia kuadratkan penyebut tidak benar-benar memiliki distribusi chi-kuadrat yang diperkecil. Ini adalah perkiraan yang mungkin atau mungkin tidak konservatif dalam beberapa contoh tertentu - pembulatan ke bawah mungkin tidak pasti menjadi konservatif ketika kita mempertimbangkan distribusi statistik yang tepat dalam contoh tertentu.
nilai p dari distribusi t (menerapkan cdf ke statistik t) dapat dihitung dengan berbagai perkiraan yang cukup akurat, sehingga mereka dihitung secara efektif daripada diinterpolasi.
Saya setuju.
Satu kemungkinan mungkin untuk menyelidiki seberapa akurat perkiraan Welch-Satterthwaite untuk nilai-p adalah dalam wilayah umum rasio varians dan tidak mengutip akurasi relatif lebih substansial daripada yang akan menyarankan berada di df (dengan mengingat bahwa df pada chi-squared di kuadrat penyebut hanya memberikan perkiraan untuk sesuatu yang tidak chi-squared).
sumber