Mengapa uji-F sangat sensitif terhadap asumsi normalitas?

16

Mengapa uji- F untuk perbedaan varian sangat sensitif terhadap asumsi distribusi normal, bahkan untuk besar ?N

Saya sudah mencoba mencari di web dan mengunjungi perpustakaan, tetapi tidak ada yang memberikan jawaban yang baik. Dikatakan bahwa tes ini sangat sensitif untuk pelanggaran asumsi untuk distribusi normal, tetapi saya tidak mengerti mengapa. Adakah yang punya jawaban yang bagus untuk ini?

Magnus Johannesen
sumber
6
Uji- manakahF yang Anda minati?
S. Kolassa - Kembalikan Monica
Uji-F untuk mengukur perbedaan varian.
Magnus Johannesen

Jawaban:

35

Saya kira maksud Anda uji-F untuk rasio varian ketika menguji sepasang varian sampel untuk kesetaraan (karena itu yang paling sederhana yang cukup sensitif terhadap normalitas; Uji-F untuk ANOVA kurang sensitif)

Jika sampel Anda diambil dari distribusi normal, varians sampel memiliki distribusi chi square yang diskalakan

Bayangkan bahwa alih-alih data yang diambil dari distribusi normal, Anda memiliki distribusi yang lebih berat dari biasanya. Maka Anda akan mendapatkan terlalu banyak varians relatif dibandingkan dengan distribusi chi-square yang diskalakan, dan probabilitas varians sampel untuk keluar ke ekor paling kanan sangat responsif terhadap ekor distribusi dari mana data diambil =. (Juga akan ada terlalu banyak varian kecil, tetapi efeknya sedikit kurang jelas)

Sekarang jika kedua sampel diambil dari distribusi berekor yang lebih berat, ekor yang lebih besar pada pembilang akan menghasilkan kelebihan nilai F besar dan ekor yang lebih besar pada penyebut akan menghasilkan kelebihan nilai F kecil (dan sebaliknya untuk ekor kiri)

Kedua efek ini cenderung mengarah pada penolakan dalam uji dua sisi, meskipun kedua sampel memiliki varian yang sama . Ini berarti bahwa ketika distribusi sebenarnya lebih berat dari biasanya, tingkat signifikansi aktual cenderung lebih tinggi dari yang kita inginkan.

Sebaliknya, menggambar sampel dari distribusi ekor yang lebih ringan menghasilkan distribusi varians sampel yang terlalu pendek - nilai varian cenderung lebih "menengah" daripada yang Anda dapatkan dengan data dari distribusi normal. Sekali lagi, dampaknya lebih kuat di ekor jauh atas daripada ekor bawah.

Sekarang jika kedua sampel diambil dari distribusi berekor lebih ringan, ini menghasilkan kelebihan nilai F di dekat median dan terlalu sedikit di kedua ekor (tingkat signifikansi aktual akan lebih rendah dari yang diinginkan).

Efek ini tampaknya tidak perlu mengurangi banyak dengan ukuran sampel yang lebih besar; dalam beberapa kasus tampaknya semakin buruk.

Sebagai ilustrasi parsial, berikut ini adalah 10.000 varians sampel (untuk n=10 ) untuk distribusi normal, t5 dan seragam, diskalakan untuk memiliki rata-rata yang sama dengan χ92 :

masukkan deskripsi gambar di sini

Agak sulit untuk melihat ekor jauh karena relatif kecil dibandingkan dengan puncak (dan untuk t5 pengamatan pada ekor melampaui cara yang adil di mana kita telah merencanakan untuk), tetapi kita dapat melihat sesuatu dari efek pada distribusi pada varians. Mungkin lebih instruktif untuk mengubahnya dengan kebalikan dari chi-square cdf,

masukkan deskripsi gambar di sini

yang dalam kasus normal terlihat seragam (sebagaimana mestinya), dalam kasus-t memiliki puncak besar di ekor atas (dan puncak yang lebih kecil di ekor bawah) dan dalam kasus seragam lebih mirip bukit tetapi dengan lebar memuncak sekitar 0,6 hingga 0,8 dan ekstrem memiliki probabilitas jauh lebih rendah daripada seharusnya jika kami mengambil sampel dari distribusi normal.

F9,9

masukkan deskripsi gambar di sini

t5

Akan ada banyak kasus lain untuk diselidiki untuk studi penuh, tetapi ini setidaknya memberikan rasa jenis dan arah efek, serta bagaimana hal itu muncul.

Glen_b -Reinstate Monica
sumber
1
Demo yang sangat bagus
shadowtalker
3

Seperti Glen_b telah menggambarkan dengan cemerlang dalam simulasi, uji-F untuk rasio varian sensitif terhadap ekor distribusi. Alasan untuk ini adalah bahwa varians dari varians sampel tergantung pada parameter kurtosis, dan kurtosis dari distribusi yang mendasarinya memiliki efek yang kuat pada distribusi rasio varians sampel.

SN2Sn2n<N

SN2Sn2Approxn1N1+NnN1F(DFC,DFn),

κ

DFn=2nκ(n3)/(n1)DFC=2(Nn)2+(κ3)(12/N+1/Nn).

κ=3DFn=n1DFC=Nn

κ^


N1N

Pasang kembali Monica
sumber
+1 Ini adalah pos yang sangat menarik. Tentu saja dengan distribusi mesokurtik lebih sulit untuk mendapatkan distribusi varians-rasio sejauh mungkin dari F karena dimungkinkan dengan berbagai pilihan distribusi tetapi tidak begitu sulit untuk mengidentifikasi kasus (pada ukuran sampel dalam jawaban saya, 10 dan 10) di mana tingkat kesalahan tipe I yang sebenarnya lebih dari sedikit jauh dari tingkat 0,05 nominal. 3 kasus pertama yang saya coba (distribusi dengan populasi kurtosis = 3 - semuanya simetris juga) memiliki tingkat penolakan tipe I 0,0379, 0,0745 dan 0,0785. ...
ctd
ctd ... Saya punya sedikit keraguan bahwa kasus-kasus yang lebih ekstrim dapat diidentifikasi dengan sedikit pemikiran tentang bagaimana memperburuk perkiraan. Saya membayangkan bahwa itu (bahwa tingkat signifikansi tidak akan banyak terpengaruh) mungkin lebih baik dalam sampel yang lebih besar.
Glen_b -Reinstate Monica