Saya menggunakan model linier umum dalam SPSS untuk melihat perbedaan rata-rata jumlah ulat (non-normal, menggunakan distribusi Tweedie) pada 16 spesies tanaman yang berbeda.
Saya ingin menjalankan beberapa perbandingan tetapi saya tidak yakin apakah saya harus menggunakan tes koreksi Sidak atau Bonferroni. Apa perbedaan antara kedua tes? Apakah yang satu lebih baik dari yang lain?
Jawaban:
Jika Anda menjalankan uji statistik independen menggunakan sebagai tingkat signifikansi Anda, dan nol diperoleh dalam setiap kasus, apakah Anda akan menemukan atau tidak 'signifikansi' hanyalah hasil dari variabel acak. Secara khusus, ini diambil dari distribusi binomial dengan dan . Misalnya, jika Anda berencana untuk menjalankan 3 tes menggunakan , dan (tanpa sepengetahuan Anda) sebenarnya tidak ada perbedaan dalam setiap kasus, maka ada kemungkinan 5% untuk menemukan hasil yang signifikan dalam setiap tes. Dengan cara ini, tingkat kesalahan tipe I ditahan untukα p = α n = k α = .05 α α α α α o α n e wk α p = α n = k α = .05 α untuk tes secara individual, tetapi di seluruh rangkaian 3 tes tingkat kesalahan tipe I jangka panjang akan lebih tinggi. Jika Anda yakin bahwa ini bermakna untuk mengelompokkan / memikirkan 3 tes ini bersama-sama, maka Anda mungkin ingin menahan tingkat kesalahan tipe I pada untuk set secara keseluruhan , bukan hanya secara individual. Bagaimana seharusnya Anda melakukan ini? Ada dua pendekatan yang berpusat pada pergeseran dari yang asli (yaitu, ) ke nilai baru (yaitu, ):α α αHai αn e w
Bonferroni: sesuaikan digunakan untuk menilai 'signifikansi' sedemikian rupaα
Dunn-Sidak: sesuaikan menggunakanα
(Perhatikan bahwa Dunn-Sidak mengasumsikan semua tes dalam set independen satu sama lain dan dapat menghasilkan inflasi kesalahan tipe I keluarga jika asumsi itu tidak berlaku.)
Hal ini penting untuk dicatat bahwa ketika melakukan tes, ada dua jenis kesalahan yang Anda ingin menghindari, ketik I (yaitu, mengatakan ada adalah perbedaan ketika tidak ada satu) dan ketik II (yaitu, mengatakan ada tidak perbedaan ketika sebenarnya ada). Biasanya, ketika orang mendiskusikan topik ini, mereka hanya membahas — dan tampaknya hanya menyadari / khawatir dengan — kesalahan tipe I. Selain itu, orang sering lalai menyebutkan bahwa tingkat kesalahan yang dihitung hanya akan berlaku jika semua nol benar. Secara sepele jelas bahwa Anda tidak dapat membuat kesalahan tipe I jika hipotesis nol salah, tetapi penting untuk mengingat fakta itu secara eksplisit dalam pikiran ketika membahas masalah ini.
Saya mengemukakan ini karena ada implikasi dari fakta-fakta ini yang tampaknya sering tidak dipikirkan. Pertama, jika , pendekatan Dunn-Sidak akan menawarkan daya yang lebih tinggi (walaupun perbedaannya bisa sangat kecil dengan kecil ) dan karenanya harus selalu lebih disukai (bila berlaku). Kedua, pendekatan 'step-down' harus digunakan. Artinya, uji efek terbesar pertama; jika Anda yakin bahwa nol tidak diperoleh dalam kasus itu, maka jumlah maksimum kesalahan tipe I yang mungkin adalah , jadi tes berikutnya harus disesuaikan, dan seterusnya. (Ini sering membuat orang tidak nyaman dan terlihat seperti memancing, tetapi ternyata tidakk k - 1 αk > 1 k k - 1 memancing, karena tes independen, dan Anda bermaksud untuk melakukannya sebelum Anda melihat data. Ini hanya cara menyesuaikan secara optimal.) α
Hal di atas berlaku tidak peduli bagaimana Anda menilai tipe I relatif terhadap kesalahan tipe II. Namun, a-priori tidak ada alasan untuk percaya bahwa kesalahan tipe I lebih buruk daripada tipe II (terlepas dari kenyataan bahwa semua orang tampaknya menganggapnya demikian). Sebaliknya, ini adalah keputusan yang harus dibuat oleh peneliti, dan harus spesifik untuk situasi itu. Secara pribadi, jika saya menjalankan kontras yang disarankan secara teoritis, a-priori , ortogonal, saya biasanya tidak menyesuaikan .α
(Dan untuk menyatakan ini lagi, karena ini penting, semua hal di atas mengasumsikan bahwa tes itu independen. Jika kontrasnya tidak independen, seperti ketika beberapa perawatan masing-masing dibandingkan dengan kontrol yang sama, pendekatan yang berbeda dari penyesuaian , seperti tes Dunnett, harus digunakan.)α
sumber
Jika Anda memerlukan prosedur yang lebih kuat, Anda mungkin ingin menggunakan prosedur Bonferroni-Holm.
sumber
Koreksi Sidak mengasumsikan tes individual secara statistik independen. Koreksi Bonferroni tidak menganggap ini.
sumber
Sidak dan Bonferroni sangat mirip sehingga Anda mungkin akan mendapatkan hasil yang sama terlepas dari prosedur yang Anda gunakan. Bonferroni hanya sedikit lebih konservatif daripada Sidak. Misalnya, untuk 2 perbandingan dan alfa satu keluarga dari 0,05, Sidak akan melakukan setiap tes pada 0,0253 dan Bonferroni akan melakukan setiap tes pada 0,050.
Banyak komentator di situs ini mengatakan bahwa Sidak hanya valid ketika statistik uji perbandingan Anda independen. Itu tidak benar. Sidak memungkinkan sedikit inflasi dari tingkat kesalahan kekeluargaan ketika statistik tes NEGATIF tergantung, tetapi jika Anda melakukan tes dua sisi, ketergantungan negatif umumnya tidak menjadi perhatian. Di bawah ketergantungan non-negatif, Sidak memang memberikan batas atas pada tingkat kesalahan kekeluargaan. Yang mengatakan, ada prosedur lain yang memberikan ikatan dan cenderung mempertahankan kekuatan statistik lebih dari Sidak. Jadi Sidak mungkin bukan pilihan terbaik.
Satu hal yang disediakan oleh prosedur Bonferroni (yang tidak dilakukan Sidak) adalah kontrol ketat terhadap jumlah kesalahan Tipe I yang diharapkan - yang disebut "tingkat kesalahan per-keluarga," yang lebih konservatif daripada tingkat kesalahan berorientasi keluarga. Untuk info lebih lanjut, lihat: Frane, AV (2015) "Apakah tingkat kesalahan per-keluarga Tipe I relevan dalam ilmu sosial dan perilaku?" Jurnal Metode Statistik Terapan Modern 14 (1), 12-23.
sumber