Saya sedang bekerja dengan beberapa analisis spasial eksplorasi di R menggunakan paket spdep.
Saya menemukan pilihan untuk menyesuaikan nilai- p dari indikator lokal dari asosiasi spasial (LISA) yang dihitung menggunakan localmoran
fungsi. Menurut dokumen itu ditujukan untuk:
... penyesuaian nilai probabilitas untuk beberapa pengujian.
Lebih lanjut dalam dokumen p.adjustSP
saya membaca bahwa opsi yang tersedia adalah:
Metode penyesuaian termasuk koreksi Bonferroni ('"bonferroni"') di mana nilai-p dikalikan dengan jumlah perbandingan. Empat koreksi yang kurang konservatif juga dimasukkan oleh Holm (1979) ('"holm"'), Hochberg (1988) ('"hochberg"'), Hommel (1988) ('"hommel"') dan Benjamini & Hochberg (1995) ('"fdr"'), masing-masing. Opsi pass-through ('"tidak ada"') juga disertakan.
Empat metode pertama dirancang untuk memberikan kontrol yang kuat terhadap tingkat kesalahan keluarga-bijaksana. Tampaknya tidak ada alasan untuk menggunakan koreksi Bonferroni yang tidak dimodifikasi karena didominasi oleh metode Holm, yang juga berlaku berdasarkan asumsi sewenang-wenang.
Metode Hochberg dan Hommel valid ketika tes hipotesis independen atau ketika mereka terkait non-negatif (Sarkar, 1998; Sarkar dan Chang, 1997). Metode Hommel lebih kuat daripada metode Hochberg, tetapi perbedaannya biasanya kecil dan nilai p Hochberg lebih cepat untuk dihitung.
Metode "BH" (alias "fdr") dan "BY" dari Benjamini, Hochberg, dan Yekutieli mengendalikan tingkat penemuan palsu, proporsi yang diharapkan dari penemuan palsu di antara hipotesis yang ditolak. Tingkat penemuan yang salah adalah kondisi yang tidak terlalu ketat dibandingkan dengan tingkat kesalahan keluarga, sehingga metode ini lebih kuat dari yang lainnya.
Beberapa pertanyaan yang muncul:
- Dengan kata sederhana - apa tujuan dari penyesuaian ini?
- Apakah perlu menggunakan koreksi seperti itu?
- Jika ya - bagaimana memilih dari opsi yang tersedia?
Jawaban:
secara singkat, masalah yang Anda hadapi disebut pengujian hipotesis berganda . Itu muncul ketika Anda menguji, seperti namanya, banyak hipotesis pada saat yang sama.
Katakanlah Anda memiliki probabilitas tertentu untuk menolak hipotesis nol (false positive) secara salah, misalnya 5%. Ketika Anda meningkatkan jumlah dataset yang Anda uji (dalam hal ini, masing-masing set di mana Anda menerapkan statistik Moran lokal), probabilitas mengamati setiap dataset yang positif palsu akan meningkat, terlepas dari kenyataan bahwa probabilitas untuk mengamati false positive untuk satu dataset adalah sama.
Ada banyak kemungkinan "koreksi", yang mana Anda temukan, untuk memperbaiki masalah ini; jika Anda benar-benar membutuhkan statistik lokal, Anda tidak dapat menghindarinya. Jika tidak, Anda dapat menggunakan statistik global sebagai hipotesis tunggal.
sumber