Kita dapat menggunakan F-statistik untuk menentukan apakah setidaknya satu dari prediktor memiliki efek pada respons. Tetapi mengapa tidak mengambil nilai p minimal di semua prediktor? Tidak perlu memperkenalkan konsep baru.
f-statistic
Yurii
sumber
sumber
Jawaban:
Di sini saya berasumsi Anda bermaksud membandingkan beberapa tes berdasarkan nilai p minimum dengan uji F keseluruhan.
Dengan memilih nilai p terkecil dan membandingkannya dengan tingkat signifikansi tertentu , nilai p Anda tidak lagi memiliki arti yang sama seperti yang akan dilakukan untuk pengujian tunggal. Akibatnya Anda menguji semua variabel individu (dan jika ada yang mengarah ke penolakan, Anda menyimpulkan setidaknya satu dari prediktor memiliki efek pada respons). Tingkat kesalahan tipe I keseluruhan jauh lebih tinggi daripada tes tunggal. (Masalah pengujian berganda .)α
Jika Anda mengurangi tingkat signifikansi Anda pada tes individu, sehingga Anda membuat kesalahan tipe I lebih sedikit (untuk membuatnya lebih sebanding dengan tes keseluruhan pada tingkat signifikansi ), Anda cenderung menemukan efek signifikan (Anda menyerah daya dengan mengurangi tingkat kesalahan tipe I).α
Bahkan jika Anda tidak memperhitungkan pengujian berganda dengan menggeser tingkat signifikansi, statistik univariat dapat dengan mudah semuanya menjadi tidak signifikan ketika ada hubungan bersama yang jelas yang melibatkan keduanya.
Ini sebuah contoh. Pertama, beberapa data:
Output regresi (dari R :)
Nilai p terkecil adalah 0,114 - Anda tidak akan menolak hipotesis nol tidak ada hubungan bahkan pada tingkat signifikansi 10%, tetapi keseluruhan regresi akan mengarah pada penolakan bahkan jika tingkat signifikansi Anda adalah 1%. Ini bahkan tanpa berurusan dengan masalah pengujian ganda.
Ini juga tidak membantu untuk menjalankan regresi terpisah dan memeriksa nilai-p di sana, karena (dalam contoh berbeda dengan yang di atas) sangat mungkin untuk tidak ada hubungan dalam regresi univariat sementara ada hubungan yang kuat dalam regresi bivariat .
sumber