The Durbin-Watson statistik uji dapat berbaring di wilayah yang tidak meyakinkan, di mana tidak mungkin baik untuk menolak atau gagal untuk menolak hipotesis nol (dalam hal ini, dari nol autokorelasi).
Tes statistik apa lagi yang dapat menghasilkan hasil yang "tidak meyakinkan"?
Apakah ada penjelasan umum (melambaikan tangan dengan baik) untuk mengapa serangkaian tes ini tidak dapat membuat keputusan "menolak" / "gagal menolak" biner?
Ini akan menjadi bonus jika seseorang dapat menyebutkan implikasi keputusan-teoretis sebagai bagian dari jawaban mereka terhadap permintaan yang terakhir - apakah kehadiran kategori tambahan dari kesimpulan (dalam) berarti bahwa kita perlu mempertimbangkan biaya Tipe I dan Tipe II kesalahan dengan cara yang lebih canggih?
Jawaban:
The Artikel Wikipedia menjelaskan bahwa distribusi statistik uji di bawah hipotesis nol tergantung pada desain matriks-konfigurasi tertentu nilai-nilai prediktor yang digunakan dalam regresi. Durbin & Watson menghitung batas bawah untuk statistik uji di mana tes untuk autokorelasi positif harus ditolak, pada tingkat signifikansi yang diberikan, untuk setiap matriks desain, & batas atas di mana pengujian harus gagal menolak untuk setiap matriks desain. "Wilayah tidak meyakinkan" hanyalah wilayah di mana Anda harus menghitung nilai kritis yang tepat, dengan mempertimbangkan matriks desain Anda, untuk mendapatkan jawaban yang pasti.
Situasi analog harus melakukan uji-satu-sampel satu-sampel satu ketika Anda hanya tahu statistik-t, & bukan ukuran sampel † : 1,645 & 6,31 (sesuai dengan derajat kebebasan tanpa batas & hanya satu) akan menjadi batas untuk tes ukuran 0,05.
Sejauh teori keputusan berjalan - Anda memiliki sumber ketidakpastian baru untuk memperhitungkan selain variasi sampel, tetapi saya tidak melihat mengapa itu tidak boleh diterapkan dengan cara yang sama seperti dengan hipotesis nol komposit. Anda berada dalam situasi yang sama dengan seseorang dengan parameter gangguan yang tidak diketahui, terlepas dari bagaimana Anda sampai di sana; jadi jika Anda perlu membuat keputusan tolak / mempertahankan sambil mengendalikan kesalahan Tipe I atas semua kemungkinan, tolak secara konservatif (yaitu ketika statistik Durbin-Watson berada di bawah batas bawah, atau statistik-t di atas 6,31).
† Atau mungkin Anda kehilangan meja Anda; tetapi dapat mengingat beberapa nilai kritis untuk Gaussian standar, & rumus untuk fungsi kuantil Cauchy.
sumber
Contoh lain dari tes dengan hasil yang mungkin tidak meyakinkan adalah tes binomial untuk proporsi ketika hanya proporsi, bukan ukuran sampel, yang tersedia. Ini tidak sepenuhnya tidak realistis - kita sering melihat atau mendengar klaim formulir "73% orang setuju bahwa ..." dan seterusnya, di mana penyebutnya tidak tersedia.
Misalkan misalnya kita hanya tahu proporsi sampel dibulatkan benar ke seluruh persen terdekat , dan kami ingin menguji terhadap pada tingkat .H 1 : π ≠ 0,5 α = 0,05H0: π= 0,5 H1: π≠ 0,5 α = 0,05
Jika proporsi yang diamati adalah maka ukuran sampel untuk proporsi yang diamati harus paling tidak 19, karena adalah fraksi dengan penyebut terendah yang akan membulatkan menjadi . Kita tidak tahu apakah jumlah keberhasilan yang diamati adalah 1 dari 19, 1 dari 20, 1 dari 21, 1 dari 22, 2 dari 37, 2 dari 38, 3 dari 55, 5 dari 55, 5 dari 100 atau 50 dari 1000 ... tetapi yang mana dari ini, hasilnya akan signifikan pada tingkat .1p = 5 % 5%α=0,05119 5 % α = 0,05
Di sisi lain, jika kita tahu proporsi sampel adalah maka kita tidak tahu apakah jumlah keberhasilan yang diamati adalah 49 dari 100 (yang tidak akan signifikan pada level ini) atau 4900 dari 10.000 (yang hanya mencapai signifikansi). Jadi dalam hal ini hasilnya tidak dapat disimpulkan.p = 49 %
Perhatikan bahwa dengan persentase bulat , tidak ada wilayah "gagal menolak": bahkan konsisten dengan sampel seperti 49.500 sukses dari 100.000, yang akan menghasilkan penolakan, serta sampel seperti 1 sukses dari 2 percobaan , yang akan menghasilkan kegagalan untuk menolak .H 0p = 50 % H0
Berbeda dengan tes Durbin-Watson, saya belum pernah melihat hasil tabulasi yang persentasenya signifikan; situasi ini lebih halus karena tidak ada batas atas dan bawah untuk nilai kritis. Hasil jelas tidak dapat disimpulkan, karena nol keberhasilan dalam satu percobaan tidak signifikan namun tidak ada keberhasilan dalam sejuta uji coba akan sangat signifikan. Kita telah melihat bahwa tidak meyakinkan tetapi ada hasil yang signifikan misalnya di antaranya. Selain itu, kurangnya cut-off bukan hanya karena kasus anomali dan . Bermain-main sedikit, sampel paling signifikan yang terkait denganp = 0 % p = 50 % p = 5 % p = 0 % p = 100 % p=16% adalah 3 keberhasilan dalam sampel 19, dalam hal ini jadi akan signifikan; untuk kita mungkin memiliki 1 keberhasilan dalam 6 percobaan yang tidak signifikan, sehingga kasus ini tidak dapat disimpulkan (karena jelas ada sampel lain dengan yang akan menjadi signifikan); untuk mungkin ada 2 keberhasilan dalam 11 percobaan (tidak signifikan, ) sehingga kasus ini juga tidak meyakinkan; tetapi untuk sampel paling signifikan yang mungkin adalah 3 keberhasilan dalam 19 percobaan dengan jadi ini signifikan lagi.Pr(X≤3)≈0.00221<0.025 p=17% Pr(X≤1)≈0.109>0.025 p=16% p=18% p = 19 % Pr ( X ≤ 3 ) ≈ 0,0106 < 0,025Pr(X≤2)≈0.0327>0.025 p=19% Pr(X≤3)≈0.0106<0.025
Bahkan adalah persentase bulat tertinggi di bawah 50% menjadi signifikan pada level 5% (nilai-p tertinggi akan untuk 4 keberhasilan dalam 17 percobaan dan hanya signifikan), sedangkan adalah hasil non-nol terendah yang tidak dapat disimpulkan (karena dapat sesuai dengan 1 keberhasilan dalam 8 percobaan). Seperti yang bisa dilihat dari contoh di atas, apa yang terjadi di antaranya lebih rumit! Grafik di bawah ini memiliki garis merah pada : poin di bawah garis jelas signifikan tetapi yang di atasnya tidak dapat disimpulkan. Pola nilai-p sedemikian rupa sehingga tidak akan ada batas bawah dan atas tunggal pada persentase yang diamati untuk hasil menjadi signifikan secara jelas.p = 13 % α = 0,05p=24% p=13% α=0.05
Kode r
(Kode pembulatan diambil dari pertanyaan StackOverflow ini .)
sumber