Saya ingin membandingkan keakuratan dua pengklasifikasi untuk signifikansi statistik. Kedua pengklasifikasi dijalankan pada set data yang sama. Ini membuat saya percaya bahwa saya harus menggunakan uji-t satu sampel dari apa yang telah saya baca .
Sebagai contoh:
Classifier 1: 51% accuracy
Classifier 2: 64% accuracy
Dataset size: 78,000
Apakah ini tes yang tepat untuk digunakan? Jika demikian, bagaimana saya menghitung jika perbedaan akurasi antara classifier signifikan?
Atau haruskah saya menggunakan tes lain?
Saya dapat memberitahu Anda, tanpa menjalankan apa pun, bahwa perbedaannya akan sangat signifikan secara statistik. Itu melewati IOTT (tes trauma interokular - itu menyentuh Anda di antara mata).
Namun, jika Anda ingin melakukan tes, Anda bisa melakukannya sebagai tes dua proporsi - ini dapat dilakukan dengan uji-dua sampel.
Anda mungkin ingin memecah "akurasi" menjadi komponen-komponennya, meskipun; sensitivitas dan spesifisitas, atau false-positive dan false-negative. Dalam banyak aplikasi, biaya kesalahan yang berbeda sangat berbeda.
sumber
Karena akurasi, dalam hal ini, adalah proporsi sampel yang diklasifikasikan dengan benar, kita dapat menerapkan uji hipotesis mengenai sistem dua proporsi.
Biarkan p 1 dan p 2 menjadi akurasi yang diperoleh dari pengklasifikasi 1 dan 2 masing-masing, dan n adalah jumlah sampel. Jumlah sampel yang diklasifikasikan dengan benar dalam klasifikasi 1 dan 2 masing-masing adalah x 1 dan x 2 .p^1 p^2 n x1 x2
Statistik uji diberikan oleh
Wilayah penolakan diberikan oleh
Referensi:
sumber