Mengapa nama Tipe 1, 2 error?

21

Apa motivasi memperkenalkan tingkat tipuan tambahan dari 'false positive' deskriptif ke integer '1'? Apakah 'false positive' terlalu lama?

Vorac
sumber
10
Aku bersamamu, itu nama yang mengerikan. Saya mengambil setiap kesempatan untuk tidak menggunakannya.
Matthew Drury
5
Sama. Saya tidak pernah bisa mengingat yang mana, sampai saya mendengar cara yang sangat membantu untuk membedakan mereka ... Dalam cerita The Boy Who Cried Wolf , penduduk desa pertama membuat kesalahan tipe 1 , dan yang kedua membuat kesalahan tipe 2 .
Sam
1
@ Sam, saya ingat mereka seperti di "Hal pertama yang dilakukan seorang peneliti setelah menemukan efek adalah mempublikasikan." Tetapi di panel kanan ada tautan ke pertanyaan dengan 84 upvotes tentang bagaimana mengingatnya.
Vorac
Saya selalu menemukan 'false positive' dan 'false negative' sangat membingungkan. Dalam kedokteran 'positif' mengacu pada 'memiliki kondisi' (yang sudah membingungkan dan sumber banyak lelucon) tetapi tes (statistik) seperti apa yang digunakan untuk menentukan Anda mendapatkan kondisi tersebut? Positif, memiliki kondisi, sama dengan tes ditolak untuk kesehatan (mis. Tes untuk tingkat sehat beberapa komponen, misalnya zat besi dalam darah), atau apakah itu sama dengan tes ditolak untuk penyakit (misalnya tes untuk penanda) yang mengindikasikan penyakit, kondisi, atau hal lain seperti kehamilan)? H0H0
Sextus Empiricus

Jawaban:

21

Pertanyaan bagus, memotivasi saya ke Google :) :) Per Wikipedia (dengan suntingan format kecil):

Kesalahan tipe I (atau kesalahan jenis pertama) adalah penolakan yang salah terhadap hipotesis nol sejati.

Kesalahan tipe II (atau kesalahan jenis kedua) adalah kegagalan untuk menolak hipotesis nol palsu.

Lebih jauh ke bawah halaman itu membahas etimologi:

Pada tahun 1928, Jerzy Neyman (1894–1981) dan Egon Pearson (1895–1980), keduanya ahli statistik terkemuka, membahas masalah yang terkait dengan "memutuskan apakah sampel tertentu dapat dinilai sebagai kemungkinan diambil secara acak dari populasi tertentu. "...

"... dalam menguji hipotesis, dua pertimbangan harus tetap diperhatikan, (1) kita harus dapat mengurangi kemungkinan menolak hipotesis yang sebenarnya hingga serendah nilai yang diinginkan; (2) tes harus dirancang sedemikian rupa sehingga akan menolak hipotesis yang diuji saat itu kemungkinan salah. "

Mereka juga mencatat bahwa, dalam memutuskan apakah akan gagal menolak, atau menolak hipotesis tertentu di antara "seperangkat hipotesis alternatif", , ,. . ., mudah membuat kesalahan:H1H2

"... [dan] kesalahan ini terdiri dari dua jenis:

  • (I) kami menolak [yaitu, hipotesis yang akan diuji] ketika itu benar H0
  • (II) kami gagal menolak ketika beberapa hipotesis alternatif atau benar. "H0HSEBUAHH1

    Dalam makalah yang sama mereka menyebut dua sumber kesalahan ini, masing-masing kesalahan tipe I dan kesalahan tipe II.

  • Jadi sepertinya jenis kesalahan pertama didasarkan pada karya asli Fisher pada pengujian signifikansi. Jenis kesalahan kedua didasarkan pada perluasan karya Fisher Neyman dan Pearson, yaitu pengenalan hipotesis alternatif dan karenanya pengujian hipotesis. Lihat di sini untuk detail lebih lanjut.

    Tampaknya urutan pengidentifikasian jenis kesalahan ini sesuai dengan jumlah mereka, seperti yang diberikan oleh Neyman dan Pearson.

    ilanman
    sumber
    1
    Alasan historis - tidak mengejutkan. Sama seperti <-makro pengganti R dan C ++. Terima kasih telah menjawab pertanyaan saya yang kurang diteliti. Dan terima kasih kepada @ung untuk edit pertanyaan yang bagus.
    Vorac
    3
    Bukankah "urutan di mana mereka memikirkannya" sangat dipengaruhi oleh karya Fisher sebelumnya? yaitu sampai Neyman dan Pearson memperkenalkan gagasan hipotesis alternatif hanya ada satu "tipe" kesalahan (menolak H_0 ketika itu benar). Bersamaan dengan H_A muncul kemungkinan kesalahan "dari tipe kedua".
    steeldriver
    Saya yakin itu.
    ilanman
    Satu poin kecil yang mungkin baik untuk ditambahkan adalah bahwa artikel 1928 "Tentang Penggunaan dan Interpretasi Kriteria Tes Tertentu untuk Tujuan Inferensi Statistik" belum mendefinisikan sumber kesalahan yang berbeda sebagai kesalahan 'tipe I' dan 'tipe II' (Alih-alih berbicara tentang jenis yang dipesan ketika berkaitan dengan distribusi Pearson). Pada tahun 1933 Neyman dan Pearson mendefinisikannya sebagai tipe I dan tipe II.
    Sextus Empiricus
    Akan lebih baik untuk meluruskan kutipan dengan referensi yang benar. Atau setidaknya kutipan pertama "... dalam menguji hipotesis dua pertimbangan ..." tidak secara harfiah dari artikel 1928.
    Sextus Empiricus