Mengenai nilai-p , saya bertanya-tanya mengapa % dan % tampaknya menjadi standar emas untuk "statistical significance"
. Mengapa tidak nilai lain, seperti % atau %?
Apakah ada alasan matematika mendasar untuk ini, atau ini hanya konvensi yang diadakan secara luas?
Jawaban:
Jika Anda memeriksa referensi di bawah ini, Anda akan menemukan sedikit variasi di latar belakang, meskipun ada beberapa elemen umum.
Angka-angka itu setidaknya sebagian didasarkan pada beberapa komentar dari Fisher, di mana dia mengatakan
(sambil mendiskusikan level 1/20)
Di sisi lain, ia terkadang lebih luas:
Fisher juga menggunakan 5% untuk salah satu tabel bukunya - tetapi sebagian besar tabel lainnya memiliki variasi tingkat signifikansi yang lebih besar
Beberapa komentarnya menyarankan pendekatan yang lebih atau kurang ketat (yaitu tingkat alfa lebih rendah atau lebih tinggi) dalam situasi yang berbeda.
Diskusi semacam itu di atas mengarah pada kecenderungan untuk menghasilkan tabel yang berfokus pada tingkat signifikansi 5% dan 1% (dan kadang-kadang dengan yang lain, seperti 10%, 2% dan 0,5%) karena ingin menggunakan nilai 'standar' apa pun untuk digunakan.
Namun, dalam makalah ini , Cowles dan Davis menyarankan bahwa penggunaan 5% - atau sesuatu yang dekat dengannya setidaknya - kembali lebih jauh dari komentar Fisher.
Singkatnya, penggunaan 5% kami (dan pada tingkat lebih rendah 1%) adalah konvensi yang sewenang-wenang, meskipun jelas banyak orang tampaknya merasa bahwa untuk banyak masalah mereka berada di jenis ballpark yang tepat.
Tidak ada alasan baik nilai tertentu harus digunakan secara umum.
Referensi lebih lanjut:
Dallal, Gerard E. (2012). The Little Handbook of praktik statistik. - Mengapa 0,05?
Stigler, Stephen (Desember 2008). "Fisher dan level 5%". Peluang 21 (4): 12. tersedia di sini
(Di antara mereka, Anda mendapatkan sedikit latar belakang yang adil - memang terlihat seperti di antara mereka ada kasus yang baik untuk berpikir tingkat signifikansi setidaknya di stadion baseball umum 5% - katakanlah antara 2% dan 10% - sudah kurang lebih di udara sebentar.)
sumber
Saya harus memberikan jawaban (sama seperti di sini ):
Rosnow, RL, & Rosenthal, R. (1989). Prosedur statistik dan pembenaran pengetahuan dalam ilmu psikologi. American Psychologist , 44 (10), 1276-1284. pdf
Makalah ini berisi beberapa diskusi lagi tentang masalah ini.
sumber
Saya percaya ada beberapa psikologi yang mendasari untuk 5%. Saya harus mengatakan saya tidak ingat di mana saya mengambil ini, tapi inilah latihan yang biasa saya lakukan dengan setiap kelas statistik intro sarjana.
Lalu saya mengambil satu tangan: siapa yang akan diyakinkan bahwa koin itu bias jika pembagiannya 5/5? 4/6? 3/7? 2/8? 1/9? 0/10? Nah, dua atau tiga yang pertama tidak akan meyakinkan siapa pun, dan yang terakhir akan meyakinkan semua orang; 2/8 dan 1/9 akan meyakinkan kebanyakan orang. Sekarang, jika Anda melihat tabel binomial, 2/8 adalah 5,5%, dan 1/9 adalah 1%. QED.
Dalam jawaban lain, Glen_b mengutip Fisher yang memberikan diskusi tentang apakah angka ajaib ini harus dimodifikasi tergantung pada seberapa serius masalahnya, jadi tolong jangan buat itu "Ada pengobatan baru untuk leukemia adikmu, tetapi itu akan menyembuhkannya di 3 bulan atau bunuh dia dalam 3 hari, jadi mari kita melempar beberapa koin "- ini akan terlihat sama konyolnya dengan komik xkcd terkenal yang bahkan Andrew Gelman tidak terlalu menyukainya.
sumber
5% tampaknya telah dibulatkan dari 4,56% oleh Fisher, sesuai dengan "area ekor dari kurva di luar rata-rata ditambah tiga atau minus tiga kemungkinan kesalahan" (Hurlbert & Lombardi, 2009).
Elemen lain dari cerita ini tampaknya adalah reproduksi tabel dengan vlaues kritis (Pearson et al., 1990; Lehmann, 1993). Fisher tidak diberi izin oleh Pearson untuk menggunakan mejanya (mungkin keduanya karena pemasaran publikasi Pearson sendiri (Hurlbert & Lombardi, 2009) dan sifat bermasalah dari hubungan mereka.
Hurlbert, SH, & Lombardi, CM (2009, Oktober). Keruntuhan akhir kerangka teori keputusan Neyman-Pearson dan kebangkitan neoFisherian. Dalam Annales Zoologici Fennici (Vol. 46, No. 5, hlm. 311-349). Penerbitan Zoologi dan Botani Finlandia
Lehmann, EL (1993). The Fisher, Neyman-Pearson teori pengujian hipotesis: Satu atau dua teori ?. Jurnal Asosiasi Statistik Amerika, 88 (424), 1242-1249.
Pearson, ES, Gosset, WS, Plackett, RL, & Barnard, GA (1990). Mahasiswa: biografi statistik William Sealy Gosset. Oxford University Press, AS.
Lihat juga: Gigerenzer, G. (2004). Statistik tanpa pikiran. Jurnal Sosial Ekonomi, 33 (5), 587-606.
Hubbard, R., & Lindsay, RM (2008). Mengapa nilai P bukan ukuran bukti yang berguna dalam pengujian signifikansi statistik. Teori & Psikologi, 18 (1), 69-88.
sumber
Menurut saya jawabannya lebih pada teori permainan penelitian daripada statistik. Memiliki 1% dan 5% terbakar ke dalam kesadaran umum berarti bahwa para peneliti tidak secara efektif bebas untuk memilih tingkat signifikansi yang sesuai dengan kecenderungan mereka. Katakanlah kita melihat kertas dengan nilai-p 0,055 dan di mana tingkat signifikansi ditetapkan pada 6% - pertanyaan akan ditanyakan. 1% dan 5% memberikan bentuk komitmen yang kredibel.
sumber
Hipotesis pribadi saya adalah 0,05 (atau 1 dari 20) dikaitkan dengan nilai / z dari (sangat dekat dengan) 2. Menggunakan 2 itu baik, karena sangat mudah dikenali jika hasil Anda signifikan secara statistik. Tidak ada pertemuan angka bulat lainnya.
sumber
Satu-satunya angka yang benar adalah 0,04284731
... yang merupakan respons sembrono yang dimaksudkan untuk berarti bahwa pilihan .05 pada dasarnya sewenang-wenang. Saya biasanya hanya melaporkan nilai p, daripada apa nilai p lebih besar atau kurang.
"Signifikansi" adalah variabel kontinu, dan, menurut saya, mendiskritkannya sering kali lebih berbahaya daripada kebaikan. Maksud saya, jika p = .13, Anda memiliki kepercayaan diri lebih dari jika p = .21 dan kurang dari jika p = .003
sumber
Ini adalah area pengujian hipotesis yang selalu membuat saya terpesona. Khususnya karena suatu hari seseorang memutuskan nomor acak yang mendikotomi prosedur pengujian dan sejak itu orang jarang mempertanyakannya.
Saya ingat memiliki dosen yang memberi tahu kami untuk tidak terlalu percaya pada tes Staiger dan Stok variabel instrumental (di mana F-stat harus di atas 10 dalam regresi tahap pertama untuk menghindari masalah instrumen yang lemah) karena angka 10 adalah pilihan yang sepenuhnya arbitrer. Saya ingat mengatakan, "Tapi bukankah itu yang kita lakukan dengan pengujian hipotesis reguler ?????"
sumber
Kenapa 1 dan 5? Karena mereka merasa benar.
Saya yakin ada studi tentang nilai emosional dan arti-penting kognitif dari angka-angka tertentu, tetapi kita dapat memahami pilihan 1 dan 5 tanpa harus menggunakan riset.
Orang-orang yang menciptakan statistik hari ini dilahirkan, dibesarkan dan hidup di dunia desimal. Tentu saja ada sistem penghitungan non-desimal, dan menghitung sampai dua belas menggunakan phalang adalah mungkin dan telah dilakukan, tetapi tidak jelas dengan cara yang sama seperti menggunakan jari adalah (yang karena itu disebut "digit", seperti angka-angka ). Dan sementara Anda (dan Fisher) mungkin tahu tentang sistem penghitungan non-desimal, sistem desimal adalah dan telah menjadi sistem penghitungan dominan Anda (dan dunia Fisher) dalam seratus tahun terakhir.
Tetapi mengapa angka lima dan satu istimewa? Karena keduanya adalah pembagian sepuluh dasar yang paling alami: satu jari, satu tangan (atau: setengah).
Anda bahkan tidak perlu melangkah terlalu jauh untuk membuat konsep pecahan dari sepuluh menjadi satu dan lima. Yang satu ada di sana, sama seperti jari Anda ada di sana. Dan membagi dua sesuatu adalah operasi yang lebih sederhana daripada membaginya menjadi bagian lain. Memotong apa pun menjadi dua bagian tidak memerlukan pemikiran, sementara membaginya dengan tiga atau empat sudah cukup rumit.
Sebagian besar sistem mata uang saat ini memiliki koin dan uang kertas dengan nilai-nilai seperti 1, 2, 5, 10, 20, 50, 100, 200, 500, 1000. Beberapa sistem mata uang tidak memiliki 2, 20 dan 200, tetapi hampir semua memiliki permulaan dalam 1 dan 5. Pada saat yang sama, sebagian besar sistem mata uang tidak memiliki koin atau uang kertas yang dimulai dalam 3, 4, 6, 7, 8 atau 9. Menarik, bukan? Tapi mengapa begitu?
Karena Anda selalu memerlukan sepuluh dari 1s atau dua dari 5s (atau lima dari 2s) untuk sampai pada urutan yang lebih besar berikutnya. Menghitung dengan uang sangat sederhana: kali sepuluh, atau dua kali lipat. Hanya dua jenis operasi. Setiap koin yang Anda miliki adalah setengah atau sepersepuluh dari koin pesanan berikutnya. Angka-angka itu berlipat ganda dan bertambah dengan mudah dan baik.
Jadi 1 dan 5 telah berurat berakar, dari masa kanak-kanak mereka yang paling awal, ke Fisher dan siapa pun yang memilih level signifikansi sebagai divisi 10. yang paling mudah, paling sederhana, paling dasar dari 10. Angka lain membutuhkan argumen untuk itu, sementara ini jumlahnya ada di sana.
Dengan tidak adanya cara obyektif untuk menghitung tingkat signifikansi yang sesuai untuk setiap set data individu, satu dan lima hanya merasa benar.
sumber