Saya mencoba untuk menulis serangkaian posting blog pada nilai-p dan saya pikir akan menarik untuk kembali ke tempat semuanya dimulai - yang tampaknya merupakan makalah Pearson tahun 1900. Jika Anda terbiasa dengan kertas itu, Anda akan ingat bahwa ini mencakup pengujian good-of-fit.
Pearson agak longgar dengan bahasanya ketika datang ke nilai-p. Dia berulang kali menggunakan "peluang" ketika menjelaskan cara menafsirkan nilai-p-nya. Sebagai contoh, pada hal.168 ketika berbicara tentang hasil gulungan berulang dari 12 dadu, ia berkata " ... yang membawa kita ke P = .0000016, atau kemungkinannya 62,499 banding 1 terhadap sistem penyimpangan seperti itu secara acak seleksi. Dengan peluang seperti itu akan masuk akal untuk menyimpulkan bahwa dadu menunjukkan bias terhadap poin yang lebih tinggi. "
Dalam artikel ini, ia merujuk pada karya sebelumnya, termasuk buku 1891 tentang kuadrat paling sedikit oleh Merriman.
Tapi Pearson tidak meletakkan kalkulus untuk nilai-p (uji goodness of fit squared chi-squared).
Apakah Pearson orang pertama yang mengandung nilai-p? Ketika saya melakukan pencarian pada nilai-p, Fisher disebutkan - dan karyanya di tahun 1920-an.
Diedit: dan terima kasih atas penyebutan Laplace - dia tampaknya tidak menanggapi hipotesis nol (Pearson tampaknya melakukannya secara implisit, meskipun dia tidak pernah menggunakan istilah itu dalam makalah 1900-nya). Pearson melihat pengujian goodness of fit dari: dengan asumsi jumlah berasal dari proses yang tidak bias, berapakah probabilitas bahwa jumlah yang diamati (dan jumlah yang lebih menyimpang) muncul dari distribusi yang diasumsikan?
Perlakuannya terhadap probabilitas / peluang (ia mengubah probabilitas menjadi peluang) menunjukkan bahwa ia bekerja dengan gagasan implisit hipotesis nol. Yang terpenting, ia juga menyebutkan bahwa probabilitas yang muncul dari nilai x ^ 2 menunjukkan peluang "terhadap sistem penyimpangan sebagai tidak mungkin atau lebih mustahil daripada yang ini" - bahasa yang kita kenal sekarang - sehubungan dengan nilai-p yang dihitungnya.
Apakah Arbuthnot tidak sejauh itu?
Jangan ragu untuk memasukkan komentar Anda sebagai jawaban. Akan menyenangkan untuk melihat diskusi.
sumber
Jawaban:
Jacob Bernoulli (~ 1700) - John Arbuthnot (1710) - Nicolaus Bernoulli (1710s) - Abraham de Moivre (1718)
Kasus Arbuthnot 1 lihat penjelasan dalam catatan di bawah ini , juga dapat dibaca tentang dalam Doktrin Peluang de Moivre (1718) dari halaman 251-254 yang memperluas garis pemikiran ini lebih jauh.
De Moivre membuat dua langkah / kemajuan:
Perkiraan normal distribusi Bernoulli, yang membantu untuk dengan mudah menghitung probabilitas untuk hasil berada di dalam atau di luar rentang tertentu. Pada bagian sebelum contoh tentang kasus Arbuthnot, de Moivre menulis tentang perkiraannya (sekarang disebut distribusi Gaussian / normal) untuk distribusi Bernoulli. Perkiraan ini memungkinkan untuk dengan mudah menghitung nilai-p (yang tidak bisa dilakukan oleh Arbuthnot).
Generalisasi argumen Arbuthnot. Dia menyebutkan bahwa "metode penalaran ini juga dapat bermanfaat diterapkan dalam beberapa pertanyaan lain yang sangat menarik". (yang mungkin memberikan kredit parsial kepada de Moivre karena melihat penerapan argumen secara umum)
Menurut de Moivre, Jacob Bernoulli menulis tentang masalah ini di Ars Conjectandi . De Moivre menyebutkan ini dalam bahasa Inggris 'Menetapkan batas di mana, dengan pengulangan eksperimen, probabilitas suatu peristiwa dapat mendekati tanpa batas ke probabilitas yang diberikan', tetapi teks asli oleh Bernouilli adalah dalam bahasa Latin. Saya tidak tahu cukup bahasa Latin untuk dapat mengetahui apakah Bernoulli menulis tentang konsep seperti nilai p atau lebih seperti hukum angka besar. Yang menarik untuk dicatat adalah bahwa Bernouilli mengklaim telah memiliki ide-ide ini selama 20 tahun (dan juga karya 1713 diterbitkan setelah kematiannya tahun 1705 sehingga tampaknya mendahului tanggal 1710 yang disebutkan dalam komentar oleh @Glen_b untuk Arbuthnot).
Salah satu sumber inspirasi untuk de Moivre adalah Nicolaus Bernouilli, yang pada 1712/1713 membuat perhitungan untuk probabilitas jumlah anak laki-laki yang dilahirkan tidak kurang dari 7037 dan tidak lebih besar dari 7363, ketika 14000 adalah jumlah total anak yang dilahirkan dan probabilitas untuk anak laki-laki adalah 18/35.
(Angka-angka untuk masalah ini didasarkan pada 80 tahun statistik untuk London. Ia menulis tentang ini dalam surat kepada Pierre Raymond de Montmort yang diterbitkan dalam edisi kedua (1713) dari Essay d'analyse sur les jeux de hazard .)
Perhitungan, yang saya tidak cukup ikuti, ternyata probabilitas 43,58 ke 1. (Menggunakan komputer menjumlahkan semua istilah probabilitas binomial dari 7037 hingga 7363 saya mendapatkan 175: 1 sehingga saya mungkin salah mengartikan pekerjaan / perhitungannya. )
1: John Arbuthnot menulis tentang kasus ini dalam Argumen untuk pemeliharaan ilahi, diambil dari keteraturan konstan yang diamati dalam kelahiran kedua jenis kelamin (1710).
Ditulis oleh StackExchangeStrike
sumber
Saya memiliki tiga tautan / argumen pendukung yang mendukung tanggal ~ 1600-1650 untuk statistik yang dikembangkan secara formal dan jauh lebih awal hanya untuk penggunaan probabilitas.
Jika Anda menerima pengujian hipotesis sebagai dasar, probabilitas yang mendahului, maka Kamus Etimologi Online menawarkan ini:
Wiktionary menawarkan:
Pada probabilitas dan statistik Wikipedia penawaran:
Dari "Wolfram, Stephen (2002). Jenis Ilmu Baru. Wolfram Media, Inc. hal. 1082.":
Sumber lain:
Bagian "Sejarah asal" menyatakan:
[1]. Arbuthnott J. Argumen untuk Penyelenggaraan Ilahi, diambil dari keteraturan yang diamati dalam kelahiran kedua jenis kelamin. Phil Trans 1710; 27: 186–90. doi: 10.1098 / rstl.1710.0011 diterbitkan 1 Januari 1710
Kami memiliki beberapa diskusi lebih lanjut di situs SE kami mengenai metode Fischer vs Neyman-Pearson-Wald di sini: Apakah "hibrid" antara pendekatan Fisher dan Neyman-Pearson untuk pengujian statistik benar-benar merupakan "mishmash yang tidak koheren"? .
Sebuah artikel dalam Journal of Epidemiology and Biostatistics (2001) Vol. 6, No. 2, 193–204 oleh Senn, berjudul: "Opini: Dua sorakan untuk nilai-P?" menjelaskan hal ini dalam pengantar:
Referensi
American Statistics Association memiliki halaman web tentang History of Statistics yang, bersama dengan informasi ini, memiliki poster (direproduksi di bagian bawah) berjudul "Timeline of statistics".
2 M: Bukti sensus yang diselesaikan selama Dinasti Han bertahan.
1500-an: Girolamo Cardano menghitung probabilitas gulungan dadu yang berbeda.
1600-an: Edmund Halley menghubungkan angka kematian dengan usia dan mengembangkan tabel kematian.
1700-an: Thomas Jefferson mengarahkan Sensus AS pertama.
1839: Asosiasi Statistik Amerika dibentuk.
1894: Istilah "standar deviasi" diperkenalkan oleh Karl Pearson.
1935: RA Fisher menerbitkan Desain Eksperimen.
Di bagian "Sejarah" pada halaman web Wikipedia " Hukum angka besar " itu menjelaskan:
Tidak, mungkin juga tidak.
Dalam " Pernyataan ASA tentang p-Values: Konteks, Proses, dan Tujuan " (09 Jun 2016) oleh Wasserstein dan Lazar, doi: 10.1080 / 00031305.2016.1154108 ada pernyataan resmi tentang definisi nilai p (tidak ada keraguan tidak disetujui oleh semua disiplin ilmu yang menggunakan, atau menolak, nilai-p) yang berbunyi:
" . Apa itu Nilai-p?
Secara informal, nilai-p adalah probabilitas di bawah model statistik yang ditentukan sehingga ringkasan statistik dari data (misalnya, perbedaan rata-rata sampel antara dua kelompok yang dibandingkan) akan sama dengan atau lebih ekstrem daripada nilai yang diamati.
3. Prinsip
...
6. Dengan sendirinya, nilai-p tidak memberikan ukuran bukti yang baik mengenai model atau hipotesis.
Peneliti harus mengakui bahwa nilai-p tanpa konteks atau bukti lain memberikan informasi terbatas. Misalnya, nilai p mendekati 0,05 yang diambil dengan sendirinya hanya menawarkan bukti yang lemah terhadap hipotesis nol. Demikian juga, nilai-p yang relatif besar tidak menyiratkan bukti yang mendukung hipotesis nol; banyak hipotesis lain mungkin sama atau lebih konsisten dengan data yang diamati. Untuk alasan ini, analisis data tidak boleh diakhiri dengan perhitungan nilai p ketika pendekatan lain sesuai dan layak. "
Penolakan terhadap hipotesis nol kemungkinan terjadi jauh sebelum Pearson.
Halaman Wikipedia tentang contoh awal status pengujian hipotesis nol :
Pilihan awal hipotesis nol
Paul Meehl berpendapat bahwa kepentingan epistemologis dari pilihan hipotesis nol sebagian besar tidak diakui. Ketika hipotesis nol diprediksi oleh teori, percobaan yang lebih tepat akan menjadi ujian yang lebih berat dari teori yang mendasarinya. Ketika hipotesis nol default ke "tidak ada perbedaan" atau "tidak ada efek", percobaan yang lebih tepat adalah ujian yang kurang parah dari teori yang memotivasi melakukan percobaan. Oleh karena itu, pemeriksaan asal usul praktik terakhir ini mungkin bermanfaat:
1778: Pierre Laplace membandingkan angka kelahiran anak laki-laki dan perempuan di beberapa kota di Eropa. Dia menyatakan: "itu wajar untuk menyimpulkan bahwa kemungkinan ini hampir dalam rasio yang sama". Dengan demikian hipotesis nol Laplace bahwa angka kelahiran anak laki-laki dan perempuan harus sama dengan diberikan "kebijaksanaan konvensional".
1900: Karl Pearson mengembangkan uji chi kuadrat untuk menentukan "apakah bentuk kurva frekuensi tertentu akan secara efektif menggambarkan sampel yang diambil dari populasi tertentu." Dengan demikian hipotesis nol adalah bahwa suatu populasi digambarkan oleh suatu distribusi yang diprediksi oleh teori. Dia menggunakan sebagai contoh angka lima dan enam dalam data lemparan dadu Weldon.
1904: Karl Pearson mengembangkan konsep "kontingensi" untuk menentukan apakah hasil tidak tergantung pada faktor kategorikal tertentu. Di sini hipotesis nol secara default bahwa dua hal tidak terkait (misalnya pembentukan bekas luka dan tingkat kematian akibat cacar). Hipotesis nol dalam kasus ini tidak lagi diprediksi oleh teori atau kearifan konvensional, tetapi lebih merupakan prinsip ketidakpedulian yang membuat Fisher dan lainnya mengabaikan penggunaan "probabilitas terbalik".
Meskipun ada satu orang yang dikreditkan karena menolak hipotesis nol, saya pikir itu tidak masuk akal untuk menamai mereka " penemuan skeptisisme yang didasarkan pada posisi matematika yang lemah".
sumber