Memahami masalah Behrens – Fisher

8

Bagian dari artikel ini mengatakan:

Ronald Fisher pada tahun 1935 memperkenalkan inferensi fidusia untuk menerapkannya pada masalah ini. Dia merujuk pada makalah sebelumnya oleh WV Behrens dari tahun 1929. Behrens dan Fisher mengusulkan untuk menemukan distribusi probabilitas mana dan adalah dua mean sampel, dan dan adalah standar deviasi mereka. [. . . ] Fisher memperkirakan distribusi ini dengan mengabaikan variasi acak dari ukuran relatif dari standar deviasi,

Tx¯1-x¯2s12/n1+s22/n2
x¯1x¯2s1s2
s1/n1s12/n1+s22/n2.

Saya menemukan bahwa saya segan untuk percaya ini. (Karenanya, Wikipedia bisa keliru!) Pada beberapa titik dalam beberapa minggu ke depan saya akan membaca apa yang ditulis Fisher dan Behrens dan Bartlett tentang hal ini pada tahun 1930-an. Untuk saat ini, saya sedang melihat buku Fisher, Metode Statistik, dan Inferensi Ilmiah . Seperti Edwin Jaynes, saya mendapat kesan bahwa fakta bahwa dia kadang-kadang idiot sama sekali tidak mengubah fakta bahwa dia adalah seorang jenius yang hebat, tetapi dia tidak selalu mengekspresikan dirinya dengan cara yang terbaik untuk berkomunikasi dengan manusia yang lebih rendah. Di halaman 97, Fisher menulis tentang Bartlett:

[...] set referensi [...] tidak terbatas pada himpunan bagian yang memiliki rasio diamati, tetapi dengan penuh semangat digunakan oleh MS Bartlett, seolah-olah itu adalah cacat dalam pengujian signifikansi dari hipotesis gabungan, bahwa dalam kasus-kasus khusus kriteria penolakan lebih jarang dicapai secara kebetulan daripada yang lain. Pada refleksi saya tidak berpikir seseorang harus mengharapkan yang lain, [...]s1/s2

Jadi, bagi saya tampaknya Fisher tidak bermaksud "mengabaikan" "variasi acak" rasio sebagai sarana perkiraan, melainkan, ia berpikir seseorang harus mengkondisikan pada . Ini memang tampak seperti "pengondisian pada statistik tambahan", yang berhasil digunakan Fisher dalam konteks lain.s1/s2s1/s2

Jika saya ingat dengan benar, saya pertama kali mendengar tentang Bartlett ketika saya membaca tentang hal ini di Ensiklopedia Ilmu Statistik , yang mengatakan secara sederhana bahwa Bartlett adalah orang pertama yang menunjukkan bahwa interval fidusia tidak sama dengan interval kepercayaan, dengan menunjukkan bahwa interval fidusia yang diperoleh Fisher dalam masalah ini tidak memiliki tingkat cakupan yang konstan. Pernyataan itu tidak meninggalkan saya dengan kesan bahwa ada beberapa kontroversi tentang ini.

Jadi inilah pertanyaan saya: Mana yang lebih dekat dengan kebenaran: artikel Wikipedia atau kecurigaan saya?

  • Fisher, RA (1935) "Argumen fidusia dalam inferensi statistik", Annals of Eugenics , 8, 391-398.
Michael Hardy
sumber

Jawaban:

10

Saya mungkin telah menyebutkan ini di situs sebelumnya. Saya akan mencoba menemukan tautan ke pos tempat saya membahas hal ini. Sekitar tahun 1977 ketika saya menjadi mahasiswa pascasarjana di Stanford kami mengadakan seminar Fisher yang saya ikuti. Sejumlah profesor dan pengunjung Stanford berpartisipasi termasuk Brad Efron dan pengunjung Seymour Geisser dan David Hinkley. Jimmie Savage pada waktu itu baru saja menerbitkan sebuah artikel dengan judul "On Rereading RA Fisher" dalam Annal of Statistics, saya kira. Karena Anda sangat tertarik dengan Fisher, saya sarankan Anda mencari dan membaca makalah ini.

Termotivasi oleh makalah seminar dirancang untuk membaca ulang banyak kertas terkenal Fisher. Tugas saya adalah artikel tentang masalah Behrens-Fisher. Perasaan saya adalah bahwa Fisher itu sombong dan keras kepala tetapi tidak pernah bodoh. Dia memiliki intuisi geometris yang hebat dan terkadang kesulitan berkomunikasi dengan orang lain. Dia memiliki hubungan yang sangat ramah dengan Gosset tetapi ketidaksepakatan yang keras dengan Karl Pearson (kemungkinan maksimum vs metode momen) dan dengan Neyman dan Egon Pearson (pengujian signifikansi melalui inferensi fidusia vs pendekatan Neyman-Pearson untuk pengujian hipotesis). Meskipun argumen fidusia pada umumnya dianggap sebagai satu-satunya kelemahan besar Fisher dan telah didiskreditkan, pendekatan ini tidak sepenuhnya mati dan ada penelitian baru di dalamnya dalam beberapa tahun terakhir.

Saya pikir kesimpulan fidusia adalah cara Fisher untuk mencoba menjadi "Bayesian objektif". Saya yakin dia berpikir panjang dan keras tentang dasar statistik. Dia tidak menerima pendekatan Bayesian tetapi juga tidak melihat ide mendasarkan kesimpulan pada mempertimbangkan sampel yang mungkin Anda tidak menarik masuk akal juga. Dia percaya bahwa kesimpulan harus didasarkan hanya pada data yang ada. Gagasan ini sangat mirip dengan inferensi Bayesian dalam hal Bayesian menarik inferensi berdasarkan data (kemungkinan) dan parameter (distribusi sebelumnya). Menurut saya, Fisher banyak berpikir seperti Jeffreys kecuali bahwa ia ingin kesimpulan didasarkan pada kemungkinan dan ingin membuang yang sebelumnya sama sekali. Itulah yang menyebabkan inferensi fidusia.

Tautan ke artikel Savage

Biografi oleh putri Fisher, Joan Fisher Box

Editor RA Fisher An Appreciation, Hinkley, dan Feinberg

Sebuah buku karya Erich Lehmann tentang Fisher dan Neyman dan kelahiran Statistik Klasik

Ini adalah tautan ke posting sebelumnya yang saya komentari bahwa Anda juga memposting. Masalah Behrens – Fisher

Sebagai kesimpulan saya pikir saya perlu menjawab pertanyaan singkat Anda. Jika pernyataan yang Anda kutip "Fisher memperkirakan distribusi ini dengan mengabaikan variasi acak dari ukuran relatif dari standar deviasi" adalah apa yang Anda maksudkan, saya pikir itu sama sekali salah. Fisher tidak pernah mengabaikan variasi. Saya tegaskan kembali bahwa saya pikir argumen fidusia didasarkan pada gagasan bahwa data yang diamati dan fungsi kemungkinan harus menjadi dasar kesimpulan dan bukan sampel lain yang dapat Anda peroleh dari distribusi populasi. Jadi saya akan memihak Anda dalam hal ini. Sehubungan dengan Bartlett seperti yang saya ingat dari penelitian saya tentang hal ini bertahun-tahun yang lalu, mereka juga telah memperdebatkan hal ini dan Bartlett membuat kasus yang bagus dan mempertahankan pendapatnya dalam debat.

Michael R. Chernick
sumber