Apakah “No Free Lunch Theorem” berlaku untuk tes statistik umum?

12

Seorang wanita tempat saya bekerja meminta saya untuk melakukan ANOVA satu arah pada beberapa data. Saya menjawab bahwa data tersebut adalah data pengukuran berulang (time series), dan saya pikir asumsi independensi dilanggar. Dia menjawab bahwa saya tidak perlu khawatir tentang asumsi, lakukan saja tes dan dia akan mempertimbangkan bahwa asumsi mungkin tidak terpenuhi.

Tampaknya itu tidak benar bagi saya. Saya melakukan riset, dan menemukan posting blog yang luar biasa ini oleh David Robinson, pengelompokan K-means bukanlah makan siang gratis , yang membuat saya terpapar pada Teorema Tanpa Makan Siang Gratis. Saya telah melihat kertas asli dan beberapa mengikuti hal-hal, dan terus terang matematika sedikit di atas kepala saya.

Inti dari itu - menurut David Robinson - tampaknya adalah bahwa kekuatan uji statistik berasal dari asumsi. Dan dia memberikan dua contoh yang bagus. Ketika saya mengarungi artikel-artikel lain dan posting blog tentang hal itu, tampaknya selalu menjadi referensi baik dalam hal pembelajaran yang diawasi atau pencarian.

Jadi pertanyaan saya adalah, apakah teorema ini berlaku untuk tes statistik secara umum? Dengan kata lain, dapatkah seseorang mengatakan bahwa kekuatan uji-t atau ANOVA berasal dari kepatuhan pada asumsi, dan mengutip Teorema Makan Siang Gratis?

Saya berutang kepada mantan bos saya sebuah dokumen final mengenai pekerjaan yang saya lakukan, dan saya ingin tahu apakah saya dapat merujuk Teorema Tanpa Makan Siang Gratis dengan menyatakan bahwa Anda tidak bisa mengabaikan asumsi tes statistik dan mengatakan Anda akan membawanya ke akun saat mengevaluasi hasil.

rwjones
sumber
4
Mengapa Anda tidak melakukan "diam-diam" secara berulang-ulang untuk mengukur ANOVA?
Horst Grünbusch
1
@ HorstGrünbusch Sebenarnya, data dan pengujian telah dibahas di forum sebelumnya, dengan pertanyaan spesifik tentang tindakan berulang ANOVA, dan ternyata model efek campuran linier mungkin merupakan pilihan terbaik.
rwjones
2
Ini sudah dijawab dengan baik, sehingga respons yang lebih sembrono dapat ditambahkan. Anda bisa bertanya kepada bos Anda dengan tepat bagaimana dia akan memperhitungkan konsekuensi dari melanggar asumsi ("berhati-hati" akan lebih baik daripada tidak sama sekali!). Singkatnya, ini adalah jalan yang panjang dan sulit untuk mendapatkan pemahaman dan pengalaman yang cukup untuk mengetahui kapan Anda bisa ceroboh tentang asumsi. Rupert G. Miller Melampaui ANOVA (New York: Wiley, 1986 dan yang kemudian dicetak ulang) adalah sumber yang baik tentang konsekuensi dan tema utama di dalamnya adalah bahwa mengabaikan asumsi independensi adalah salah satu hal paling berbahaya yang dapat Anda lakukan.
Nick Cox
1
@NickCox Yah, dia bukan lagi bos saya, dan situasi khusus ini adalah alasan utama mengapa. Itu pada dasarnya adalah puncak dari banyak pemikiran yang ceroboh dan manajemen proyek yang ceroboh di pihaknya dalam lingkungan penelitian yang layak. Selain itu, terima kasih untuk rekomendasi buku. Dari suaranya, itu salah satu hal yang saya cari untuk kutip dalam laporan akhir saya.
rwjones

Jawaban:

11

Saya tidak tahu buktinya tetapi saya berani bertaruh ini berlaku secara umum. Contohnya adalah percobaan dengan 2 subjek di masing-masing 2 kelompok perlakuan. Tes Wilcoxon tidak mungkin signifikan pada level 0,05, tetapi uji-t dapat. Bisa dibilang kekuatannya lebih dari setengah dari asumsi dan bukan hanya dari data. Untuk masalah awal Anda, tidak tepat untuk melanjutkan seolah-olah pengamatan per subjek independen. Mempertimbangkan hal-hal setelah fakta tentu saja bukan praktik statistik yang baik kecuali dalam keadaan yang sangat khusus (misalnya, penduga sandwich cluster).

Frank Harrell
sumber
2

Anda dapat mengutip Teorema Makan Siang Gratis jika Anda mau, tetapi Anda juga bisa mengutip Modus Ponens (juga dikenal sebagai Hukum Detasemen , dasar penalaran deduktif), yang merupakan akar dari Teorema Makan Siang Gratis .

The Tidak ada makan siang gratis Teorema mencakup ide yang lebih spesifik: fakta bahwa tidak ada algoritma yang dapat cocok untuk semua tujuan. Dengan kata lain, Teorema Tanpa Makan Siang Gratis pada dasarnya mengatakan bahwa tidak ada peluru ajaib algoritmik . Ini berakar pada Modus Ponens, karena untuk algoritme atau uji statistik untuk memberikan hasil yang benar, Anda harus memenuhi premis.

Sama seperti dalam semua teorema matematika, jika Anda melanggar premis, maka uji statistik kosong, dan Anda tidak dapat memperoleh kebenaran darinya. Jadi, jika Anda ingin menjelaskan data Anda menggunakan tes Anda, Anda harus mengasumsikan bahwa premis yang diperlukan terpenuhi, jika tidak (dan Anda tahu itu), maka tes Anda salah.

Itu karena penalaran ilmiah adalah berdasarkan deduksi: pada dasarnya, pengujian Anda / hukum / teorema adalah aturan implikasi , yang mengatakan bahwa jika Anda memiliki premisse yang Amaka Anda dapat menyimpulkan B: A=>B, tetapi jika Anda tidak memiliki A, maka Anda baik dapat memiliki Batau tidak B, dan kedua kasus itu benar , itulah salah satu prinsip dasar inferensi / deduksi logis (aturan Modus Ponens). Dengan kata lain, jika Anda melanggar premis, hasilnya tidak masalah, dan Anda tidak dapat menyimpulkan apa pun .

Ingat tabel biner implikasinya:

A   B   A=>B
F   F    T
F   T    T
T   F    F
T   T    T

Jadi dalam kasus Anda, untuk menyederhanakan, Anda punya Dependent_Variables => ANOVA_correct. Sekarang, jika Anda menggunakan variabel independen, dengan demikian Dependent_Variablesadalah False, maka implikasinya akan menjadi kenyataan, karena Dependent_Variablesasumsi dilanggar.

Tentu saja ini sederhana, dan dalam praktiknya tes ANOVA Anda mungkin masih memberikan hasil yang bermanfaat karena hampir selalu ada beberapa tingkat independensi antara variabel dependen, tetapi ini memberi Anda gagasan mengapa Anda tidak bisa mengandalkan tes tanpa memenuhi asumsi .

Namun, Anda juga dapat menggunakan tes yang premisnya tidak puas dengan aslinya dengan mengurangi masalah Anda: dengan secara eksplisit mengendurkan kendala independensi, hasil Anda mungkin masih bermakna, meskipun tidak dijamin (karena hasil Anda berlaku untuk masalah yang berkurang, bukan masalah penuh, jadi Anda tidak dapat menerjemahkan setiap hasil kecuali jika Anda dapat membuktikan bahwa kendala tambahan dari masalah baru tidak memengaruhi tes Anda dan dengan demikian hasil Anda).

Dalam praktiknya, ini sering digunakan untuk memodelkan data praktis, dengan menggunakan Naif Bayes misalnya, dengan memodelkan variabel dependen (bukan independen) menggunakan model yang mengasumsikan variabel independen, dan secara mengejutkan ini sering bekerja dengan sangat baik, dan kadang-kadang lebih baik daripada model akuntansi untuk dependensi . Anda juga dapat tertarik dengan pertanyaan ini tentang cara menggunakan ANOVA ketika data tidak sepenuhnya memenuhi semua harapan .

Ringkasnya: jika Anda berniat mengerjakan data praktis dan tujuan Anda bukan untuk membuktikan hasil ilmiah apa pun, tetapi untuk membuat sistem yang hanya berfungsi (yaitu, layanan web atau aplikasi praktis apa pun), asumsi independensi (dan mungkin asumsi lain) bisa santai, tetapi jika Anda mencoba untuk menyimpulkan / membuktikan kebenaran umum , maka Anda harus selalu menggunakan tes yang Anda dapat menjamin secara matematis (atau setidaknya berasumsi dengan aman dan terbukti) bahwa Anda memenuhi semua premis .

gaborous
sumber
2
Jika saya memahami argumen Anda dengan benar, Anda mulai dengan mengatakan bahwa tidak ada aplikasi statistik yang asumsi tidak dipenuhi dengan tepat adalah valid. Jika benar, ini memang berita buruk. Sebagian besar buku ekonometrik (untuk memberikan satu contoh saja) menghabiskan waktu mereka menjelaskan bahwa itu salah (ringkasan satu kata) dan secara terperinci mengapa. Namun, Anda tampaknya mengubah taktik Anda di tengah dan apa yang Anda anjurkan justru kabur. Entah bagaimana, bekerja pada data dapat terdengar meskipun secara logika tidak valid. Karena itu saya tidak bisa melihat garis nasihat yang jelas di sini.
Nick Cox
Intinya adalah: jika premis dilanggar, Anda tidak dapat mengambil hasil tes pada nilai nominal karena kesimpulannya bias. Namun, Anda masih bisa mencobanya dan jika Anda cukup percaya diri dan berpengalaman, Anda masih bisa mendapatkan sesuatu darinya, tetapi kebanyakan pada implementasi praktis di mana sebenarnya Anda tidak peduli dengan alasan ilmiah (Anda hanya mencoba membuat model data untuk beberapa tujuan praktis, bukan mencoba menyimpulkan kebenaran umum yang beralasan tentang dunia). Jadi jawaban saya bukan "ringkasan satu kata", itu hanya kasus umum (salah) vs kasus khusus (mungkin ok).
gaborous
PS: Pernyataan saya tidak hanya menyangkut aplikasi statistik tetapi aplikasi apa pun dari teorema / aturan / tes logis atau matematis, ini berlaku untuk alasan apa pun yang menggunakan inferensi dan induksi. Tetapi saya tertarik pada referensi buku ekonometrik Anda, referensi lain yang Anda berikan dalam komentar atas pertanyaan OP sangat relevan.
gaborous
Terima kasih telah menambahkan komentar, tetapi saya harus mengatakan bahwa saya tidak menemukan pernyataan Anda sangat jelas atau beralasan. Saya tidak dapat melihat bahwa ilmuwan yang bekerja (saya satu) akan memahami perbedaan Anda antara analisis data untuk alasan ilmiah dan untuk tujuan praktis. Saya akan meninggalkannya di sana kecuali memuji buku teks seperti buku Jeff Wooldridge sebagai akibat esai panjang yang anggapannya penting, yang tidak, dan area abu-abu besar di antaranya. amazon.com/Jeffrey-M.-Wooldridge/e/B001IGLWNY
Nick Cox
Terima kasih untuk referensi Saya baru saja menemukan pertanyaan lain di mana mereka menyebutkan sebuah makalah yang menjelaskan mengapa asumsi independensi naif masih dapat bekerja pada data dengan variabel dependen: "Makalah ini tampaknya membuktikan bahwa (naif) bayes baik tidak hanya ketika fitur independen, tetapi juga ketika dependensi fitur dari satu sama lain mirip / berlawanan antara fitur " stats.stackexchange.com/a/23491/25538
gaborous