Bayangkan seorang peneliti sedang mengeksplorasi dataset dan menjalankan 1000 regresi yang berbeda dan ia menemukan satu hubungan yang menarik di antara mereka.
Sekarang bayangkan peneliti lain dengan data yang sama hanya menjalankan 1 regresi, dan ternyata itu sama dengan yang peneliti lain lakukan untuk menemukan 1000 regresi. Peneliti 2 tidak mengenal peneliti 1.
Haruskah peneliti 1 membuat kesimpulan yang berbeda dari peneliti 2? Mengapa? Misalnya, apakah peneliti 1 harus melakukan beberapa koreksi perbandingan, tetapi peneliti 2 tidak?
Jika peneliti 2 menunjukkan Anda kemundurannya sendiri, kesimpulan apa yang akan Anda buat? Jika setelah itu peneliti 1 menunjukkan kepada Anda hasilnya, haruskah Anda mengubah kesimpulan Anda? Jika demikian, mengapa itu penting?
PS 1 : Jika berbicara tentang peneliti hipotetis membuat masalahnya abstrak, pikirkan tentang ini: bayangkan Anda menjalankan hanya satu regresi untuk makalah Anda, menggunakan metode terbaik yang tersedia. Kemudian peneliti lain mengeksplorasi 1000 regresi berbeda dengan data yang sama, sampai ia menemukan regresi yang sama persis dengan yang Anda jalankan . Haruskah kalian membuat kesimpulan yang berbeda? Apakah buktinya sama untuk kedua kasus atau tidak? Haruskah Anda mengubah kesimpulan Anda jika Anda tahu hasil peneliti lainnya? Bagaimana seharusnya masyarakat menilai bukti dari dua studi?
PS 2: tolong coba untuk lebih spesifik dan untuk memberikan pembenaran matematis / teoritis, jika mungkin!
sumber
Jawaban:
Inilah slogan "Bayesian" saya pada pertanyaan Anda. Saya pikir Anda telah menggambarkan situasi di mana dua orang dengan informasi sebelumnya yang berbeda harus mendapatkan jawaban / kesimpulan yang berbeda ketika diberi dataset yang sama. Contoh yang lebih blak-blakan / ekstrem adalah misalkan kita memiliki "peneliti 1b" yang kebetulan menebak parameter model regresi dan kesimpulan dari hipotesis apa pun. Menjalankan regresi secara konseptual tidak terlalu jauh dari dugaan.1000
Apa yang saya pikirkan sedang terjadi ... apa yang kita pelajari tentang para peneliti informasi sebelumnya dari pertanyaan di atas? - peneliti 1 mungkin memiliki flat sebelumnya untuk model - peneliti 2 memiliki prior yang tajam untuk model yang menarik (menganggap adalah model keduanya cocok)P( M.k| saya1) = 11000 P( M.1| saya2) = 1 M.1
Ini jelas penyederhanaan, tetapi Anda bisa lihat di sini, kami sudah lebih menekankan pada kesimpulan peneliti 2 tanpa data apa pun. Tapi Anda tahu, begitu mereka berdua memperhitungkan data, probabilitas posterior peneliti 1 untuk akan meningkat ... (... kita tahu ini karena itu "lebih baik "Dari model lain ...). Posterior peneliti 2 tidak dapat berkonsentrasi lagi, itu sudah sama dengan . Yang kami tidak tahu adalah seberapa banyak data mendukung dibandingkan alternatif. Apa yang kita juga tidak tahu adalah bagaimana model yang berbeda mengubah kesimpulan substantif peneliti 1. Misalnya, anggap semuaM.1 P( M.1| DI) > > P( M.1| saya) 999 1 M1 1000 model berisi istilah umum, dan semua parameter regresi untuk variabel tersebut secara signifikan lebih besar dari (misalnya untuk semua model). Maka tidak ada masalah dengan menyimpulkan efek positif yang signifikan, meskipun banyak model cocok.1000 0 p−value<10−8
Anda juga tidak mengatakan seberapa besar dataset, dan ini penting! Jika Anda berbicara tentang dataset dengan pengamatan dan variabel kovariat / prediktor / independen, maka peneliti 1 mungkin masih akan sangat tidak yakin tentang model. Namun, jika peneliti 1 menggunakan pengamatan, ini dapat menentukan model.10 2 , 000 , 000100 10 2,000,000
Tidak ada yang salah secara mendasar dengan dua orang yang mulai dengan informasi yang berbeda, dan terus memiliki kesimpulan yang berbeda setelah melihat data yang sama. Namun ... melihat data yang sama akan mendekatkan mereka, asalkan "ruang model" mereka tumpang tindih dan data mendukung "wilayah yang tumpang tindih" ini.
sumber
Penafsiran statistik jauh lebih tidak jelas daripada, apa yang Anda minta, perlakuan matematika.
Matematika adalah masalah yang didefinisikan dengan jelas. Misalnya menggulirkan dadu yang sempurna, atau menggambar bola dari guci.
Statistik diterapkan matematika di mana matematika memberikan pedoman tetapi bukan solusi (tepat).
Dalam hal ini jelas bahwa keadaan memainkan peran penting. Jika kita melakukan regresi dan kemudian menghitung (matematika) beberapa nilai p untuk mengekspresikan kekuatan lalu apa interpretasi (statistik) dan nilai dari nilai p?
Dalam kasus 1000 regresi yang dilakukan oleh peneliti 1 hasilnya jauh lebih lemah karena jenis situasi ini terjadi ketika kita tidak benar-benar memiliki petunjuk dan hanya mengeksplorasi data. Nilai p hanyalah indikasi bahwa mungkin ada sesuatu.
Jadi nilai p jelas kurang layak dalam regresi yang dilakukan oleh peneliti 1. Dan jika peneliti 1 atau seseorang yang menggunakan hasil peneliti 1 ingin melakukan sesuatu dengan regresi maka nilai p perlu dikoreksi. (dan jika Anda menganggap perbedaan antara peneliti 1 dan peneliti 2 tidak cukup, pikirkan saja banyak cara yang dapat dilakukan peneliti 1 untuk mengoreksi nilai p untuk beberapa perbandingan)
Dalam kasus regresi tunggal yang dilakukan oleh peneliti 2 hasilnya adalah bukti yang jauh lebih kuat. Tetapi itu karena regresi tidak berdiri sendiri. Kita harus memasukkan alasan mengapa peneliti 2 hanya melakukan satu regresi tunggal. Ini bisa jadi karena dia punya alasan (tambahan) yang bagus untuk percaya bahwa regresi tunggal adalah model yang baik untuk data.
Pengaturan regresi yang dilakukan oleh peneliti 1 dan 2 jauh berbeda, dan tidak jarang Anda menemukan keduanya pada waktu yang sama untuk masalah yang sama. Jika ini masalahnya maka baik
Peneliti 2 sangat beruntung
Ini tidak biasa, dan kita harus memperbaiki hal ini ketika menafsirkan sastra, juga kita harus meningkatkan penerbitan gambar total penelitian. Jika ada seribu peneliti seperti peneliti 2, dan kita hanya akan melihat salah satu dari mereka mempublikasikan keberhasilan, maka karena kita tidak melihat kegagalan 999 peneliti lain, kita mungkin keliru percaya bahwa kita tidak memiliki kasus seperti peneliti 1
Peneliti 1 tidak begitu pintar dan melakukan pencarian yang sangat berlebihan untuk beberapa regresi sementara dia mungkin sudah tahu dari awal bahwa itu seharusnya yang tunggal, dan dia bisa melakukan tes yang lebih kuat.
Untuk orang luar yang lebih pintar dari peneliti 1 (tidak peduli tentang 999 regresi tambahan dari awal) dan membaca tentang pekerjaan, mereka mungkin memberikan kekuatan lebih pada signifikansi hasil, namun masih tidak sekuat yang akan dilakukannya untuk hasil peneliti 2.
Sementara peneliti 1 mungkin terlalu konservatif ketika mengoreksi 999 regresi tambahan yang berlebihan, kita tidak bisa mengabaikan fakta bahwa penelitian itu dilakukan dalam kekosongan pengetahuan dan jauh lebih mungkin untuk menemukan peneliti yang beruntung dari tipe 1 daripada tipe. 2.
Sebuah cerita terkait yang menarik: Dalam astronomi, ketika mereka merencanakan instrumen yang lebih baik untuk mengukur latar belakang kosmik dengan presisi yang lebih tinggi, ada peneliti yang berpendapat hanya merilis setengah data. Ini karena hanya ada satu kesempatan untuk mengumpulkan data. Setelah semua regresi telah dilakukan oleh puluhan peneliti yang berbeda (dan karena variasi dan kreativitas yang luar biasa dari ahli teori, pasti ada beberapa yang cocok untuk setiap kemungkinan, acak, menabrak data), tidak ada kemungkinan untuk melakukan Eksperimen baru untuk memverifikasi (yaitu, kecuali Anda dapat menghasilkan seluruh dunia baru).
sumber
Cerpen: kami tidak memiliki cukup informasi untuk menjawab pertanyaan Anda karena kami tidak tahu apa-apa tentang metode yang digunakan atau data yang dikumpulkan.
Jawaban panjang ... Pertanyaan sesungguhnya di sini adalah apakah yang dilakukan setiap peneliti:
Metode mereka akan menentukan kekuatan interpretasi hasil mereka. Ini karena beberapa metode kurang suara daripada yang lain.
Dalam sains yang ketat kami mengembangkan hipotesis, mengidentifikasi variabel pengganggu, mengembangkan kontrol untuk variabel di luar hipotesis kami, merencanakan metode pengujian, merencanakan metodologi analitik kami, melakukan tes / mengumpulkan data, dan kemudian menganalisis data. (Perhatikan bahwa metode analitis direncanakan sebelum pengujian terjadi). Ini adalah yang paling ketat karena kita harus menerima data dan analisis yang tidak sesuai dengan hipotesis. Tidak dapat diterima untuk mengubah metode setelah mendapatkan sesuatu yang menarik. Hipotesis baru apa pun dari temuan harus melalui proses yang sama lagi.
Dalam pseudosain kita sering mengambil data yang sudah dikumpulkan. Ini lebih sulit untuk digunakan secara etis karena lebih mudah untuk menambahkan bias pada hasil. Namun, masih mungkin untuk mengikuti metode ilmiah untuk analis etis. Mungkin sulit untuk membuat kontrol yang tepat dan yang perlu diteliti dan dicatat.
Eksplorasi data tidak didasarkan pada sains. Tidak ada hipotesis khusus. Tidak ada evaluasi apriori faktor perancu. Juga, sulit untuk kembali dan melakukan analisis ulang menggunakan data yang sama, karena hasilnya mungkin ternoda oleh pengetahuan atau pemodelan sebelumnya dan tidak ada data baru untuk digunakan untuk validasi. Eksperimen ilmiah yang ketat direkomendasikan untuk mengklarifikasi kemungkinan hubungan yang ditemukan dari analisis eksplorasi.
Pengerukan atau peretasan data adalah tempat "analis" melakukan beberapa tes dengan harapan jawaban yang tidak terduga atau tidak diketahui atau memanipulasi data untuk mendapatkan hasil. Hasilnya mungkin kebetulan yang sederhana, mungkin hasil dari variabel pengganggu, atau mungkin tidak memiliki ukuran efek atau kekuatan yang berarti.
Ada beberapa solusi untuk setiap masalah, tetapi solusi tersebut harus dievaluasi dengan cermat.
sumber