Mengapa regressor yang tidak relevan menjadi signifikan secara statistik dalam sampel besar?

8

Saya mencoba untuk lebih memahami signifikansi statistik, ukuran efek dan sejenisnya.

Saya memiliki persepsi (mungkin itu salah) bahwa bahkan regresi yang tidak relevan sering menjadi signifikan secara statistik dalam sampel besar . Dengan tidak relevan saya berarti bahwa tidak ada penjelasan pokok permasalahan mengapa regressor harus berhubungan dengan variabel dependen. Jadi tidak relevan dalam posting ini adalah konsep materi pelajaran murni dan bukan konsep statistik.

Saya tahu bahwa seorang regressor akan signifikan secara statistik dengan memberikan sampel yang cukup besar kecuali jika efek populasi benar-benar nol (seperti yang dibahas di sini ). Oleh karena itu, regressor yang tidak relevan yang tampak signifikan secara statistik dalam sampel besar memiliki ukuran efek yang tidak nol pada populasi.

Pertanyaan:

  1. Kenapa seorang regressor yang tidak relevan ternyata signifikan secara statistik?
  2. Haruskah saya mencari penjelasan pokok permasalahan (yaitu mencoba menyangkal tidak relevan) atau ini fenomena statistik?

Ini adalah kelanjutan dari pos di mana saya mencoba menjelaskan bagaimana cara menyembuhkan efek ini. Sementara itu, di sini saya bertanya mengapa hal itu terjadi.

Richard Hardy
sumber
Ini tampaknya masih menggandakan posting Anda sebelumnya, yang sudah dijawab sendiri. Satu jawaban untuk duplikat status pos tersebut "nilai-p adalah arbitrer, karena Anda dapat menjadikannya sekecil yang Anda inginkan dengan mengumpulkan data yang cukup." Bukankah itu alamat kedua # 1 dan # 2?
whuber
1
Terima kasih @whuber. Saya mencoba menjelaskan bahwa posting ini membahas pertanyaan baru yang berbeda. Saya sudah mengerti apa yang terjadi jika benar-benar ada efek dalam populasi (topik posting lain dan yang lebih tua itu duplikat). Pertanyaan saya di sini adalah (i) adalah alasan untuk seringnya signifikansi statistik dari para regresi yang tampaknya tidak relevan selalu sama, yaitu bahwa sebenarnya ada efek populasi; (ii) jika tidak, lalu apa alasan alternatifnya; (iii) jika ya, maka apakah dampak dalam populasi paling sering disebabkan oleh subjek atau karena kebetulan. Saya harap ini membuatnya lebih jelas.
Richard Hardy

Jawaban:

9

Pertanyaan:

Kenapa seorang regressor yang tidak relevan ternyata signifikan secara statistik?

Saya pikir akan sangat membantu untuk memikirkan apa yang terjadi ketika ukuran sampel Anda mendekati populasi itu sendiri. Pengujian signifikansi dimaksudkan untuk memberi Anda gambaran tentang apakah tidak ada efek pada populasi. Ini adalah alasan mengapa ketika bekerja dengan data sensus (yang mensurvei populasi), pengujian signifikansi tidak ada artinya (karena, apa yang ingin Anda generalisasi?).

Dengan mengingat hal itu, apa yang dimaksud "pengaruh dalam populasi"? Ini berarti hubungan apa pun antara variabel dalam populasi, terlepas dari seberapa kecil (baik perbedaan 1 poin atau 1 orang), bahkan jika hubungan itu disebabkan oleh kebetulan dan keacakan di alam semesta.

Dengan demikian, ketika sampel Anda mendekati ukuran populasi, uji signifikansi menjadi kurang dan kurang bermakna karena perbedaan apa pun akan "signifikan secara statistik". Apa yang Anda akan lebih tertarik pada itu adalah ukuran efek - yang analog dengan "praktis signifikan".

Haruskah saya mencari penjelasan pokok permasalahan (yaitu mencoba menyangkal tidak relevan) atau ini fenomena statistik?

Ini sebuah fenomena - Anda harus melihat ukuran efek.

QxV
sumber
Anda menyebutkan sesuatu yang saya cari secara intuitif tetapi belum berhasil dirumuskan. Efek dalam populasi dapat berupa hubungan antar variabel dalam populasi, terlepas dari seberapa kecil (baik perbedaan 1 poin atau 1 orang), bahkan jika hubungan itu disebabkan oleh kebetulan dan keacakan di alam semesta. Jika efek ini disebabkan oleh kebetulan, saya tidak perlu mencari penjelasan masalah apa pun. Terima kasih!
Richard Hardy
Omong-omong, argumen Anda masuk akal secara intuitif dalam kasus-kasus di mana seseorang menguji misalnya kesetaraan cara atau apakah efek pengobatan sama dengan nol. Tetapi bagaimana dengan signifikansi regressor dalam regresi berganda? Bisakah Anda menyatakan poin Anda dalam konteks regresi sehingga saya bisa lebih mudah mengikuti?
Richard Hardy
1
Hmm, saya pikir analogi ini relevan secara langsung. Misalnya, jika Anda membayangkan konsumsi cokelat tidak berpengaruh pada harapan hidup, setelah disesuaikan dengan variabel kontrol seperti jumlah olahraga, dll., Tetapi satu orang dalam populasi 6 miliar orang kebetulan adalah orang yang outlier, akan ada populasi " efek "konsumsi cokelat pada harapan hidup, tetapi ukuran efeknya akan sangat kecil. Mudah-mudahan contoh itu bermanfaat, tetapi saya kesulitan berpikir bagaimana koefisien regresi akan berbeda dari parameter lainnya.
QxV
3
Saya agak bingung mengapa pengujian signifikansi harus tidak berarti jika Anda sampel seluruh "populasi" (jika menurut populasi Anda populasi sebenarnya). Jika saya ingin menguji sesuatu tentang orang dan sampel saya semuanya 7 miliar orang, maka pasti saya masih bisa menjalankan tes signifikansi dan mungkin menolak atau gagal untuk menolak hipotesis nol. Saya tidak mengerti mengapa secara konseptual tidak ada artinya. "Generalisasi" yang Anda sebutkan dapat merujuk misalnya untuk generasi mendatang atau sesuatu. (CC @Richard.)
amoeba
1
@amoeba: Saya pikir pengujian signifikansi statistik hanya masuk akal untuk sampel, bukan populasi. Setelah kita mengamati seluruh populasi, semua pengetahuan kita sempurna: tidak ada ketidakpastian estimasi parameter atau sejenisnya. Kita bisa mengukur hubungan apa pun dengan tepat. (Itu tidak berarti kita akan memiliki penjelasan subjek-sempurna untuk semua hubungan, tapi itu intinya.) Sementara itu, jika Anda menggeneralisasi untuk generasi masa depan, itu secara implisit membuat populasi saat ini hanya sampel dari {saat ini + masa depan} populasi. Kemudian pengujian signifikansi statistik kembali dalam permainan.
Richard Hardy
2

Bahkan jika ukuran sampel Anda tidak mendekati populasi Anda, efek kecil menjadi signifikan dalam sampel besar. Ini adalah konsekuensi dari arti signifikansi statistik:

Jika, dalam populasi dari mana sampel ini diambil, hipotesis nol itu benar, apakah (XX%) kemungkinan bahwa kita akan mendapatkan statistik uji setidaknya sebesar ini dalam sampel ukuran yang kita miliki?

Jika pertanyaan Anda adalah sesuatu tentang semua orang di Bumi, maka jika Anda mengambil sampel 1.000.000 (tidak mendekati 7.000.000.000) bahkan efek yang sangat kecil akan signifikan, karena sangat tidak mungkin untuk menemukan statistik uji seperti itu dalam sampel besar ketika nol benar .

Ada banyak masalah dengan pengujian signifikansi, dibahas di banyak tempat. Ini salah satunya. "Penyembuhan" adalah melihat ukuran efek dan interval kepercayaan.

Peter Flom
sumber
1
Terima kasih! Saya pikir saya mengerti mekanisme bagaimana efek kecil itu berubah menjadi signifikan secara statistik diberikan sampel yang cukup besar. Pertanyaan intinya adalah, mengapa efek kecil itu ada dalam populasi? Apakah itu terjadi karena "keacakan di alam semesta"? Atau apakah mereka mewakili beberapa hubungan subjek-materi yang sebenarnya (bukan karena kebetulan) yang cenderung kita abaikan ketika kita memikirkannya dari sudut pandang subjek-materi?
Richard Hardy
4
Saya akan mengatakan yang terakhir.
Ben Bolker
@ BenBolker Bisakah Anda memberikan beberapa alasan? Itu bisa sangat membantu.
Richard Hardy
3
Saya setuju dengan Ben. Hampir setiap dua variabel akan terkait dengan tingkat tertentu; dan yang kita masukkan ke dalam model jauh lebih mungkin terkait. Kami tidak (dan tidak seharusnya) hanya membuang sampah ke dalam model.
Peter Flom
2

Saya telah meminjam beberapa wawasan dari @QxV untuk memberikan penjelasan tentang keberadaan efek populasi bahkan jika pengetahuan subjek menunjukkan tidak ada efek seperti itu.

Misalkan ada proses penghasil populasi (PGP) yang menghasilkan populasi dengan fitur dan . Rumus PGP sedemikian rupa sehingga dan independen hingga istilah kesalahan acak. Justru karena istilah kesalahan acak ini, setiap realisasi terbatas dan memiliki nol probabilitas tepat, yaitu . Jika demikian, dengan probabilitas satu ada efek populasi. Itulah bagaimana efek muncul dalam populasi.yxyxyrealizedxrealizedP(yrealizedxrealized)=0

Setelah efek populasi ada, itu masalah ukuran sampel ketika kita akan mendeteksinya dalam sampel dan kapan itu akan menjadi signifikan secara statistik.

Richard Hardy
sumber
2

Selain jawaban bagus yang sudah diposting, saya akan mencoba dari sudut pandang lain. Semua model adalah perkiraan, dalam arti tertentu ... Lihatlah beberapa model regresi, dan beberapa variabel yang tidak relevan adalah signifikan. Apa yang bisa menjelaskannya?

  1. Mungkin itu tidak relevan, bahwa konsensus ilmiah saat ini mengenai hal itu adalah salah . Selain itu:

  2. Itu bisa menjadi stand-in atau proxy untuk beberapa variabel yang dihilangkan yang relevan, dan yang berkorelasi dengan variabel yang tidak relevan.

  3. Beberapa variabel yang relevan, termasuk linier dalam model, dapat bertindak non-linear, dan variabel yang tidak relevan Anda dapat menjadi bagian dari variabel terkait.

  4. Beberapa interaksi antara dua variabel yang relevan adalah penting, tetapi tidak termasuk dalam model. Variabel Anda yang tidak relevan dapat menjadi pendukung interaksi yang dihilangkan.

  5. Variabel yang tidak relevan hanya bisa sangat berkorelasi dengan beberapa variabel penting, yang mengarah ke koefisien berkorelasi negatif. Ini bisa menjadi penting terutama jika ada kesalahan pengukuran dalam variabel ini.

  6. Mungkin ada beberapa pengamatan dengan leverage yang sangat tinggi, yang mengarah ke perkiraan aneh.

Tentunya yang lain ... satu poin penting adalah bahwa model regresi linier bisa menjadi pendekatan yang sangat baik dengan sampel kecil, hanya efek besar yang akan signifikan. Tetapi sampel yang lebih besar akan menyebabkan varians yang lebih rendah, tetapi tidak dapat mengurangi bias karena perkiraan . Jadi dengan sampel yang lebih besar ketidakcukupan model menjadi nyata, dan akhirnya akan mendominasi lebih dari varian.

kjetil b halvorsen
sumber
-1

Tidak. Regressor yang tidak relevan tidak menjadi signifikan secara statistik karena ukuran sampel meningkat. Coba kode berikut dalam R.

y <- rnorm (10000000)

x <- rnorm (10000000)

ringkasan (lm (y ~ x))

David
sumber
1
Apakah Anda mengulangi kode itu, katakanlah, 1000 kali (atau lebih) dan lihat apa yang akan terjadi?
kjetil b halvorsen
Anda akan memiliki tingkat positif palsu 5%, seperti yang diharapkan. Tetapi hal yang sama diperoleh terlepas dari ukuran sampel
David
Lihat jawaban saya untuk sudut pandang lain
kjetil b halvorsen
Saya memahami pos Anda, dan untuk hubungan "jenis-linear" itu benar (seperti halnya untuk relatinoships "sebenarnya-linear") Namun, jika Anda mengubah 10000000 untuk 10 dalam kode saya, Anda sekarang tidak cenderung untuk memperoleh positif palsu dalam uji F
David
Terima kasih atas jawaban Anda! Meskipun benar dengan sendirinya, saya pikir itu melenceng dari pertanyaan. Pertanyaannya dimotivasi oleh pengamatan bahwa kita sering menemukan hubungan yang signifikan secara statistik yang tidak memiliki penjelasan materi.
Richard Hardy