Dari Modern Epidemiology Edisi ke-3 oleh Rothman, Greenland and Lash:
Setidaknya ada tiga bentuk overmatching. Yang pertama mengacu pada pencocokan yang membahayakan efisiensi statistik, seperti pencocokan kasus-kontrol pada variabel yang terkait dengan paparan tetapi bukan penyakit. Yang kedua mengacu pada pencocokan yang merusak validitas, seperti pencocokan pada perantara antara paparan dan penyakit. Yang ketiga mengacu pada pencocokan yang membahayakan efisiensi biaya.
Jawaban dari AndyW adalah tentang bentuk kedua dari overmatching. Secara singkat, inilah cara mereka semua bekerja:
1: Untuk menjadi perancu, salah satu kriteria adalah bahwa kovariat dikaitkan dengan hasil dan paparan. Jika itu hanya dikaitkan dengan salah satunya, itu bukan perancu, dan semua yang berhasil Anda lakukan adalah memperluas interval kepercayaan diri Anda.
Untuk mengeksplorasi jenis overmatching ini lebih lanjut, pertimbangkan studi kasus kontrol yang cocok dari paparan biner, dengan satu kontrol cocok dengan setiap kasus pada satu atau lebih pembaur. Setiap strata dalam analisis akan terdiri dari satu kasus dan satu kontrol kecuali beberapa strata dapat digabungkan. Jika kasing dan kontrol yang cocok terbuka atau tidak terbuka, satu margin dari tabel 2 x 2 adalah 0 ... sepasang subjek tidak akan menyumbangkan informasi apa pun untuk analisis. Jika seseorang bertingkat pada korelasi paparan, orang akan meningkatkan kemungkinan bahwa tabel tersebut akan terjadi dan dengan demikian cenderung meningkatkan informasi yang hilang dalam analisis bertingkat.
2: Ini sebagian dibahas oleh AndyW. Pencocokan pada faktor perantara akan membiaskan estimasi Anda, sebagaimana akan mencocokkan pada sesuatu yang dipengaruhi oleh paparan dan hasil. Ini pada dasarnya mengendalikan collider, dan teknik apa pun yang melakukannya akan membiasakan perkiraan Anda.
Namun, jika faktor pencocokan potensial dipengaruhi oleh paparan dan faktor pada gilirannya mempengaruhi penyakit (yaitu, merupakan variabel perantara), atau dipengaruhi oleh paparan dan penyakit, maka pencocokan pada faktor tersebut akan membiaskan baik efek kasar maupun yang disesuaikan. perkiraan. Dalam situasi ini, pencocokan kontrol kasus tidak lebih dari bentuk bias seleksi yang tidak dapat diperbaiki.
3: Ini lebih merupakan masalah desain penelitian. Pencocokan luas pada variabel yang tidak perlu Anda cocokkan dengan alasan 1 & 2 dapat menyebabkan Anda menolak kontrol yang mudah diperoleh (teman, keluarga, jejaring sosial terdekat, dll.) Karena jauh lebih sulit untuk mendapatkan kontrol yang dapat dicocokkan dengan set kovariat yang tidak perlu. Itu membutuhkan uang - uang yang bisa dihabiskan untuk lebih banyak mata pelajaran, paparan yang lebih baik atau penentuan penyakit, dll., Tanpa keuntungan yang cukup besar dalam hal bias atau presisi, dan memang telah mengancam keduanya.
Sementara saya tidak tahu tentang istilah "terlalu cocok", satu contoh dari ide yang sama yang saya dengar dalam istilah Ekonomi dan Statistik bisa cocok dengan hasil "menengah". Lihat posting Andrew Gelman tentang masalah ini
Ini adalah masalah yang sama seperti yang dijelaskan di awal artikel yang Anda kutip ( Marsh et al., 2002 )
Gelman memberikan contoh yang jelas secara konseptual dalam posting "Membuat anak laki-laki membuat Anda lebih konservatif". Dalam istilah yang sederhana (tidak ada contoh) itu hanya Anda memiliki arah sebab akibat Anda ke belakang.
sumber