Bagaimana cara memperkenalkan secara lembut ahli epidemiologi / rekan kerja kesehatan masyarakat ke pemodelan prediktif tingkat lanjut?

8

Berasal dari latar belakang ilmu sosial dan epidemiologi, rekan kerja saya dilatih tentang regresi kuadrat terkecil, regresi logistik, dan analisis kelangsungan hidup. Mereka suka melihat interval kepercayaan 95% dan nilai-p dengan koefisien parameter, dan tidak mempercayai alat prediktif yang lebih terkini seperti jaringan saraf, CART, bagging & boosting, serta teknik regresi yang dihukum.

RobertF
sumber
4
Kursus singkat saya ditujukan untuk audiens itu, antara lain. Info termasuk selebaran ada di situs web untuk versi semester penuh dari kursus: biostat.mc.vanderbilt.edu/CourseBios330 . Salah satu dari banyak hal yang saya bahas adalah mengapa tidak masuk akal untuk koefisien regresi logistik anti-log untuk mendapatkan rasio odds; ini dalam konteks memungkinkan efek menjadi nonlinier dan mendapatkan mis rasio odds antar-kuartil.
Frank Harrell
2
Saya suka 2 buku berikut: Pengantar Pembelajaran Statistik: dengan Aplikasi dalam R (James, Witten, Hastie dan Tibshirani). Elemen Pembelajaran Statistik: Penambangan Data, Inferensi, dan Prediksi (Hastie, Tibshirani, Friedman). Saya juga menemukan bahwa ahli epidemiologi lebih suka model regresi parametrik (model tipe GLM yang Anda sebutkan) untuk estimasi dan inferensi dibandingkan dengan model regresi semi / non-parametrik modern. Saya kira karena banyak dari pekerjaan mereka berfokus pada penemuan / penjelasan faktor risiko / perlindungan, daripada menghasilkan kecocokan regresi yang fleksibel (untuk prediksi)?
Chris
2
@RobertF: Itu berlaku untuk sebagian besar profesi (inersia?). Namun, ahli epidemiologi biasanya tertarik pada model penjelasan dan tidak selalu sepenuhnya jelas bagaimana pendekatan prediksi baru seperti hukuman harus digunakan ketika misalnya seseorang ingin menilai perancu, interaksi pada paparan yang menarik. Kursus, buku, dan dept Frank Harrell. Situs ini mengandung banyak bahan berguna yang dapat diterapkan dalam epidemiologi juga.
Thomas Speidel
1
@RobertF: Ini adalah sesuatu yang sulit saya pahami. Jika kita secara sengaja memperkirakan perkiraan efek untuk mengurangi overfitting, bagaimana kita bisa memperlakukannya seolah-olah itu tidak bias ketika kita ingin menafsirkannya?
Thomas Speidel
1
@ Chris Salah satu alat analisis kelangsungan hidup yang paling umum digunakan epidemiolog adalah model semi-parametrik.
Fomite

Jawaban:

6

Saya akan mempertimbangkan sebagai Epidemiologis.

Saya dapat melihat inersia masuk sebagai peneliti & profesional di bidang perawatan kesehatan pindah ke manajemen menengah dan seterusnya dan tidak terhubung dengan perkembangan baru dalam statistik.

Pertama, saya akan sangat menyarankan Anda untuk tidak menganggap ini hanya inersia, baik dalam bentuk disiplin yang tidak ingin mengadopsi teknik-teknik baru, atau rekan kerja Anda tidak terhubung dengan perkembangan baru dalam statistik. Anda dapat pergi ke konferensi epidemiologi akademik di mana pekerjaan baru dan sangat metodologis canggih sedang dilakukan, dan masih belum menemukan banyak tentang pemodelan prediktif.

Petunjuk ada di namanya. Pemodelan prediktif .

Epidemiologi, sebagai suatu bidang, tidak terlalu tertarik pada prediksi untuk kepentingannya sendiri. Sebaliknya, fokusnya adalah mengembangkan penjelasan etiologis untuk pola penyakit yang diamati dalam suatu populasi. Keduanya terkait, tetapi berbeda, dan ini sering mengarah pada sesuatu dari ketidakpercayaan filosofis klasifikasi yang lebih modern dan teknik prediksi yang murni berusaha untuk memaksimalkan dampak prediksi model. Pada ujung ekstrim ini adalah orang-orang yang berpendapat bahwa pemilihan variabel harus dilakukan terutama dengan menggunakan sesuatu seperti grafik asiklik terarah, yang dapat dianggap sebagai kebalikan dari arah pemodelan prediktif.

Ini menghasilkan tidak menjadi bagian dari latar belakang mereka, tidak menjadi sesuatu yang mereka temui banyak dalam literatur, dan sejujurnya, kemungkinan besar bahwa paparan mereka terhadap itu telah melalui orang-orang yang tidak benar-benar memahami masalah yang mereka coba menyelesaikan.

Ini, dalam komentar, adalah contoh sempurna:

Itu melempar beberapa orang - fakta kami sengaja memperkenalkan bias ke dalam regresi hukuman untuk meningkatkan akurasi prediksi

Hampir setiap ahli epidemiologi yang saya tahu, jika Anda membuat mereka memilih, akan memilih pengurangan bias daripada peningkatan akurasi.

Itu tidak berarti bahwa itu tidak pernah dibesarkan. Ada saat-saat ketika model prediksi digunakan - sering dalam kasus-kasus klinis di mana prediksi hasil pasien ini sangat menarik, atau deteksi wabah, di mana teknik ini berguna karena kita tidak tahu apa yang akan terjadi dan tidak dapat membuat etiologis argumen. Atau ketika prediksi benar-benar merupakan tujuan - misalnya, dalam banyak model estimasi paparan. Mereka hanya ceruk di lapangan.

Fomite
sumber
Saya minta maaf jika ini agak ofensif, saya tidak bermaksud begitu. Berapa banyak pelatihan epidemiologis dalam statistik dan / atau matematika? Berasal dari pengalaman saya sendiri, para ahli epidemiologi yang telah saya temui (dan saya telah bertemu banyak sekali) tidak memiliki perlengkapan yang memadai secara statistik untuk menggunakan dan menafsirkan model yang telah mereka tunjukkan. Banyak dari mereka telah mengabaikan konsep dasar seperti koreksi pengujian berganda dan masalah praktis lainnya. Saya ingin tahu apakah Anda dapat mengomentari ini. Apakah saya hanya bertemu dengan ahli epidemiologi yang buruk, atau apakah ini fenomena yang luas? Sekali lagi, saya harap itu tidak
Chris C
1
@ChristC Bagian dari masalahnya adalah, dibandingkan dengan mengatakan, "Ahli statistik", ahli epidemiologi adalah bidang yang sangat luas. Ada banyak orang yang bisa lolos dengan tabel 2x2 dan matematika tidak kalah kompleks dari pembagian panjang, karena untuk sebagian besar masalah kesehatan masyarakat setempat, itu sudah cukup. 1 / n
Fomite
1
Ada juga beberapa keanehan di lapangan (Charlie Poole di UNC memiliki argumen tentang: beberapa koreksi perbandingan menjadi konsep yang cacat dalam Epidemiologi), dan beberapa kurangnya pendidikan karena sebagian besar epi adalah pengguna model, dan terus terang, program statistik sering kali sama sekali tidak tertarik mengajar mereka. 2 / n
Fomite
1
Di ujung lain spektrum, Anda memiliki beberapa ahli metodologi yang sangat canggih yang bekerja pada masalah yang berfokus pada epi - inferensial kausal, model sistem, risiko yang bersaing, dll. Yang sangat berpengetahuan luas. Itu semua sangat tergantung pada jenis pekerjaan apa yang mereka lakukan, latar belakang mereka, dll. N / n
Fomite
1
@ ChrisC Contoh ilustrasi khusus yang baru saya ingat. Pada konferensi yang sama, pada sesi yang sama , saya mempresentasikan pendekatan baru (jika agak turunan) untuk pemodelan musiman menggunakan model regresi dengan fungsi harmonis di dalamnya. Pembicaraan sebelum saya? Diagram lingkaran. Keduanya sangat kredibel bisa disebut "Epidemiologi".
Fomite