Rumah sakit mana yang harus dipilih? Satu memiliki tingkat keberhasilan yang lebih tinggi, tetapi yang lain memiliki tingkat keberhasilan keseluruhan yang lebih tinggi

27

Saya memiliki pertanyaan tentang sesuatu yang dikatakan oleh guru statistik saya tentang masalah berikut. Pertanyaan saya bahkan bukan tentang kemunculan paradoks Simpson dalam situasi ini. Pertanyaan saya hanyalah tentang desakan profesor saya bahwa A) dan D) adalah jawaban yang benar, bukan A) dan F). Dia berkata:

"Karena tingkat keberhasilan sangat rendah untuk operasi Tipe E, kita dapat menyimpulkan bahwa mereka sulit dan bukan hanya tidak biasa. Karenanya, Mercy mungkin memiliki peralatan / dokter yang lebih baik jika dibandingkan dengan Hope."

Saya tidak mengerti bagaimana ia dapat menyimpulkan secara statistik bahwa Mercy melakukan "operasi yang lebih sulit". Mercy jelas memiliki tingkat keberhasilan yang lebih baik pada operasi tipe E, tetapi mengapa ini berarti mereka melakukan "operasi yang lebih sulit". Saya pikir saya sedang kacau oleh masalah ini dan profesor tidak mau mengalah. Bisakah seseorang menjelaskan mengapa saya salah atau bagaimana saya bisa menjelaskan hal ini kepada profesor?


Ada dua rumah sakit bernama Mercy and Hope di kota Anda. Anda harus memilih salah satunya untuk menjalani operasi. Anda memutuskan untuk mendasarkan keputusan Anda pada keberhasilan tim bedah mereka. Untungnya, di bawah rencana kesehatan baru, rumah sakit memberikan data tentang keberhasilan operasi mereka, dipecah menjadi lima kategori operasi besar. Misalkan Anda mendapatkan data berikut untuk dua rumah sakit:

Mercy Hospital

Type         A    B      C    D      E    All
Operations  359  1836   299   2086  149  4729
Successful  292  1449   179   434   13   2366

Hope Hospital 

Type          A   B  C   D   E   All
Operations   88 514 222 86  45   955
Successful   70 391 113 12  2    588

Anda perhatikan bahwa, dalam semua jenis operasi, Mercy memiliki tingkat keberhasilan yang lebih tinggi daripada Harapan, namun Harapan memiliki tingkat keberhasilan keseluruhan tertinggi. Rumah sakit mana yang akan Anda pilih dan mengapa (pilih dua jawaban)?

A) Rahmat; karena saya akan masuk untuk operasi tertentu, saya ingin rumah sakit yang memiliki tingkat keberhasilan terbaik untuk operasi itu.

B) Harapan; karena mereka melakukan lebih sedikit operasi di semua kategori, mereka tidak "senang operasi" seperti Mercy.

C) Harapan; ini adalah contoh dari paradoks Simpson dan kita harus selalu memilih kesimpulan yang "jelas".

D) Rahmat; melihat kolom E, Mercy jelas melakukan operasi yang lebih sulit dan mungkin juga rumah sakit yang lebih baik.

E) Harapan; ini memiliki tingkat keberhasilan keseluruhan yang lebih baik.

F) Rahmat; ini adalah contoh dari paradoks Simpson dan kita harus selalu memilih kebalikan dari kesimpulan "jelas".

swiecki
sumber
Oh wow, maaf, Anda benar sekali. Saya tidak benar-benar melihat bahwa ada situs SE untuk analisis statistik. Terima kasih.
swiecki
Tidak perlu meminta maaf. Saya baru saja mengingatkan Anda tentang fakta ini jika Anda mungkin tidak menyadarinya. Anda dapat mengklik tautan "panji" dan minta saja untuk dimigrasi ke sana. Itu harus terjadi dengan cukup cepat. (+1) pada pertanyaannya juga.
kardinal
Saya akan memindahkan pertanyaan ini ke situs statistics.SE. Akan ada tautan yang muncul di bawah pertanyaan di sini yang dapat Anda ikuti ke lokasi baru pertanyaan Anda. Jika Anda perlu bantuan mengaitkan akun pada statistik.SE, Anda dapat menandai pertanyaan Anda untuk diperhatikan moderator, dan seseorang di sana akan membantu.
Zev Chonoles

Jawaban:

22

Saya pikir A dan E bukan kombinasi yang baik, karena A mengatakan Anda harus memilih Mercy dan E mengatakan Anda harus memilih Hope.

A dan D memiliki sifat menganjurkan pilihan yang sama. Tapi, mari kita periksa garis penalaran dalam D secara lebih rinci, karena itu tampaknya menjadi kebingungan. Probabilitas keberhasilan untuk operasi mengikuti pemesanan yang sama di kedua rumah sakit, dengan tipe A yang paling mungkin berhasil dan tipe E yang paling tidak mungkin. Jika kita runtuh (yaitu, mengabaikan) rumah sakit, kita dapat melihat bahwa probabilitas keberhasilan yang paling kecil untuk operasi adalah:

Type     A     B     C     D     E     All  
Prob   .81   .78   .56   .21   .08     .52

Karena E lebih kecil kemungkinannya untuk berhasil, masuk akal untuk membayangkan bahwa itu lebih sulit (walaupun di dunia nyata, kemungkinan lain juga ada). Kita dapat memperluas garis pemikiran itu ke empat tipe lainnya juga. Sekarang mari kita lihat proporsi operasi total masing-masing rumah sakit dari masing-masing jenis:

Type     A     B     C     D     E  
Mercy  .08   .39   .06   .44   .03  
Hope   .09   .54   .23   .09   .05

Apa yang kami perhatikan di sini adalah bahwa Harapan cenderung melakukan lebih banyak operasi AC yang lebih mudah (dan terutama B & C), dan lebih sedikit dari operasi yang lebih sulit seperti D. E sangat jarang di kedua rumah sakit, tetapi, untuk apa nilainya, Harapan sebenarnya melakukan persentase yang lebih tinggi. Meskipun demikian, efek Paradox Simpson sebagian besar akan didorong oleh BD di sini (sebenarnya bukan kolom E seperti pilihan jawaban D yang disarankan).

Paradox Simpson terjadi karena operasi bervariasi dalam kesulitan (secara umum) dan juga karena N berbeda. Ini adalah tingkat dasar yang berbeda dari berbagai jenis operasi yang membuat ini kontra-intuitif. Apa yang terjadi akan mudah dilihat jika kedua rumah sakit melakukan jumlah yang persis sama untuk setiap jenis operasi. Kita dapat melakukannya dengan hanya menghitung probabilitas keberhasilan dan mengalikannya dengan 100; ini menyesuaikan untuk frekuensi yang berbeda:

Type     A     B     C     D     E     All  
Mercy   81    79    60    21    09     250  
Hope    80    76    51    14    04     225

Sekarang, karena kedua rumah sakit melakukan 100 dari setiap operasi (total 500), jawabannya jelas: Belas kasih adalah rumah sakit yang lebih baik.

gung - Reinstate Monica
sumber
+1 Saya bermain dengan pbinom di R saat Anda menjawab ini. :)
Michelle
1
Oh sayang, dalam melihat jawaban Anda, saya menyadari bahwa saya membuat sedikit kesalahan dalam memberikan perincian: Saya percaya A) dan F) menjadi jawabannya, bukan E) karena jelas tidak cocok. Maaf soal itu. Jika Anda berbaik hati meninggalkan komentar lain atau menjawab dengan menjawab F), saya akan dengan senang hati memperbaikinya dan tentu saja menerima tanggapan ini.
swiecki
2
Jadi perbedaan pendapatnya adalah dia mengatakan A & D, dan Anda mengatakan A & F, apakah itu benar? Jika Anda mencoba meyakinkannya untuk memberi Anda poin untuk jawaban Anda, Anda bisa mengatakan bahwa operasi E bukan pendorong utama efeknya, seperti yang saya tunjukkan di atas. OTOH, F sebenarnya bukan jawaban yang baik, F menarik bagi pengakuan fenomena tanpa pemahaman yang solid tentang itu. Karena hanya ada 3 pilihan yang mengadvokasi Mercy (rumah sakit yang tepat) yang meninggalkan A& D. Selain itu, operasi E adalah bagian dari efeknya walaupun itu bukan pengaruh terbesar. Saya akan memilih A & D, tetapi jawabannya dirancang dengan buruk.
gung - Reinstate Monica
1
+1 Ini hanya tentang penjelasan paling jelas yang saya dapatkan tentang paradoks Simpson (terima kasih!). Satu hal yang sangat kecil - di tabel terakhir Anda, saya mendapatkan hasil yang sedikit berbeda untuk kolom terakhir, baris pertama ( github.com/RInterested/SIMULATIONS_and_PROOFS/blob/master/… )
Antoni Parellada
1
@ung Ah! Jadi Anda mengacu pada persentase, bukan bilangan bulat?
Yunani - Proposal Area 51
4

Tidak ada jawaban yang sepenuhnya tidak berdasar. Tetapi mereka SEMUA mengasumsikan pengetahuan eksternal yang signifikan dan tidak dapat dianggap benar berdasarkan statistik.

A, B, D, dan E semuanya memerlukan asumsi tentang faktor-faktor yang menyebabkan pasien memilih satu rumah sakit daripada rumah sakit lainnya; proses di mana dokter dan pasien dicocokkan, sejauh mana tingkat keberhasilan dikaitkan dengan kelas operasi tertentu vs faktor bersama seperti ICU, dan seterusnya.

Di dunia nyata kita dapat secara sah mempertimbangkan banyak faktor alternatif seperti penyedia pembayaran yang diterima secara resmi oleh rumah sakit, sosial ekonomi dan tingkat obesitas di lingkungan itu, apakah ini rumah sakit pendidikan (dalam hal ini tingkat keberhasilan merosot ketika magang baru tiba dan kita harus mempertimbangkan campuran bulanan), dan seterusnya.

Jelas kita dapat dan memang membuat asumsi yang masuk akal tentang faktor-faktor ini, tetapi tanpa secara khusus mengatasi atau mengeluarkan mereka dari masalah, tidak mungkin untuk mengatakan apakah jawaban itu "benar" atau tidak.

Jonathan
sumber
3

@ung memberikan jawaban yang sangat teliti, tetapi ada satu alasan lagi mengapa D adalah jawaban yang benar untuk pertanyaan: Rumah sakit yang lebih baik melakukan lebih banyak operasi yang sulit karena mereka lebih baik. Yaitu, jika seseorang datang ke Rumah Sakit Harapan untuk operasi E (yang paling sulit) mereka dapat mengirimnya ke Mercy karena mereka di Hope tidak tahu bagaimana melakukannya.

Ini bahkan terjadi di dunia nyata, dengan kasus yang paling sulit dikirim ke rumah sakit yang lebih besar atau lebih khusus.

Peter Flom - Pasang kembali Monica
sumber
Bukankah Operasi E yang paling sulit dalam contoh ini? Juga, dalam masalah ini, kita tahu operasi E dilakukan pada Hope dan Mercy karena kami memiliki data tentang mereka.
Jarad
E adalah yang paling sulit, kesalahan saya, tetapi sementara kedua rumah sakit sama-sama melakukan E, mereka tidak melakukan proporsi yang sama dari E. Itu bagian dari alasan itu adalah paradoks.
Peter Flom - Kembalikan Monica