Bagaimana cara menerapkan teorema Bayes untuk mencari seorang nelayan yang hilang di laut

19

Artikel The Odds, Continuous Updated menyebutkan kisah seorang nelayan Long Island yang benar-benar berutang hidupnya kepada Statistik Bayesian. Ini versi singkatnya:

Ada dua nelayan di atas kapal di tengah malam. Saat satu tertidur, yang lain jatuh ke laut. Kapal terus berjalan bersama dengan autopilot sepanjang malam sampai orang pertama akhirnya bangun dan memberi tahu Coast Guard. Coast Guard menggunakan perangkat lunak yang disebut SAROPS ( Sistem Pencarian dan Penyelamatan Optimal) untuk menemukannya tepat waktu, karena ia hipotermia dan kehabisan energi untuk tetap bertahan.

Ini versi panjangnya: A Speck In The Sea

Saya ingin tahu lebih banyak tentang bagaimana Teorema Bayes sebenarnya diterapkan di sini. Saya menemukan sedikit tentang perangkat lunak SAROPS hanya dengan googling.

Simulator SAROPS

Komponen simulator memperhitungkan data tepat waktu seperti arus laut, angin, dll. Dan mensimulasikan ribuan kemungkinan jalur penyimpangan. Dari jalur drift tersebut, peta distribusi probabilitas dibuat.

Perhatikan bahwa gambar berikut ini tidak merujuk pada kasus nelayan yang hilang yang saya sebutkan di atas, tetapi merupakan contoh mainan yang diambil dari presentasi ini

Probability Map 1 (Merah menunjukkan probabilitas tertinggi; biru terendah) masukkan deskripsi gambar di sini

Perhatikan lingkaran yang merupakan lokasi awal.

Probability Map 2 - Semakin banyak waktu berlalu masukkan deskripsi gambar di sini

Perhatikan bahwa peta probabilitas telah menjadi multimodal. Itu karena dalam contoh ini, beberapa skenario dicatat:

  1. Orang itu mengambang di air - mode top-menengah
  2. Orang itu dalam rakit kehidupan (lebih banyak dipengaruhi oleh angin keluar dari Utara) - mode 2 terbawah (terbagi karena "efek jibing")

Probability Map 3 - Pencarian telah dilakukan di sepanjang jalur persegi panjang berwarna merah masukkan deskripsi gambar di sini Gambar ini menunjukkan jalur optimal yang dihasilkan oleh perencana (komponen lain dari SAROPS). Seperti yang Anda lihat, jalur tersebut dicari dan peta probabilitas telah diperbarui oleh simulator.

hal(gagal)

Efek dari pencarian yang gagal

Di sinilah Bayes 'Theorem masuk untuk bermain. Setelah pencarian dilakukan, peta probabilitas akan diperbarui sesuai sehingga pencarian lain dapat direncanakan secara optimal.

Setelah meninjau Teorema Bayes di wikipedia dan di artikel An Intuitive (and Short) Penjelasan Teorema Bayes di BetterExplained.com

Saya mengambil persamaan Bayes:

P(SEBUAHX)=P(XSEBUAH)×P(SEBUAH)P(X)

Dan mendefinisikan A dan X sebagai berikut ...

  • Peristiwa A: Orang tersebut ada di area ini (sel jaringan)

  • Tes X: Pencarian yang gagal di area itu (sel grid) yaitu Mencari area itu dan tidak melihat apa pun

Menghasilkan,

P(orang di sanagagal)=P(gagalorang di sana)×P(orang di sana)P(gagal)

P(gagal)P(gagal)

Jadi sekarang kita punya,

P(orang di sanagagal)=P(gagal)×P(orang di sana)P(gagal)
  1. Apakah persamaan Bayes diterapkan dengan benar di sini?

  2. Bagaimana penyebutnya, probabilitas pencarian yang gagal, dihitung?

    Juga dalam Sistem Perencanaan Optimal Pencarian dan Penyelamatan , kata mereka

    Probabilitas sebelumnya "dinormalisasi dengan cara Bayesian biasa" untuk menghasilkan probabilitas posterior

  3. Apa artinya "dinormalisasi dalam mode Bayesian normal" ?

    P(gagal)

  4. P(orang di sana)P(orang di sanagagal)

Namun catatan penyederhanaan lainnya - menurut Sistem Perencanaan Optimal Pencarian dan Penyelamatan distribusi posterior sebenarnya dihitung dengan memperbarui probabilitas jalur drift yang disimulasikan, dan KEMUDIAN menghasilkan kembali peta probabilitas grid. Untuk menjaga agar contoh ini cukup sederhana, saya memilih untuk mengabaikan jalur sim dan fokus pada sel-sel grid.

mlai
sumber

Jawaban:

6
  1. Dengan asumsi independensi antara sel-sel grid, maka ya tampaknya Teorema Bayes telah diterapkan dengan benar.
  2. P(X)=P(X|SEBUAH)P(SEBUAH)+P(X|SEBUAHc)P(SEBUAHc)
    SEBUAHcSEBUAHP(X|SEBUAHc)=1
  3. P(SEBUAH|X)
    P(SEBUAH|X)P(X|SEBUAH)P(SEBUAH)P(SEBUAHc|X),P(X|SEBUAHc)P(SEBUAHc), dan P(SEBUAH|X)+P(SEBUAHc|X)=1
    P(X)
  4. sayaSEBUAHsayasayaXsayasayaX

    • sayaP(SEBUAHsaya|X)=1
    • P(SEBUAHsaya|X)=P(SEBUAHsaya|Xsaya)P(Xsaya|SEBUAHsaya)P(SEBUAHsaya)P(SEBUAHsaya|X)P(SEBUAHsaya)P(SEBUAHsaya|X)

    P(SEBUAHsaya|X) dan memperbarui peta yang sesuai.

jaradniemi
sumber
sayaP(SEBUAHsaya|X)=1P(X|SEBUAH)P(SEBUAH)sayaP(X|SEBUAH)P(SEBUAHsaya)
Saya baru menyadari bahwa mencari setiap sel dengan probabilitas kegagalan yang tetap akan menghasilkan sama sekali tidak ada perubahan di antara distribusi probabilitas :)
mlai
P(X|SEBUAH)P(SEBUAHsaya)P(SEBUAHsaya)
4

Saya diarahkan ke sebuah buku yang memiliki seluruh bab yang didedikasikan untuk pertanyaan saya - Analisis Operasi Angkatan Laut - oleh seorang mantan profesor yang pernah menjadi pilot helikopter dan telah benar-benar melakukan misi pencarian dan penyelamatan, tidak kurang!

Dalam bab 8 contoh disediakan sesuatu seperti ini (saya sedikit mengubahnya):

Untuk mulai dengan, ada distribusi sebelum grid untuk lokasi orang hilang, kapal, dll.

Distribusi sebelumnya: Distribusi sebelumnya

Pencarian dilakukan pada bagian dari grid dan probabilitas diperbarui dengan distribusi posterior dinormalisasi dengan menerapkan persamaan Bayes dengan cara yang sama yang saya sebutkan dalam pertanyaan saya:

P(target dalam (i, j)tidak ada deteksi)=P(tidak ada deteksitarget dalam (i, j))×P(target dalam (i, j))P(tidak ada deteksi)

dimana (i, j) = (lat, panjang)

Dalam hal ini, saya memutuskan untuk mencari kolom 3 karena kolom itu memiliki probabilitas sebelum total terbesar .

Distribusi posterior yang dinormalisasi setelah mencari kolom ketiga w / pFail = 0.2: Distribusi posterior yang dinormalisasi (dengan probabilitas kegagalan = 0,2)

Pertanyaan saya terutama tentang bagaimana posterior dinormalisasi. Inilah cara melakukannya dalam buku ini - cukup bagi setiap probabilitas posterior individu dengan jumlah total , S :

uraian gambar; kesan

Saya memilih probabilitas 0,2 dari pencarian yang gagal karena profesor saya mengatakan ini, "Kami hanya mencari hingga 80% kemungkinan deteksi karena itu biasanya merupakan tradeoff terbaik antara ketepatan waktu dan akurasi."

Hanya untuk iseng, saya menjalankan contoh lain dengan pFail 0,5. Sedangkan dalam contoh pertama ( pFail = 0,2), rute pencarian terbaik berikutnya (mengingat posterior dinormalisasi dan asumsi pencarian garis lurus, tidak ada diagonal atau zig-zag) akan terbang di atas kolom 2, dalam contoh kedua ( pFail = 0.5) rute terbaik berikutnya adalah melewati baris 2.

Distribusi posterior yang dinormalisasi setelah mencari kolom ketiga w / pFail = 0,5: Distribusi posterior eNormalisasi (dengan probabilitas kegagalan = 0,5)

masukkan deskripsi gambar di sini

Dia juga menambahkan, "Pesawat membawa checklist kecil bersama mereka untuk membantu menentukan ketinggian dan kecepatan udara terbaik. Mengerjakan ini dengan helikopter terbang seperti duduk di atas mesin cuci, membaca buku yang dilekatkan ke mesin cuci yang berbeda."

mlai
sumber