Baru-baru ini saya belajar tentang dugaan serakah untuk Masalah Superstring Terpendek .
Dalam masalah ini, kita diberi satu set string dan kami ingin menemukan terpendek superstring yaitu sehingga setiap muncul sebagai substring dari .
Masalah ini NP-hard dan setelah kertas yang panjang, algoritma pendekatan yang paling dikenal untuk masalah ini memiliki rasio [Paluch '14].
Dalam praktiknya, ahli biologi menggunakan algoritma Greedy berikut:
Pada setiap langkah, gabungkan dua string yang memiliki tumpang tindih maksimum pada semua pasangan (akhiran maksimum yang merupakan awalan dari string lain), dan ulangi pada instance baru ini hingga hanya ada satu string yang tersisa (yang merupakan superstring dari semua string input) )
Batas bawah dalam rasio pendekatan Algoritma Greedy ini dapat diperoleh dari input .
perkiraan untuk Masalah Superstring Terpendek. Saya sangat terkejut melihat bahwa algoritma yang alami dan mudah seperti itu sangat sulit untuk dianalisis.
Adakah intuisi, fakta, pengamatan, contoh yang menunjukkan mengapa pertanyaan ini begitu menantang?
sumber
Jawaban:
Pertama-tama saya coba meringkas apa yang diketahui tentang dugaan serakah.
Saya pikir salah satu alasan mengapa sulit untuk membuktikan dugaan serakah mungkin sebagai berikut. Sebagian besar pendekatan untuk membuktikan jaminan aproksimasi dari Greedy Algorithm menganalisis grafik tumpang tindih (atau, ekuivalen, grafik awalan) dari set input string. Kita hanya tahu beberapa properti dari grafik ini (seperti ketidaksetaraan Monge dan Triple), tetapi properti ini terbukti tidak cukup untuk membuktikan dugaan serakah ( Weinard, Schnitger ; Laube, Weinard ).
sumber