DFA minimal yang memuaskan tampilan bahasa yang terbatas

12

Katakanlah seseorang memiliki bahasa , tetapi orang tidak tahu string apa yang sebenarnya bagian dari bahasa tersebut. Semua yang dimiliki adalah pandangan terbatas bahasa: seperangkat string terbatas A L yang dikenal dalam bahasa tersebut, dan seperangkat string terbatas B ( Σ L ) yang diketahui tidak berada dalam bahasa.LΣALB(ΣL)

Sebagai contoh, katakanlah saya memiliki dan B = { b , a a b , a a a b a } . Saya mungkin memiliki bahasa L = { a 2 i + 1 b j | i , j N } , karena AA={ab,aaab,aaaaabb}B={b,aab,aaaba}L={a2i+1bj | i,jN}Adan B konsisten dengan L , atau saya mungkin memiliki bahasa yang sama sekali berbeda.

Pertanyaan saya adalah: apakah ada cara yang diketahui untuk membuat DFA (deterministic finite automata) yang menerima string dalam A dan menolak string dalam B , dengan jumlah minimal atau hampir-hampir minimal negara? Apa kerumitan masalah ini? Seberapa baik dalam mendekati L (dengan asumsi L memiliki kompleksitas deskriptif yang cukup rendah, dan A dan B besar)?

Pertanyaan asli di math.stackexchange.com. Saya memutuskan untuk mem-posting ulang di sini setelah tidak mendapatkan jawaban pada pertanyaan awal, dan tidak tahu ke mana harus mencari mereka. Jika seseorang dapat mengarahkan saya ke penelitian di bidang ini, itu akan sangat dihargai.

Francisco Mota
sumber
2
Jawaban Lev yang ditulis dengan baik untuk pertanyaan yang saya tautkan sudah mencakup hal-hal yang tidak dapat diperkirakan.
Tsuyoshi Ito
6
Saya juga menulis posting blog yang lebih rinci daripada jawaban asli saya cstheory.blogoverflow.com/2011/08/on-learning- regular
Lev Reyzin
1
Saya gagal melihat perbedaan antara "versi Anda" dan hasil yang tidak dapat diperkirakan yang dikutip dalam jawabannya. Selain itu, saya gagal melihat hubungan antara "versi Anda" dan "sebaliknya."
Tsuyoshi Ito
1
AB

Jawaban:

0

Sepertinya saya bahwa Anda dapat menggunakan penyempurnaan kesetaraan Myhill-Nerode untuk masalah ini.

x Σ u x A v x B A B u vuvxΣuxAvxBABuv

Itu sudah cukup untuk mempelajari hubungan ini lebih prefiks dari unsur dan . Ini akan memberi Anda batas bawah pada jumlah negara yang Anda butuhkan. Saya tidak yakin itu secara langsung memberi Anda cara untuk membangun otomat minimal, tetapi setidaknya jalan untuk dijelajahi.BAB

Denis
sumber
-1

Saya pikir masalah ini mungkin secara tidak tepat diungkapkan oleh si penanya. Si penanya rupanya menginginkan algoritma yang menggeneralisasikan kata-kata tak terbatas berdasarkan contoh-contoh kata terbatas tertentu, dengan menggunakan semacam induksi mekanis, yaitu mengenali pola-pola nyata dalam contoh-contoh.

Selain beberapa penelitian teori CS yang dikutip dalam komentar, ada juga beberapa penelitian lebih empiris di bidang ini misalnya di bawah ini, menggunakan JST untuk membuat FSM dari contoh. Catatan satu selalu dapat menjalankan algoritma minimalisasi DFA standar pada hasilnya. Perpustakaan AT&T FSM baik untuk bekerja di area ini.

Penanya tidak spesifik tentang domain masalahnya, yang dapat membantu memahami struktur contoh dan mendapatkan referensi yang lebih spesifik. Namun, satu contoh yang dapat dilihat adalah algoritma AI dalam game yang menggunakan algoritma FSM. Saya menduga ada beberapa kasus di mana FSM dipelajari dari contoh menggunakan algoritma pembelajaran.

[1] Mempelajari kelas mesin negara berhingga besar dengan jaringan saraf berulang C. Lee Giles, 1, BG Horne, T. Lin 1995

[2] Mempelajari FSM dengan jaringan berulang pengelompokan mandiri oleh Zeng & Smyth 1993

[3] Perpustakaan AT&T FSM

vzn
sumber
1
tautan kedua Anda hanya tautan ke pertanyaan ini. Di mana seharusnya tautan?
Artem Kaznatcheev
oops, thx, fix
vzn