Apakah ada peningkatan pada algoritma Dana Angluin untuk mempelajari perangkat reguler

Dalam makalah seminalinya tahun 1987, Dana Angluin menyajikan algoritma waktu polinomial untuk mempelajari DFA dari pertanyaan keanggotaan dan pertanyaan teori (contoh tandingan terhadap proposal DFA).

Dia menunjukkan bahwa jika Anda mencoba mempelajari DFA minimal dengan status, dan contoh balasan terbesar Anda adalah panjang , maka Anda perlu membuat kueri keanggotaan dan paling banyak teori-kueri. $n$ $m$ $O(mn^2)$ $n - 1$

Apakah ada peningkatan signifikan pada jumlah pertanyaan yang diperlukan untuk mempelajari satu set reguler?

Referensi dan Pertanyaan Terkait

Dana Angluin (1987) "Mempelajari Kumpulan Reguler dari Kueri dan Tandingan", Infortmation and Computation 75: 87-106
Batas bawah untuk belajar dalam kueri keanggotaan dan model kontra-contoh

algorithms learning-theory machine-learning Artem Kaznatcheev
sumber

Semoga, @DominikFreydenberger mampir di beberapa titik di masa depan. Dia akan tahu.

Raphael

Saya curiga @LevReyzin akan tahu jawabannya juga ... dan itulah mengapa saya awalnya mempertimbangkan untuk bertanya pada cstheory, tapi saya kira saya harus membantu mengembangkan situs baru ini.

Artem Kaznatcheev

Bukan jawaban untuk pertanyaan itu, tetapi mungkin masih bisa membantu: [ citeulike.org/user/erelsegal-halevi/article/9275508 Kernel Universal untuk Mempelajari Bahasa Reguler]

Erel Segal-Halevi

terima kasih untuk tautannya @Erel, tapi saya tidak mengerti bagaimana hubungannya. Kernel universal Kontorovich tidak dapat dihitung secara efisien, dan model pembelajarannya tidak memiliki contoh tandingan.

Artem Kaznatcheev

Jawaban:

Dalam jawabannya di cstheory.SE, Lev Reyzin mengarahkan saya ke tesis Robert Schapire yang meningkatkan keterikatan dengan pertanyaan keanggotaan di bagian 5.4.5. Jumlah kueri counterexample tetap tidak berubah. Algoritma yang digunakan Schapire berbeda dalam apa yang dikerjakannya setelah kueri berulang kali. $O(n^2 + n\log m)$

Sketsa perbaikan

Pada level tertinggi, Schapire memaksa dari algoritma Angluin untuk memiliki kondisi ekstra yaitu untuk yang tertutup dan masing-masing jika lalu . Ini menjamin bahwa $(S,E,T)$ $(S,E,T)$ $s_1, s_2 \in S$ $s_1 \neq s_2$ $row(s_1) \neq row(s_2)$ dan juga membuatpropertikonsistensidari algoritma Angluin sepele untuk dipenuhi. Untuk memastikan hal ini, ia harus menangani hasil dari sebuah sampel tandingan secara berbeda. $|S| \leq n$

Mengingat counterexample , Angluin hanya menambahkan dan semua prefiks untuk . Schapire melakukan sesuatu yang lebih halus oleh bukannya menambahkan satu elemen untuk . baru ini akan membuat menjadi tidak tertutup dalam pengertian Angluin dan pembaruan untuk mendapatkan penutupan dengan memperkenalkan setidaknya satu string baru ke sambil menjaga semua baris berbeda. Kondisi pada adalah: $z$ $z$ $S$ $e$ $E$ $e$ $(S,E,T)$ $S$ $e$

\exists s, s^{'} \in S, Sebuah \in Σ st r Hai w (s) = r Hai w (s^{'} Sebuah) dan Hai (δ (q_{0}, s e)) \neq Hai (δ (q_{0}, s^{'} Sebuah e))

$\exists s, s' \in S, a \in \Sigma \quad \text{s.t} \quad row(s) = row(s'a) \; \text{and} \; o(\delta(q_0,se)) \neq o(\delta(q_0,s'ae))$

Di mana adalah fungsi output, adalah status awal, dan aturan pembaruan dari DFA 'tidak dikenal' yang sebenarnya. Dengan kata lain, harus berfungsi sebagai saksi untuk membedakan masa depan dari . $o$ $q_0$ $\delta$ $e$ $s$ $s'a$

Untuk mengetahui ini dari kami melakukan pencarian biner untuk mencari substring sedemikian rupa sehingga dan sedemikian rupa sehingga perilaku mesin dugaan kami berbeda berdasarkan pada satu karakter input. Secara lebih rinci, kita membiarkan menjadi string yang sesuai dengan keadaan yang dicapai dalam mesin dugaan kita dengan mengikuti . Kami menggunakan pencarian biner (ini adalah tempat $e$ $z$ $r_i$ $z = p_ir_i$ $0 \leq |p_i| = i < |z|$ $s_i$ $p_i$ $\log m$ berasal dari) untuk menemukan sedemikian sehingga . Dengan kata lain, membedakan dua menyatakan bahwa mesin menduga kami menemukan setara dan dengan demikian memenuhi kondisi pada , jadi kami menambahkannya ke . $k$ $o(\delta(q_0,s_kr_k)) \neq o(\delta(q_0,s_{k+1}r_{k+1})$ $r_{k+1}$ $e$ $E$

Artem Kaznatcheev
sumber

Saya tidak tahu apakah jawaban saya masih relevan. Baru-baru ini telah dijelaskan implementasi algoritma baru yang disebut Paket Pengamatan atau dalam beberapa keadaan Pohon Diskriminasi oleh Falk Howar. Algoritma ini seperti L * tetapi menggunakan Rivest-Shapire atau metode lain (lihat Steffen dan Isberner) untuk menangani dekomposisi counterexample; dan menggunakan struktur data, pohon diskriminasi (pohon biner) untuk membuat efisien "sift" yaitu penyisipan transisi-A (di mana A adalah setiap simbol alfabet) dari keadaan baru yang ditemukan hingga tidak ada penutupan. . Algoritma ini ada dalam dua versi: OneGlobally dan OneLocally sesuai dengan apakah sufiks yang ditemukan dalam dekomposisi ditambahkan ke masing-masing komponen atau tidak (rasio di balik algoritma adalah bahwa semua awalan dalam komponen setara dengan awalan pendek dan mewakili keadaan yang sama dalam target sesuai dengan akhiran yang ditemukan saat ini. Kemudian dengan counterexample baru akhiran baru ditemukan yang membedakan setidaknya 2 awalan dari komponen yang sama. Hal ini menyebabkan perpecahan komponen itu dalam dua komponen). Dengan OneLocally ada kueri keanggotaan yang jauh lebih sedikit tetapi jumlah kueri kesetaraan dapat meningkat secara drastis dengan DFA target besar. Sebaliknya OneGlobally memiliki jumlah kueri keanggotaan yang selalu lebih rendah dari L * (tetapi lebih besar dari OneLocally) dan jumlah kueri setara yang serupa dengan L * Kemudian dengan counterexample baru ditemukan suffix baru yang membedakan setidaknya 2 prefix dari komponen yang sama. Ini menyebabkan pemisahan komponen itu menjadi dua komponen). Dengan OneLocally ada kueri keanggotaan yang jauh lebih sedikit tetapi jumlah kueri kesetaraan dapat meningkat secara drastis dengan DFA target besar. Sebaliknya OneGlobally memiliki jumlah kueri keanggotaan yang selalu lebih rendah dari L * (tetapi lebih besar dari OneLocally) dan jumlah kueri setara yang serupa dengan L * Kemudian dengan counterexample baru ditemukan suffix baru yang membedakan setidaknya 2 prefix dari komponen yang sama. Ini menyebabkan pemisahan komponen itu menjadi dua komponen). Dengan OneLocally ada kueri keanggotaan yang jauh lebih sedikit tetapi jumlah kueri kesetaraan dapat meningkat secara drastis dengan DFA target besar. Sebaliknya OneGlobally memiliki jumlah kueri keanggotaan yang selalu lebih rendah dari L * (tetapi lebih besar dari OneLocally) dan jumlah kueri setara yang serupa dengan L *

Saya tahu ada juga algoritma lain: Algoritma TTT yang lebih baik dari Paket Observasi juga, tetapi saya tidak memiliki pengetahuan yang baik tentang itu. AlgoritmaTTT haruslah canggih

Umbert
sumber

Terima kasih atas jawaban ini! Apakah Anda memiliki referensi makalah untuk algoritma Howar dan untuk TTT?

Artem Kaznatcheev

Ini untuk tautan Observation Pack Howar dan ini untuk tautan algoritme TTT TTT Anda dapat menemukan implementasinya di LearLib (Paket Observasi disebut disana Pohon Diskriminasi)

Umbert