Mengapa ekspresi reguler didefinisikan dengan penyatuan, penggabungan dan operasi bintang?

11

Sebuah expresssion biasa didefinisikan secara rekursif sebagai

$a$ untuk beberapa $a \in \Sigma$ adalah ekspresi reguler,
$\varepsilon$ adalah ekspresi reguler,
$\emptyset$ adalah ekspresi reguler,
$(R_1 \cup R_2)$ mana dan adalah ekspresi reguler adalah ekspresi reguler, $R_1$ $R_2$
$(R_1 \circ R_2)$ mana dan adalah ekspresi reguler adalah ekspresi reguler, $R_1$ $R_2$
$(R_1)^*$ mana adalah ekspresi reguler adalah ekspresi reguler. $R_1$

Definisi ini diambil dari halaman 64 dari

Sipser, Michael. Pengantar Teori Komputasi, edisi ke-3. Cengage Learning, 2012.

Sekarang, saya punya pertanyaan berikut.

Mengapa definisi tersebut tidak mengandung intersection, complementatau reverseoperasi?
Jika kita mengubah item ke-4 menjadi $R_1 \cap R_2$ , apakah kita mendapatkan definisi yang setara, yaitu untuk setiap bahasa reguler, ada ekspresi reguler yang dimodifikasi dan sebaliknya?
Saya tahu bahwa definisi ini lengkap dan terdefinisi dengan baik, tetapi mengapa lebih disukai daripada definisi lain yang setara, terdefinisi dengan baik dan lengkap?

formal-languages regular-languages regular-expressions Ali Shakiba
sumber

2

Harap batasi diri Anda untuk satu pertanyaan per posting.

Raphael

16

1) Jika kita juga mengizinkan persimpangan dan komplemen, maka ekspresi yang dihasilkan kadang-kadang disebut ekspresi reguler yang diperluas; karena bahasa reguler ditutup di bawah operasi boolean tidak ada yang diperoleh oleh mereka. Ini hanya gula sintaksis. Kesimpulan serupa berlaku untuk operasi terbalik. Sebagian alasan mengapa pada contoh pertama semua operasi lain tidak disebutkan adalah tujuan menjaga definisi sesederhana mungkin, sehingga bukti (induktif) tidak harus menangani banyak kasus. Penyebab lain mungkin adalah bahwa jika kita mengizinkan operasi tertentu, tetapi yang lain tidak, dalam beberapa kasus hasil kelas bahasa yang sangat berbeda (tidak teratur), misalnya jika kita mempertimbangkan perluasan ekspresi reguler tanpa operator bintang, maka kita mendapatkan subkelas yang tepat dari yang reguler , yang disebut bahasa bebas bintang atau aperiodik, lihat wikipedia: bahasa bebas bintang .

2) Jika kita menyimpan item 1. - 6. tetapi hanya mengubah item 4. dalam menggunakan persimpangan bukan penyatuan, kita mendapatkan subkelas yang tepat dari bahasa reguler. Sebagai contoh kita tidak bisa lagi menggambarkan bahasa karena akan melibatkan penyatuan dan (lihat bukti di bawah). Jika kita mengizinkan pelengkap, segalanya berubah karena kita memiliki penyatuan kembali oleh hukum DeMorgan. $L = \{a,b\}$ $\{a\}$ $\{b\}$

3) Ini sebagian saya jawab dalam 1), tetapi apa yang Anda maksud ketika Anda mengatakan bahwa definisi ini lebih disukai? Saya tahu definisi di mana 2. dihilangkan (seperti yang kita miliki dengan 6. bahwa ), atau 3. dihilangkan (seperti yang kita miliki )), atau keduanya dihilangkan ; jadi ini bukan definisi seminimal mungkin (itu memberi kita juga beberapa gula sintaksis karena kita memiliki simbol tambahan untuk menggambarkan dan ). $L(\emptyset^{\ast}) = \{\varepsilon\}$ $\emptyset = L(\overline{ X^{\ast} }$ $\{\varepsilon\}$ $\emptyset$

EDIT : Komentar pertama saya yang disebutkan dalam 2) salah, bahasa dalam penutupan induktif di bawah , dan tidak selalu merupakan himpunan bagian dari untuk beberapa , misalnya pertimbangkan . Namun demikian kita memiliki bahwa tidak dapat dijelaskan dengan ungkapan seperti itu. Saya akan memberikan bukti, yaitu saya membuktikan bahwa jika $\circ$ $^{\ast}$ $\cap$ $x^{\ast}$ $x \in X$ $L(a\circ b) = \{ab\}$ $L = \{a,b\}$ $L = L(R)$ untuk beberapa ekspresi dengan item-4 diubah, maka jika (dan karenanya ) Buktinya berjalan dengan induksi pada ekspresi . Untuk kasing pangkalan kosong, sekarang anggap berlaku untuk . Jika $X = \{a,b\}$ $a\ne b$

{Sebuah, b} \subseteq L. \Rightarrow Sebuah b \in L. .

$\{a,b\} \subseteq L \Rightarrow ab \in L.$

R

$R$

L (R_{1}), L (R_{2})

$L(R_1), L(R_2)$

dan

, maka

maka dengan hipotesis induksi kita memiliki

. Jika

L = L (R_{1} \cap R_{2}) = L (R_{1}) \cap L (R_{2})

$L = L(R_1 \cap R_2) = L(R_1) \cap L(R_2)$

{a, b} \subseteq L

$\{a,b\} \subseteq L$

{a, b} \subseteq L (R_{i}), i = 1, 2

$\{a,b\} \subseteq L(R_i), i = 1,2$

a b \in L (R_{1}) \cap L (R_{2})

$ab \in L(R_1) \cap L(R_2)$

kemudian sebagai

kita harus memiliki

dan

atau sebaliknya. Misalkan kasus pertama. Jika

{a, b} \subseteq L (R_{1} \circ R_{2}) = L (R_{1}) L (R_{2})

$\{a,b\} \subseteq L(R_1\circ R_2) = L(R_1)L(R_2)$

a = a \cdot ε = ε \cdot a

$a = a\cdot \varepsilon = \varepsilon\cdot a$

a \in L (R_{1})

$a\in L(R_1)$

ε \in L (R_{2})

$\varepsilon \in L(R_2)$

, maka

dengan hipotesis induksi, maka

. Sekarang anggaplah

, maka kita memiliki

dengan definisi dari

b \in L (R_{1})

$b \in L(R_1)$

a b \in L (R_{1})

$ab \in L(R_1)$

a b = a b \cdot ε \in L (R_{1}) L (R_{2})

$ab = ab\cdot \varepsilon \in L(R_1)L(R_2)$

b \in L (R_{2})

$b \in L(R_2)$

a \cdot b \in L (R_{2}) L (R_{2})

$a\cdot b \in L(R_2)L(R_2)$

. Terakhir jika

, maka

dan

untuk beberapa

. Jika

kita menemukan

L (R_{1}) L (R_{2})

$L(R_1)L(R_2)$

a, b \in L (R_{1}^{*})

$a,b \in L(R_1^{\ast})$

a \in L (R_{1})^{n}

$a \in L(R_1)^n$

b \in L (R_{2})^{m}

$b \in L(R_2)^m$

n, m > 0

$n,m > 0$

n = m = 1

$n = m = 1$

oleh hipotesis induksi, sehingga kira

, tapi ini memberikan

, mirip baik

atau

memberikan

dan hipotesis induksi memberikan

.

a b \in L (R_{1})

$ab \in L(R_1)$

n > 1

$n > 1$

a \in L (R_{1})

$a \in L(R_1)$

m = 1

$m = 1$

m > 1

$m > 1$

b \in L (R_{1})

$b \in L(R_1)$

a b \in L (R_{1}) \subseteq L (R_{1}^{*})

$ab \in L(R_1) \subseteq L(R_1^{\ast})$

◻

$\square$

Keterangan: Satu kesimpulan yang umum digunakan: Jika , maka atau . Ini mengikuti sebagai , karenanya dan atau dan $a = uw$ $u = a$ $w = a$ $1 = |a| = |uw| = |u| + |w|$ $|u| = 0$ $|w| = 1$ $|u| = 1$ . Dalam kasus pertama kita memiliki dan karenanya . $|w| = 0$ $u = \varepsilon$ $a = w$

StefanH
sumber

2

Memang

tidak dalam set bahasa "tidak teratur", tetapi

adalah karena

.

{a, b}

$\{a,b\}$

{a, b}^{*}

$\{a,b\}^{\ast}$

{a, b}^{*} = (a^{*} \circ b^{*})^{*}

$\{a,b\}^{\ast} = (a^{\ast}\circ b^{\ast})^{\ast}$

rici

Ya, kadang-kadang agak sulit untuk melihat apa yang bisa diekspresikan dan apa yang tidak seperti dengan kombinasi bintang yang pintar dan lainnya yang bisa Anda dapatkan cukup jauh.

StefanH

10

Laporan teknis yang memperkenalkan bahasa reguler, ekspresi reguler, dan automata terbatas menanyakan pertanyaan Anda di halaman 70:

Pertanyaan mungkin muncul pada pembaca, mengapa kami memilih tiga operasi tertentu $E\vee F$ , $EF$ , dan $E*F$ ?

(Segera setelah itu, dicatat bahwa $E^*$ adalah operator yang lebih nyaman daripada $E*F$ dan setara dalam kekuasaan. Jadi hari ini, kami menggunakan $E^*$ sebagai gantinya.)

Jawabannya menempati beberapa halaman. Pertama, dikatakan bahwa jawabannya harus dicari apakah bahasa yang dihasilkan membentuk kelas yang menarik dan bagaimana mereka membandingkan dengan bahasa yang dijelaskan dengan cara lain. Pada halaman 72, dikatakan bahwa negasi dan konjungsi itu berlebihan: mereka tidak menambah kekuatan ekspresif. Pada halaman 80 dan selanjutnya, terbukti bahwa bahasa reguler adalah bahasa yang dikenali oleh mesin negara hingga.

Dengan kata lain: Jawaban Stefan dapat dengan aman dianggap konklusif, seperti yang sudah diberikan dalam laporan yang pertama kali memperkenalkan konsep-konsep ini.

reinierpost
sumber

Terima kasih untuk tautannya. Saya selalu menjelaskan kepada siswa saya bahwa operasi adalah abstraksi alami dari urutan pilihan (seperti jika-maka-lain) (instruksi mengikuti satu sama lain) dan iterasi (seperti saat-lakukan). Namun ternyata itu tidak disebutkan oleh Kleene?

Hendrik Jan

Saya hanya seorang lelaki yang mencari artikel Kleene dan terkejut bahwa semua jawaban saya sudah ada di sana. Saya tidak tahu apa-apa lagi. Jadi saya kira jawabannya adalah membaca artikel dan mungkin mencari apa pun yang ditulis Kleene sebelumnya.

reinierpost

4

Dari pemilihan operator ini (penyatuan, gabungan, dan bintang) orang dapat membangun NFA dengan ukuran linier dengan ukuran ekspresi. Di sisi lain, jika Anda menambahkan persimpangan dan komplementasi, ukuran otomat setara dapat meledak secara non-elemen, yang biasanya tidak diinginkan.

doganulus
sumber

Mengapa ekspresi reguler didefinisikan dengan penyatuan, penggabungan dan operasi bintang?

Jawaban: