Batas pada ukuran NFA terkecil untuk L_k-berbeda

18

Pertimbangkan bahasa Lkdistinct yang terdiri dari semua k -surat string lebih Σ sehingga tidak ada dua huruf yang sama:

Lkdistinct:={w=σ1σ2...σki[k]:σiΣ  and  ji:σjσi}

Bahasa ini terbatas dan karenanya teratur. Khususnya, jika |Σ|=n , lalu.|Lkdistinct|=(nk)k!

Apakah otomat terbatas non-deterministik terkecil yang menerima bahasa ini?

Saat ini saya memiliki batasan longgar atas dan bawah:

  • NFA terkecil yang dapat saya buat memiliki menyatakan.4k(1+o(1))polylog(n)

  • Lemma berikut menyiratkan batas bawah status :2k

Biarkan LΣ menjadi bahasa biasa. Misalkan ada n pasangan P={(xi,wi)1in} sehingga xiwjL jika dan hanya jika i=j . Maka setiap NFA yang menerima L memiliki setidaknya n status.

  • Batas bawah (sepele) lainnya adalah log(nk) , yang merupakan log dengan ukuran DFA terkecil untuk bahasa tersebut.

Saya juga tertarik pada NFA yang hanya menerima sebagian kecil ( 0<ϵ<1 ) dari Lkdistinct , jika ukuran automaton lebih kecil dari ϵ4k(1+o(1))polylog(n) .


Sunting: Saya baru saja memulai karunia yang memiliki kesalahan dalam teks.

Maksud saya, kita dapat mengasumsikan k=polylog(n) sementara saya menulis k=O(log(n)) .

Sunting2:

Karunia akan segera berakhir, jadi jika ada yang tertarik dengan cara yang mungkin lebih mudah untuk mendapatkannya, pertimbangkan bahasa berikut:

L(r,k)distinct:={w:w berisi k simbol yang berbeda dan tidak ada simbol yang muncul lebih dari r kali } .

(Yaitu L(1,k)distinct=Lkdistinct ).

Konstruksi yang mirip dengan yang ada di komentar memberikan otomat berukuran untuk .O(ek2klog(1+r)poly(n))L(r,k)distinct

Bisakah ini diperbaiki? Apa batas bawah terbaik yang bisa kami tunjukkan untuk bahasa ini?

BPR
sumber
2
Bisakah Anda menggambarkan NFA batas atas Anda?
mjqxxxx
Saya belum bisa menulisnya karena kami masih mengerjakannya, dan belum menyelesaikan buktinya. Sebagai gantinya, saya akan menjelaskan otomat yang jauh lebih sederhana dari ukuran : Ambil keluarga hash sempurna . Setiap hash tersebut adalah fungsi . Ini berarti bahwa untuk setiap subset dari ukuran paling banyak , ada fungsi sehingga memetakan setiap item dari subset ke nomor yang berbeda. Setelah hashing, alfabet yang dihasilkan memiliki huruf , karenanya autumaton ukuran dapat menerima bahasa . O((2e)k2O(log(k))log(n))(n,k)Hh:[n][k][n]khHk2kLkdistinct
BPR
4
Batas bawah memberi hanya menghitung jumlah status bahwa NFA dapat berada setelah persis langkah . Saya tidak berpikir bahwa saya mengetahui adanya metode pembuktian yang memberikan batasan yang jauh lebih baik untuk ukuran total daripada apa yang bisa diperoleh daripada hanya dengan melihat apa yang terjadi setelah langkah , untuk beberapa . Tapi di sini, untuk setiap ada NFA yang hanya bisa berada dalam satu setelah persis menyatakan. (2o(1))kk/2ttt(2+o(1))kt
Noam
3
Bukti (dari klaim saya sebelumnya): Kasus tersulit adalah ; memilih yang berbeda subset acak (dari simbol alfabet) ukuran persis masing-masing dan membangun sebuah NFA yang memiliki negara untuk setiap dengan beberapa jalan menuju ke sana IFF pertama simbol semua berbeda dan yang terkandung dalam , dan memiliki jalur menerima dari itu IFF berikut simbol semua berbeda dan yang terkandung dalam komplemen dari . Argumen penghitungan akan menunjukkan whp (atas pilihan acakt=k/22kpoly(k,logn)SintitSiktSiSiNFA ini memang akan menerima semua bahasa yang diinginkan.
Noam
3
Dalam konstruksi sebelumnya, cara paling sederhana untuk membangun NFA akan memiliki status untuk setiap kemungkinan awalan panjang dan untuk setiap akhiran panjang yang mungkin . Sebaliknya, bagian awalan dan bagian akhiran dari NFA dapat dibangun secara rekursif menggunakan konstruksi acak yang sama (tapi masing-masing sekarang hanya dalam dan pelengkapnya) dan ini akan memberikan ukuran total . j<tj>ktSi(4+o(1))k
Noam

Jawaban:

2

Ini bukan jawaban tetapi metode yang saya percaya akan meninggalkan batas bawah yang lebih baik. Mari kita memotong masalah setelah surat yang dibaca. Menunjukkan keluarga unsur set oleh dan keluarga elemen set oleh . Nyatakan status yang dapat dijangkau setelah membaca elemen (dalam urutan apa pun) oleh dan status dari mana status penerima dapat dicapai setelah membaca elemen (dalam urutan apa pun) oleh . Kita membutuhkan jika dan hanya jikaaa[n]Ab=ka[n]BASABTBSATBAB= . Ini sudah memberikan batas bawah untuk jumlah negara yang diperlukan dan saya pikir itu bisa memberikan sesuatu yang non-sepele.

Masalah ini pada dasarnya meminta batas bawah pada jumlah simpul dari sebuah hypergraph yang grafik garisnya (sebagian) diketahui. Masalah serupa dipelajari misalnya, oleh Bollobas dan ada beberapa metode bukti yang diketahui yang dapat berguna.

Pembaruan 2014.03.24: Sebenarnya jika hypergraph di atas dapat direalisasikan pada simpul , maka kita juga mendapatkan protokol kompleksitas komunikasi non-deterministik panjang untuk mengatur disjointness dengan input set ukuran dan (sebenarnya keduanya masalahnya setara). Kemacetan tentu saja ketika , untuk ini saya hanya bisa menemukan yang berikut dalam buku Eyal dan Noam: dibuktikan oleh argumen probabilistik standar. Sayangnya saya tidak bisa (belum) menemukan batas bawah yang cukup baik pada masalah ini tetapi dengan asumsi di atas tajam, itu akan memberikan batas bawahslogsaba=b=k/2N1(DISJa)log(2kloge(na))Ω(2klogn) menyatukan dua batas bawah yang telah Anda sebutkan.

domotorp
sumber
1
Terima kasih @domotorp atas jawaban Anda. Ini tampaknya sangat mirip dengan bukti lemma yang saya gunakan untuk batas bawah dalam pertanyaan awal, tetapi tanpa menentukan dan , dan dengan demikian bukan batas yang dapat dihitung. Komentar Anda pada pertanyaan di atas menunjukkan bahwa ikatan tidak dapat ditingkatkan dengan metode itu, apakah menurut Anda ini bisa lebih baik? xiyi2k
RB
3
Inti dari komentar saya di atas adalah bahwa teknik-teknik ini tidak dapat memberikan batas bawah di atas . Inilah yang membuat masalah ini menarik bagi saya. (2+o(1))k
Noam
@Noam: Misalkan k = 2, a = b = 1. Sudah maka kita mendapatkan batas bawah karena setiap harus berbeda. lognSA
domotorp
1
@domotorp: The menyembunyikan faktor : Berikut adalah analisis untuk kasus terburuk di mana : Mulai dengan dan tetap dan pilih secara acak subset dari huruf maka kita memiliki . Sekarang pilih set seperti itu secara acak maka probabilitas bahwa untuk setidaknya satu dari ini terjadi adalah . Jika kita memilih maka kita mendapatkan whp ini demikian untuk SEMUA set saling terpisah dan (ukurano(1)O(klogn)a=b=k/2ABSnPr[ASandBSc]=2kr2k1exp(r)r=O(log(nk))=O(klogn)ABk/2). Jumlah total seperti dalam konstruksi ini adalah . SO(2kklogn)
Noam
2
@Noam: Saya minta maaf tapi saya belum pernah melihat disembunyikan di dalam , terutama karena masalah ini juga menarik imho untuk . Tetapi Anda benar bahwa BPR bertanya tentang . logno(1)k<<lognk=polylogn
domotorp
0

Beberapa pekerjaan dalam proses:

Saya mencoba membuktikan batas bawah . Berikut adalah pertanyaan yang saya yakin akan memberikan batas yang lebih rendah: temukan minimum sehingga ada fungsi yang menjaga disjointness, yaitu iff . Saya cukup yakin bahwa batas bawah akan segera menyiratkan batas bawah untuk masalah kita. kasar sesuai dengan set node yang NFA dapat dapatkan setelah membaca simbol pertama dari input, ketika himpunan4ktf:{S[n],|S|=k/2}{0,1}tS1S2=f(S1)f(S2)=t2k22k=4kf(S)k/2k/2simbol adalah .S

Saya pikir solusi untuk pertanyaan ini mungkin sudah diketahui, baik dalam literatur kompleksitas komunikasi (terutama dalam makalah yang berurusan dengan masalah ketidakjelasan; mungkin beberapa argumen peringkat matriks akan membantu), atau dalam literatur tentang pengkodean (misalnya seperti ini ).

pangsit mobius
sumber
2
Komentar saya di atas menunjukkan bahwa pendekatan ini tidak dapat mengalahkan(2+o(1))n
Noam