Apa cara tercepat untuk memeriksa set inklusi?

24

Diberikan himpunan bagian dari . $n$ $S_1,\ldots,S_n$ $\{1,\ldots,d\}$

Periksa apakah ada set dengan . (Jika demikian, cari contoh, jika tidak, katakan saja "tidak") $S_i,S_j$ $S_i \subsetneq S_j$

Solusi sepele untuk masalah ini melewati semua pasangan set dan memeriksa inklusi untuk pasangan dalam waktu , sehingga runtime keseluruhan adalah . Bisakah masalah ini diselesaikan lebih cepat? Apakah ada nama untuknya dalam literatur? $O(d)$ $O(n^2 d)$

ds.algorithms reference-request Karl
sumber

27

Anda tidak dapat menyelesaikannya dalam waktu untuk konstanta kecuali Hipotesis Waktu Eksponensial Kuat salah. $O(n^{2-\epsilon})$ $\epsilon>0$

Yaitu, jika kita memiliki algoritma seperti itu, kita bisa menyelesaikan -variable CNF Satisfiability di waktu untuk beberapa . Alasannya adalah bahwa kita bisa membagi variabel dalam dua bagian yang sama dan dari variabel masing-masing. Untuk setiap bagian, kami membuat keluarga dan masing-masing subset dari klausa dengan cara berikut. Untuk setiap penugasan, kami menambahkan subset yang terdiri dari klausa yang tidak dipenuhi oleh penugasan. Konstruksi ini berjalan dalam waktu. $n$ $O((2-\epsilon')^{n})$ $\epsilon'>0$ $P_1$ $P_2$ $n/2$ $F_1$ $F_2$ $poly(n)2^{n/2}$

Untuk menyelesaikan konstruksi, kami mencatat bahwa instance CNF asli memiliki solusi jika ada subset di yang terpisah untuk beberapa subset di . $F_1$ $F_2$

Menambahkan beberapa elemen tambahan ke set ground Anda selain yang untuk setiap klausa, tidak terlalu sulit untuk menyematkan masalah keterputusan ini sebagai masalah inklusi set. Anda pada dasarnya mengambil pelengkap dari subset di . Untuk memastikan dua set di tidak dihitung sebagai penyertaan, Anda menambahkan kode dari anti-rantai pada elemen tambahan. Kode anti-rantai lain (pada elemen tambahan lainnya dari set ground) digunakan pada himpunan bagian dari untuk memastikan tidak ada pasangan himpunan bagian dari membentuk penyertaan. Akhirnya, semua set yang terbentuk dari mencakup semua elemen anti-rantai . $F_1$ $F_1$ $F_2$ $F_2$ $F_1$ $F_2$

Ini adalah set pertanyaan inklusi pada himpunan pada himpunan ground . Argumen pada dasarnya kembali ke beberapa makalah awal Ryan Williams (tidak ingat yang mana). $2^{n/2+1}$ $d=poly(n)$

Andreas Björklund
sumber

Terima kasih banyak atas jawaban cepatnya. Kami bahkan memiliki , jika kami menggunakan Lemma Sparsifikasi terlebih dahulu, kan?

d = O (n)

$d = O(n)$

Karl

9

Jika Anda tertarik untuk menetapkan keluarga dengan , maka solusi lain secara konseptual sangat mirip dengan yang diuraikan dalam jawaban Yuval adalah untuk menghitung transformasi zeta $n = \omega(2^{d/2})$

f ζ (T) = \sum_{S \subseteq T} f (S),

$f\zeta(T) = \sum_{S \subseteq T} f(S)\,,$

di mana adalah fungsi indikator dari keluarga input . Yaitu, jika dan sebaliknya. Jelas ada set sehingga jika dan hanya jika untuk beberapa . $f \colon 2^{[d]} \to \mathbb{R}$ $\mathcal{F} = \{ S_1, S_2, \dotsc, S_n \}$ $f(S) = 1$ $S \in \mathcal{F}$ $f(S) = 0$ $S_i \not= S_j$ $S_i \subseteq S_j$ $f\zeta(S) > 1$ $S \in \mathcal{F}$

Transformasi zeta dapat dihitung dalam waktu menggunakan algoritma Yates, lihat misalnya TAOCP Knuth, vol. 2, §4.6.4. Algoritme itu sendiri adalah pemrograman dinamis yang cukup mudah, dan mudah untuk memodifikasinya untuk memberikan contoh set yang disertakan jika ada. $O(d2^d)$

Janne H. Korhonen
sumber

Ini jauh lebih sederhana daripada jawaban saya!

Yuval Filmus

8

Masalah ini dapat diatasi dengan menggunakan algoritma untuk perkalian matriks cepat, dan saya juga menduga itu secara komputasi setara dengan perkalian matriks (meskipun saya tidak tahu cara untuk membuktikan ini, dan saya tidak berpikir teknik untuk membuktikan ini ada ). Solusi ini akan memiliki waktu berjalan O (n ^ {2.373}) ketika n = d, dan waktu berjalan lainnya untuk hubungan lain antara d dan n.

Inilah cara Anda menyelesaikannya menggunakan perkalian matriks: Anda menulis vektor karakteristik dari himpunan di baris n oleh d matriks A, dan vektor karakteristik dari komplemen himpunan himpunan di kolom iklan dengan n matriks B. Anda lalu kalikan A dengan B. Pasangan set yang berpotongan persis lokasi produk A * B yang sama dengan nol.

Untuk waktu berjalan terbaik yang diketahui untuk masalah ini, lihat kertas Huang dan Pan pada subjek. Jika saya ingat dengan benar, ketika d menjadi cukup besar, waktu berjalan akan menjadi O (nd) yang jelas-optimal. Untuk n = d, Anda akan memiliki waktu berjalan O (n ^ {2.373}). Untuk relasi n dan d lainnya, Anda akan mendapatkan nilai lain. Jika algoritma optimal untuk perkalian matriks persegi panjang ada, Anda akan mendapatkan algoritma dengan waktu berjalan O (n ^ 2 + nd) untuk masalah Anda. Saya kira tidak ada cara yang lebih baik dari ini untuk menyelesaikan masalah Anda, tetapi saya masih jauh dari yakin.

Solusi ini mungkin tidak praktis digunakan, karena konstanta dari algoritma ini terlalu besar. Algoritma Strassen mungkin memberikan peningkatan atas solusi naif untuk nilai wajar n dan d, tapi saya bahkan tidak yakin tentang itu. Namun, masalah yang tampaknya sangat terkait dengan perkalian matriks tampaknya jarang memiliki algoritma kombinatorial yang lebih baik daripada algoritma naif (oleh lebih dari faktor polylogaritmik), jadi jika saya harus menebak, saya akan menebak bahwa tidak ada algoritma yang baik untuk masalah Anda yang secara signifikan lebih baik daripada yang naif, menggunakan teknik saat ini.

Elad
sumber

6

Jika maka kita tahu bahwa himpunan itu bukan antikimia oleh lemma Sperner, dan versi keputusan dari masalah menjadi sepele. Tetapi mungkin menarik untuk mempertimbangkan kasus di mana $n > \binom{d}{d/2} \approx \frac{2^d}{\sqrt{\pi d/2}}$ $n$ dekat dengan nilai itu.

Pekerjaan Friedgut ini pada Erdös-Ko-Rado teorema menunjukkan bahwa mengingat karakteristik vektor dari keluarga himpunan bagian dari , satu dapat menemukan di waktu apakah adalah keluarga berpotongan (setiap dua unsur memotong). Lebih umum, metodenya memungkinkan kita untuk menghitung dimana $f$ $[m]$ $O(m2^m)$ $f$ $f$

Σ = \sum_{x, y \in f} S (x, y),

$\Sigma = \sum_{x,y \in f} S(x,y),$

S (x, y) \geq 0

$S(x,y) \geq 0$ adalah beberapa fungsi (spesifik) yang diketahui yang bukan nol hanya jika

terpisah.

hanya bergantung pada histogram

, di mana

adalah indikator untuk

.

x, y

$x,y$

S (x, y)

$S(x,y)$

{(x_{i}, y_{i}) : i \in [d]}

$\{(x_i,y_i) : i \in [d]\}$

x_{i}

$x_i$

i \in x

$i \in x$

(Sebagai tambahan, kami berkomentar bahwa metodenya juga berfungsi jika kita diberikan dua keluarga , dan tertarik pada . Dalam kedua kasus, kita perlu menghitung -skewed Fourier-Walsh transformasi dari untuk sewenang-wenang , dan kemudian $f,g$ $\Sigma = \sum_{x\in f, y\in g} S(x,y)$ $p$ $f,g$ $p \in (0,1/2)$ .), di manahanya bergantung pada berat Hamming dari $\Sigma = \sum_x T(x) \hat{f}(x) \hat{g}(x)$ $T(x)$ $x$

Bagaimana semua ini berhubungan dengan masalah yang dihadapi? Pertimbangkan keluarga Setiap terpisah dari setiap . Sejak

F = {S_{i} \cup {x} : i \in [n]} \cup {\bar{S_{i}} \cup {y} : i \in [n]} .

$F = \{ S_i \cup \{x\} : i \in [n] \} \cup \{ \overline{S_i} \cup \{y\} : i \in [n] \}.$

S_{i} \cup {x}

$S_i \cup \{x\}$

\bar{S_{i}} \cup {y}

$\overline{S_i} \cup \{y\}$

S (x, y)

$S(x,y)$ diberikan secara eksplisit, kita dapat menghitung kontribusi pasangan ini untuk

. Apakah ada pasangan yang saling terpisah? Jika

terpisah dari

maka

dan begitu juga

. Jadi

adalah antichain iff

Σ

$\Sigma$

S_{i} \cup {x}

$S_i \cup \{x\}$

\bar{S_{j}} \cup {y}

$\overline{S_j} \cup \{y\}$

S_{i} \cap \bar{S_{j}} = \emptyset

$S_i \cap \overline{S_j} = \emptyset$

S_{i} \subseteq S_{j}

$S_i \subseteq S_j$

S_{1}, \dots, S_{n}

$S_1,\ldots,S_n$

Σ = \sum_{i = 1}^{n} S (S_{i} \cup {x}, \bar{S_{i}} \cup {y}) .

$\Sigma = \sum_{i=1}^n S(S_i \cup \{x\}, \overline{S_i} \cup \{y\}).$

Algoritma ini berjalan dalam waktu , mengabaikan faktor polinomial dalam . Ketika mendekati , ini jauh lebih baik daripada . Secara umum, kami mendapatkan peningkatan selama . $\tilde{O}(n + 2^d)$ $d$ $n$ $2^d$ $\tilde{O}(n^2)$ $n = \omega(2^{d/2})$

Mengingat kita tahu bahwa ada pasangan yang memuaskan , bagaimana kita menemukannya? Misalkan kita membagi semua set menjadi dua kelompok secara acak. Dengan probabilitas kira-kira , set dan akan menemukan diri mereka dalam kelompok yang sama. Jika kami sangat beruntung, kami dapat menjalankan algoritme kami di dan $S_i \subseteq S_j$ $S_1,\ldots,S_n$ $G_1,G_2$ $1/2$ $S_i$ $S_j$ $G_1$ $G_2$ , temukan di mana milik siapa ini, dan jadi separuh jumlah set yang perlu kita pertimbangkan. Jika tidak, kita bisa coba lagi. Ini menunjukkan bahwa dengan perkiraan jumlah panggilan oracle ke versi keputusan, kita benar-benar dapat menemukan pasangan yang memuaskan . $O(\log n)$ $S_i \subseteq S_j$

Kami juga dapat derandomisasi algoritme. Tanpa kehilangan sifat umum, misalkan . Dalam setiap langkah, kita mempartisi sesuai dengan masing-masing bit . Salah satu dari partisi ini akan selalu menempatkan dan di bagian yang sama, kecuali mereka memiliki polaritas yang berlawanan; kita dapat menguji untuk ini secara eksplisit hanya menggunakan operasi . Ini memberikan algoritma deterministik menggunakan panggilan oracle ke versi keputusan. $n = 2^k$ $k$ $x$ $y$ $O(nd)$ $O(\log^2 n)$

Yuval Filmus
sumber

Menarik. Apa yang harus saya baca jika saya ingin mempelajari lebih lanjut tentang ini?

Janne H. Korhonen

2

Periksa kertas Friedgut "Tentang ukuran keluarga yang berpotongan, keunikan dan stabilitas".

Yuval Filmus

Apa cara tercepat untuk memeriksa set inklusi?

Jawaban: