Menggabungkan Dua Pohon Pencarian Biner

Saya mencari algoritme untuk menggabungkan dua pohon pencarian biner dengan ukuran dan jangkauan yang berubah-ubah. Cara yang jelas saya akan menerapkan ini adalah untuk menemukan seluruh sub pohon yang jangkauannya dapat masuk ke dalam simpul eksternal yang berubah-ubah di pohon lain. Namun, kasus terburuk berjalan waktu untuk jenis algoritma tampaknya berada di urutan O(n+m)di mana ndan madalah ukuran masing-masing pohon masing-masing.

Namun, saya telah diberitahu bahwa ini bisa dilakukan di O(h), di mana hketinggian pohon dengan ketinggian lebih besar. Dan saya benar-benar bingung tentang bagaimana ini mungkin. Saya sudah mencoba bereksperimen dengan memutar satu pohon terlebih dahulu, tetapi memutar pohon menjadi tulang belakang sudah O (h).

ds.algorithms ds.data-structures tree efritz
sumber

Saya tidak tahu erick saya punya pertanyaan yang sama juga.

Agar adil, ini adalah pertanyaan yang diberikan dalam pekerjaan rumah Algoritma. Ternyata O (h) terlalu ketat untuk runtime, karena pertanyaannya lupa untuk memberikan informasi yang lebih diperlukan: Bahwa semua kunci dari satu pohon lebih kecil dari semua kunci di pohon kanan.

efritz

Apakah saya melewatkan sesuatu, tidakkah menggabungkan pohon biner dengan mudah dapat dilakukan O(log n)dengan fungsi simpul gerak yang sederhana?

@AT Ya, tapi kami tidak tahu bahwa kunci dari satu BST itu saling eksklusif dari yang lain.

efritz

Ini adalah pohon merah-hitam, bukan BST. Merah hitam (serta pohon dan tumpukan AVL) adalah jenis pohon khusus yang menjaga properti dengan ketinggian tinggi. Vanilla BST dapat berupa tulang belakang tunggal. Coba masukkan serangkaian angka yang tidak berkurang atau tidak bertambah ke dalam BST dan Anda akan melihat bahwa ketinggian pohon-pohon ini sebenarnya n. Hanya pohon biner penuh atau lengkap memiliki tinggi logaritmik untuk jumlah total node mereka.

efritz

Jawaban:

Dalam ArXiv: 1002.4248 , John Iacono dan Özgür Özkan menggambarkan algoritma yang relatif sederhana untuk menggabungkan dua pohon pencarian biner dalam waktu diamortisasi ; analisis adalah bagian yang sulit. [ Pembaruan: Seperti yang diamati Joe dengan benar dalam jawabannya, algoritma ini disebabkan oleh Brown dan Tarjan.] Mereka juga menggambarkan struktur data kamus yang lebih rumit, berdasarkan daftar lompatan yang bias, yang mendukung penggabungan dalam waktu diamortisasi . $O(\log^2 n)$ $O(\log n)$

Di sisi lain, ikatan kasus terburuk dari tidak mungkin. Pertimbangkan dua pohon pencarian biner dengan node, satu menyimpan bilangan bulat genap antara dan , yang lain menyimpan bilangan bulat ganjil antara dan . Menggabungkan dua pohon menciptakan pohon pencarian biner baru yang menyimpan semua bilangan bulat antara dan . Dalam pohon seperti itu, sebagian kecil dari node memiliki paritas yang berbeda dari orang tua mereka. (Bukti: Induk daun aneh harus genap.) Dengan demikian, menggabungkan pohon genap dan aneh perlu diubah $O(\log n)$ $n$ $2$ $2n$ $1$ $2n-1$ $1$ $2n$ petunjuk. $\Omega(n)$

Jeffε
sumber

Satu catatan: jika saya telah membaca deskripsi di makalah ini dengan benar, pohon-pohon ini tidak mendukung penyisipan dan penghapusan. The

gabungan hanya mengikuti prosedur untuk penggabungan pohon pencarian jari (dijelaskan dalam jawaban Joe). Set operasi terbatas memungkinkan untuk analisis yang lebih baik daripada

O (\lg^{2} n)

$O(\lg^2 n)$

satu.

O (n \lg \frac{m}{n})

$O(n \lg \frac{m}{n})$

jbapple

Analisis yang ditingkatkan adalah karena amortisasi, bukan pembatasan operasi yang diizinkan. Sisipan dan penghapusan dapat didukung dengan pemisahan dan penggabungan (sebenarnya "bergabung") dalam hal yang sama

diamortisasi terikat waktu.

O (l o g n)

$O(log n)$

Jeffε

Hanya karena penasaran, apakah waktu

akan terpengaruh jika pohon disimpan dalam array alih-alih daftar-tertaut (yang saya asumsikan adalah apa yang Anda maksud ketika mengatakan "mengubah ... pointer ")?

Ω (n)

$\Omega(n)$

mtahmed

Secara default, "pohon pencarian biner" adalah struktur berbasis pointer (bukan "daftar tertaut"); setiap simpul menunjuk ke dua anaknya dan mungkin juga induknya. Tetapi batas bawah tidak tergantung pada representasi yang tepat. Ada

cara untuk menggabungkan duapohon pencarian biner

-node, sehingga setiap algoritma berbasis perbandingan memerlukan setidaknya

(\binom{2 n}{n})

$\binom{2n}{n}$

n

$n$

perbandingan

untuk memilih yang benar.

\log_{2} (\binom{2 n}{n}) \geq 2 n - O (\log n)

$\log_2 \binom{2n}{n} \ge 2n - O(\log n)$

Jeffε

@ Jɛ ﬀ E: Saya setuju bahwa splits dan joins didukung, tetapi saya tidak berpikir bahwa membuat atau menghancurkan pohon adalah. Jadi, misalnya, jika saya ingin menghapus "x" dari alfabet, saya tidak hanya mendapatkan "a..wyz", tetapi juga "x". Ukuran alam semesta (yaitu

, lihat bagian 2.1) tidak berubah. Juga, pengantar bagian 1 mencatat bahwa himpunan harus mempartisi alam semesta, yang saya artikan (mungkin secara salah) berarti bahwa setiap elemen di alam semesta ada di pohon tertentu. Jadi, cara saya membacanya, konstruksi ini tidak berfungsi di alam semesta yang tidak terikat. Begitulah cara saya menulis komentar di atas.

n

$n$

jbapple

Anda dapat menemukan referensi ini bermanfaat: Brown dan Tarjan, Algoritma Penggabungan Cepat , di mana penulis menunjukkan cara menggabungkan pohon biner seimbang (AVL) di yang optimal (untuk algoritma berbasis perbandingan). dan adalah panjang dari daftar yang disortir yang diwakili oleh pohon pencarian biner, dan diasumsikan bahwa . $O(n \log \frac{m}{n})$ $m$ $n$ $m \geq n$

Anda juga dapat melihat diskusi tentang berbagai teknik untuk menggabungkan set yang dipesan pada bagian 11.5 dari makalah ini pada pohon pencarian jari

Joe
sumber

Baik

batas waktu dan batas bawah yang cocok mengasumsikan bahwa

O (n \log \frac{m}{n})

$O(n\log \frac{m}{n})$

m \geq n

$m\ge n$

Jeffε

Saya pikir itu tersirat oleh batas waktu, tetapi saya mengedit pertanyaan untuk membuatnya eksplisit.

Joe

Anda dapat menggabungkan pohon dalam waktu kasus terburuk $\bf\mathcal{O}(1)$ sambil tetap mendukung: masukkan, hapus dan cari di . $\mathcal{O}(log\ n)$

Brodal, Gerth Stølting, Christos Makris, dan Kostas Tsichlas. 'Fungsional Terburuk dengan Kasus Terbukti, Waktu Konstan Daftar Diurutkan' . Dalam Prosiding Konferensi ke-14 tentang Simposium Tahunan Eropa - Volume 14, 172–183. ESA'06. London, Inggris, Inggris: Springer-Verlag, 2006. [ PDF ]

DI
sumber

Mereka mendukung struktur data bergabung di O (1) diamortisasi waktu, tidak menggabungkan. Semua elemen dalam satu pohon harus lebih kecil dari semua elemen di pohon lainnya.

Jeffε

T_{i}

$T_i$

T_{j}

$T_j$

T_{i}

$T_i$

T_{j}

$T_j$

T_{j}

$T_j$

T_{i}

$T_i$

w (T_{i}) = w (T_{j})

$w(T_i) = w(T_j)$

T_{j}

$T_j$

T_{i}

$T_i$

T_{i} \cdot T_{j}

$T_i \centerdot T_j$

T_{i}

$T_i$