Masalah besar yang belum terpecahkan dalam sistem terdistribusi?

23

Terinspirasi oleh pertanyaan ini , apa masalah utama dan solusi yang ada yang perlu perbaikan dalam domain sistem terdistribusi (teoritis).

Sesuatu seperti protokol keanggotaan, konsistensi data?

zengr
sumber

Jawaban:

14

The kompleksitas waktu didistribusikan dari berbagai masalah grafik masih merupakan pertanyaan terbuka.

Secara umum, algoritma grafik terdistribusi adalah area di mana kita diharapkan memiliki (setidaknya asimtotik) yang cocok dengan batas atas dan bawah untuk kompleksitas waktu terdistribusi dari masalah grafik. Misalnya, untuk banyak masalah pengoptimalan, batasan ketat diketahui . Namun, ada banyak masalah pemecahan simetri klasik yang masih kurang dipahami.

Kami tidak tahu, misalnya, berapa banyak putaran komunikasi yang dibutuhkan untuk menemukan set maksimal independen , sebuah pencocokan maksimal , sebuah tepat vertex mewarnai dengan warna, atau tepat tepi mewarnai dengan 2 Δ - 1 warna dalam grafik dengan tingkat maksimum ΔΔ+12Δ-1Δ . Semua masalah ini mudah diselesaikan dengan algoritma terpusat yang rakus, dan ada algoritma yang didistribusikan secara efisien untuk masing-masing masalah ini, tetapi kami tidak tahu apakah ada algoritma yang optimal.

Misalnya, untuk semua masalah ini terdapat algoritma terdistribusi deterministik untuk model LOCAL dengan waktu operasi , di mana n adalah jumlah node. Hal ini juga diketahui bahwa masalah ini tidak dapat diselesaikan dalam waktu O ( Δ ) + o ( log * n ) putaran, tetapi tidak diketahui apakah mereka dapat diselesaikan dalam waktu o ( Δ ) + O ( log * n )HAI(Δ+logn)nHAI(Δ)+Hai(logn)Hai(Δ)+HAI(logn)putaran. Secara umum, kami tidak mengerti bagaimana waktu berjalan tergantung pada tingkat maksimum - inilah yang saya sebut masalah koordinasi lokal .

Peran keacakan adalah masalah besar lainnya. Sebagai contoh, banyak masalah yang disebutkan di atas dapat diselesaikan dalam waktu polylog dengan algoritma acak (yaitu, waktu adalah polylog dalam untuk nilai Δ ), tetapi tidak ada algoritma deterministik waktu polylog yang dikenal untuk misalnya set independen maksimal . Pertanyaan-pertanyaan ini, serta banyak masalah terbuka lainnya, dibahas secara lebih rinci dalam Bagian 11 buku terbaru oleh Barenboim dan Elkin .nΔ


Di atas, saya fokus pada pertanyaan yang khusus untuk komputasi terdistribusi. Ada juga pertanyaan terbuka dalam algoritma grafik terdistribusi yang memiliki koneksi nontrivial untuk membuka masalah dalam ilmu komputer teoretis secara umum. Sebagai contoh, batas bawah non-konstan untuk model klik tersumbat adalah pertanyaan terbuka besar dalam komputasi terdistribusi; baru-baru ini ditemukan bahwa batas bawah seperti itu juga akan menyiratkan batas bawah baru untuk ACC.

Jukka Suomela
sumber
7

Buka masalah pada "Algoritma Terdistribusi untuk Minimum Spanning Trees (MST)": (tercantum dalam [1])

  1. Mengenai kompleksitas waktu ,

    Algoritma optimal waktu dekat dan batas bawah muncul di [2] dan referensi di sini. Kompleksitas waktu optimal tetap menjadi masalah terbuka.

  2. Mengenai kompleksitas pesan ,

    Sejauh kompleksitas pesan , meskipun terikat ketat asimptotikHAI(m+nlogn) untuk masalah MST dalam grafik umum diketahui, menemukan konstanta aktual tetap merupakan masalah terbuka.

  3. Mengenai model sinkron :

    Dalam model sinkron untuk jaringan overlay, di mana semua prosesor terhubung langsung satu sama lain, sebuah MST dapat dibangun dalam waktu sublogaritmik, yaitu HAI(loglogn) putaran komunikasi [3], dan tidak ada batas bawah yang sesuai diketahui.

Perhatikan juga bahwa ada HAI(logn) algoritma aproksimasi untuk MST terdistribusi [4].


[1] Algoritma Terdistribusi untuk Pohon Rentang Minimum Rentang oleh Sergio Rajsbaum dalam "Encyclopedia of Algorithms", 2008.

[2] MST yang didistribusikan untuk grafik diameter konstan oleh Lotker et al. Distrib. Comput., 2006.

[3] Konstruksi pohon merentang berat minimum di IndonesiaHAI(loglogn) putaran komunikasi oleh Lotker et al. SIAM J. Comput., 35 (1), 2005.

[4] Algoritma Aproksimasi Terdistribusi Cepat untuk Pohon Rentang Minimum oleh Khan et al. DISC 2006.

Hengxin
sumber
3
Mengenai item ke-3: batas atas HAI(logloglogn)juga dikenal, lihat arxiv.org/abs/1412.2333 - dan seperti yang saya sebutkan secara singkat dalam jawaban saya, kami saat ini memahami sedikit lebih baik mengapa ada sedikit kemajuan dengan batas bawah untuk model klik tersumbat (batas bawah nontrivial untuk yang padat) model klik akan menyiratkan kompleksitas sirkuit nontrivial batas bawah).
Jukka Suomela
4

lihat juga (baru-baru ini) tayangan slide "Masalah Ilmu Komputer yang Tidak Terpecahkan dalam Komputasi Terdistribusi" dari 2012 oleh peneliti Notre Dame Douglas Thain yang memimpin laboratorium komputasi kooperatif mereka. ia memiliki lebih banyak kemiringan yang diterapkan tetapi pertanyaan-pertanyaan kunci yang tercantum tak terelakkan mengarah ke bidang teoritis.

  • Masalah Kiloscale: Setiap alur kerja dengan konkurensi yang memadai harus dapat berjalan dengan benar pada core 1K pertama kali dan setiap kali tanpa bantuan sysadmin.

  • Masalah Berhenti: Diberikan alur kerja yang berjalan pada seribu node, membuatnya berhenti dan membersihkan semua negara terkait dengan kepastian lengkap.

  • Masalah Ketergantungan:

    (1) Diberikan suatu program, cari tahu semua yang sebenarnya perlu dijalankan pada mesin yang berbeda.

    (2) Dengan adanya proses, cari tahu sumber daya (didistribusikan) yang sebenarnya digunakan saat berjalan.

    (3) Perpanjang 1 dan 2 ke seluruh alur kerja.

  • Masalah Right-Sizing: Diberikan aplikasi (terstruktur) dan cluster, cloud, atau grid yang diberikan, pilih alokasi sumber daya yang mencapai kinerja yang baik dengan biaya yang dapat diterima.

  • Masalah Pemecahan Masalah: Ketika kegagalan terjadi di tengah tumpukan perangkat lunak 100-lapisan, bagaimana dan kapan Anda melaporkan / mencoba lagi / mengabaikan / menekan kesalahan?

  • Masalah Desain: Bagaimana seharusnya aplikasi dirancang sehingga cocok untuk komputasi terdistribusi?

ay
sumber