Saya seorang siswa sekolah menengah yang mencoba untuk membangun sebuah cluster linux untuk sebuah proyek (saya memiliki banyak komputer yang layak dijadwalkan untuk gambar ulang musim panas ini, jadi departemen teknologi pada dasarnya mengatakan selama saya tidak secara fisik memecahkannya saya bisa lakukan apapun.
Bagaimanapun, saya tidak benar-benar tahu apa-apa tentang membangun sebuah cluster, tapi saya cukup baik dengan Linux.
Saya perlu tahu hal-hal ini: -Apa distro yang harus saya gunakan? Apakah itu penting? -Apa perangkat lunak apa yang dapat mengkonfigurasi cluster? -Di papan atau FS didistribusikan? -Setiap situs yang dapat menawarkan panduan atau panduan yang layak?
linux
cluster
distributed-filesystem
Gilles 'SANGAT berhenti menjadi jahat'
sumber
sumber
Jawaban:
Itu benar-benar tergantung pada apa yang ingin Anda capai, dan apa yang Anda maksud dengan "Cluster Terdistribusi Terdistribusi." Saya melakukan hal serupa di Uni menggunakan mesin lama dan PVM itulah "Cluster" dalam arti sekelompok mesin bertindak sebagai satu komputer tunggal untuk melakukan pemrosesan paralel - pikirkan cluster Beowulf. Tentu saja, Anda akan memerlukan kode yang ditulis untuk memanfaatkan ini.
Tempat yang baik untuk memulai, akan menentukan apa yang ingin Anda pelajari dengan proyek ini. Saya sarankan membaca artikel wikipedia tentang Komputasi Paralel sebagai permulaan, dan kemudian menyempurnakan kebutuhan Anda berdasarkan apa yang ingin Anda lakukan.
Sistem antrian pekerjaan sederhana (seperti tukang gigi ) mungkin cukup untuk mendapatkan beberapa hasil keren dengan cepat.
Masalah yang saya miliki ketika saya membuat sebuah cluster komputasi paralel, adalah saya tidak ada hubungannya dengan itu, itu hanya pada dasarnya duduk di sana, tetapi itu adalah proyek yang menyenangkan dan saya belajar sedikit. Bagaimanapun, Anda cenderung belajar sedikit dan bersenang-senang pada saat yang sama, terlepas dari apa yang Anda pilih untuk diterapkan.
Sejauh pilihan distribusi, saya akan menggunakan apa yang paling nyaman bagi saya, karena Anda mungkin perlu menginstal sesuatu dari sumber. Setelah Anda merasa nyaman untuk mengatur semuanya, maka Anda dapat mencari menemukan distribusi yang lebih disesuaikan dengan kebutuhan Anda. Tetapi distribusi apa pun harus dilakukan.
Perangkat lunak apa yang mengkonfigurasi cluster? Ini sepenuhnya tergantung pada jenis cluster apa yang Anda buat.
On board vs. FS yang didistribusikan? Sekali lagi, ini tergantung pada apa persyaratan untuk kluster Anda. Apakah setiap node akan meneruskan data bolak-balik di antara node lain? Apakah mereka akan beroperasi sebagai budak dengan tuan tunggal? akankah mereka beroperasi sepenuhnya secara mandiri? Pertanyaan-pertanyaan ini akan mulai menginformasikan pilihan Anda. Dan tentu saja, selalu ada trade off.
Beberapa tautan lain yang mungkin terbukti menarik:
http://hadoop.apache.org/
http://www.csm.ornl.gov/oscar/
https://computing.llnl.gov/tutorials/parallel_comp/
http://www.google.com/Top/Computers/Parallel_Computing/Programming/Environmentments/
http://www.google.com/Top/Computers/Parallel_Computing/Beowulf/
sumber
Ini adalah saran yang sangat sederhana dan tidak dikembangkan; tapi mungkin coba gugus Plan 9? http://plan9.bell-labs.com/plan9/
sumber
Mencoba Linux HA (Ketersediaan Tinggi) ini adalah solusi gugus Linux yang tersedia secara bebas yang berfungsi pada beberapa distribusi.
Mungkin hanya satu dari beberapa solusi. Saya tidak tahu bagaimana membandingkannya dengan yang lain, atau bahkan apa fitur spesifiknya, saya hanya tahu bahwa beberapa rekan kerja bersumpah untuk perangkat lunak komersial yang serius.
sumber