Saya sedang dalam proses mengevaluasi desain terbaik untuk instalasi Cassandra kami.
Tidak banyak informasi di Internet tentang penggunaan dua tingkat akses pertama yang disediakan Cassandra - ruang kunci dan keluarga kolom .
Saya bertanya-tanya apakah dan apa hukumannya jika Anda memilih untuk membuat sejumlah besar ruang kunci atau keluarga kolom (> 10.000).
Posting blog lama di suatu tempat menyarankan agar Cassandra menyimpan memori untuk setiap keluarga kolom. Artikel ini tentang versi 0.6 dan versi saat ini adalah 1.0. Apakah ini masih merupakan masalah nyata?
Apa hukuman menggunakan ribuan keluarga kolom atau ruang kunci di Cassandra?
Jawaban:
Cassandra 1.0 menggunakan heap minimum 1MB per CF. Jadi, 1000 atau 2000 CF akan baik-baik saja untuk ukuran tumpukan biasa, tetapi 10.000 mungkin tidak akan. JVM GC buruk dengan tumpukan sangat besar; Saya sarankan tetap di bawah 8GB.
sumber
Memulai simpul Cassandra akan mulai memakan waktu lebih lama jika Anda memiliki banyak keluarga kolom. Ini juga akan memengaruhi jumlah memori yang digunakan.
Dengan demikian jumlah memori tidak akan digunakan untuk baris / cache kunci dan pengindeksan. Kinerja mungkin menurun lebih lanjut saat Anda terus menambahkan keluarga kolom, tergantung pada perangkat keras spesifik node Anda.
sumber