Jumlah data per node di Neo4j

14

Saya perlu menyimpan sejumlah besar data per node di Neo4j. Data adalah potongan teks Unicode. Sebenarnya tidak setiap node akan memiliki potongan besar, tetapi banyak dari mereka akan memiliki potongan besar.

Saya mengarungi dokumentasi tetapi tidak menemukan menyebutkan pada ukuran Node - jumlah data yang dapat mengandung satu node.

Adakah yang punya ide?

treecoder
sumber
Seberapa besar bongkahan Anda secara umum? Anda harus memastikan untuk menemukan string_block_size yang sesuai untuk menjaga jumlah blok string dalam penyimpanan ke tingkat yang wajar serta tidak membuang terlalu banyak ruang hanya dalam blok setengah penuh. Bagaimana data akan digunakan? Hanya diberikan atau juga tanya / diproses sebaliknya? Jika Anda perlu menghemat ruang, kompresi + penyimpanan sebagai array byte dapat menjadi pilihan.
Michael Hunger

Jawaban:

13

Pada akhirnya, itu tergantung pada arsitektur yang dimiliki mesin Anda.


(latar belakang) Node hanya dapat menyimpan data di propertinya. Properti mereka disimpan menggunakan toko kunci-nilai. (per disini )

Nilai di setiap properti terbatas pada primitif Java (int, float, dll.), String, dan array array primitif / string.

Oleh karena itu, jumlah maksimum data yang dimiliki oleh properti tertentu akan terbatas pada ukuran maksimum untuk string atau ukuran maksimum untuk array string (itu per node ). Batas ini (untuk mesin 32-bit) adalah 4GB. (Perhatikan bahwa ini mungkin terbatas pada 2-3 GB .)

(Juga, setelah mengatakan ini, sebelumnya ada bug yang membatasi ukuran string hingga 1 MB . Saya berharap ini teratasi.)

Tentu saja, ini menimbulkan pertanyaan apakah beberapa properti bisa menyimpan lebih dari 4GB per node. Karena daftar properti pada dasarnya adalah penyimpanan nilai-kunci, maka diharapkan ukuran maksimum akan dibatasi oleh ruang disk dan pemilihan kunci. Saya tidak dapat menemukan apa pun untuk mendukung atau menyangkal ini.


Itu tidak secara pasti menjawab pertanyaan Anda, tetapi dari apa yang saya pahami Anda harus dapat menyimpan sejumlah besar data per node (hingga kapasitas ruang disk).

Richard
sumber