Saya sedang mengerjakan proyek data-sains yang terkait dengan penambangan hubungan sosial dan perlu menyimpan data dalam beberapa basis data grafik. Awalnya saya memilih Neo4j sebagai databasenya. Tapi sepertinya Neo4j tidak skala dengan baik. Alternatif yang saya temukan adalah Titan dan oriebtDB. Saya telah melalui perbandingan ini pada ketiga Basis Data ini, Tetapi saya ingin mendapatkan lebih banyak perincian tentang basis data ini. Jadi bisakah seseorang membantu saya dalam memilih yang terbaik. Terutama saya ingin membandingkan kinerja, penskalaan, dokumentasi / tutorial on-line yang tersedia, dukungan pustaka Python, kompleksitas bahasa kueri, dan dukungan algoritma grafik dari basis data ini. Apakah ada opsi database lain yang bagus?
sumber
Jawaban:
Saya pikir Anda mungkin harus mengingat keseluruhan jalur pipa Data dan jalur pembelajaran Mesin. Untuk itu Anda membutuhkan kerangka kerja yang kuat untuk memindahkan data antara tabel seperti dan grafik seperti penyimpanan selain dari pemrosesan terdistribusi yang kuat. Dari pemahaman saya, Spark GraphX menjanjikan untuk membangun jaringan pipa ini. Pembicaraan Joseph Gonzalez (salah satu pencipta GraphLab dari CMU) di GraphX di youtube patut ditonton.
sumber