Saya bertanya-tanya apakah ada solusi yang baik untuk merekam data dalam database NoSQL dan kemudian mengubahnya menjadi RDBMS?
Misalnya, jika Anda ingin mengambil beberapa data dengan cepat, seperti log sesi, tetapi kemudian Anda ingin dapat membuat laporannya nanti.
Basis data favorit saya adalah Postgres, jadi jika jawaban Anda relevan di Postgres, itu akan bagus.
Jawaban:
Jawaban Cepat - Ya. Terjadi sepanjang waktu.
Ada banyak solusi bagus. Solusi apa yang sudah ada di lingkungan Anda? Saya membantu satu klien yang mengambil situs web mereka / informasi aktivitas sesi dari aplikasi web mereka, mereka menulisnya ke xml kemudian deserialize xml itu ke Hadoop. Mereka kemudian menggunakan Hive di atas Hadoop untuk membuat agregasi dan fakta (dengan bergabung dengan data log ini untuk referensi data dari situs web mereka yang mereka simpan dalam database Postgres). Agregasi dan fakta ini kemudian dimuat ke RDBMS (mereka menggunakan SQL Server, karena analitik yang kaya disediakan dalam tumpukan SQL Server).
Saya akan menjelajahi Hadoop, lihat Hive yang merupakan mesin permintaan di atas Hadoop yang memungkinkan Anda untuk menulis pertanyaan deklaratif yang sangat mirip dengan SQL dan diterjemahkan ke dalam pekerjaan MapReduce di belakang layar. Kemudian lihat Sqoop yang merupakan alat lain dalam keluarga Hadoop yang membantu Anda mengekspor / mengimpor data.
http://hadoop.apache.org/ http://www.amazon.com/Hadoop-Definitive-Guide-Tom-White/dp/1449389732/ref=sr_1_1?s=books&ie=UTF8&qid=1319160463&sr=1-1 http : //www.cloudera.com/blog/2009/06/introducing-sqoop/ http://hive.apache.org/
Ada opsi lain di luar sana juga ...
sumber
Tidak semua NoSQL sama. Misalnya MongoDB memiliki kemampuan permintaan yang sangat baik. sangat mudah untuk mengambil data, mengurutkan data dengan cara yang mengingatkan Anda pada SQL. Jadi apa yang saya katakan adalah, bahwa Anda tidak boleh berpikir - SQL untuk pelaporan, kecuali jika Anda memiliki alat yang membutuhkan data yang sesuai dengan SQL, tentu saja. Beberapa NoSQL lainnya sedikit lebih terlibat sejauh mendapatkan hasil seperti SQL dari toko Anda, CouchDB misalnya, tidak sepele untuk mendefinisikan kueri jenis klausa mana yang sederhana. MongodDB - Saya telah menggunakan driver Python - sangat mudah. Jadi saya merasa kurang penting untuk khawatir tentang porting data saya ke toko relasional.
sumber