Sering kali ketika mencoba membuat desain basis data yang efisien, tindakan terbaik adalah membangun dua basis data sampel, mengisinya dengan data, dan menjalankan beberapa pertanyaan terhadap mereka untuk melihat mana yang berkinerja lebih baik.
Apakah ada alat yang akan menghasilkan (idealnya langsung ke database) besar (~ 10.000 catatan) set data uji yang relatif cepat? Saya mencari sesuatu yang setidaknya berfungsi dengan MySQL.
Saya biasanya menghasilkan data saya sendiri, menggunakan beberapa data yang dikenal sebagai input - jika terlalu acak, itu tidak selalu merupakan tes yang baik; Saya membutuhkan data yang akan didistribusikan mirip dengan produk akhir saya.
Semua database yang lebih besar yang harus saya sempurnakan bersifat ilmiah - jadi saya biasanya dapat mengambil beberapa investigasi lain sebagai input, dan mengubah skala dan menambahkan jitter. (misalnya, mengambil data yang berada pada irama 5 menit dengan ketepatan milidetik, dan mengubahnya menjadi irama 10 detik dengan ketepatan milidetik tetapi jitter +/- 100 ms sesuai waktu)
...
Tetapi, sebagai alternatif lain, jika Anda tidak ingin menulis sendiri, adalah dengan melihat beberapa alat benchmarking - karena mereka dapat mengulangi hal-hal berulang-ulang berdasarkan pada set pelatihan, Anda dapat menggunakannya untuk memasukkan banyak catatan (dan kemudian abaikan saja laporan tentang seberapa cepat itu melakukannya) ... dan kemudian Anda dapat menggunakan alat yang sama untuk menguji seberapa cepat kinerja database setelah itu diisi.
sumber
Saya telah menggunakan mysqlslap. Itu membersihkan setelah dirinya sendiri juga.
Inilah artikel yang saya baca ketika saya mulai menggunakannya.
sumber
Lihatlah benerator
Memang tidak mudah untuk memulai, tetapi cukup kuat.
sumber
Lihatlah fungsi ini. Anda dapat menghasilkan nama, alamat nomor telepon, kode pos dll. Ini sepenuhnya dilakukan di MYSQL tidak perlu untuk aplikasi lain. http://moinne.com/blog/ronald/mysql/howto-generate-meaningful-test-data-using-a-mysql-function
sumber
Cara yang paling hemat biaya mungkin menggunakan sumber terbuka atau generator data komersial. Saya biasa melakukan itu.
Sekarang, di tahun-tahun emas saya, saya menganggap setiap kebutuhan akan data uji sebagai mandat untuk mempelajari bahasa skrip lain.
sumber
Bagi siapa pun yang mencari solusi berbeda untuk masalah ini ... Saya menulis proyek pembangkit data uji untuk Studio Sinkronisasi Data. Ini dapat menghasilkan dataset besar mulai dari 1 hingga 100-an juta baris data pengujian realistis. Berikut ini adalah posting blog tentang hal itu. http://www.simco.com/Blog/2012/02/Test-Data-Generator-Download-for-Data-Sync Ini gratis untuk digunakan selama 15 hari (setelah Anda memiliki data pengujian, Anda memilikinya)
sumber