Apakah ada satu?
Semua definisi yang saya temukan menggambarkan ukuran, kompleksitas / variasi atau kecepatan data.
Definisi Wikipedia adalah satu-satunya yang saya temukan dengan angka aktual
Ukuran data besar adalah target yang terus bergerak, mulai 2012 mulai dari beberapa lusin terabyte hingga banyak petabyte data dalam satu set data tunggal.
Namun, ini tampaknya bertentangan dengan definisi MIKE2.0 , yang dirujuk dalam paragraf berikutnya, yang menunjukkan bahwa data "besar" bisa kecil dan 100.000 sensor pada pesawat yang hanya menghasilkan 3GB data dapat dianggap besar.
IBM meskipun mengatakan bahwa:
Data besar lebih dari sekadar masalah ukuran.
telah menekankan ukuran dalam definisi mereka .
O'Reilly juga menekankan "volume, velocity and variety"
. Meskipun dijelaskan dengan baik, dan secara lebih mendalam, definisi tersebut tampaknya merupakan hash dari yang lain - atau sebaliknya tentu saja.
Saya pikir judul artikel Computer Weekly merangkum sejumlah artikel dengan cukup baik, "Apa itu data besar dan bagaimana bisa digunakan untuk mendapatkan keunggulan kompetitif" .
Tapi ZDNet menang dengan yang berikut dari 2012 :
"Big Data" adalah frasa tangkapan yang telah muncul dari ceruk komputasi kinerja tinggi pasar TI ... Jika seseorang duduk melalui presentasi dari sepuluh pemasok teknologi, lima belas atau lebih definisi yang berbeda kemungkinan akan muncul. Setiap definisi, tentu saja, cenderung mendukung kebutuhan akan produk dan layanan pemasok itu. Bayangkan itu.
Pada dasarnya "data besar" adalah "besar" dalam beberapa bentuk atau cara.
Apa itu "besar"? Apakah ini dapat diukur pada saat ini?
Jika "besar" tidak dapat dikuantifikasi, adakah definisi yang tidak hanya bergantung pada generalisasi?
Jawaban:
Tidak ada; itu kata kunci.
Namun delineatornya adalah bahwa data Anda berada di luar kemampuan sistem tradisional. Data terlalu besar untuk disimpan pada disk terbesar, kueri membutuhkan waktu terlalu lama tanpa optimasi khusus, jaringan atau disk tidak dapat mendukung arus lalu lintas yang masuk, tampilan data lama yang sederhana tidak akan menangani visualisasi untuk bentuk / ukuran / luasnya data ...
Pada dasarnya, bahwa data Anda berada di luar titik kritis yang tidak jelas di mana "tambahkan saja perangkat keras" tidak akan memotongnya.
sumber
Seperti yang ditunjukkan dalam tautan Oracle (komentar oleh Immad Careem) oracle.com/us/technologies/big-data/index.html. Big Data adalah segala sesuatu yang bukan data relasional yang disimpan dalam RDBMS. Beberapa tahun sebelum hype itu hanya "banyak data". Sekarang itu tumbuh dan dipromosikan oleh pemasar untuk menjadi semacam data khusus.
Ada beberapa alasan sekunder (selain pemasaran) untuk menganggap Big Data sebagai hal yang nyata.
sumber
Menggunakan jawaban Doug Laney sebagai titik awal, kami merekayasa balik daftar definisi Big Data, sekarang lebih dari 30 dan menjadi kuat. Daftar definisi kami untuk "Big Data" ada di sini .
Kami menerima koreksi, entri, grafik, dll.
sumber
Senang melihat O'Reilly dan yang lainnya akhirnya menggunakan data besar 3V Gartner yang pertama kali kami perkenalkan lebih dari 11 tahun yang lalu. Untuk referensi, inilah karya asli yang saya tulis pada tahun 2001: http://blogs.gartner.com/doug-laney/deja-vvvue-others-claiming-gartners-volume-velocity-variety-construct-for-big-data/ .
Definisi baru-baru ini yang diperbarui oleh Gartner juga mengakui aspek nilai: "Big Data adalah aset informasi dengan volume, kecepatan, dan / atau variasi yang memerlukan bentuk inovatif dari pemrosesan informasi untuk peningkatan penemuan wawasan, pengambilan keputusan, dan otomatisasi proses."
Kami juga telah mengembangkan metode untuk mengukur besarnya data di sepanjang tiga vektor yang bersifat preskriptif dalam hal adopsi teknologi. Namun saya tidak dapat membaginya secara publik.
sumber