Studi kasus big data atau contoh penggunaan kasus

13

Saya telah membaca banyak artikel \ blog tentang bagaimana berbagai jenis industri menggunakan Big Data Analytic. Tetapi sebagian besar dari artikel ini gagal menyebutkan

  1. Apa yang agak data perusahaan ini digunakan. Berapa ukuran data
  2. Alat teknologi apa yang mereka gunakan untuk memproses data
  3. Apa masalah yang mereka hadapi dan bagaimana wawasan mereka mendapatkan data membantu mereka untuk menyelesaikan masalah.
  4. Bagaimana mereka memilih alat \ teknologi yang sesuai dengan kebutuhan mereka.
  5. Pola apa yang mereka identifikasi dari data & pola apa yang mereka cari dari data.

Saya ingin tahu apakah seseorang dapat memberi saya jawaban untuk semua pertanyaan ini atau tautan yang setidaknya menjawab beberapa pertanyaan. Saya mencari contoh dunia nyata.

Akan lebih bagus jika seseorang berbagi bagaimana industri keuangan memanfaatkan Big Data Analytic.

Brown_Dynamite
sumber

Jawaban:

14

Outlet berita cenderung menggunakan "Big Data" dengan cukup longgar. Vendor biasanya memberikan studi kasus seputar produk spesifik mereka. Tidak ada banyak di luar sana untuk implementasi open source, tetapi mereka disebutkan. Sebagai contoh, Apache tidak akan menghabiskan banyak waktu membangun studi kasus tentang hadoop, tetapi vendor seperti Cloudera dan Hortonworks mungkin akan melakukannya.

Berikut adalah contoh studi kasus dari Cloudera di sektor keuangan.

Mengutip penelitian:

Satu konglomerat jasa keuangan global utama menggunakan Cloudera dan Datameer untuk membantu mengidentifikasi aktivitas perdagangan jahat. Tim dalam grup manajemen aset perusahaan melakukan analisis ad hoc pada umpan harian harga, posisi, dan informasi pesanan. Memiliki analisis ad hoc untuk semua data rinci memungkinkan grup untuk mendeteksi anomali di kelas aset tertentu dan mengidentifikasi perilaku yang mencurigakan. Pengguna sebelumnya hanya mengandalkan alat spreadsheet desktop. Sekarang, dengan Datameer dan Cloudera, pengguna memiliki platform yang kuat yang memungkinkan mereka untuk menyaring lebih banyak data lebih cepat dan mencegah potensi kerugian sebelum mereka mulai.

.

Bank ritel terkemuka menggunakan Cloudera dan Datameer untuk memvalidasi keakuratan dan kualitas data seperti yang disyaratkan oleh Dodd-Frank Act dan peraturan lainnya. Mengintegrasikan data pinjaman dan cabang serta data manajemen kekayaan, inisiatif kualitas data bank bertanggung jawab untuk memastikan bahwa setiap catatan akurat. Proses ini termasuk menjadikan data lebih dari 50 kewarasan data dan pemeriksaan kualitas. Hasil pemeriksaan tersebut cenderung terus-menerus untuk memastikan bahwa toleransi untuk korupsi data dan domain data tidak berubah secara merugikan dan bahwa profil risiko yang dilaporkan kepada investor dan badan pengatur adalah bijaksana dan sesuai dengan persyaratan peraturan. Hasilnya dilaporkan melalui dashboard kualitas data ke Chief Risk Officer dan Chief Financial Officer,

Saya tidak melihat studi terkait keuangan lainnya di Cloudera, tetapi saya tidak mencari dengan keras. Anda dapat melihat perpustakaan mereka di sini.

Juga, Hortonworks memiliki studi kasus tentang Strategi Perdagangan di mana mereka melihat penurunan 20% dalam waktu yang dibutuhkan untuk mengembangkan strategi dengan memanfaatkan K-means, Hadoop, dan R.

Setiap warna menunjukkan sekelompok strategi dengan probabilitas yang sama untung dan rugi

bagaimana sistem perdagangan ditingkatkan dengan menggunakan Hadoop (Platform Data Hortonworks), dan algoritma k-means

Ini tidak menjawab semua pertanyaan Anda. Saya cukup yakin kedua studi ini membahas sebagian besar dari mereka. Saya tidak melihat apa pun tentang pemilihan alat secara khusus. Saya membayangkan tenaga penjualan banyak berhubungan dengan mendapatkan produk secara keseluruhan di pintu, tetapi para ilmuwan data itu sendiri memanfaatkan alat yang paling nyaman bagi mereka. Saya tidak memiliki banyak wawasan tentang area itu di ruang data besar.

Steve Kallestad
sumber
1
Terima kasih. Ini sangat membantu. Saya tahu ini ruang bug dan tidak ada jawaban yang benar. Saya sangat tertarik untuk mengetahui bagaimana seseorang memilih alat data besar dan teknologi yang sesuai dengan kebutuhan mereka. Saya tidak menandainya sebagai jawaban yang tepat untuk saat ini, tetapi sudah pasti pantas mendapatkan suara UP. Cheers :)
Brown_Dynamite
6

Jasa Keuangan adalah pengguna besar Big Data, dan inovator juga. Salah satu contohnya adalah perdagangan obligasi hipotek. Untuk menjawab pertanyaan Anda untuk itu:

Apa yang agak data perusahaan ini digunakan. Berapa ukuran data?

  • Sejarah panjang masing-masing hipotek diterbitkan selama bertahun-tahun terakhir, dan pembayaran per bulan terhadap mereka. (Miliaran baris)
  • Sejarah panjang sejarah kredit. (Miliaran baris)
  • Indeks harga rumah. (Tidak sebesar)

Seperti apa teknologi alat yang mereka gunakan untuk memproses data?

Bervariasi. Beberapa menggunakan solusi in-house yang dibangun di atas basis data seperti Netezza atau Teradata. Lainnya mengakses data melalui sistem yang disediakan oleh penyedia data. (Corelogic, Experian, dll.) Beberapa bank menggunakan teknologi basis data kolom seperti KDB, atau data 1010.

Apa masalah yang mereka hadapi dan bagaimana wawasan mereka mendapatkan data membantu mereka untuk menyelesaikan masalah.

Masalah utamanya adalah menentukan kapan obligasi hipotek (sekuritas yang didukung hipotek) akan dibayar di muka atau gagal bayar. Ini sangat penting untuk obligasi yang tidak memiliki jaminan pemerintah. Dengan menggali riwayat pembayaran, file kredit, dan memahami nilai rumah saat ini, dimungkinkan untuk memprediksi kemungkinan default. Menambahkan model suku bunga dan model prabayar juga membantu memprediksi kemungkinan prabayar.

Bagaimana mereka memilih alat \ teknologi yang sesuai dengan kebutuhan mereka.

Jika proyek didorong oleh TI internal, biasanya didasarkan pada vendor database besar seperti Oracle, Teradata atau Netezza. Jika didorong oleh quants, maka mereka lebih cenderung langsung ke vendor data, atau sistem "All in" pihak ke-3.

Pola apa yang mereka identifikasi dari data & pola apa yang mereka cari dari data.

Menautkan data memberikan wawasan besar tentang siapa yang kemungkinan gagal bayar atas pinjaman mereka, dan membayar di muka. Ketika Anda menjumlahkan pinjaman menjadi obligasi, itu bisa menjadi perbedaan antara obligasi yang diterbitkan di100,000,000besayangwHairththSebuahtSebuahmHaikamunt,HairSebuahslsayattleSebuahs20.000.000.

MathAttack
sumber
Pernahkah Anda melihat contoh di mana teknik pembelajaran mesin digunakan untuk pemodelan prabayar. Yaitu jaring saraf, hutan acak, GBM?
Josh
5

Kaggle memiliki ringkasan aplikasi yang singkat:

Revolution Analytics menerbitkan banyak studi kasus umum, lembar data, dan buku putih:

Untuk aplikasi dalam sains dan teknik, Anda dapat berkonsultasi dengan studi kasus Nutonian :

Analyx memberi tahu klien potensial tentang aplikasi dalam perdagangan:

The Financial Times menerbitkan kumpulan cerita tentang aplikasi bisnis big data:

McKinsey menjabarkan aplikasi pada tahun 2011:

Perusahaan konsultan lain membuat laporan serupa.

Gartner membuat Hype Cycle for Big data:

masukkan deskripsi gambar di sini

Belum lagi studi kasus dan buku putih oleh perusahaan lain yang ingin mempromosikan produk mereka.

Anton Tarasenko
sumber
1

Lihatlah laporan data gratis O'Reilly . Anda dapat menemukan laporan tentang Perbankan dan Fintech, Olahraga, Mode, Musik, Kesehatan, Minyak dan Gas, dan sebagainya.

Perlu diingat bahwa laporan McKinsey yang disebutkan sebelumnya adalah laporan klasik dan harus dibaca.

Hamideh
sumber