Apa perbedaan antara Gudang Data Federasi dan Terdesentralisasi?

9

Saya tidak dapat menemukan definisi atau penjelasan yang jelas tentang semua ini. Keduanya tampak terdesentralisasi. Tampaknya dalam DWH Federasi, data didistribusikan dan tidak diintegrasikan ke dalam repositori tunggal dan diakses dari sumber terdistribusi.

Sementara dalam implementasi DWH Terdesentralisasi, data diintegrasikan ke dalam satu repositori pusat.

Tolong jelaskan perbedaan antara kedua implementasi ini.

LifeH2O
sumber

Jawaban:

6

Gudang data terdesentralisasi pada dasarnya adalah kumpulan gudang data yang dikelola oleh masing-masing wilayah atau unit bisnis tetapi disediakan secara terpusat. Ini mungkin berada di server fisik yang sama, berbagi alat pelaporan, atau disediakan di seluruh organisasi dengan cara lain. Mungkin juga ada komponen terpusat seperti manajemen data master. Ini biasanya dilakukan karena gudang data terpusat menjadi berat di luar ukuran organisasi tertentu. Gudang data harus responsif terhadap perubahan dan jika terlalu responsif maka masing-masing departemen akan mulai membangun solusi mereka sendiri.

Anda dapat melihat ini di bank investasi, di mana kecenderungannya adalah melakukan gudang data untuk memenuhi persyaratan tertentu (misalnya inisiatif regulasi tertentu atau beberapa jenis pelaporan keuangan) daripada membangun gudang terpusat di seluruh bisnis. Sebuah perusahaan seukuran bank besar terlalu rumit untuk melakukan persyaratan bagi EDW yang sepenuhnya terpusat dalam jangka waktu yang wajar.

Gudang data gabungan menambahkan lapisan konsolidasi induk di seluruh gudang data desentralisasi. Biasanya ini hanya akan menampung potongan vertikal sempit dari data, karena tujuannya adalah untuk mengkonsolidasikan metrik kunci di seluruh bisnis untuk pelaporan tingkat perusahaan atau grup, daripada menyediakan platform MI umum untuk semua departemen. Departemen dibiarkan menghasilkan sistem EDW atau MI mereka sendiri tetapi diharuskan untuk melengkapi set data yang diperlukan untuk mengisi lapisan konsolidasi pusat.

Arsitektur ini memberi Anda yang terbaik dari kedua dunia. Manajemen pusat dapat melihat metrik mereka di seluruh organisasi, dan departemen dapat mengatur solusi MI untuk memenuhi kebutuhan mereka. Manajemen pusat hanya perlu memaksakan persyaratan data yang dibutuhkan oleh analitik dan MI mereka sebagai umpan yang disediakan oleh sistem departemen. Jika mereka membutuhkan lebih banyak pelaporan atau analisis mendalam pada departemen tertentu maka ini dapat dilengkapi dengan sistem departemen.

Artikel yang ditautkan di bawah ini membahas gudang data gabungan secara lebih mendalam.

http://www.zentut.com/data-warehouse/federated-data-warehouse-architecture/

Artikel ini membahas topologi gudang data secara lebih mendalam.

https://www.ibmbigdatahub.com/blog/data-warehouse-architectures-multinational-organizations-part-1

https://www.ibmbigdatahub.com/blog/data-warehouse-architectures-multinational-organizations-part-2

ConcernedOfTunbridgeWells
sumber
Jadi keduanya terdesentralisasi, tetapi federasi mengintegrasikan subset (metrik utama) di satu tempat?
LifeH2O
Iya. Itu benar. Ingatlah bahwa definisi ini cukup informal, sehingga orang dapat menggunakannya secara berbeda. Saya tidak pernah memiliki kesempatan untuk membangun kedua jenis sistem, meskipun saya pernah mengajukan proposal untuk arsitektur gabungan sekali dan saya telah melihat beberapa situs yang memiliki sistem yang dapat dikategorikan sebagai terdesentralisasi oleh definisi yang saya gunakan.
ConcernedOfTunbridgeWells