KOMPONEN-KOMPONEN DALAM DATAWAREHOUSE

Komponen Datawarehouse


Data Source
Untuk membangun suatu datawarehouse yang baik data yang didapatkan harus
teralokasi dengan baik. Ini melibatkan OLTP saat ini dimana informasi ‘dari hari
ke hari’ tentang bisnis yang berjalan, tentunya dengan data historis periode
sebelumnya, yang mungkin telah dikumpulkan dalam beberapa bentuk sistem
lain. Sering kali data yang terbentuk bukan terbentuk database relasional,
sehingga membutuhkan banyak upaya untuk mengambil data yang diinginkan.

Design Datawarehouse
Proses perancangan datawarehouse sangat berhati-hati untuk memilih jenis
query yang digunakan dalam datawarehouse. Tahapan ini sangat memerlukan
pemahaman yang baik tentang skema database yang ingin dibuat, dan haruslah
selalu aktif untuk berkomunikasi dengan pengguna. Desain adalah proses yang
tidak dilakukan satu kali, melainkan berulang-ulang agar model yang dimiliki
stabil. Tahap ini harus dilakukan secara berhati-hati karena model akan diisi
dengan data yang jumlahnya sangat banyak, yang salah satunya dari beberapa
model adalah model yang tak dapat diubah.

Akuisi data
Proses perpindahan data dari sumbernya (source) ke datawarehouse. Proses ini
proses yang menggunakan banyak waktu dalam proyek datawarehouse, dan
dilakukan dengan software yang dikenal dengan ETL (extract,transform,load)
Tools. Sekarang sudah hamper lebih kurang 60 tool yang tersebar diranah maya.

Komunitas eLearning IlmuKomputer.Com Copyright © 2003-2007 IlmuKomputer.Com
Waktu yang dibutuhkan untuk akuisisi data bisa mencapai berbulan-bulan
bahkan bertahun-tahun.

Perubahan data tangkapan
Pembaharuan data periodik datawarehouse dari sistem transaksi menjadi rumit
karena harus diidentifikasi dari sumber data yang selalu up to date. Ini disebut
dengan ‘perubahan data capture’. Ini merupakan tahapan khusus, dan sudah
cukup banyak software yang beredar untuk mengatasinya. Seperti Replication
Server, Publish/Subscribe, Triggers and Stored Procedures, dan Database log
Analysis.

Pembersihan Data
Ini biasanya dilakukan dengan akuisisi data, kalau dalam ETL ini terdapat pada
bagian ‘T’. Datawarehouse yang berisi data tidak benar tidak hanya tak berguna,
tapi juga menyesatkan. Ide dibalik pembuatan datawarehouse adalah untuk
memudahkan pengambilan keputusan, jika keputusan yang besar yang ditunjang
oleh data yang tidak valid maka perusahaan mengalami resiko yang amat besar
pula.
Pembersihan data suatu proses rumit yang memvalidasi dan bila perlu
mengoreksi data sebelum masuk kedalam datawarehouse. Pembersihan data
dapat juga disebut sebagai “data scrubbing” atau “penjamin kualitas data”,
proses ini harus dilakukan secara berhati-hati dan dilakukan keseluruhan
terutama datawarehouse yang diambil dari perangkat yang sudah tua.

Data Aggregation
Termasuk proses tansformasi, datawarehouse dirancang untuk menyimpanan
yang amat detil dari tiap transaksi, untuk beberapa tingkat aggregate
(ringkasan). Keuntungan jika data diringkas yaitu query khusus dalam
datawarehouse berjalan lebih cepat. Kekurangannya adalah informasi yang
didapat kurang, karena ringkasnya data yang ada pada datawarehouse. Ini harus
berhati-hati karena keputusan tidak dapat dibatalkan tanpa membangun
kembali datawarehouse dan mencocokan dengan datawarehouse lain (atau
sumber data lain). Paling aman digunakan oleh perusahaan yang amat besar,
yang mampu membangun datawarehouse tingkat detail yang tinggi dengan
biaya yang besar pula.
Previous
Next Post »