Oleh
Ida Bagus Brama Barnawa/1304505079
Jurusan Teknologi Informasi Fakultas Teknik Univeristas Udayana
Data Warehouse
Dosen Pengampu
I Putu Agus Eka Pratama S.T., M.T.
Dalam data warehouse, terdapat istilah data mart. Data mart adalah bentuk sederhana dari sebuah gudang data yang di kategorikan sesuai dengan kebutuhan pada objek tunggal atau area fungsional yang dibangun dan dikendalikan oleh departemen dalam sebuah organisasi, seperti sub-sub bagian dalam suatu usaha (marketing, inventory, penjualan, dll). Secara teknis dapat dikatakan bahwa data mart merupakan bagian dari data warehouse. Apabila data warehouse menyangkut keseluruhan data maka data mart merupakan sub-sub dari data warehouse. Data mart biasanya menggambar data dari beberapa sumber. Selain data warehouse, sumber bisa sistem operasional internal atau pusat data eksternal.
Dalam proses perubahan data dikenal dengan proses ETL, yakni Extraction, Transformation, and Loading. Proses ETL (Extraction, Transformation, Loading) merupakan proses yang harus dilalui dalam pembentukan data warehouse (Kimball, 2004). Berikut adalah penjelasan dari tiap proses.
Ekstraksi Data (Extract)
Ekstraksi data adalah proses dimana data diambil atau diekstrak dari berbagai sistem operasional, baik menggunakan query, atau aplikasi ETL. Terdapat beberapa fungsi ekstraksi data, yaitu :
1. Ekstraksi data secara otomatis dari aplikasi sumber.
2. Penyaringan atau seleksi data hasil ekstraksi.
3. Pengiriman data dari berbagai platform aplikasi ke sumber data.
4. Perubahan format layout data dari format aslinya.
5. Penyimpanan dalam file sementara untuk penggabungan dengan hasil ekstraksi dari sumber lain.
Transformasi Data (Transformation)
Transformasi adalah proses dimana data mentah (raw data) hasil ekstraksi disaring dan diubah sesuai dengan kaidah bisnis yang berlaku. Langkah-langkah dalam transformasi data adalah sebagai berikut:
1. Memetakan data input dari skema data aslinya ke skema data warehouse.
2. Melakukan konversi tipe data atau format data.
3. Pembersihan serta pembuangan duplikasi dan kesalahan data.
4. Penghitungan nilai-nilai derivat atau mula-mula.
5. Penghitungan nilai-nilai agregat atau rangkuman.
6. Pemerikasaan integritas referensi data.
7. Pengisian nilai-nilai kosong dengan nilai default.
8. Penggabungan data.
Pengisian Data (Loading)
Proses terakhir yang perlu dilakukan adalah proses pemuatan data yang didapatkan dari hasil transformasi ke dalam data warehouse. Cara untuk memuat data adalah dengan menjalankan SQL scriptsecara periodik. (Brigida Arie Minartiningtyas : ETL (Extraction, Transformation, Loading))
ELT (Extraction, Loading, Transformation) tidak jauh berbeda dengan ETL, hanya saja prosesnya tergantung dengan komputasi database. Pada ETL proses transformasi dibebankan ke utilitas di luar database sistem. Ini terutama jika database lebih kuat di storage tapi lemah di komputasinya. Sedangkan ELT maka proses transformasi dibebankan ke utilitas di dalam database sistem. Ini terutama jika memiliki mesin database yang komputasinya cukup kuat.
Kemudian setelah data diubah dan disimpan, maka proses berikutnya adalah proses pengolahan yang dilakukan oleh OLAP server. Dalam proses ini, data di proses sedemikian rupa sehingga akhirnya menghasilkan output berupa Informasi, Reporting, Query serta Data Mining yang nantinya dapat digunakan user sebagai expert system (sistem pakar), business intelligence, smart economic, big data, dll.
Untuk mempermudah dan mempertahankan ke-reliable-an sistem maka proses komputasi biasanya menggunakan teknologi Cloud Computing atau Big Data serta proses analisis yang juga dapat di lakukan di Cloud, ini termasuk layanan Cloud yang di sebut AaaS (Analytical as a Service).
Daftar Pustaka:
[1] Brigida Arie Minartiningtyas.
2014. ETL (Extraction, Transformation,
Loading). http://informatika.web.id/etl-extraction-transformation-loading.htm
. 11 Oct 2015
[2] Suroso, Aji, d.k.k. 2013. Data Mart. https://adorable3b.wordpress.com/2013/01/27/data-mart/ . 14 Oct 2015