Pengertian Data Warehouse (Gudang Data)

Apa itu Data Warehouse?



ilustrasi oleh Undraw
Berkembangnya teknologi dan Informasi saat ini telah melahirkan “gunungan” data di bidang ilmu pengetahuan, bisnis dan pemerintah. Kemampuan teknologi informasi untuk mengumpulkan dan menyimpan berbagai tipe data jauh meninggalkan kemampuan untuk menganalisis, meringkas dan mengekstraksi “pengetahuan” dari data. Metodologi tradisional untuk menganalisis data yang ada, tidak dapat menangani data dalam jumlah besar. Para peneliti melihat peluang untuk melahirkan sebuah teknologi baru yang menjawab kebutuhan ini, yaitu data warehouse. Teknologi ini sekarang sudah ada dan diaplikasikan oleh perusahaan perusahaan untuk memecahkan berbagai permasalahan bisnis.

Data warehouse merupakan metode dalam perancangan database, yang menunjang DSS (Decission Support System) dan EIS (Executive Information System). Secara fisik data warehouse adalah database, tapi perancangan data warehouse dan database sangat berbeda. Dalam perancangan database tradisional menggunakan normalisasi, sedangkan pada data warehouse normalisasi bukanlah cara yang terbaik.


Pengertian Data Warehouse


Bayangkan jika ada sejumlah data dari berbagai sumber data (aplikasi, sistem informasi, website, dll) Setiap data punya format, struktur, model, jenis masing-masing Data-data ini kemudian “digudangkan” ke dalam suatu “tempat” untuk kemudian “diolah” atau sewaktu waktu bisa diambil lagi jika diperlukan. Mirip seperti konsep gudang (warehouse) untuk penyimpanan (berbagai) barang.

Pengertian Data Warehouse dapat bermacam-macam namun mempunyai inti yang sama, seperti pendapat beberapa ahli berikut ini :

  • Menurut W.H. Inmon dan Richard D.H., data warehouse adalah koleksi data yang mempunyai sifat berorientasi subjek,terintegrasi,time-variant, dan bersifat tetap dari koleksi data dalam mendukung proses pengambilan keputusan management.
  • Menurut Vidette Poe, data warehouse merupakan database yang bersifat analisis dan read only yang digunakan sebagai fondasi dari sistem penunjang keputusan.
  • Menurut Paul Lane, data warehouse merupakan database relasional yang didesain lebih kepada query dan analisa dari pada proses transaksi, biasanya mengandung history data dari proses transaksi dan bisa juga data dari sumber lainnya. Data warehouse memisahkan beban kerja analisis dari beban kerja transaksi dan memungkinkan organisasi menggabung/konsolidasi data dari berbagai macam sumber.

Dari definisi-definisi yang dijelaskan tadi, dapat disimpulkan data warehouse adalah database yang saling bereaksi yang dapat digunakan untuk query dan analisisis, bersifat orientasi subjek, terintegrasi, time-variant,tidak berubah yang digunakan untuk membantu para pengambil keputusan.

Pada Data Warehouse:

  • Data dikumpulkan dari berbagai sumber data
  • Struktur dan jenis data berbeda
  • Dilakukan penyeragaman data, pembersihan data
  • Diolah/proses
  • Analisa data
  • Tampilkan hasilnya (report, dashboard) untuk analisa, pengambilan keputusan, 
  • strategi, informasi, dll.


Sejarah Data Warehouse


Sejak awal 1990-an, data gudang yang berada di garis depan aplikasi teknologi informasi sebagai cara bagi organisasi untuk secara efektif menggunakan informasi digital untuk perencanaan bisnis dan pengambilan keputusan. Oleh karena itu, pemahaman tentang sistem arsitektur data warehouse adalah atau akan menjadi penting dalam peran dan tanggung jawab dalam pengelolaan informasi.

  • 1960 – General Mills dan Dartmouth College, dalam proyek penelitian bersama, mengembangkan dimensi syarat dan fakta.
  • 1970 – ACNielsen dan IRI menyediakan data mart dimensi untuk penjualan eceran.
  • 1983 – Teradata memperkenalkan sistem manajemen database yang khusus dirancang untuk mendukung keputusan.
  • 1988 – Barry Devlin dan Paul Murphy mempublikasikan artikel arsitektur An untuk dan sistem informasi bisnis di IBM Systems Journal mana mereka memperkenalkan istilah “data bisnis” gudang.
  • 1990 – memperkenalkan Sistem Bata Merah Red Brick Warehouse, sebuah sistem manajemen database khusus untuk data warehouse.
  • 1991 – memperkenalkan Prism Prism Solusi Gudang Manager, perangkat lunak untuk mengembangkan gudang data.
  • 1991 – Bill Inmon menerbitkan buku Membangun Data Warehouse.
  • 1995 – Data Warehousing Institute, sebuah organisasi nirlaba yang mempromosikan data warehouse, didirikan.
  • 1996 – Ralph Kimball menerbitkan buku The Data Warehouse Toolkit.
  • 2000 – Daniel Linstedt melepaskan Vault Data, memungkinkan real time diaudit Data Warehouse.


Keuntungan Data Warehouse


Data warehouse merupakan pendekatan untuk menyimpan data dimana sumber-sumber data yang heterogen (yang biasanya tersebar pada beberapa database OLTP) dimigrasikan untuk penyimpanan data yang homogen dan terpisah. Keuntungan yang didapatkan dengan menggunakan data warehouse tersebut dibawah ini (Ramelho).

  • Data diorganisir dengan baik untuk query analisis dan sebagai bahan untuk pemrosesan transaksi.
  • Perbedaan diantara struktur data yang heterogen pada beberapa sumber yang terpisah dapat diatasi.
  • Aturan untuk transformasi data diterapkan untuk memvalidasi dan mengkonsolidasi data apabila data dipindahkan dari database OLTP ke data warehouse.
  • Masalah keamanan dan kinerja bisa dipecahkan tanpa perlu mengubah sistem produksi.

Membangun data warehouse tentu saja memberikan keuntungan lebih bagi suatu perusahaan, karena data warehouse dapat memberikan keuntungan strategis pada perusahaan tersebut melebihi pesaing-pesaing mereka. Keuntungan tersebut diperoleh dari beberapa sumber (Sean Nolan,Tom Huguelet):

  • Kemampuan untuk mengakses data yang besar
  • Kemampuan untuk memiliki data yang konsistent
  • Kemampuan kinerja analisa yang cepat
  • Mengetahui adanya hasil yang berulang-ulang
  • Menemukan adanya celah pada business knowledge atau business process.
  • Mengurangi biaya administrasi
  • Memberi wewenang pada semua anggota dari perusaahan dengan menyediakan kepada mereka informasi yang dibutuhkan agar kinerja bisa lebih efektif.


Konsep dan Arsitektur Data Warehouse


Data warehouse : kumpulan data yang berorientasi subjek, terintegrasi, time variant, dan non volatile untuk mendukung proses pengambilan keputusan.

Data warehouse mengorganisasi-kan subjek utama perusahaan (pelanggan, produk, dan penjualan), bukan area aplikasi utama (faktur pelanggan, pengawasan stock, dan penjualan produk). Hal ini menggambarkan kebutuhan untuk menyimpan data pendukung keputusan daripada aplikasi yang berorientasi data.

  • Integrated

Pengambilan secara bersamaan sumber data yang berasal dari sistem aplikasi berbagai perusaan besar yang berbeda. Sumber data sering tidak konsisten, misal berbeda format. Sumber data yang terintegrasi harus dapat dibuat konsis-ten untuk menggambarkan view gabungan data ke pemakai.

  • Time variant

data warehouse hanya akurat dan valid pada saat tertentu atau beberapa interval waktu tertentu.

  • Non volatile

data tidak diperbaharui secara real time tetapi diperbaharui dari sistem operasional secara regular. Data baru selalu ditambahkan sebagai lampiran pada basis data, bukan menggantikan data lama.


Definisi Decision Support System


Istilah dari decision support system telah digunakan dengan banyak cara (Alter 1980) dan menerima banyak definisi yang berbeda menurut pandangan dari sang penulis (Druzdzel dan Flynn 1999). Finlay (1994) dan lainnya mendefiniskan DSS kurang lebih sebagai sebuah sistem berbasis komputer yang membantu dalam proses pengambilan keputusan.

Turban (1995) mendefinisikan secara lebih spesifik dengan, sesuatu yang interaktif,flexible dan dapat menyesuaikan diri(adaptable) dari sistem informasi berdasarkan komputer, khususnya pengembangan untuk mendukung pemecahan masalah dari non-struktur management, untuk meningkatkan pengambilan keputusan. Dengan menggunakan data, mendukung antar muka yang mudah digunakan dan memberikan wawasan untuk sang pengambil keputusan.

Definisi lainnya bisa jadi gugur dibandingkan dengan dua pandangan ekstrim berikut, Keen dan Scott Morton (1978), DSS adalah dukungan berdasar kan komputer  untuk para pengambil keputusan management yang berurusan dengan masalah semi-struktur. Sprague dan Carlson (1982), DSS adalah  sistem berdasarkan komputer interaktif yang membantu para pengambil keputusan  menggunakan data dan model-model untuk memecahkan masalah yang tak terstruktur(unstructured problem). 

Menurut Power (1997), istilah DSS mengingatkan suatu yang berguna dan istilah inklusif untuk banyak jenis sistem informasi yang mendukung pembuatan pengambilan keputusan. Dia dengan penuh humor menambahkan bahwa jika suatu sistem komputer yang bukan OLTP, seseorang akan tergoda untuk menyebutnya sebagai DSS.

Seperti yang kita lihat, DSS memiliki banyak arti dengan maksud yang kurang lebih hampir sama, yaitu suatu sistem komputer yang berguna bagi para pengambil keputusan untuk memecahkan masalah mereka yang kurang lebih berhadapan dengan masalah non-struktur atau semi-struktur.


Hubungan Data Warehouse Dengan DSS


Setelah kita lihat dan selami tentang data warehouse, kita dapat menyimpulkan bahwa data warehouse adalah sebuah model database yang berguna untuk menyimpan dan memproses data dengan pendekatan kepada kegunaan data dalam pengambilan keputusan bagi EIS atau DSS.

Sebuah DSS (tergantung dengan yang disupport-nya)membutuhkan data warehouse agar dapat menjalankan kerjanya dengan baik. Dan memang data warehouse sendiri dibangun untuk memenuhi kebutuhan DSS.

Referensi :

  • ppt materi psti pertemuan 11 dari Bapak I Putu Agus Eka Pratama, S.T., M.T.

Jika kamu Memiliki Ide Cerita Tentang Personal Branding, Bisa klik melalui tombol dibawah ini yah, Ide-Ide Kamu akan kami bahas di Next Post dan nama kamu akan kami cantumkan. Terima Kasih 👌

Posting Komentar

0 Komentar