Data Warehouse Dan Pembahasannya

1. Pengertian Data Warehouse

      Menurut Innon tahun 2002, h.31-35, Data warehouse adalah kumpulan data yang berorientasi subyek, terintegrasi, tidak dapat diupdate, memiliki dimensi waktu, yang digunakan untuk mendukung proses manajemen dalam mengambil keputusan dan kecerdasan bisnis.

2. Karakteristik Data Warehouse

      Ada 4 karakteristik data warehouse yaitu :
a. Berorientasi Subjek (Subject Oriented
Data warehouse berorientasi subject artinya data warehouse didesain untuk menganalisa data berdasarkan subject-subject tertentu dalam organisasi,bukan pada proses atau fungsi aplikasi tertentu.
b. Teritegrasi (Integrated)
Data Warehouse dapat menyimpan data-data yang berasal dari sumber-sumber yang terpisah kedalam suatu format yang konsisten dan saling terintegrasi satu dengan lainnya. Dengan demikian data tidak bisa dipecah-pecah karena data yang ada merupakan suatu kesatuan yang menunjang keseluruhan konsep data warehouse itu sendiri
c. Rentang Waktu (Time Variant)
Seluruh data pada data warehouse dapat dikatakan akurat atau valid pada rentang waktu tertentu. Data tidak menyediakan status saat ini, mereka disimpan untuk lima atau sepuluh tahun atau lebih dan digunakan untuk tren, peramalan dan perbandingan.
d. Nonvolatile
maksudnya data pada data warehouse tidak di-update secara real time tetapi di refresh dari sistem operasional secara reguler. Data yang baru selalu  ditambahkan sebagai suplemen bagi database itu sendiri dari pada sebagai sebuah perubahan. Database tersebut secara kontinyu menyerap data baru ini, kemudian secara incremental disatukan dengan data sebelumnya.

3. Keuntungan Data Warehouse

      Membangun data warehouse tentu saja memberikan keuntungan lebih bagi suatu perusahaan, karena data warehouse dapat memberikan keuntungan strategis pada perusahaan tersebut melebihi pesaing-pesaing mereka. Keuntungan tersebut diperoleh dari beberapa sumber (Sean Nolan,Tom Huguelet):
1. Kemampuan untuk mengakses data yang besar
2. Kemampuan untuk memiliki data yang konsistent
3. Kemampuan kinerja analisa yang cepat
4. Mengetahui adanya hasil yang berulang-ulang
5. Menemukan adanya celah pada business knowledge atau business process.
6. Mengurangi biaya administrasi
7. Memberi wewenang pada semua anggota dari perusaahan dengan menyediakan kepada mereka informasi yang dibutuhkan agar kinerja bisa lebih efektif.

4. Tujuan Data Warehouse

1. Mempermudah pengaksesan informasi perusahaan
2. Menyediakan informasi perusahaan secara konsisten
3. Mampu beradaptasi dan tahan terhadap perubahan
4. Mampu mengamankan informasi Perusahaan
5. Mampu memberikan dukungan dalam pengambilan keputusan
6. Dapat diterima dan dioperasikan dengan baik oleh pengguna

5. Mekanisme Data Pada Data Warehouse

      Data warehouse memiliki empat level data (kimball, 2004), yaitu :
1. Level Operasional
Level ini khusus menyimpan data yang berorientasi pada aplikasi secara detil dan diutamakan untuk memenuhi kebutuhan operasional. Akses pada level operasional pada umumnya memiliki frekuensi yang sangat tinggi. Level ini sering juga disebut dengan OLTP (Online Analytical Transactional Processing)
2. Level Integrasi
Level ini menyimpan data historis yang terintegrasi serta berorientasi subjek. Data pada level ini lebih sederhana daripada di level operasional dan tidak dapat di-update.
3. Level data mart
Level ini dirancang sesuai dengan kebutuhan dari pengguna dan merupakan data agregasi.
4. Level Individual
Level ini merupakan tempat terjadinya analisis dan reporting. Data pada level ini bersifat temporal, ad hoc, heuristik, dan non retitif.

6. Proses Dalam Data Warehouse

      Beberapa proses yang terjadi dari basis data operasional menuju data warehouse adalah sebagai berikut (corey, dkk, 2001) :
1. Melakukan ekstraksi data dari berbagai sumber
2. Melakukan integrasi data ke tempat yang umum
3. Menyimpan data dalam format yang dapat digunakan oleh pengguna
4. Menyediakan mekanisme bagi pengguna agar dapat mengakses data warehouse.

7. Data Mart

      Bill Inmon dkk menentukan data mart adalah subset dari data warehouse yang telah disesuaikan agar sesuai dengan kebutuhan departemen.

8. Metadata

      Metadata adalah tentang kumpulan data yang telah ada pada program data warehouse dan data operasional.

9. ETL (Extraction Transformation Loading)

      ETL adalah salah satu proses dalam data warehouse yang melibatkan pembacaan data dari sumbernya, pembersihan dan penyesuaian format data tersebut, penulisan data tersebut ke dalam ruang penyimpanan untuk digunakan lebih lanjut. (Songini, 2004).

10. Online Analythical Processing (OLAP)

      Konsep OLAP pertama diusulkan oleh E.F Codd, untuk merepresentasikan model data multidimensional. OLAP (Online Analytical Processing) adalah teknologi yang memproses data di dalam data warehouse dalam struktur multidimensi, menyediakan jawaban yang cepat untuk query analisis yang kompleks
      Tujuan dari OLAP adalah mengordinisir sejumlah data yang besar, agar bisa d1~nalisa dan.dievaluasi dengan cepat menggunakan sarana online seperti misalnya Microsoft PivotTable serta representasi grafik. Sistem OLAP menyediakan kecepatan dan fleksibilitas untuk mendukung analisa dalam waktu nyata.
      Data warehouse dan OLAP (Online analytical Processing) menyediakan kunci untuk memecahkan masalah yang kompleks, karena secara umum mampu menyediakan data yang terkonsolidasi dan konsisten, berorientasi pada topic tertentu, bersifat historis dan hanya bias dibaca (read only).

11. Cube

      Cube adalah bagian utama dari OLAP. Cube berisi kumpulan banyak data yang telah disatukan (di agregasi) sehingga mempercepat hasil query. Misal, data penjualan yang telah disatukan dengan data periode waktu dan jenis barang, akan mempercepat hasil query untuk menampilkan data penjualan per minggu, atau per bulan dan berdasarkan jenis barang tertentu. (Webb, dkk., 2009)

12. Pengembangan Data Warehouse

      Menurut Kimball ada sembilan tahap yang dilakukan untuk mengembangkan database data warehouse, antara lain:
1. Pemilihan proses
2. Pemilihan sumber
3. Mengidentifikasi dimensi
4. Pemilihan fakta
5. Menyimpan pre-kalkukasi di tabel fakta
6. Melengkapi tabel dimensi
7. Pemilihan durasi tabel data
8. Menelusuri perubahan dimensi
9. Menentukan prioritas dan mode query

13. Perancangan Data Warehouse

      Ada 2 pendekatan dalam membuat data warehouse:
1. Skema Bintang (Star Schema)
Mengikuti bentuk bintang. Skema bintang terdiri atas 1 tabel fakta (fact table) dipusat bintang dengan beberapa table dimensi (dimensional tables) mengelilinginya. Semua table dimensi secara langsung berhubung ke table fakta.


2. Skema Bola Salju (Snowflake Schema)
Skema bola salju merupakan perluasan dari skema bintang dengan tambahan berupa beberapa table dimensi yang tidak terhubung secara langsung ke tabel fakta, melainkan melalui tabel dimensi lainnya.