Transformation & Extract Dalam Data Warehouse

Transformation & Extract Dalam Data Warehouse


Definisi umum dari gudang data atau data warehouse adalah sistem komputer yang bertugas untuk mengarsipkan dan menganalisis sebuah data historis untuk keperluan suatu organisasi atau bisnis tertentu. Informasi yang dikelola dapat berupa data terkait penjualan, gaji, serta informasi harian lainnya. Dalam pembuatan atau pembentukan Data Warehouse tentu meiliki sebuah langkah atau proses didalamnya yang harus dilalui agar terbentuknya Data Warehouse itu sendiri yang mana salah satunya ialah Extract dan Transformation. Extract dan Transformation merupakan salah satu langkah untuk pembuatan atau pembentukan Data Warehouse yang harus di lalui.




Apabila kita mendengar kata Extract kita bisa menyimpulkan bahwa mengambil sebuah inti dari suatu bahan. Didalam Data Warehouse pun sama, yaitu memiliki sebuah proses dari banyaknya suatu data yang ada kita ambil dan kita pilih nantinya kita baca atau kita akses data yang kita pilih tersebut. Dengan banyaknya data yang kita temui atau akan kita gunakan nantinya definisikan kebutuhan untuk data kita sebelum melakukan Extract suatu data agar kita lebih mudah mengetahui data yang akan kita pergunakan. 


Selanjutnya yaitu adalah Transformation, tak asing bagi kita mendengar sebuah Transformation atau biasa kita dengar dengan transfer atau mengirimkan sebuah data. Dalam proses Data Warehouse setelah kita melakukan proses Extract sebuah data kita mengambil data dari proses hasil Extract data. lalu data tersebut di murnikan kembali atau diubah menjadi bentuk aslinya sesuai dengan kebutuhan pada Data Warehouse. kita melakukan penggabungan data dengan beberpa sistem agar data tersebut bersifat konsisten, hal inilah yang kita kenal dengan proses Transformation.


Contoh dari proses tersebut misalkan koita mengambil sebuah data Twitter dari Kaggle lalu kita melakukan filtering, cleaning data tersebut yang masih berantakan sesuai dengan kebutuhan kita seperti menghapus tanda petik dan sebagainya, sampai ke tahap sorting dan mendapatkan sebuah data yang valid dan bersih.


Semoga Bermanfaat :)

Komentar