DATA PREPARATION & DATA VISUALIZATION

1. Data Preparation

Data preparation adalah proses mengumpulkan, membersihkan, dan mengubah data mentah menjadi format yang sesuai untuk analisis atau pemodelan. Proses ini sangat penting karena data mentah sering kali mengandung kesalahan, inkonsistensi, atau informasi yang tidak relevan.

Langkah-langkah umum dalam data preparation meliputi:

  1. Mengumpulkan Data: Mengimpor data dari berbagai sumber seperti database, file CSV, API, dll.
  2. Membersihkan Data: Menghapus data duplikat, mengisi nilai yang hilang, dan menangani outlier.
  3. Mengubah Data: Mengonversi data ke format yang sesuai, misalnya mengubah tipe data, melakukan normalisasi, atau melakukan encoding pada variabel kategorikal.
  4. Feature Engineering: Membuat fitur baru yang lebih relevan untuk analisis atau pemodelan dari fitur yang sudah ada.

contoh data preparation :



Result :




2. Data Visualization

Data visualization adalah proses penyajian data dalam bentuk grafik atau gambar untuk memudahkan pemahaman informasi yang ada dalam data. Visualisasi data membantu mengidentifikasi tren, pola, dan anomali dalam data yang mungkin tidak terlihat dalam tabel data mentah.

Berikut adalah beberapa langkah umum untuk melakukan visualisasi data:

  1. Mengimpor dan Membersihkan Data: Memastikan data dalam kondisi siap untuk divisualisasikan.
  2. Memilih Jenis Grafik: Menentukan jenis grafik yang sesuai dengan data dan tujuan visualisasi (misalnya, bar chart, line chart, scatter plot, dll.).
  3. Membuat Grafik: Menggunakan library visualisasi seperti Matplotlib atau Seaborn untuk membuat grafik.
  4. Menambahkan Elemen Visualisasi: Menambahkan judul, label, legenda, dll. untuk memperjelas informasi yang disampaikan.
Berikut Contoh data Visualization: 





Result :











Komentar

Postingan populer dari blog ini

Tugas post 3: Conseptual DB