Pre-prosesesing
1. Data Cleaning Data cleaning (pembersihan data) adalah proses mengidentifikasi dan memperbaiki atau menghapus data yang tidak akurat, tidak lengkap, atau tidak relevan dari dataset. Proses ini penting untuk memastikan kualitas data yang baik sehingga analisis dan model prediktif yang dihasilkan lebih akurat dan dapat diandalkan. Langkah-langkah dalam data cleaning termasuk menghapus atau memperbaiki data yang hilang, menghapus duplikasi, mengubah tipe data, dan menangani outlier. Langkah-Langkah Data Cleaning Memeriksa Data yang Hilang: Menghapus Duplikasi: Mengubah Tipe Data: Menangani Outlier: Menghapus Kolom yang Tidak Relevan: Contoh data cleaning : Result 2. Data Collection Pengumpulan data (data collection) adalah proses mengumpulkan informasi dari berbagai sumber untuk dianalisis. Data ini dapat berasal dari berbagai sumber seperti survei, database, API, web scraping, dan sebagainya. Berikut adalah langkah-langkah umum untuk pengumpulan data: Menentukan Sumber Data: Identifik...