Postingan

THR

Gambar
1. Data Cleaning Data cleaning adalah proses membersihkan data dari kesalahan atau ketidakakuratan untuk memastikan data tersebut berkualitas dan siap digunakan.                                          Result :                                            2. Data Transformation Data transformation adalah proses mengubah data dari satu format atau struktur ke format atau struktur lain. Proses ini penting dalam analisis data dan integrasi data, karena memungkinkan data dari berbagai sumber untuk digabungkan, dianalisis, dan digunakan secara efektif Reslut : 3. Data Reduction Data reduction adalah proses mengurangi jumlah data yang perlu dianalisis atau disimpan tanpa mengorbankan kualitas atau relevansi informasi.                  ...

SUPERVISE LEARNING (30 ALGORITMA PREDIKSI)

Survise learning, atau yang lebih dikenal sebagai supervised learning, adalah pendekatan dalam machine learning di mana model dilatih menggunakan data yang telah diberi label. Dalam supervised learning, model mempelajari hubungan antara fitur input dan label output untuk membuat prediksi pada data baru.  Berikut adalah 30 algoritma prediksi yang umum digunakan dalam supervised learning: 1. Linear Regression: Menggunakan hubungan linear antara variabel input dan output untuk memprediksi nilai kontinu. 2 . Logistic Regression: Digunakan untuk klasifikasi biner, memprediksi probabilitas dari kelas yang berbeda. 3. Decision Tree: Algoritma berbasis pohon yang membagi dataset menjadi subset yang lebih kecil berdasarkan fitur input untuk membuat prediksi. 4. Random Forest: Kombinasi dari banyak pohon keputusan untuk meningkatkan akurasi dan mengurangi overfitting. 5. Gradient Boosting Machine (GBM): Menggabungkan beberapa model prediktif sederhana untuk membentuk model yang lebih kuat...

QUIZ DATA MINING P5

 Link G.collab https://colab.research.google.com/drive/1lvEcWCBIzg40YPKhnyrb9QHoV-_hWWzN?usp=sharinghttps://colab.research.google.com/drive/1lvEcWCBIzg40YPKhnyrb9QHoV-_hWWzN?usp=sharing Link Pdf https://drive.google.com/file/d/18ZkEnFQzufpK_soZatcaKLDf8Zc-fv73/view?usp=sharing Menyelidiki tentang data transkrip nilai mahasiswa untuk mengeksplorasi beberapa aspek, seperti indeks prestasi semester per mahasiswa, keterkaitan antara indeks prestasi dan kelulusan tepat waktu, hubungan antara kelulusan dengan predikat 'Pujian' dan kelulusan tepat waktu, korelasi antara masa studi dan predikat kelulusan, dan perbandingan prestasi akademik berdasarkan jenis kelamin dengan metode, Menghitung nilai total untuk setiap semester berdasarkan data nilai total mata kuliah, Menghitung jumlah SKS yang diambil untuk setiap semester, Membagi nilai total dengan jumlah SKS untuk setiap semester.

Pre-prosesesing

Gambar
1. Data Cleaning Data cleaning (pembersihan data) adalah proses mengidentifikasi dan memperbaiki atau menghapus data yang tidak akurat, tidak lengkap, atau tidak relevan dari dataset. Proses ini penting untuk memastikan kualitas data yang baik sehingga analisis dan model prediktif yang dihasilkan lebih akurat dan dapat diandalkan. Langkah-langkah dalam data cleaning termasuk menghapus atau memperbaiki data yang hilang, menghapus duplikasi, mengubah tipe data, dan menangani outlier. Langkah-Langkah Data Cleaning Memeriksa Data yang Hilang: Menghapus Duplikasi: Mengubah Tipe Data: Menangani Outlier: Menghapus Kolom yang Tidak Relevan: Contoh data cleaning : Result 2. Data Collection Pengumpulan data (data collection) adalah proses mengumpulkan informasi dari berbagai sumber untuk dianalisis. Data ini dapat berasal dari berbagai sumber seperti survei, database, API, web scraping, dan sebagainya. Berikut adalah langkah-langkah umum untuk pengumpulan data: Menentukan Sumber Data: Identifik...

DATA PREPARATION & DATA VISUALIZATION

Gambar
1. Data Preparation Data preparation adalah proses mengumpulkan, membersihkan, dan mengubah data mentah menjadi format yang sesuai untuk analisis atau pemodelan. Proses ini sangat penting karena data mentah sering kali mengandung kesalahan, inkonsistensi, atau informasi yang tidak relevan. Langkah-langkah umum dalam data preparation meliputi: Mengumpulkan Data: Mengimpor data dari berbagai sumber seperti database, file CSV, API, dll. Membersihkan Data: Menghapus data duplikat, mengisi nilai yang hilang, dan menangani outlier. Mengubah Data: Mengonversi data ke format yang sesuai, misalnya mengubah tipe data, melakukan normalisasi, atau melakukan encoding pada variabel kategorikal. Feature Engineering: Membuat fitur baru yang lebih relevan untuk analisis atau pemodelan dari fitur yang sudah ada. contoh data preparation : Result : 2. Data Visualization Data visualization adalah proses penyajian data dalam bentuk grafik atau gambar untuk memudahkan pemahaman informasi yang ada dalam d...

CCC (COMPUTATIONAL, COGNITIVE, AND COMMUNICATION)

 CCC (Computational, Cognitive, and Communication) adalah kerangka kerja yang digunakan dalam pemrosesan informasi dan analisis data. Ini menggambarkan tiga aspek penting yang terlibat dalam pemahaman dan penggunaan informasi. Berikut penjelasan singkat tentang masing-masing aspek: 1. Computational (Komputasional) :    - Merujuk pada aspek teknis dari pemrosesan informasi.    - Ini berkaitan dengan kemampuan untuk mengumpulkan, menyimpan, mengelola, dan menganalisis data menggunakan teknologi dan perangkat lunak komputer.    - Komputasi melibatkan penggunaan algoritma, pemrograman, pemrosesan paralel, dan teknik komputasi lainnya untuk mengolah data secara efisien. 2. Cognitive (Kognitif):    - Mengacu pada aspek mental dari pemrosesan informasi.    - Ini berfokus pada pemahaman manusia terhadap informasi, termasuk bagaimana manusia mempersepsikan, memahami, dan membuat keputusan berdasarkan informasi yang diterima.    - K...

SEMMA (SAMPLE, EXPLORE, MODIFY, MODEL, ASSESS)

 SEMMA adalah singkatan dari Sample, Explore, Modify, Model, dan Assess. Ini adalah kerangka kerja yang digunakan dalam analisis data dan data mining. Berikut adalah penjelasan singkat tentang setiap tahapan dalam SEMMA: 1. Sample (Sampel) :    - Tahap ini melibatkan pemilihan sampel representatif dari data yang tersedia.    - Sampel diambil dari populasi data untuk analisis lebih lanjut.    - Sampel yang tepat penting untuk memastikan bahwa hasil analisis mencerminkan populasi secara keseluruhan. 2. Explore (Eksplorasi) :    - Setelah sampel dipilih, data dieksplorasi untuk memahami karakteristiknya.    - Analisis eksplorasi termasuk statistik deskriptif, visualisasi data, dan pemahaman awal tentang pola dan hubungan di dalamnya.    - Eksplorasi membantu mengidentifikasi tren, outlier, dan pola menarik lainnya dalam data. 3. Modify (Modifikasi) :    - Pada tahap ini, data dimodifikasi atau dibersihkan untuk meni...