Big Data Science

Program ini dirancang untuk membantu peserta memahami bagaimana mengelola, memproses, menganalisis, dan memvisualisasikan data berukuran besar yang berasal dari berbagai sumber. Peserta akan mempelajari ekosistem Big Data, teknologi pendukung, teknik analitik modern, serta penerapan Data Science untuk menghasilkan insight strategis yang mendukung pengambilan keputusan bisnis berbasis data.

Target Audience

Pelatihan ini cocok untuk:

  • Data Analyst
  • Data Scientist
  • Business Intelligence Analyst
  • Data Engineer
  • Machine Learning Engineer
  • IT Professional
  • Software Developer
  • Mahasiswa dan Fresh Graduate di bidang Teknologi Informasi
Learning Outcomes

Setelah mengikuti pelatihan ini, peserta diharapkan mampu:

  • Memahami konsep dan karakteristik Big Data.
  • Mengidentifikasi teknologi dan arsitektur Big Data yang umum digunakan.
  • Mengelola dan memproses data dalam volume besar.
  • Melakukan analisis data menggunakan pendekatan Data Science.
  • Membangun pipeline data untuk kebutuhan analitik.
  • Menggunakan teknik visualisasi untuk menyajikan insight secara efektif.
  • Memahami integrasi Big Data dengan Machine Learning dan AI.
Curriculum

Modul 1 — Fundamental Big Data Science & Analytics

Membahas konsep dasar Big Data dan Data Analytics dari perspektif bisnis maupun teknologi. Peserta akan mempelajari karakteristik dan jenis data, proses analisis data, konsep machine learning, berbagai pendekatan analytics, serta peran Business Intelligence dan visualisasi data dalam menghasilkan wawasan yang mendukung pengambilan keputusan. Modul ini juga mengulas manfaat, tantangan, dan pertimbangan penting dalam adopsi Big Data di organisasi.

Pokok Bahasan

  • Memahami Big Data
  • Terminologi dan Konsep Dasar Big Data
  • Pendorong Bisnis Big Data dan Pendorong Teknologi
  • Teknologi Enterprise Tradisional yang Berkaitan dengan Big Data
  • OLTP, OLAP, ETL, dan Data Warehouse dalam Konteks Big Data
  • Karakteristik Data dalam Lingkungan Big Data
  • Jenis Dataset dalam Lingkungan Big Data
  • Data Terstruktur, Tidak Terstruktur, dan Semi-Terstruktur
  • Metadata dan Keakuratan Data (Data Veracity)
  • Analisis Dasar dan Analitik
  • Analisis Kuantitatif dan Kualitatif
  • Jenis-jenis Machine Learning
  • Analitik Deskriptif dan Diagnostik
  • Analitik Prediktif dan Preskriptif
  • Business Intelligence dan Big Data
  • Visualisasi Data dan Big Data
  • Adopsi Big Data dan Pertimbangan Perencanaan

Modul 2 — Big Data Analysis & Technology Concepts

Membahas konsep dan teknik analisis data modern dalam lingkungan Big Data, termasuk metode statistik, machine learning dasar, serta pendekatan analitik seperti A/B testing, regresi, clustering, dan time series analysis. Peserta juga akan mempelajari analisis data lanjutan seperti sentiment analysis, network analysis, serta filtering techniques, disertai pemahaman konsep teknologi backend yang mendukung ekosistem Big Data seperti storage, processing engine, dan cloud computing.

Pokok Bahasan

  • Siklus Hidup Analisis Big Data (dari evaluasi kasus bisnis hingga analisis dan visualisasi data)
  • A/B Testing dan Korelasi
  • Regresi dan Heat Map (Peta Panas)
  • Analisis Deret Waktu (Time Series Analysis)
  • Analisis Jaringan dan Analisis Data Spasial
  • Klasifikasi dan Clustering
  • Filtering, termasuk Collaborative Filtering dan Content-Based Filtering
  • Analisis Sentimen dan Text Analytics
  • Cluster serta Pemrosesan Beban Kerja Batch dan Transaksional
  • Hubungan Cloud Computing dengan Big Data
  • Mekanisme Teknologi Dasar Big Data
  • Penyimpanan Data Big Data dan Mesin Pemrosesan (Processing Engines)
  • Resource Manager, Data Transfer Engine, dan Query Engine
  • Analytics Engine, Workflow Engine, dan Coordination Engine

Modul 4 — Big Data Analysis & Science

Modul ini membahas konsep analitik dan data science dalam konteks Big Data, dengan fokus pada teknik eksplorasi, statistik, dan pemodelan data untuk dataset berukuran besar, beragam, dan dinamis.

Pokok Bahasan

  • Ilmu Data, Data Mining, dan Pemodelan Data
  • Kategori Dataset Big Data
  • Dataset dengan Volume Tinggi, Kecepatan Tinggi, Variasi Tinggi, Verifikasi Tinggi, dan Nilai Tinggi
  • Analisis Data Eksploratif (EDA)
  • Ringkasan Numerik EDA, Aturan, dan Reduksi Data
  • Jenis Analisis EDA, termasuk Univariate, Bivariate, dan Multivariate
  • Statistik Dasar, termasuk Kategori Variabel dan Matematika Terkait
  • Analisis Statistik, termasuk Deskriptif, Inferensial, Kovarians, Uji Hipotesis, dll.
  • Ukuran Variasi atau Dispersi, Rentang Interkuartil & Outlier, Z-Score, dll.
  • Probabilitas, Frekuensi, Estimator Statistik, Interval Kepercayaan, dll.
  • Data Munging dan Machine Learning
  • Variabel dan Notasi Matematika Dasar
  • Ukuran Statistik dan Inferensi Statistik
  • Analisis Data Konfirmatori (CDA)
  • Uji Hipotesis CDA, Hipotesis Nol, Hipotesis Alternatif, Signifikansi Statistik, dll.
  • Distribusi dan Teknik Pemrosesan Data
  • Discretization Data, Binning, dan Clustering
  • Teknik Visualisasi, termasuk Diagram Batang, Diagram Garis, Histogram, Poligon Frekuensi, dll.
  • Prediksi Regresi Linear, Mean Squared Error, dan Koefisien Determinasi R², dll.
  • Clustering k-means, Distorsi Cluster, Nilai Fitur yang Hilang, dll.
  • Ringkasan Numerik

Modul 5 — Advanced Big Data Analysis & Science

Modul ini membahas teknik analisis data lanjutan dalam konteks Big Data, mencakup pemodelan statistik, machine learning, pattern mining, serta evaluasi model untuk meningkatkan akurasi analisis dan prediksi pada dataset besar.

Pokok Bahasan

  • Pemodelan, Evaluasi Model, Fitting Model, dan Overfitting Model
  • Model statistik dan ukuran evaluasi model
  • Cross-validation, bias-variance, confusion matrix, dan F-score
  • Algoritma machine learning dan identifikasi pola
  • Aturan asosiasi (association rules) dan algoritma Apriori
  • Reduksi data, seleksi fitur (feature selection), dan pengurangan dimensi
  • Ekstraksi fitur, diskretisasi data (binning dan clustering)
  • Teknik statistik lanjutan
  • Model parametrik vs non-parametrik, clustering vs non-clustering
  • Metode berbasis jarak, supervised vs semi-supervised learning
  • Regresi linear dan regresi logistik untuk Big Data
  • Aturan klasifikasi untuk Big Data
  • Regresi logistik, Naïve Bayes, smoothing Laplace, dll.
  • Decision Tree untuk Big Data
  • Pruning pohon, pemilihan fitur (feature splitting), algoritma One Rule (1R)
  • Identifikasi pola dan aturan asosiasi (Association Rules), algoritma Apriori
  • Analisis deret waktu (time series), tren, dan musiman (seasonality)
  • K-Nearest Neighbor (kNN) dan K-means
  • Analitik teks untuk Big Data
  • Bag of Words, Term Frequency, Inverse Document Frequency (TF-IDF), Cosine Distance, dll.
  • Deteksi outlier untuk Big Data
  • Teknik statistik, berbasis jarak, supervised, dan semi-supervised learning

Modul 6 — Big Data Analysis & Science Lab

Modul ini berupa latihan berbasis studi kasus untuk menguji penerapan konsep Big Data Analysis & Science dalam konteks permasalahan nyata. Peserta diminta mengintegrasikan teknik statistik, analitik, dan machine learning untuk menghasilkan solusi berbasis data.

Pokok Bahasan

  • Latihan Membaca 6.1: Studi Kasus TMC – Latar Belakang
  • Latihan Praktikum 6.2: Analisis untuk Meningkatkan Kualitas Produk
  • Latihan Praktikum 6.3: Analisis untuk Menurunkan Total Biaya Kepemilikan (Total Cost of Ownership)
  • Latihan Membaca 6.4: Studi Kasus PLGM – Latar Belakang
  • Latihan Praktikum 6.5: Analisis untuk Rencana Pemasaran dengan Hasil Tinggi (High-Yield Marketing Plan)
  • Latihan Praktikum 6.6: Analisis Tata Letak Barang dan Data Kartu Kredit
  • Latihan Membaca 6.7: Studi Kasus LHL – Latar Belakang
  • Latihan Praktikum 6.8: Meningkatkan Kemampuan Diagnosis Pasien
  • Latihan Membaca 6.9: Studi Kasus SWP – Latar Belakang
  • Latihan Praktikum 6.10: Meningkatkan Manajemen Risiko dan Memahami Pola Permintaan
Course Level
Intermediate
Delivery Mode
Offline
Online
Certification Body
Arcitura
Rp. 21.350.000,-
Brochure File

Available Schedule by Course