Tổng Quan Data Wrangling & Big Data
🎯 Tổng quan khóa học
Sau bài học này, bạn sẽ:
✅ Hiểu Data Wrangling là gì và tại sao chiếm 60-80% thời gian của Data Scientist
✅ Phân biệt khi nào dùng Pandas vs PySpark vs Spark SQL
✅ Nắm được lộ trình 14 bài học và dự án cuối khóa
✅ Hiểu 5V's của Big Data và ngưỡng chuyển sang Big Data tools
📖 Bảng Thuật Ngữ Quan Trọng
| Thuật ngữ | Tiếng Việt | Giải thích đơn giản |
|---|---|---|
| Data Wrangling | Xử lý dữ liệu | Chuyển data thô → sạch, sẵn sàng phân tích |
| ETL | Trích xuất - Chuyển đổi - Nạp | Pipeline tự động hóa xử lý dữ liệu |
