Khóa Học Python for Data Analysis – Hướng Dẫn Cho Người Mới
Thời lượng
20 Buổi
Hình thức đào tạo
Online
Học phí
Liên hệ
Tổng quan
Python – Công cụ số 1 cho phân tích dữ liệu:
- Tự động hóa xử lý dữ liệu lớn.
- Phân tích và trực quan hóa dữ liệu nhanh chóng.
- Ứng dụng trong nhiều lĩnh vực: tài chính, marketing, vận hành, nhân sự, sản xuất...
- Kết nối với hệ sinh thái mạnh mẽ: Pandas, Matplotlib, Seaborn, Plotly, v.v.
Khóa học Python for Data Analysis tại Cole:
Đây là bước đi chiến lược giúp bạn mở rộng cơ hội nghề nghiệp và nâng cấp năng lực cá nhân. Khóa học được thiết kế từ nền tảng đến ứng dụng thực tế, kết hợp lý thuyết và thực hành, giúp học viên nhanh chóng làm chủ Python và áp dụng trực tiếp vào công việc phân tích dữ liệu.

Những xu hướng sử dụng Python hiện nay:
Lợi ích khóa học
Đào tạo trực tuyến
Các buổi học sẽ diễn ra qua các nền tảng trực tuyến như Zoom, Microsoft Teams, và Google Meet. Học viên tham gia các buổi học trực tiếp với giảng viên qua hình thức online.
Nội dung buổi học
Sẽ bao gồm trung bình 60% lý thuyết và 40% thực hành. Các bài thực hành được lấy từ các bài toán thực tế, giúp học viên áp dụng ngay kiến thức vào công việc.
Tài liệu học tập
Slide bài giảng, hướng dẫn thực hành chi tiết.
Video bài giảng
Học viên có thể xem lại video các buổi học để ôn tập và nắm vững kiến thức.
Tương tác trực tiếp
Học viên có thể trao đổi trực tiếp 1-1 với giảng viên hoặc trợ giảng để được giải đáp thắc mắc và hỗ trợ trong quá trình học.
Mục tiêu học tập
Đối tượng học tập
Chuẩn đầu ra
Biết – Nắm được kiến thức cơ bản
Biết – Nắm được kiến thức cơ bản
- Biết cách viết các câu lệnh cơ bản trong Python: khai báo biến, kiểu dữ liệu, điều kiện, vòng lặp, hàm, lớp.
- Biết các định dạng dữ liệu phổ biến (CSV, Excel) và cách đọc/ghi dữ liệu bằng Python.
- Làm quen với các thư viện quan trọng trong phân tích dữ liệu: Pandas, NumPy, Matplotlib, Seaborn.
- Nhận biết các dạng biểu đồ thường dùng để trực quan hóa dữ liệu.
- Hiểu các khái niệm quan trọng: xử lý dữ liệu thiếu, dữ liệu ngoại lệ, GroupBy, Pivot Table, EDA, Machine Learning.
Hiểu – Kết nối và lý giải được vấn đề
Hiểu – Kết nối và lý giải được vấn đề
- Hiểu được quy trình phân tích dữ liệu: từ thu thập – xử lý – phân tích – trực quan – trình bày báo cáo.
- Hiểu rõ cách vận hành và ứng dụng thực tế của Pandas trong thao tác dữ liệu bảng (DataFrame).
- Hiểu nguyên lý và vai trò của trực quan hóa dữ liệu trong phân tích & truyền đạt insight.
- Hiểu logic các phép thống kê mô tả, phân tích thăm dò dữ liệu (EDA), xử lý dị biệt và phân nhóm dữ liệu.
- Hiểu cách hoạt động cơ bản của các thuật toán học máy trong phân tích dữ liệu như K-means, KNN.
Áp dụng – Thực hành và giải quyết vấn đề thực tế
Áp dụng – Thực hành và giải quyết vấn đề thực tế
- Xây dựng script Python để xử lý dữ liệu tài chính, tỷ giá, bán hàng, marketing...
- Áp dụng Pandas để làm sạch, hợp nhất, phân nhóm, lọc và tạo báo cáo từ nhiều nguồn dữ liệu.
- Tạo dashboard biểu đồ bằng Matplotlib và Seaborn để phân tích và trình bày dữ liệu.
- Triển khai quy trình phân tích dữ liệu từ A–Z: crawling dữ liệu, xử lý, phân tích, trực quan hóa, trình bày báo cáo.
- Thực hiện project tổng hợp mô phỏng công việc của một Python Data Analyst: phân tích tỷ giá hối đoái, phát hiện dị biệt, phân cụm dữ liệu và xây dựng báo cáo cuối kỳ.
Lộ trình học tập
- Giới thiệu về Python
- Môi trường lập trình Python
- Jupyter Notebook và Google Colab
- Ví dụ các chương trình Python
- Thảo luận
- Khái niệm biến
- Lệnh gán giá trị cho biến
- Các kiểu dữ liệu cơ bản:
- Kiểu số (Number)
- Kiểu xâu (String)
- Kiểu danh sách (List)
- Kiểu bộ (Tuple)
- Kiểu tập hợp (Set)
- Kiểu từ điển (Dictionary)
- Kiểu logic (Boolean)
- Bài tập thực hành
- Các toán tử trong Python:
- Toán tử số học
- Toán tử quan hệ (còn gọi là toán tử so sánh)
- Toán tử gán
- Toán tử logic
- Toán tử membership
- Toán tử identity
- Toán tử thao tác bit
- Thứ tự ưu tiên toán tử
- Lệnh rẽ nhánh
- Vòng lặp
- Bài tập thực hành
- Các loại đối số hàm trong Python
- Biến cục bộ và biến toàn cục
- Thay đổi giá trị tham số hàm
- Hàm trả về nhiều giá trị
- Hàm lambda
- Bài tập thực hành
- Đọc file trên Google Drive
- Đọc dữ liệu từ nhiều sheet
- Đọc dữ liệu từ nhiều bảng trong 1 sheet
- Đọc dữ liệu từ các bảng có cấu trúc phức tạp
- Bài tập thực hành
- Ghi dữ liệu ra nhiều sheet
- Ghi nhiều bảng ra 1 sheet
- Ghi bảng dữ liệu có cấu trúc phức tạp
- Ẩn cột trong file Excel
- Tạo format khi ghi dữ liệu
- Thêm chart vào file Excel
- Bài tập thực hành
- Package: khái niệm, cách tạo
- Lệnh import
- Khái niệm lớp và đối tượng
- Tạo lớp và đối tượng
- Sử dụng lớp và đối tượng
- Các thao tác nâng cao với các kiểu dữ liệu chuẩn trong Python
- Bài tập thực hành
- Giới thiệu về Pandas
- Pandas Series
- Pandas DataFrame
- Thao tác đọc/ghi dữ liệu với file
- Các thao tác cơ bản với Series và DataFrame
- Đặc tả thống kê (Descriptive Statistics)
- Sắp xếp trên DataFrame (Sorting)
- Cắt nhỏ DataFrame (Slicing)
- Lọc DataFrame (Filtering)
- Duyệt trên Series và DataFrame (Iteration)
- Đánh lại nhãn cho DataFrame (Reindexing)
- Làm sạch dữ liệu
- Hàm tổng hợp dữ liệu (Aggregation)
- Chia nhóm dữ liệu (GroupBy)
- Ghép nối các DataFrame
- Hợp nhất dữ liệu (Merge)
- Pivot Table
- Bài tập thực hành
- Một số dạng biểu đồ thường gặp
- Numpy
- Matplotlib và biểu đồ đường
- Bài tập thực hành
- Biểu đồ tròn (Pie Chart)
- Biểu đồ vùng xếp chồng (Stack Plot)
- Biểu đồ Histogram
- Biểu đồ phân tán (Scatter Plot)
- Biểu đồ Time series
- Nhiều biểu đồ trong hình
- Biểu đồ đám mây chữ (Word Cloud)
- Một số cấu hình cho biểu đồ
- Bài tập thực hành
- Hàm trong Seaborn
- Cấu trúc dữ liệu truyền vào cho Seaborn
- Style và theme trong Seaborn
- Biểu đồ phân tán (scatter plot)
- Biểu đồ đường (line plot)
- Biểu đồ quan hệ
- Biểu đồ histogram
- Biểu đồ KDE
- Biểu đồ cặp (pair plot)
- Biểu đồ nhiệt (heat map)
- Bài tập thực hành
- Phương pháp bách phân vị (percentile)
- Phương pháp độ lệch chuẩn (std – standard deviation)
- Phương pháp Z-score
- Phương pháp IQR (Interquartile Range)
- Mô hình Isolation Forest
- Bài tập thực hành
- Biểu đồ violin (violin plot)
- Phân tích khám phá dữ liệu – EDA
- Các hàm và phương thức hay dùng trong EDA
- Ví dụ
- Bài tập thực hành
- Các loại mô hình/thuật toán học máy
- KNN
- K-Means
- Bài tập thực hành
- Thảo luận vận dụng Python vào thục tiễn
Giảng viên
- 9+ năm kinh nghiệm phát triển phần mềm, thiết kế dữ liệu và dữ liệu lớn Community Organizer - Vietnam Data scientists
- Founder & trainer - AlgoDSE
- Ex- Product manager - Cohost AIEx- Data Engineer - YODY Fashion Tech
- Ex- Big Data Engineer - DAC Data science Vietnam
- Ex- Software engineer - FPT Software
Dự án học viên
Feedback học viên

Vân Anh
HR tại công ty logistics

Đức Minh
Operations Executive tại công ty thương mại điện tử

Thái Thùy Linh
Data Analyst tại CMC
Lợi ích chỉ có tại COLE
Giới thiệu việc làm sau khóa học
Học lại free
Cộng đồng chuyển đổi số 1
Câu hỏi thường gặp
- Một số khóa học có công cụ để thhuwcj hành, các GV sẽ chuẩn bị trước thông tin và hướng dẫn cài đặt công cụ để học viên tham gia học tập một cách hiệu quả nhất."
Để biết thêm thông tin chi tiết đừng ngần ngại gọi cho chúng tôi.
-
Hotline
-
Email
-
Trang tin chính thức
Hoặc để lại thông tin
COLE - Lựa chọn hàng đầu cho nhân
sự về Digital Skills
5000+
Học viên theo học
30%
Thu nhập học viên tăng lên sau khi học
30+ Khóa học
Hàng đầu về ứng dụng công nghệ
50+
Chuyên gia hàng đầu về chuyển đổi số
300+ Doanh nghiệp hàng đầu lựa chọn Cole để nâng cấp kỹ năng
Hình ảnh lớp học