Khóa học Data Analyst/Data Science/Machine Learning từ A - Z
Thời lượng
56 buổi
Hình thức đào tạo
Online qua Zoom
Học phí
Liên hệ
Tổng quan
Mức lương và cơ hội:
Hiện nay, mức lương cho chuyên viên phân tích dữ liệu dao động từ 14 đến 50 triệu đồng/tháng, tùy vào kỹ năng và kinh nghiệm. Nhiều doanh nghiệp lớn như FPT, VinGroup, VNG, cùng các startup công nghệ đang đầu tư mạnh vào dữ liệu như một lợi thế cạnh tranh cốt lõi.
Thách thức nhân lực:
Thị trường vẫn đang đối mặt với tình trạng thiếu hụt nguồn nhân lực chất lượng cao. Đây là lý do các khóa học bài bản về Data Analyst, Data Science, Machine Learning ngày càng trở thành lựa chọn chiến lược cho những ai muốn đón đầu xu hướng nghề nghiệp của thời đại số.
Khóa học Data Analyst / Data Science / Machine Learning:
Chương trình được thiết kế theo lộ trình hệ thống – toàn diện – thực tiễn, giúp học viên: - Làm chủ quy trình phân tích dữ liệu từ cơ bản đến nâng cao.
- Hiểu cách áp dụng trực tiếp vào bài toán doanh nghiệp thực tế.
- Phát triển năng lực nghề nghiệp từ Data Analyst lên các vai trò chuyên sâu như Business Intelligence, Data Scientist hoặc Machine Learning Engineer.

Một số lợi ích khác của việc cạnh tranh bằng Khoa học dữ liệu bao gồm:
Lợi ích khóa học
Đào tạo trực tuyến
Các buổi học sẽ diễn ra qua các nền tảng trực tuyến như Zoom, Microsoft Teams, và Google Meet.Học viên tham gia các buổi học trực tiếp với giảng viên qua hình thức online.
Lý thuyết và thực hành
60% lý thuyết và 40% thực hành. Các bài thực hành được lấy từ các bài toán thực tế, giúp học viên áp dụng ngay kiến thức vào công việc.
Tài liệu học tập
Slide bài giảng, hướng dẫn thực hành chi tiết.
Video bài giảng
Học viên có thể xem lại video các buổi học để ôn tập và nắm vững kiến thức.
Tương tác trực tiếp
Học viên có thể trao đổi trực tiếp 1-1 với giảng viên hoặc trợ giảng để được giải đáp thắc mắc và hỗ trợ trong quá trình học.
Mục tiêu học tập
Đối tượng học tập
Chuẩn đầu ra
Biết
Biết
Kiến thức và kỹ năng cốt lõi:
- Nắm vững các kiến thức nền tảng về xác suất thống kê, đại số tuyến tính, giải tích.
- Hiểu rõ quy trình phân tích dữ liệu thăm dò (Exploratory Data Analysis – EDA).
- Biết sử dụng Python, SQL để xử lý, phân tích và trực quan hóa dữ liệu.
- Làm quen với các kỹ thuật học máy (Machine Learning) như Decision Tree, Random Forest, Gradient Boosting và Deep Learning cơ bản.
- Nhận thức về các loại hệ quản trị cơ sở dữ liệu như RDBMS, NoSQL, Graph Database, và dữ liệu lớn (ElasticSearch).
Hiểu
Hiểu
Năng lực phân tích và triển khai:
- Phân biệt cách áp dụng các thuật toán và công cụ xử lý dữ liệu phù hợp với từng bài toán thực tiễn.
- Hiểu tầm quan trọng của làm sạch và chuẩn hóa dữ liệu để đảm bảo chất lượng phân tích.
- Giải thích được cách đánh giá mô hình, áp dụng A/B Testing trong các dự án doanh nghiệp.
Áp dụng
Áp dụng
Cơ hội nghề nghiệp và ứng dụng thực tế:
- Có thể đảm nhiệm vai trò Junior Data Analyst hoặc Fresher Data Scientist.
- Thực hiện thu thập dữ liệu từ file, API, database; xử lý và phân tích theo quy trình chuyên nghiệp.
- Thiết kế dashboard trực quan bằng Power BI, Streamlit, Excel để trình bày kết quả phân tích.
- Tham gia phát triển POC cho các bài toán phân tích – dự báo trong doanh nghiệp.
Lộ trình học tập
- Quy trình phân tích dữ liệu
- Các công cụ, kỹ năng, kiến thức
- Khoa học dữ liệu
- Dimension, Fact
Các thao tác phân tích cơ bản trong OLAP
- Roll-up, Drill-down, Slice and dice, Pivot (rotate)
Hệ thống chiều khái niệm
Các mô hình dữ liệu
Case study thực tiễn: Tối ưu hóa tỷ lệ hoàn trả
- Thống kê doanh số, lợi nhuận theo quốc gia
- Thống kê tỷ trọng đơn hàng không thực hiện được
- Thống kê doanh số theo nội địa tại các office lọc theo năm
- Thống kê dòng sản phẩm bán chạy nhất theo từng năm
Phân tích OLAP với bộ dữ liệu Orders
- Xác định các fact
- Xác định các dim
- Xác định hệ thống chiều khái niệm (dim)
- Xây mô hình dữ liệu
Một số khái niệm về biến đổi dữ liệu (Transform)
- Data Binding, Data Join, Data Rotation, Data Integration - Union, Data Aggregation
Các tính năng ETL trong công cụ Power Query
- Trích rút dữ liệu từ nhiều nguồn (Excel, Folder, Google Sheet, Database)
- Biến đổi dữ liệu (Pivot, Unpivot, Merge Queries, Append Queries, Group By,...)
- Lưu trữ dữ liệu
- Thực hành tổng hợp 1: Tìm đơn hàng dự án
- Thực hành tổng hợp 2: Tìm tỷ lệ chuyển từ khám bệnh sang nhập viện
Xây dựng mô hình OLTP
Phân tích đa chiều
- Tối ưu hóa lợi nhuận thông qua phân tích đa chiều OLAP analysis
- Khái niệm BI, Khám phá dữ liệu, Trực quan hóa dữ liệu, Dashboard, Kể chuyện với dữ liệu
Kiến trúc hệ thống phân tích
- Hệ thống OLTP và OLAP (optional), Các nguồn dữ liệu (File, Folder, Google sheet, Database, ....), Tiền xử lý dữ liệu, Kho dữ liệu, Kho chủ đề, Truy vấn đa chiều
Giới thiệu Power BI
- Các thành phần, Các visualization
Thực hành Xây dựng các biểu đồ cơ bản
Case study: Phân tích đơn hàng
- Lấy dữ liệu vào Power BI (Excel)
- Xây dựng các biểu đồ cơ bản: Card, Slicer, Column và Bar chart, Line Chart, Pie Chart
- Xây dựng dashboard cơ bản
Case study: Phân tích đơn hàng chuyên sâu
- Dự báo bằng Line Chart
- Combo Chart
- Gauge chart, Ribon Chart
- Drill-through
Case study: Phân tích đơn hàng chuyên sâu
- Table, Matrix
- Map
- Page Navigator
Xây dựng dashboard kinh doanh
- Trực quan hóa dữ liệu
- Xây dựng hệ thống chiều khái niệm
- Xây dựng Dashboard phân tích bán hàng
- Xây dựng Dashboard phân tích marketing
Nguồn dữ liệu (sạch): đơn hàng, marketing
Quản trị dữ liệu và nguyên lý phân tích
- Hệ thống phân tích dữ liệu, các tầng dữ liệu
- Một số nguyên lý phân tích
- Một số mẫu dashboard
Thực hành chấm dashboard
- So sánh CSDL quan hệ với phi quan hệ
- Hệ quản trị cơ sở dữ liệu (RDBMS)
- Cơ sở dữ liệu (DB)
- Ngôn ngữ SQL
- Chương trình giúp người dùng giao tiếp với cơ sở dữ liệu ( MySQL Workbench )
- Thiết lập môi trường truy vấn Workbench
- Tạo cơ sở dữ liệu qua Copy and Paste
- Tạo cơ sở dữ liệu qua Import, Export
- Gõ các câu truy vấn SQL theo mẫu
- Đọc nội dung của một số câu truy vấn SQL
- Cấu trúc, ví dụ cụ thể cho từng câu lệnh
+ Select
+ where và các điều kiện logic and, or
+ các hàm cơ bản trong MySQL
+ các hàm tổng hợp dữ liệu trong MySQL sum(), count(),
+ group by, order by, having, limit)
- SELECT, SELECT DISTINCT, AS, ORDER BY, WHERE, LIMIT, GROUP BY, HAVING
Nhóm toán tử logic
- AND, OR, IN, BETWEEN, NULL
Nhóm hàm toán học
- SUM, COUNT
+ Các bảng, view của một CSDL
+ Các cột của một bảng và tính chất các cột
- Đọc Diagram
- Quan hệ dữ liệu: 1-1; 1-n; n-n;
- Khóa: Primary Key; Foreign Key
- Kiểu dữ liệu
- Union: Khái niệm, ví dụ
- View: Các kiểu views
- Đọc và phân tích được cơ sở dữ liệu từ lược đồ quan hệ
- Truy vấn các bảng của cơ sở dữ liệu
- Delete: Xóa dòng, ý nghĩa mệnh đề where
- Update: Cập nhật dữ liệu, ý nghĩa mệnh đề where
- Table, View, Các ràng buộc: Key (PK, UK)
- Tối ưu qua Index
- Procedure
- Join (left join, right join, inner join), Union, View
Tạo cấu trúc và thủ tục
- Table, View, Procedure
- Truy vấn từ cơ bản đến nâng cao để tìm hiểu Cơ sở dữ liệu
- Xây dựng cơ sở dữ liệu OLAP
- Xây dựng dashboard trên OLTP (excel hoặc Power BI)
- Xây dựng dashboard trên OLAP
- Chia sẻ các nội dung chuyên sâu
- Hỏi đáp thắc mắc
- Các bài toán phổ biến và quan trọng trong lĩnh vực Khoa học dữ liệu.
- Python trong Data Science.
- Tổng quan kiến thức cơ bản về Machine Learning cần thiết trong khóa học.
- Giới thiệu và hướng dẫn cài đặt môi trường thực hành như Jupyter Notebook, Colab, v.v.
- Biến và các kiểu dữ liệu
- Input & print trong python
- Áp dụng các kiểu dữ liệu nào trong thực tế?
- Biểu thức điều kiện
- Vòng lặp For, While
- Tự động hóa các tác vụ lặp đi lặp lại
- Gọi hàm trong python
- Biến cục bộ và biến toàn cục
- Hàm lambda
- Khởi tạo List
- Truy cập phần tử trong List (truy cập bằng index, truy cập đầu cuối danh sách)
- Thao tác trên List (Thêm, xóa, thay đổi giá trị phần tử)
- Cắt (slicing) List
- Các phương thức List (sort(), reverse(), count(), index(), extend()) Các thao tác trên Tuple
- Cú pháp để tạo tuple bằng dấu ngoặc tròn ().
- Truy cập phần tử trong Tuple:
- Thao tác với Tuple
- Ứng dụng của Tuple
- Tuple packing và unpacking
- Khởi tạo và thao tác trên Dictionaries và Sets
- Ứng dụng của Dictionaries và Sets
- Phương thức
- Package và import
- Thực hành: lớp và đối tượng
- Đối tượng Groupby
- Làm việc với DataFrame
- Chèn, xóa, sửa dòng và cột trong DataFrame
- Sắp xếp dữ liệu trong DataFrame
- Các biểu đồ cơ bản
- Lợi ích của Seaborn
- Biểu đồ trong Seaborn
Phân biệt giữa thống kê mô tả và thống kê suy luận.
Sử dụng thống kê mô tả (Python) để:
- Tóm tắt nhanh dữ liệu.
- Đo lường trung tâm dữ liệu.
- Đo lường độ phân tán dữ liệu.
- Đo lường vị trí tương đối của dữ liệu.
- Khám phá cách sử dụng định lý Bayes để mô tả các sự kiện phức tạp.
- Học cách sử dụng các phân phối xác suất (nhị thức, Poisson, chuẩn) để hiểu rõ cấu trúc dữ liệu.
- Tìm hiểu cách tránh sai lệch do chọn mẫu.
- Học cách sử dụng phân phối mẫu để đưa ra ước lượng chính xác.
- Sử dụng mẫu nhỏ để suy luận về tập dữ liệu lớn.
- Kiểm định giả thuyết giúp xác định tính ý nghĩa thống kê của kết quả so với ngẫu nhiên.
- Học các bước cơ bản của một kiểm định giả thuyết.
- Hiểu cách kiểm định giả thuyết giúp đưa ra kết luận có ý nghĩa về dữ liệu.
- Áp dụng kiến thức thống kê để đánh giá thêm về dữ liệu và mô hình trực quan hóa.
- Giới thiệu các thuật toán Hồi quy phổ biến như Linear Regression, Logistic Regression,...
- Cách tiếp cận và xây dựng một mô hình Hồi quy trong các tình huống thực tế.
- Các phương pháp để đánh giá hiệu suất và độ chính xác của một hệ thống Hồi quy.
- Cách tiếp cận và xây dựng một mô hình phân loại trong các tình huống thực tế.
- Các phương pháp để đánh giá hiệu suất và độ chính xác của một hệ thống phân loại.
- Cung cấp cơ hội cho học viên đặt câu hỏi và nhận được sự giải đáp từ giảng viên hoặc các thành viên khác trong khóa học.
- Tổng quan về bài tập lớn (Project) của khóa học, đưa ra mục tiêu, yêu cầu và quá trình thực hiện của dự án.
- Giới thiệu về khái niệm độ tương đồng trong phân cụm, là một phép đo để đánh giá sự tương đồng giữa các điểm dữ liệu.
- Giới thiệu một số phương pháp mã hóa văn bản như Bag-of-Words, TF-IDF và Word Embedding để biểu diễn văn bản thành dữ liệu số hóa.
- Hướng dẫn thực hành giải quyết bài toán truy xuất và phân cụm tài liệu, sử dụng các kỹ thuật và công cụ như k-means và phương pháp mã hóa văn bản, để xử lý và phân tích các tài liệu dựa trên nội dung của chúng.
- Tổng quan về một số thuật toán phổ biến trong hệ thống gợi ý như Lọc cộng tác, Gợi ý dựa trên nội dung,...
- Cách tiếp cận và quy trình xây dựng một hệ thống gợi ý trong môi trường thực tế, từ việc thu thập dữ liệu đến xây dựng mô hình và triển khai.
- Giới thiệu các phương pháp để đánh giá hiệu suất và độ chính xác của một hệ thống gợi ý.
- Hướng dẫn thực hành xây dựng và đánh giá hệ thống gợi ý trên một bộ dữ liệu thực tế, áp dụng các thuật toán và phương pháp đã học vào thực tế.
- Các phương pháp và định dạng để biểu diễn luật kết hợp, bao gồm dạng tập hợp, dạng chuỗi, và dạng cây.
- Phương pháp khai thác và tìm kiếm các mẫu phổ biến từ dữ liệu, như tìm tập hợp phổ biến, chuỗi phổ biến, hoặc cây phổ biến.
- Khám phá các luật kết hợp từ các mẫu phổ biến
- Phân tích tương quan giữa các mẫu hoặc thuộc tính dữ liệu, để tìm hiểu sự tương quan và tương tác giữa chúng, đồng thời đưa ra các phân tích và nhận định về mối quan hệ.
- Cung cấp cơ hội cho học viên đặt câu hỏi và nhận được sự giải đáp từ giảng viên hoặc các thành viên khác trong khóa học.
- Học viên sẽ được giới thiệu tổng quan về bài tập lớn (Project) của khóa học, bao gồm mục tiêu, yêu cầu và quy trình thực hiện của dự án.
- Giới thiệu về xử lý và phân tích hình ảnh thông qua công nghệ thị giác máy tính và các ứng dụng trong thực tế.
- Giới thiệu về xử lý ngôn ngữ tự nhiên và các phương pháp, công cụ để xử lý, phân tích và hiểu văn bản tự nhiên.
- Tổng kết Module 4 về lý thuyết.
- Hỏi đáp về Mini-Project.
- Hướng dẫn về việc xác định và thu thập dữ liệu phù hợp cho bài toán, bao gồm các nguồn dữ liệu, phương pháp thu thập và quy trình xử lý dữ liệu.
- Hướng dẫn về quy trình khai phá dữ liệu (EDA) để hiểu cấu trúc và tính chất của dữ liệu. Bên cạnh đó, cung cấp hướng dẫn về các phương pháp biểu diễn trực quan dữ liệu, như biểu đồ, đồ thị, hay bản đồ, để hỗ trợ quá trình khai phá và hiểu rõ hơn về dữ liệu.
- Hướng dẫn về cách khai thác thông tin từ các trường dữ liệu có sẵn và tạo ra các trường dữ liệu mới dựa trên kiến thức và hiểu biết về bài toán. Điều này có thể bao gồm việc kết hợp, biến đổi hoặc áp dụng các quy tắc và hàm tính toán để tạo ra thông tin mới từ dữ liệu hiện có.
- Hướng dẫn về việc mã hóa và chuẩn hóa dữ liệu để đảm bảo tính nhất quán và khả năng so sánh giữa các đặc trưng. Bao gồm các phương pháp như mã hóa one-hot, mã hóa số hóa, chuẩn hóa z-score và chuẩn hóa min-max để biến đổi và điều chỉnh các giá trị dữ liệu thành dạng phù hợp và thống nhất.
- Hướng dẫn về quá trình huấn luyện mô hình base, bao gồm việc chuẩn bị dữ liệu huấn luyện, chia thành batch, tạo bộ kiểm tra, lựa chọn hàm mất mát và phương pháp tối ưu hóa, đánh giá và tinh chỉnh mô hình dựa trên kết quả huấn luyện.
- Hướng dẫn về cách tối ưu các tham số của mô hình trong quá trình huấn luyện. Điều này có thể bao gồm việc sử dụng phương pháp tìm kiếm lưới (grid search) để thử nghiệm các giá trị khác nhau cho các tham số, sử dụng kỹ thuật tinh chỉnh tự động (automated tuning) như tối ưu bayes (Bayesian optimization), hoặc sử dụng phương pháp tinh chỉnh thông qua việc giảm thiểu hàm mất mát (loss function minimization).
- Đánh giá mô hình và lựa chọn mô hình tốt nhất: Sử dụng các phương pháp như cross-validation, độ đo hiệu suất và so sánh mô hình để lựa chọn mô hình tốt nhất cho áp dụng thực tế.
- Xây dựng một quy trình tự động hoàn chỉnh để xử lý dữ liệu, huấn luyện mô hình và triển khai mô hình trong môi trường thực tế. Quy trình này bao gồm các bước từ chuẩn bị dữ liệu, tiền xử lý, huấn luyện mô hình, đánh giá, triển khai và cập nhật mô hình.
- Các hướng giải quyết khác có thể áp dụng để đạt được kết quả tốt hơn, khám phá và nghiên cứu thêm về các phương pháp mới và tiến bộ trong lĩnh vực khoa học dữ liệu.
- Một số vấn đề cần chú ý khi áp dụng vào hệ thống dữ liệu lớn trong thực tiễn doanh nghiệp bao gồm quy mô, tính khả thi, hiệu suất, bảo mật và tính ổn định của hệ thống và các yếu tố khác như quản lý dữ liệu, quản lý tài nguyên, và tương tác với các thành phần khác trong hệ thống.
- Học viên đặt câu hỏi, chia sẻ kinh nghiệm và thảo luận về project.
- Đánh giá tiến độ và kết quả học tập: Xem xét và đánh giá tiến bộ cá nhân và kết quả học tập của mỗi học viên để đảm bảo họ đã đáp ứng được các mục tiêu và yêu cầu của khóa học.
- Thảo luận về ứng dụng thực tế: Trao đổi về cách áp dụng kiến thức đã học vào thực tế và giải quyết các vấn đề trong lĩnh vực tương ứng.
- Phân tích và đánh giá project: Đánh giá và phân tích kết quả của các dự án đã thực hiện bởi các nhóm học viên, bao gồm sự đóng góp, hiệu suất và tính khả thi của các giải pháp.
- Tổng kết và phản hồi: Tổng kết khóa học bằng cách cung cấp phản hồi về nội dung, phương pháp giảng dạy và trải nghiệm học tập, nhằm cải thiện chất lượng của khóa học trong tương lai.
Giảng viên
Giảng viên Toán ứng dụng và Khoa học máy tính - ĐH Ngoại Thương TP.HCM
| - Hơn 3 năm là Giảng viên dạy các chủ đề Toán ứng dụng và Khoa học máy tính,Đại học Ngoại Thương,TP HCM Phân tích dữ liệu, AI, Cơ sở dữ liệu, PowerBI, v.v. |
| - Hơn 3 năm Giảng viên Đại học Khoa Kỹ thuật Hàng không Vũ trụ, Khoa Kỹ thuật Giao thông Vận tải, Đại học Bách khoa TP.HCM Nhà khoa học nghiên cứu và Giảng viên về các chủ đề liên quan đến Khoa học tính toán. |
| - Hơn 3 năm Nghiên cứu viên Viện Năng lượng ứng dụng – NUPEC (Nuclear Power Trung tâm Kỹ thuật), Tokyo, Nhật Bản. |
| - Hơn 4 năm CNTT tại Công ty DFM-engineering |
| - Hơn 10 năm nghiên cứu trong lĩnh vực khoa học tính toán và phân tích dữ liệu |
Giảng viên trường ĐH Bách khoa Hà Nội chuyên nghành toán tin ứng dụng
-
10+ năm kinh nghiệm quản lý nhân sự 500+ người, sản phẩm 100K+ người dùng
Xây dựng Data Warehouse cho sản phẩm Topica Native17+ năm Giảng viên Viện Toán ứng dụng, Đại học Bách Khoa Hà Nội
6+ năm kinh nghiệm đào tạo nhân sự quản lý cấp trungXây dựng chương trình “Phân tích dữ liệu” và đào tạo trực tiếp cho 1000+ nhân sự
15+ năm kinh nghiệm làm việc thực tế về Quản lý doanh nghiệp, xây dựng hệ thống phần mềm CNTT trên các công cụ lập trình cũng như "Tin học văn phòng" Excel, GoogleSheet, PowerBIĐã đào tạo trực tiếp các phần mềm phân tích và xử lý dữ liệu trên Excel, GoogleSheet, PowerBI +2000 người
Đã đào tạo online Excel: +100K người
Đào tạo/coaching/tư vấn cho nhiều bạn quản lý, chủ doanh nghiệp về một số mảng (xây dựng hệ thống, chiến lược marketing, xây dựng sản phẩm, tài chính, problem solving,....)
|
* Học vấn: |
|
* Kinh nghiệm làm việc: |
|
* Nghiên cứu khoa học: |
|
* Tiến sĩ Tùng đã công bố nhiều bài báo khoa học quốc tế về các hệ thống thông minh, học sâu, và ứng dụng |
Dự án học viên
Feedback học viên

Vũ Minh Nhật
Data Scientist tại VP Bank

Mai Thị Hòa
Data Analyst tại Viettel

Đỗ Tiến Đạt
Data Scientist tại CMC
Lợi ích chỉ có tại COLE
Giới thiệu việc làm sau khóa học
Học lại free
Cộng đồng chuyển đổi số 1
Câu hỏi thường gặp
- Một số khóa học có công cụ để thhuwcj hành, các GV sẽ chuẩn bị trước thông tin và hướng dẫn cài đặt công cụ để học viên tham gia học tập một cách hiệu quả nhất."
Để biết thêm thông tin chi tiết đừng ngần ngại gọi cho chúng tôi.
-
Hotline
-
Email
-
Trang tin chính thức
Hoặc để lại thông tin
COLE - Lựa chọn hàng đầu cho nhân
sự về Digital Skills
5000+
Học viên theo học
30%
Thu nhập học viên tăng lên sau khi học
30+ Khóa học
Hàng đầu về ứng dụng công nghệ
50+
Chuyên gia hàng đầu về chuyển đổi số
300+ Doanh nghiệp hàng đầu lựa chọn Cole để nâng cấp kỹ năng
Hình ảnh lớp học