Khóa học Data Analyst/Data Science/Machine Learning từ A - Z

Thời lượng

56 buổi

Hình thức đào tạo

Online qua Zoom

Học phí

Liên hệ

Tổng quan

Phân tích và khoa học dữ liệu được dự báo là một trong những ngành nghề tăng trưởng nhanh và bền vững nhất tại Việt Nam. Nhu cầu tuyển dụng các vị trí như Data Analyst, Data Scientist, BI Analyst, Machine Learning Engineer hay Data Engineer ngày càng tăng cao, đặc biệt trong các lĩnh vực tài chính, thương mại điện tử, sản xuất, y tế và logistics.

Mức lương và cơ hội:
Hiện nay, mức lương cho chuyên viên phân tích dữ liệu dao động từ 14 đến 50 triệu đồng/tháng, tùy vào kỹ năng và kinh nghiệm. Nhiều doanh nghiệp lớn như FPT, VinGroup, VNG, cùng các startup công nghệ đang đầu tư mạnh vào dữ liệu như một lợi thế cạnh tranh cốt lõi.

Thách thức nhân lực:
Thị trường vẫn đang đối mặt với tình trạng thiếu hụt nguồn nhân lực chất lượng cao. Đây là lý do các khóa học bài bản về Data Analyst, Data Science, Machine Learning ngày càng trở thành lựa chọn chiến lược cho những ai muốn đón đầu xu hướng nghề nghiệp của thời đại số.

Khóa học Data Analyst / Data Science / Machine Learning:
Chương trình được thiết kế theo lộ trình hệ thống – toàn diện – thực tiễn, giúp học viên: - Làm chủ quy trình phân tích dữ liệu từ cơ bản đến nâng cao.
- Hiểu cách áp dụng trực tiếp vào bài toán doanh nghiệp thực tế.
- Phát triển năng lực nghề nghiệp từ Data Analyst lên các vai trò chuyên sâu như Business Intelligence, Data Scientist hoặc Machine Learning Engineer.

Một số lợi ích khác của việc cạnh tranh bằng Khoa học dữ liệu bao gồm:

Tăng cường khả năng phân tích và dự đoán trong việc ra quyết định kinh doanh
Tối ưu hóa quản lý và vận hành sản xuất
Nâng cao khả năng định vị thương hiệu và hiểu rõ hành vi của khách hàng
Tăng hiệu quả tiếp cận và tối đa hóa lợi nhuận từ giới hàng hóa ở trong và ngoài nước
Tăng cường năng lực cạnh tranh, giảm chi phí cho các doanh nghiệp
Tạo tương tác động với khách hàng, tạo niềm tin và giúp gia tăng giá trị tương tác ở các khía cạnh như, sản phẩm, dịch vụ, v.v.

Lợi ích khóa học

Đào tạo trực tuyến

Các buổi học sẽ diễn ra qua các nền tảng trực tuyến như Zoom, Microsoft Teams, và Google Meet.Học viên tham gia các buổi học trực tiếp với giảng viên qua hình thức online.

Lý thuyết và thực hành

60% lý thuyết và 40% thực hành. Các bài thực hành được lấy từ các bài toán thực tế, giúp học viên áp dụng ngay kiến thức vào công việc.

Tài liệu học tập

Slide bài giảng, hướng dẫn thực hành chi tiết.

Video bài giảng

Học viên có thể xem lại video các buổi học để ôn tập và nắm vững kiến thức.

Tương tác trực tiếp

Học viên có thể trao đổi trực tiếp 1-1 với giảng viên hoặc trợ giảng để được giải đáp thắc mắc và hỗ trợ trong quá trình học.

Mục tiêu học tập

OP1 Kiến thức nền tảng phân tích dữ liệu: Hiểu rõ OLTP, OLAP, Fact, Dimension; nắm quy trình phân tích và ứng dụng vào bối cảnh kinh doanh thực tế.
OP2 Xử lý & phân tích với Excel và Power Query: Làm sạch, chuẩn hóa dữ liệu; phân tích đa chiều; xây dựng mô hình dữ liệu ngay trên Excel để sẵn sàng báo cáo.
OP3 Trực quan hóa dữ liệu với Power BI: Tạo dashboard chuyên nghiệp, kể chuyện bằng dữ liệu; phân tích đơn hàng, marketing và hiệu quả kinh doanh theo thời gian thực.
OP4 Làm việc với cơ sở dữ liệu & SQL: Sử dụng MySQL; thành thạo truy vấn nâng cao (JOIN, VIEW, PROCEDURE); thiết kế CSDL chuẩn hóa và tối ưu hiệu suất.
OP5 Lập trình Python cho phân tích dữ liệu: Làm chủ Pandas, Matplotlib, Seaborn; thao tác dữ liệu, feature engineering và vẽ biểu đồ chuyên sâu.
OP6 Thống kê & phân tích thăm dò (EDA): Ứng dụng thống kê mô tả, xác suất, kiểm định giả thuyết để khám phá insight có giá trị.
OP7 Xây dựng mô hình Machine Learning: Thực hành hồi quy, phân lớp, phân cụm với Linear Regression, Decision Tree, SVM, K-Means; đánh giá và tinh chỉnh mô hình.
OP8 Khai phá dữ liệu & hệ thống gợi ý: Thành thạo TF-IDF, Word Embedding, collaborative filtering; áp dụng phân cụm và luật kết hợp cho bài toán đề xuất.
OP9 Làm quen với Deep Learning: Nền tảng neural network; ứng dụng xử lý ảnh và văn bản trong các bài toán thực tế.
OP10 Triển khai dự án phân tích dữ liệu thực tế: Từ hiểu bài toán, xử lý dữ liệu, mô hình hóa đến xây dựng báo cáo và dashboard hoàn chỉnh, sẵn sàng trình bày.
OP11 Kỹ năng mềm nghề Data Analyst: Trình bày chuyên nghiệp, teamwork hiệu quả, storytelling bằng dữ liệu và phản biện sắc bén, thuyết phục stakeholders.

Đối tượng học tập

Người mới bắt đầu, chưa biết gì về lập trình hay khoa học dữ liệu
Người đi làm các ngành khác muốn hiểu và ứng dụng dữ liệu
Sinh viên các ngành CNTT, kinh tế, nghiên cứu... muốn theo đuổi lĩnh vực dữ liệu

Chuẩn đầu ra 

Biết

Biết



Kiến thức và kỹ năng cốt lõi:
- Nắm vững các kiến thức nền tảng về xác suất thống kê, đại số tuyến tính, giải tích.
- Hiểu rõ quy trình phân tích dữ liệu thăm dò (Exploratory Data Analysis – EDA).
- Biết sử dụng Python, SQL để xử lý, phân tích và trực quan hóa dữ liệu.
- Làm quen với các kỹ thuật học máy (Machine Learning) như Decision Tree, Random Forest, Gradient Boosting và Deep Learning cơ bản.
- Nhận thức về các loại hệ quản trị cơ sở dữ liệu như RDBMS, NoSQL, Graph Database, và dữ liệu lớn (ElasticSearch).

Hiểu

Hiểu



Năng lực phân tích và triển khai:
- Phân biệt cách áp dụng các thuật toán và công cụ xử lý dữ liệu phù hợp với từng bài toán thực tiễn.
- Hiểu tầm quan trọng của làm sạch và chuẩn hóa dữ liệu để đảm bảo chất lượng phân tích.
- Giải thích được cách đánh giá mô hình, áp dụng A/B Testing trong các dự án doanh nghiệp.

Áp dụng

Áp dụng



Cơ hội nghề nghiệp và ứng dụng thực tế:
- Có thể đảm nhiệm vai trò Junior Data Analyst hoặc Fresher Data Scientist.
- Thực hiện thu thập dữ liệu từ file, API, database; xử lý và phân tích theo quy trình chuyên nghiệp.
- Thiết kế dashboard trực quan bằng Power BI, Streamlit, Excel để trình bày kết quả phân tích.
- Tham gia phát triển POC cho các bài toán phân tích – dự báo trong doanh nghiệp.

Lộ trình học tập 

- Các góc nhìn về Phân tích dữ liệu
- Quy trình phân tích dữ liệu
- Các công cụ, kỹ năng, kiến thức
- Khoa học dữ liệu
OLAP Cube
- Dimension, Fact
Các thao tác phân tích cơ bản trong OLAP
- Roll-up, Drill-down, Slice and dice, Pivot (rotate)
Hệ thống chiều khái niệm
Các mô hình dữ liệu
Case study thực tiễn: Tối ưu hóa tỷ lệ hoàn trả
Thực hành 4 nhiệm vụ sử dụng pivot table với bộ dữ liệu Orders
- Thống kê doanh số, lợi nhuận theo quốc gia
- Thống kê tỷ trọng đơn hàng không thực hiện được
- Thống kê doanh số theo nội địa tại các office lọc theo năm
- Thống kê dòng sản phẩm bán chạy nhất theo từng năm
Phân tích OLAP với bộ dữ liệu Orders
- Xác định các fact
- Xác định các dim
- Xác định hệ thống chiều khái niệm (dim)
- Xây mô hình dữ liệu
TL, Staging
Một số khái niệm về biến đổi dữ liệu (Transform)
- Data Binding, Data Join, Data Rotation, Data Integration - Union, Data Aggregation
Các tính năng ETL trong công cụ Power Query
- Trích rút dữ liệu từ nhiều nguồn (Excel, Folder, Google Sheet, Database)
- Biến đổi dữ liệu (Pivot, Unpivot, Merge Queries, Append Queries, Group By,...)
- Lưu trữ dữ liệu
Tiền xử lý dữ liệu
- Thực hành tổng hợp 1: Tìm đơn hàng dự án
- Thực hành tổng hợp 2: Tìm tỷ lệ chuyển từ khám bệnh sang nhập viện
Xây dựng mô hình OLTP
Phân tích đa chiều
- Tối ưu hóa lợi nhuận thông qua phân tích đa chiều OLAP analysis
Kinh doanh thông minh (BI)
- Khái niệm BI, Khám phá dữ liệu, Trực quan hóa dữ liệu, Dashboard, Kể chuyện với dữ liệu
Kiến trúc hệ thống phân tích
- Hệ thống OLTP và OLAP (optional), Các nguồn dữ liệu (File, Folder, Google sheet, Database, ....), Tiền xử lý dữ liệu, Kho dữ liệu, Kho chủ đề, Truy vấn đa chiều
Giới thiệu Power BI
- Các thành phần, Các visualization
Thực hành Xây dựng các biểu đồ cơ bản
Case study: Phân tích đơn hàng
- Lấy dữ liệu vào Power BI (Excel)
- Xây dựng các biểu đồ cơ bản: Card, Slicer, Column và Bar chart, Line Chart, Pie Chart
- Xây dựng dashboard cơ bản
Xây dựng các biểu đồ nâng cao
Case study: Phân tích đơn hàng chuyên sâu
- Dự báo bằng Line Chart
- Combo Chart
- Gauge chart, Ribon Chart
- Drill-through
Xây dựng các biểu đồ Chuyên sâu
Case study: Phân tích đơn hàng chuyên sâu
- Table, Matrix
- Map
- Page Navigator
Bảo vệ Project
Xây dựng dashboard kinh doanh
- Trực quan hóa dữ liệu
- Xây dựng hệ thống chiều khái niệm
- Xây dựng Dashboard phân tích bán hàng
- Xây dựng Dashboard phân tích marketing
Nguồn dữ liệu (sạch): đơn hàng, marketing
Quản trị dữ liệu và nguyên lý phân tích
- Hệ thống phân tích dữ liệu, các tầng dữ liệu
- Một số nguyên lý phân tích
- Một số mẫu dashboard
Thực hành chấm dashboard
- Giới thiệu về các RDBMS,công cụ làm việc, ngôn ngữ làm việc, đơn vị hay sử dụng.
- So sánh CSDL quan hệ với phi quan hệ
- Hệ quản trị cơ sở dữ liệu (RDBMS)
- Cơ sở dữ liệu (DB)
- Ngôn ngữ SQL
- Chương trình giúp người dùng giao tiếp với cơ sở dữ liệu ( MySQL Workbench )
- Thiết lập hệ quản trị CSDL MySQL trên máy tính cá nhân
- Thiết lập môi trường truy vấn Workbench
- Tạo cơ sở dữ liệu qua Copy and Paste
- Tạo cơ sở dữ liệu qua Import, Export
- Gõ các câu truy vấn SQL theo mẫu
- Đọc nội dung của một số câu truy vấn SQL
- Khái niện truy vẫn dữ liệu
- Cấu trúc, ví dụ cụ thể cho từng câu lệnh
+ Select
+ where và các điều kiện logic and, or
+ các hàm cơ bản trong MySQL
+ các hàm tổng hợp dữ liệu trong MySQL sum(), count(),
+ group by, order by, having, limit)
Nhóm cấu trúc truy vấn
- SELECT, SELECT DISTINCT, AS, ORDER BY, WHERE, LIMIT, GROUP BY, HAVING
Nhóm toán tử logic
- AND, OR, IN, BETWEEN, NULL
Nhóm hàm toán học
- SUM, COUNT
- Truy vấn các bảng hệ thống
+ Các bảng, view của một CSDL
+ Các cột của một bảng và tính chất các cột
- Đọc Diagram
- Quan hệ dữ liệu: 1-1; 1-n; n-n;
- Khóa: Primary Key; Foreign Key
- Kiểu dữ liệu
- Join: Khái niệm, phân biệt left join, inner join, right join
- Union: Khái niệm, ví dụ
- View: Các kiểu views
- Tạo lược đồ quan hệ của cơ sở dữ liệu
- Đọc và phân tích được cơ sở dữ liệu từ lược đồ quan hệ
- Truy vấn các bảng của cơ sở dữ liệu
- Insert: Chèn 1 dòng hoặc nhiều dòng từ 1 bảng
- Delete: Xóa dòng, ý nghĩa mệnh đề where
- Update: Cập nhật dữ liệu, ý nghĩa mệnh đề where
Xây dựng các cấu trúc:
- Table, View, Các ràng buộc: Key (PK, UK)
- Tối ưu qua Index
- Procedure
Truy vấn dữ liệu
- Join (left join, right join, inner join), Union, View
Tạo cấu trúc và thủ tục
- Table, View, Procedure
Dự án
- Truy vấn từ cơ bản đến nâng cao để tìm hiểu Cơ sở dữ liệu
- Xây dựng cơ sở dữ liệu OLAP
- Xây dựng dashboard trên OLTP (excel hoặc Power BI)
- Xây dựng dashboard trên OLAP
- Ôn tập
- Chia sẻ các nội dung chuyên sâu
- Hỏi đáp thắc mắc
- Tổng quan về lĩnh vực Khoa Học Dữ liệu và tầm quan trọng của nó.
- Các bài toán phổ biến và quan trọng trong lĩnh vực Khoa học dữ liệu.
- Python trong Data Science.
- Tổng quan kiến thức cơ bản về Machine Learning cần thiết trong khóa học.
- Giới thiệu và hướng dẫn cài đặt môi trường thực hành như Jupyter Notebook, Colab, v.v.
- Cấu trúc chương trình Python
- Biến và các kiểu dữ liệu
- Input & print trong python
- Áp dụng các kiểu dữ liệu nào trong thực tế?
- Các phép toán
- Biểu thức điều kiện
- Vòng lặp For, While
- Tự động hóa các tác vụ lặp đi lặp lại
- Cách thức hoạt động của hàm
- Gọi hàm trong python
- Biến cục bộ và biến toàn cục
- Hàm lambda
Các thao tác trên List
- Khởi tạo List
- Truy cập phần tử trong List (truy cập bằng index, truy cập đầu cuối danh sách)
- Thao tác trên List (Thêm, xóa, thay đổi giá trị phần tử)
- Cắt (slicing) List
- Các phương thức List (sort(), reverse(), count(), index(), extend()) Các thao tác trên Tuple
- Cú pháp để tạo tuple bằng dấu ngoặc tròn ().
- Truy cập phần tử trong Tuple:
- Thao tác với Tuple
- Ứng dụng của Tuple
- Tuple packing và unpacking
- Khởi tạo và thao tác trên Dictionaries và Sets
- Ứng dụng của Dictionaries và Sets
- Lớp và đối tượng
- Phương thức
- Package và import
- Thực hành: lớp và đối tượng
- Xử lý dữ liệu thiếu Missing Data
- Đối tượng Groupby
- Làm việc với DataFrame
- Chèn, xóa, sửa dòng và cột trong DataFrame
- Sắp xếp dữ liệu trong DataFrame
- Import thư viện
- Các biểu đồ cơ bản
- Lợi ích của Seaborn
- Biểu đồ trong Seaborn
- Sử dụng database trên kaggel dùng Python để xử lý dữ liệu ban đầu, phân tích và trực quan hóa dữ liệu.
Khám phá vai trò của thống kê trong khoa học dữ liệu.
Phân biệt giữa thống kê mô tả và thống kê suy luận.
Sử dụng thống kê mô tả (Python) để:
- Tóm tắt nhanh dữ liệu.
- Đo lường trung tâm dữ liệu.
- Đo lường độ phân tán dữ liệu.
- Đo lường vị trí tương đối của dữ liệu.
- Học các quy tắc cơ bản để tính xác suất cho sự kiện đơn lẻ.
- Khám phá cách sử dụng định lý Bayes để mô tả các sự kiện phức tạp.
- Học cách sử dụng các phân phối xác suất (nhị thức, Poisson, chuẩn) để hiểu rõ cấu trúc dữ liệu.
- Học về các phương pháp thu thập và phân tích dữ liệu mẫu.
- Tìm hiểu cách tránh sai lệch do chọn mẫu.
- Học cách sử dụng phân phối mẫu để đưa ra ước lượng chính xác.
- Sử dụng mẫu nhỏ để suy luận về tập dữ liệu lớn.
- Khám phá cách sử dụng khoảng tin cậy để mô tả sự không chắc chắn trong ước lượng. - Học cách xây dựng và diễn giải khoảng tin cậy. - Tìm hiểu cách tránh các hiểu lầm phổ biến liên quan đến khoảng tin cậy.
- Kiểm định giả thuyết giúp xác định tính ý nghĩa thống kê của kết quả so với ngẫu nhiên.
- Học các bước cơ bản của một kiểm định giả thuyết.
- Hiểu cách kiểm định giả thuyết giúp đưa ra kết luận có ý nghĩa về dữ liệu.
- Sử dụng Python để trực quan hóa dữ liệu.
- Áp dụng kiến thức thống kê để đánh giá thêm về dữ liệu và mô hình trực quan hóa.
- Ứng dụng xác suất thống kê vào qui trình phân tích dữ liệu thăm dò (EDA) và trực quan hóa cho các bộ dữ liệu thật từ doanh nghiệp.
- Tổng quan về bài toán Hồi quy và các ứng dụng thực tế của nó.
- Giới thiệu các thuật toán Hồi quy phổ biến như Linear Regression, Logistic Regression,...
- Cách tiếp cận và xây dựng một mô hình Hồi quy trong các tình huống thực tế.
- Các phương pháp để đánh giá hiệu suất và độ chính xác của một hệ thống Hồi quy.
- Tổng quan về bài toán Phân loại và các ứng dụng thực tế của nó. - Giới thiệu các thuật toán Phân loại phổ biến như Linear classifiers, Decision Tree, SVM,...
- Cách tiếp cận và xây dựng một mô hình phân loại trong các tình huống thực tế.
- Các phương pháp để đánh giá hiệu suất và độ chính xác của một hệ thống phân loại.
- Học viên thực hành áp dụng kiến thức đã học vào việc giải quyết một bộ dữ liệu mẫu trên nền tảng Kaggle.
- Cung cấp cơ hội cho học viên đặt câu hỏi và nhận được sự giải đáp từ giảng viên hoặc các thành viên khác trong khóa học.
- Tổng quan về bài tập lớn (Project) của khóa học, đưa ra mục tiêu, yêu cầu và quá trình thực hiện của dự án.
- Giới thiệu bài toán phân cụm và giải thuật k-means, một phương pháp phân cụm phổ biến trong Khoa học Dữ liệu.
- Giới thiệu về khái niệm độ tương đồng trong phân cụm, là một phép đo để đánh giá sự tương đồng giữa các điểm dữ liệu.
- Giới thiệu một số phương pháp mã hóa văn bản như Bag-of-Words, TF-IDF và Word Embedding để biểu diễn văn bản thành dữ liệu số hóa.
- Hướng dẫn thực hành giải quyết bài toán truy xuất và phân cụm tài liệu, sử dụng các kỹ thuật và công cụ như k-means và phương pháp mã hóa văn bản, để xử lý và phân tích các tài liệu dựa trên nội dung của chúng.
- Giới thiệu về hệ thống gợi ý và vai trò của nó trong cung cấp thông tin và đề xuất cho người dùng.
- Tổng quan về một số thuật toán phổ biến trong hệ thống gợi ý như Lọc cộng tác, Gợi ý dựa trên nội dung,...
- Cách tiếp cận và quy trình xây dựng một hệ thống gợi ý trong môi trường thực tế, từ việc thu thập dữ liệu đến xây dựng mô hình và triển khai.
- Giới thiệu các phương pháp để đánh giá hiệu suất và độ chính xác của một hệ thống gợi ý.
- Hướng dẫn thực hành xây dựng và đánh giá hệ thống gợi ý trên một bộ dữ liệu thực tế, áp dụng các thuật toán và phương pháp đã học vào thực tế.
- Giới thiệu về khái niệm và mục tiêu của khai phá luật kết hợp trong Khoa học Dữ liệu.
- Các phương pháp và định dạng để biểu diễn luật kết hợp, bao gồm dạng tập hợp, dạng chuỗi, và dạng cây.
- Phương pháp khai thác và tìm kiếm các mẫu phổ biến từ dữ liệu, như tìm tập hợp phổ biến, chuỗi phổ biến, hoặc cây phổ biến.
- Khám phá các luật kết hợp từ các mẫu phổ biến
- Phân tích tương quan giữa các mẫu hoặc thuộc tính dữ liệu, để tìm hiểu sự tương quan và tương tác giữa chúng, đồng thời đưa ra các phân tích và nhận định về mối quan hệ.
- Học viên sẽ được thực hành áp dụng kiến thức về bài toán phân cụm, hệ gợi ý và khai phá luật kết hợp bằng cách giải quyết một bộ dữ liệu mẫu trên nền tảng Kaggle.
- Cung cấp cơ hội cho học viên đặt câu hỏi và nhận được sự giải đáp từ giảng viên hoặc các thành viên khác trong khóa học.
- Học viên sẽ được giới thiệu tổng quan về bài tập lớn (Project) của khóa học, bao gồm mục tiêu, yêu cầu và quy trình thực hiện của dự án.
- Tổng quan về Học Sâu và các lĩnh vực ứng dụng trong Khoa học dữ liệu. - Các kiến thức cơ bản cần nắm về Học Sâu, bao gồm kiến trúc mạng neural, hàm kích hoạt, lan truyền ngược, và thuật toán tối ưu hóa.
- Giới thiệu về xử lý và phân tích hình ảnh thông qua công nghệ thị giác máy tính và các ứng dụng trong thực tế.
- Giới thiệu về xử lý ngôn ngữ tự nhiên và các phương pháp, công cụ để xử lý, phân tích và hiểu văn bản tự nhiên.
- Học viên sẽ được thực hành áp dụng kiến thức về mô hình học sâu bằng cách giải quyết một bộ dữ liệu mẫu trên nền tảng Kaggle.
- Tổng kết Module 4 về lý thuyết.
- Hỏi đáp về Mini-Project.
- Hướng dẫn về cách tiếp cận và phân tích một bài toán trong Khoa học dữ liệu, bao gồm việc định nghĩa mục tiêu, thu thập dữ liệu, đặt câu hỏi và tạo ra giả thuyết để đưa ra các phương pháp phân tích.
- Hướng dẫn về việc xác định và thu thập dữ liệu phù hợp cho bài toán, bao gồm các nguồn dữ liệu, phương pháp thu thập và quy trình xử lý dữ liệu.
- Hướng dẫn về quy trình khai phá dữ liệu (EDA) để hiểu cấu trúc và tính chất của dữ liệu. Bên cạnh đó, cung cấp hướng dẫn về các phương pháp biểu diễn trực quan dữ liệu, như biểu đồ, đồ thị, hay bản đồ, để hỗ trợ quá trình khai phá và hiểu rõ hơn về dữ liệu.
- Hướng dẫn về các phương pháp tiếp cận dữ liệu, bao gồm tiền xử lý, lọc dữ liệu và trích xuất đặc trưng. Điều này bao gồm các kỹ thuật như xử lý dữ liệu thiếu, giải quyết nhiễu, trích xuất thông tin quan trọng và giảm chiều dữ liệu.
- Hướng dẫn về cách khai thác thông tin từ các trường dữ liệu có sẵn và tạo ra các trường dữ liệu mới dựa trên kiến thức và hiểu biết về bài toán. Điều này có thể bao gồm việc kết hợp, biến đổi hoặc áp dụng các quy tắc và hàm tính toán để tạo ra thông tin mới từ dữ liệu hiện có.
- Hướng dẫn về việc mã hóa và chuẩn hóa dữ liệu để đảm bảo tính nhất quán và khả năng so sánh giữa các đặc trưng. Bao gồm các phương pháp như mã hóa one-hot, mã hóa số hóa, chuẩn hóa z-score và chuẩn hóa min-max để biến đổi và điều chỉnh các giá trị dữ liệu thành dạng phù hợp và thống nhất.
- Hướng dẫn về quá trình phân tích bài toán và lựa chọn mô hình phù hợp dựa trên yêu cầu và đặc điểm của dữ liệu. Bao gồm việc tìm hiểu và so sánh các mô hình khác nhau, đánh giá khả năng của chúng trong việc giải quyết bài toán cụ thể. - Hướng dẫn về quá trình xây dựng mô hình, bao gồm việc định nghĩa kiến trúc mô hình, khởi tạo các tham số và quyết định các thông số quan trọng như learning rate, số lượng layer, kích thước batch, v.v.
- Hướng dẫn về quá trình huấn luyện mô hình base, bao gồm việc chuẩn bị dữ liệu huấn luyện, chia thành batch, tạo bộ kiểm tra, lựa chọn hàm mất mát và phương pháp tối ưu hóa, đánh giá và tinh chỉnh mô hình dựa trên kết quả huấn luyện.
- Giới thiệu tổng quan về các tham số của mô hình và các tham số được sử dụng trong quá trình huấn luyện, bao gồm các thông số kiến trúc như số lượng layer, số lượng units trong mỗi layer, hệ số dropout, v.v. Các tham số huấn luyện bao gồm learning rate, số lượng epoch, kích thước batch, v.v.
- Hướng dẫn về cách tối ưu các tham số của mô hình trong quá trình huấn luyện. Điều này có thể bao gồm việc sử dụng phương pháp tìm kiếm lưới (grid search) để thử nghiệm các giá trị khác nhau cho các tham số, sử dụng kỹ thuật tinh chỉnh tự động (automated tuning) như tối ưu bayes (Bayesian optimization), hoặc sử dụng phương pháp tinh chỉnh thông qua việc giảm thiểu hàm mất mát (loss function minimization).
- Phân tích lỗi mô hình: Sử dụng hàm lỗi và quan sát thực tế để hiểu các hạn chế và điểm yếu của mô hình.
- Đánh giá mô hình và lựa chọn mô hình tốt nhất: Sử dụng các phương pháp như cross-validation, độ đo hiệu suất và so sánh mô hình để lựa chọn mô hình tốt nhất cho áp dụng thực tế.
- Triển khai mô hình bằng cách xây dựng các API hoặc dịch vụ để cung cấp chức năng dự đoán cho người dùng hoặc hệ thống khác.
- Xây dựng một quy trình tự động hoàn chỉnh để xử lý dữ liệu, huấn luyện mô hình và triển khai mô hình trong môi trường thực tế. Quy trình này bao gồm các bước từ chuẩn bị dữ liệu, tiền xử lý, huấn luyện mô hình, đánh giá, triển khai và cập nhật mô hình.
- Tổng kết và củng cố kiến thức đã học trong module thực hành, bao gồm các phương pháp, công cụ và kỹ năng đã được áp dụng để giải quyết các bài toán thực tế.
- Các hướng giải quyết khác có thể áp dụng để đạt được kết quả tốt hơn, khám phá và nghiên cứu thêm về các phương pháp mới và tiến bộ trong lĩnh vực khoa học dữ liệu.
- Một số vấn đề cần chú ý khi áp dụng vào hệ thống dữ liệu lớn trong thực tiễn doanh nghiệp bao gồm quy mô, tính khả thi, hiệu suất, bảo mật và tính ổn định của hệ thống và các yếu tố khác như quản lý dữ liệu, quản lý tài nguyên, và tương tác với các thành phần khác trong hệ thống.
- Học viên đặt câu hỏi, chia sẻ kinh nghiệm và thảo luận về project.
- Học viên trình bày Mini-project của mình cá nhân hoặc theo nhóm - Các nhóm đặt câu hỏi, chia sẻ kinh nghiệm và thảo luận.
- Tổng hợp và phân tích kiến thức đã học: Tổng kết và đánh giá lại các khái niệm, kỹ năng và công nghệ đã học trong suốt khóa học.
- Đánh giá tiến độ và kết quả học tập: Xem xét và đánh giá tiến bộ cá nhân và kết quả học tập của mỗi học viên để đảm bảo họ đã đáp ứng được các mục tiêu và yêu cầu của khóa học.
- Thảo luận về ứng dụng thực tế: Trao đổi về cách áp dụng kiến thức đã học vào thực tế và giải quyết các vấn đề trong lĩnh vực tương ứng.
- Phân tích và đánh giá project: Đánh giá và phân tích kết quả của các dự án đã thực hiện bởi các nhóm học viên, bao gồm sự đóng góp, hiệu suất và tính khả thi của các giải pháp.
- Tổng kết và phản hồi: Tổng kết khóa học bằng cách cung cấp phản hồi về nội dung, phương pháp giảng dạy và trải nghiệm học tập, nhằm cải thiện chất lượng của khóa học trong tương lai.

Giảng viên

Tiến sĩ Đặng Lê Quang

Giảng viên Toán ứng dụng và Khoa học máy tính - ĐH Ngoại Thương TP.HCM

- Hơn 3 năm là Giảng viên dạy các chủ đề Toán ứng dụng và Khoa học máy tính,Đại học Ngoại Thương,TP HCM
Phân tích dữ liệu, AI, Cơ sở dữ liệu, PowerBI, v.v.
-  Hơn 3 năm Giảng viên Đại học Khoa Kỹ thuật Hàng không Vũ trụ, Khoa Kỹ thuật Giao thông Vận tải, Đại học Bách khoa TP.HCM
Nhà khoa học nghiên cứu và Giảng viên về các chủ đề liên quan đến Khoa học tính toán.
- Hơn 3 năm Nghiên cứu viên Viện Năng lượng ứng dụng – NUPEC (Nuclear Power Trung tâm Kỹ thuật), Tokyo, Nhật Bản.
- Hơn 4 năm CNTT tại Công ty DFM-engineering
- Hơn 10 năm nghiên cứu trong lĩnh vực khoa học tính toán và phân tích dữ liệu
Thạc sĩ. Nguyễn Danh Tú

Giảng viên trường ĐH Bách khoa Hà Nội chuyên nghành toán tin ứng dụng

  • 10+ năm kinh nghiệm quản lý nhân sự 500+ người, sản phẩm 100K+ người dùng
    Xây dựng Data Warehouse cho sản phẩm Topica Native

    17+ năm Giảng viên Viện Toán ứng dụng, Đại học Bách Khoa Hà Nội
    6+ năm kinh nghiệm đào tạo nhân sự quản lý cấp trung

    Xây dựng chương trình “Phân tích dữ liệu” và đào tạo trực tiếp cho 1000+ nhân sự
    15+ năm kinh nghiệm làm việc thực tế về Quản lý doanh nghiệp, xây dựng hệ thống phần mềm CNTT trên các công cụ lập trình cũng như "Tin học văn phòng" Excel, GoogleSheet, PowerBI

    Đã đào tạo trực tiếp các phần mềm phân tích và xử lý dữ liệu trên Excel, GoogleSheet, PowerBI +2000 người
    Đã đào tạo online Excel: +100K người
    Đào tạo/coaching/tư vấn cho nhiều bạn quản lý, chủ doanh nghiệp về một số mảng (xây dựng hệ thống, chiến lược marketing, xây dựng sản phẩm, tài chính, problem solving,....)

TS. Doãn Trung Tùng

* Học vấn:
- Cử nhân CNTT tại ĐHBKHN năm 2002
- Thạc sĩ CNTT tại Viện Tin học Pháp ngữ năm 2005
- Tiến sĩ CNTT tại Đại học Blaise Pascal Pháp năm 2012

* Kinh nghiệm làm việc:
- Tiến sĩ Tùng đã đảm nhận nhiều vị trí giảng viên và nghiên cứu viên tại các cơ sở đào tạo như ĐHBKHN,
giảng viên và chủ nhiệm khoa khoa CNTT Đại học Greenwich Việt Nam (ĐH liên kết giữa Đại học FPT và
ĐH Greenwich UK)
- Các chuyên môn chính bao gồm trí tuệ nhân tạo (AI), học máy, công nghệ phần mềm, hệ thống phân tán và
cấu trúc dữ liệu

* Nghiên cứu khoa học:
- Thành viên nghiên cứu VNGrid (2010)
- Đề tài hợp tác quốc tế về KHCN: Nghiên cứu các hệ thống tính toán hiệu năng cao và ứng dụng mô phỏng vật
liệu vi mô (2009)
- Dự án hợp tác nghiên cứu và chuyển giao công nghệ về tính toán hiệu năng cao với Trung tâm Centre for
Development of Advanced Computing (Ấn Độ) (2014)
- Xây dựng gINFO Portal trong đề tài EuAsiaGrid (2011)
- Nghiên cứu xây dựng và triển khai dịch vụ tin sinh trên nền điện toán đám mây ứng dụng cho các bài toán
siêu bộ gien (2015 - 2016)

* Tiến sĩ Tùng đã công bố nhiều bài báo khoa học quốc tế về các hệ thống thông minh, học sâu, và ứng dụng
trong các lĩnh vực như nhận diện thẻ căn cước và nhận dạng dấu hiệu giao thông.

 

Dự án học viên

Feedback học viên 

Vũ Minh Nhật

Data Scientist tại VP Bank

Mình rất thích cách giảng viên luôn gắn kiến thức với những ví dụ thực tế trong ngành, giúp mình hiểu rõ về cách áp dụng Data Science vào công việc. Ngoài ra, mình được thực hành nhiều qua các dự án nhỏ, từ làm sạch dữ liệu đến xây dựng mô hình dự đoán, điều này làm mình tự tin hơn khi tiếp cận các bài toán thật.

Mai Thị Hòa

Data Analyst tại Viettel

Mình rất thích cách giảng viên luôn gắn kiến thức với những ví dụ thực tế trong ngành, giúp mình hiểu rõ về cách áp dụng Data Science vào công việc. Ngoài ra, mình được thực hành nhiều qua các dự án nhỏ, từ làm sạch dữ liệu đến xây dựng mô hình dự đoán, điều này làm mình tự tin hơn khi tiếp cận các bài toán thật.

Đỗ Tiến Đạt

Data Scientist tại CMC

Cộng đồng học viên Data Analyst/Data Science/Machine Learning rất hỗ trợ nhau, ai cũng chia sẻ và cùng giải quyết vấn đề một cách thoải mái, không ngại ngần. Nếu bạn còn phân vân thì mình khuyên nên thử, vì không chỉ có kiến thức mà còn kỹ năng thực tế - điều mình nghĩ Cole.vn làm rất tốt!

Lợi ích chỉ có tại COLE

Giới thiệu việc làm sau khóa học

Học lại free

Cộng đồng chuyển đổi số 1

Câu hỏi thường gặp

Với khóa học căn bản/ kỹ năng mới trại hè thì khóa hiện tại không yêu cầu đầu vào. Tùy theo lộ trình học để học viên lựa chọn, ví dụ với trình độ và nhu cầu học nâng cao học viên sẽ có yêu cầu đầu vào ở một số khóa.
Sau khi kết thúc khóa học, học viên sẽ được cấp giấy chứng nhận hoàn thành - chương trình đào tạo kỹ năng của trung tâm. Học viên cần làm qua 1 số bài test theo yêu cầu của giáo viên để trung tâm dựa trên đó làm kết quả cấp chứng nhận sau khóa học.
Khi tham gia lớp học, các học viên sẽ được add vào một group trao đổi chung để hỏi đáp các câu hỏi cần hỗ trợ. Các câu hỏi sẽ được giảng viên và chuyên gia trả lời thắc mắc trên nhóm chung này vĩnh viễn.
Đối với các khóa học được tuyển sinh liên tục và đều đặn, Cole có chính sách cho học viên học lại khóa thứ 2 hoặc thứ 3 nếu chưa nắm vững kiến thức. Nhưng với khóa tổ chức một lần thì có thể sắp xếp được sang các lớp khác cùng chủ đề
Đối với các khóa học tương tác trực tuyến qua zoom, Ms tearm - Cole.vn lưu lại video cho các học viên tham gia khóa học. Đối với các lớp tổ chức offline nếu các lớp trung tâm cũng có record và upload lên nền tảng để học viên xem lại. Tuy nhiên có một số lớp mà không quay video lại được thì không xem được
Một số khóa lộ trình nghề nghiệp cụ thể, Cole có hợp tác với một số doanh nghiệp để giới thiệu ứng viên tham gia thực tập và làm việc. Có rất nhiều các học viên sau khi học xong các khóa học tại Cole đã kiếm được các cơ hội nghề nghiệp mới
"Khóa học tại Cole sẽ học trực tiếp offline tại Hà Nội (các địa điểm trung tâm liên kết của Cole), đào tạo trực tiếp tại doanh nghiệp. Và các khóa học dạng tương tác trực tuyến thì được học qua nền tảng Zoom, MS Tearm. Hoặc 1 số dạng khóa học đã quay sẵn qua video.
- Một số khóa học có công cụ để thhuwcj hành, các GV sẽ chuẩn bị trước thông tin và hướng dẫn cài đặt công cụ để học viên tham gia học tập một cách hiệu quả nhất."
Liên hệ với chúng tôi

Để biết thêm thông tin chi tiết đừng ngần ngại gọi cho chúng tôi.

Hoặc để lại thông tin

COLE - Lựa chọn hàng đầu cho nhân
sự về Digital Skills

5000+

Học viên theo học

30%

Thu nhập học viên tăng lên sau khi học

30+ Khóa học

Hàng đầu về ứng dụng công nghệ

50+

Chuyên gia hàng đầu về chuyển đổi số

300+ Doanh nghiệp hàng đầu lựa chọn Cole để nâng cấp kỹ năng

Hình ảnh lớp học