Tổng quan về lộ trình
TRỞ THÀNH KỸ SƯ DỮ LIỆU (DATA ENGINEER) SAU 4.5 THÁNG
Thông tin chung:
Thời lượng: Khóa học online 30 buổi (4.5 tháng) qua Zoom.
Khai giảng liên tục
Nội dung học: Đi từ kiến thức nền tảng, áp dụng lý thuyết, thực hành dự án thực tế, học từ chuyên gia hàng đầu giúp bạn "đi tắt - đón đầu" trong nghề Data Engineer một cách nhanh nhất.
Số lượng học viên: 25 học viên/lớp
Giảng viên: Giảng viên giàu kinh nghiệm thực chiến làm tại các tập đoàn lớn như VNPT, BRG Group, từng làm các dự án outsource cho Bộ Công An, các sở, ban, ngành,...
Mục tiêu khóa học:
Thành thạo các kiến thức, kỹ năng, công nghệ bắt buộc mà 1 kỹ sư Data Engineer sẽ phải có trong quá trình đi làm.
Nắm rõ về Cơ sở dữ liệu quan hệ (SQL), Cách cài đặt hệ thống lưu trữ.
Nắm chắc kiến thức ETL - Extract, Transform, Load Data Warehouse
Thành thạo Data Visualization trên Power BI
Thành thạo Data Lake - Big Data, nắm kiến thức về Oracle, Cloud: AWS, Google Cloud, Azure
Biểu diễn dữ liệu từ những kết quả của phân tích.
Áp dụng vào các dự án thực tế.Làm chủ được kỹ năng xử lý dữ liệu, đặc biệt là dữ liệu có số lượng lớn thường gặp trong tài chính, ngân hàng, bảo hiểm, viễn thông, CNTT, …
Lộ trình học
Khóa học 1
Lộ trình 30 buổi để trở thành Data Engineer
Khóa học 2
Data Engineer - Cơ sở dữ liệu quan hệ (SQL - SQL Server)
Buổi 1 - Tổng quan về Data Engineer Các công nghệ trong Data Engineer
Data Warehousing
ETL
SQL
Business Intelligence
SQL Server
Framework ETL, ELT
Buổi 2 - Tổng quan về CSDL, Truy vấn dữ liệu
Tổng quan về CSDL
Cài đặt Microsoft SQL Server
Cài đặt Tool SSMS
Cơ sở của truy vấn - Ngôn ngữ SQL
Các khái niệm, thành phần cơ bản trong SQL
Các nhóm lệnh cơ bản trong SQL
Kiểu dữ liệu trong SQL Server
Select statement
Bài tập thực hành
Buổi 3 - Queries and Practice (Truy vấn SQL), DDL, DML statement
Select statement: Cú pháp câu điều kiện (DISTINCT, WHERE, IN, ORDER BY, AND, OR, NOT,...)
SQL statement with aggregate functions (COUNT, SUM, AVERAGE , MIN, MAX, ..)
SQL statement with datetime functions practice exercises
DDL statement
Constraint
DML statement
Bài tập thực hành
Buổi 4 - Database Design (Thiết kế Database)
Covering database design with multiple tables, foreign keys, and the JOIN operation, Relational Database Design, Normalization and Foreign Keys, Building a Physical Data Schema, Relational Database Design, SQL statement with JOIN operator (left join, right join, full join), SQL statement with UNION, 1 practice exercise
Buổi 5 - Procedure, Function, Điều khiển logic
Procedure (Thủ tục)
Functioin (Hàm)
If ... else ...
case ... when ...
vòng lặp while
cursor (con trỏ)
bảng tạm with cte
Bài tập thực hành
Buổi 6 - View, Index, Transaction, Lock, Deadlock
View, Index, Transaction, Lock, Deadlock
Buổi 7 - Ôn tập, thực hành
Ôn tập, thực hành
Buổi 8 - Tuning SQL
Nguyên nhân gây chậm câu truy vấn SQL
Công cụ turning, debug, tracing
Tối ưu hóa câu lệnh SQL
Execution plan (Kế hoạch thực thi)
Bài tập thực hành
Buổi 9 - Thực hành Turning SQL
Buổi 10 - Project
Khóa học 3
Data Engineer - Data warehouse and data visualization
Buổi 1 - Tổng quan về datawarehouse và ETL
Tổng quan về DW
Tổng quan về ETL
Buổi 2 - Các bước thực hiện ET và các tool ETL
Các bước ETL- Extract, transform load
Giới thiệu tool ETL: SQL Server Integration Services (SSIS)
Buổi 3 - Xây dựng CSDL đa chều trong DW
Xây dựng OLAP trên SQL server
Buổi 4 - SQL Server Integration Services (SSIS)
Thực hành SSIS
Buổi 5 - SQL Server Integration Services (SSIS)
Thực hành SSIS
Buổi 6 - Tổng quan về phân tích và trực quan hóa dữ liệu
Tổng quan về phân tích dữ liệu
Tổng quan trực quan hóa dữ liệu
Buổi 7 - Thực hành Data Visualization - Business Inteligence trên Power BI Buổi 1
- Lấy dữ liệu vào power BI
- Xây dưng các biểu đồ
Buổi 8 - Thực hành Data Visualization - Business Inteligence trên Power BI Buổi 2
- Data Analysis Expression
Buổi 9 - Project cuối khóa
Khóa học 4
Data Engineer - AWS, Google Cloud and Azure
Buổi 1 - Tổng quan về AWS
- Overview
- AWS console
- IAM
- Các dịch vụ dữ liệu của AWS
Buổi 2 - Dịch vụ cơ dữ liệu quan hệ RDS
- Các loại cơ sở dữ liệu được RDS hỗ trợ
- Cách tạo RDS và kết nối tới database
- Giám sát trạng thái hoạt động của server
- Backup dữ liệu định kỳ
- Bài tập thực hành
Buổi 3 - Dịch vụ lưu trữ S3
- Cách tạo bucket, upload, download file lên S3
- Sử dụng công cụ aws-cli để upload/download file
- Sử dụng athena để truy vấn dữ liệu trên S3
- Bài tập thực hành
Buổi 4 - DynamoDB (NoSQL Engine)
- Cách tạo và kết nối database
- Một số cú pháp truy vấn cơ bản
- Backup định kỳ
- Bài tập thực hành
Buổi 5 - AWS Glue cơ bản
- Giới thiệu về AWS Glue
- Data Catalogue
- Crawler
- Visual ETL
- Bài tập thực hành
Buổi 6 - AWS Glue nâng cao
- Các phép biến đổi dữ liệu thông dụng
- Chạy job theo định kỳ
- Sử dụng workflow
- Bài tập thực hành
Buổi 7 - Google Cloud và Azure
Giới thiệu Google Cloud, Azure với các dịch vụ dữ liệu tương tự như của AWS
Buổi 8 - Kéo dữ liệu từ nhiều nguồn
Buổi 9 - Project cuối khóa
Xây dựng data pipeline để khai thác dữ liệu bán hàng trên Shopee
Giảng viên
Giảng viên TS.Nguyễn Thế Anh
Giảng viên Chuyên gia Nguyễn Công Nhân
Giảng viên Chuyên gia Tạ Minh Tùng
Dự án của học viên
Cảm nhận của học viên
Khóa học 1
Lộ trình 30 buổi để trở thành Data Engineer
Khóa học 2
Data Engineer - Cơ sở dữ liệu quan hệ (SQL - SQL Server)
Khóa học 3
Data Engineer - Data warehouse and data visualization
Khóa học 4
Data Engineer - AWS, Google Cloud and Azure