Thời lượng

7 tháng (60 buổi)

Hình thức đào tạo

Online qua Zoom

Số tín chỉ

30

Tổng quan

Trong bối cảnh thế giới ngày càng số hóa, dữ liệu đã trở thành nguồn tài nguyên quý giá không thể thiếu đối với các doanh nghiệp và tổ chức. Xu hướng chuyển đổi số đang diễn ra mạnh mẽ trên toàn cầu, kéo theo nhu cầu cao về việc xử lý và phân tích dữ liệu lớn (Big Data). Các công ty, từ các tập đoàn lớn đến các startup nhỏ, đều đang tìm kiếm những giải pháp hiệu quả để quản lý và khai thác dữ liệu nhằm nâng cao hiệu quả kinh doanh, tối ưu hóa quy trình và đưa ra các quyết định chiến lược dựa trên dữ liệu.

Chương trình học Big Data Engineer được thiết kế nhằm trang bị cho học viên kiến thức và kỹ năng cần thiết để trở thành một kỹ sư dữ liệu chuyên nghiệp. Các mục tiêu chính của khóa học bao gồm: Từ việc làm quên với nghề Data engineer, bằng việc học các kiến thức cơ bản đến SQL Sever, các khái niệm về Data Warehouse, thực hành làm Data Warehouse, các dịch vụ AWS trên Clound. Nắm vững các khái niệm cơ bản về Big Data, quy trình xử lý dữ liệu lớn và các lĩnh vực ứng dụng (bigdata). Thành thạo lập trình Python, từ cú pháp cơ bản đến lập trình đa luồng và lập trình mạng(python). Hiểu biết về hệ sinh thái Hadoop và các thành phần như HDFS, MapReduce, HBase, Sqoop, Flume và Spark. Tạo và quản lý cơ sở dữ liệu, bảng trong Hive, sử dụng các loại file format trong Big Data(hadoop). Tối ưu RDD, làm việc với DataFrame và SQL trong Spark, xử lý dữ liệu song song và streaming.

Chương trình bao gồm các buổi học lý thuyết kết hợp với thực hành, giúp học viên áp dụng kiến thức vào các bài tập và dự án thực tế. Sau khi hoàn thành khóa học, học viên sẽ có khả năng làm việc với các công cụ và công nghệ tiên tiến trong lĩnh vực Big Data Engineer, sẵn sàng đối mặt với các thách thức trong ngành.

Những xu hướng chính trong lĩnh vực Big Data Engineer có thể kể đến bao gồm:

Tăng cường sử dụng công nghệ AI và Machine Learning: Các công nghệ này giúp khai thác và phân tích dữ liệu một cách tự động và thông minh, phát hiện ra những mô hình và xu hướng ẩn giấu trong dữ liệu.
Chuyển đổi dữ liệu sang nền tảng đám mây: Việc lưu trữ và xử lý dữ liệu trên các nền tảng đám mây như AWS, Google Cloud, và Azure giúp tiết kiệm chi phí, tăng cường bảo mật và linh hoạt trong quản lý dữ liệu.
Ứng dụng dữ liệu thời gian thực: Khả năng xử lý và phân tích dữ liệu trong thời gian thực ngày càng trở nên quan trọng, giúp doanh nghiệp phản ứng nhanh chóng với các thay đổi và sự kiện tức thời.
Tăng cường bảo mật và quản trị dữ liệu: Khi khối lượng dữ liệu ngày càng lớn, việc bảo vệ dữ liệu và tuân thủ các quy định về quyền riêng tư trở thành ưu tiên hàng đầu. Tại Việt Nam, các doanh nghiệp đang dần nhận thức rõ hơn về tầm quan trọng của Big Data Engineer. Nhiều công ty lớn như FPT, Viettel, VNG, BRG và các tổ chức tài chính, ngân hàng đang đầu tư mạnh mẽ vào công nghệ này. Điều này dẫn đến nhu cầu ngày càng tăng về các chuyên gia Big Data, những người c ó khả năng làm việc với các công cụ và nền.

Mục tiêu học tập

OP 1: Tổng quan về khái niệm Data Engineer và các lĩnh vực áp dụng, trải nghiêm quy trình xử lý dữ liệu lớn và các công việc liên quan tại Việt Nam.
OP 2: Thiết kê và truy vấn được Database chịu tải cao, tối ưu hóa các câu lệnh SQL.
OP 3: Xây dựng được Data Warehouse trên SQL Sever, ETL dữ liệu bằng SSIS
OP 4: Xây dựng đượcData Visuallization, Data Pipeline để khai thác dữ liệu
OP 5: Sử dụng thành thạo hệ điều hành Linux và các lệnh cơ bản, được thực hành các thao tác phân quyền, IO Redirection, Data Streams và lập trình shell.
OP 6: Tổng quan về khái niệm Big Data và các lĩnh vực áp dụng, trải nghiêm quy trình xử lý dữ liệu lớn và các công việc liên quan tại Việt Nam.
OP 7: Lập trình Python từ cơ bản đến nâng cao, ứng dung các Python Design Patterns và lập trình đa luồng.
OP 8: Hệ sinh thái công nghệ trong Datalake/Bigdata - Hadoop Ecosystem,hệ sinh thái Hadoop và các thành phần liên quan như HDFS, MapReduce, HBase, Sqoop, Flume, Spark, Pig.
OP 9: Tổng quan và giải thích kiến trúc của HDFS và YARN, cài đặt Hadoop với các cấu hình cơ bản.
OP 10: Trải nghiệm sử dụng mô hình lập trình MAP/REDUCE và các ví dụ thực tế.
OP 11: Sử dụng Sqoop để nhập và xuất dữ liệu giữa RDBMS và HDFS, HBase, Hive.
OP 12: Ứng dụng các tính năng của Hive và quản lý dữ liệu với Hive.
OP 13: Tạo và quản lý cơ sở dữ liệu, bảng trong Hive, thực hiện các thao tác load và query dữ liệu.
OP 14: Phân loại file format trong Big Data và cách sử dụng chúng.
OP 15: Giới thiệu sử dụng HiveQL và cải thiện hiệu suất với partitioning.
OP 16: Thành phần và kiến trúc của Flume và HBase.
OP 17: Sử dụng Apache Pig cho xử lý dữ liệu.
OP 18: Tổng quan các khái niệm liên quan đến Spark, sử dụng Spark với Python.
OP 19: Ứng dụng RDD implemention trong Pyspark
OP 20: Triển khai ứng dụng Spark và cấu hình Spark Application.
OP 21: Được giới thiệu và ứng dụng lý song song trong Spark và tạo các partition.
OP 22: Sử dụng RDD Lineage, Persistence và tối ưu RDD.
OP 23: Làm việc với Data Frame trong PySpark, sử dụng PySpark SQL, Spark Streaming cho các truy vấn dữ liệu.
OP 24: Project cuối khóa:
- Xây dựng hệ thống lưu trữ dữ liệu cho tập đoàn - nhiều công ty thành viên
- Xây dựng hệ thống lưu trữ dữ liệu cho tổng công ty - gồm nhiều phòng ban chức năng.

Đối tượng học tập

Sinh viên các ngành Công nghệ thông tin, Khoa học máy tính, và các ngành liên quan.

Các chuyên viên IT, lập trình viên, và những người muốn chuyển đổi nghề nghiệp sang lĩnh vực dữ liệu.

Những ai có mong muốn nâng cao kỹ năng và kiến thức về xử lý và quản lý dữ liệu lớn.

Chuẩn đầu ra 

Theo chuẩn Bloom 3 mốc đầu

Knowledge (Hiểu biết):
• Khái niệm cơ bản về Kỹ sư Dữ liệu (Data Engineer), Data Warehousing, ETL, SQL, Business Intelligence, và các hệ thống cơ sở dữ liệu như SQL Server.
• Quy trình xử lý và quản lý dữ liệu lớn, bao gồm các công nghệ như Power BI, AWS, Google Cloud, Azure, Hadoop, HDFS, YARN, và hệ sinh thái Hadoop.

Comprehension (Lĩnh hội):
• Học viên có khả năng giải thích, thảo luận các khái niệm đã học, Python cho Data Engineers, và các công cụ xử lý dữ liệu lớn như Sqoop, HIVE, Flume, Hbase, Pig, Spark.
• Học viên áp dụng các kiến thức lý thuyết vào các tình huống thực tế trong lĩnh vực dữ liệu lớn, chẳng hạn như xây dựng data pipeline, trực quan hóa dữ liệu với Power BI, và thực hiện các quy trình ETL.

Application (Ứng dụng):
•Học viên có thể sử dụng thành thạo các công cụ và công nghệ để xử lý và quản lý dữ liệu, bao gồm việc triển khai và cấu hình các hệ thống Hadoop, Spark, và các công cụ liên quan như Sqoop, HIVE, Flume, Hbase, Pig, và các công cụ Spark như RDD, DataFrame, Spark SQL, và Spark Streaming.
• Học viên có khả năng thực hiện các thao tác phức tạp như tối ưu hóa câu lệnh SQL, xử lý dữ liệu với Python, và sử dụng các dịch vụ cloud như AWS, Google Cloud, Azure để quản lý và phân tích dữ liệu.

Chuẩn đầu ra theo tư duy, công cụ, kỹ năng

- Công cụ:
• SQL Server: Nắm vững các lệnh và cú pháp SQL, tối ưu hóa câu lệnh SQL, thiết kế và quản lý cơ sở dữ liệu.
• Power BI: Trực quan hóa dữ liệu, tạo báo cáo và dashboard.
• AWS, Google Cloud, Azure: Quản lý cơ sở dữ liệu trên đám mây, sử dụng các dịch vụ dữ liệu của AWS, Google Cloud và Azure.
• Hadoop Ecosystem: Sử dụng các công cụ trong hệ sinh thái Hadoop như HDFS, YARN, MapReduce, Hbase, Sqoop, Flume, Pig, và Spark.
• Python: Lập trình Python cho Data Engineering, sử dụng các thư viện và framework phổ biến.

- Tư duy:
• Tư duy phân tích: Phân tích dữ liệu, tìm ra insights từ dữ liệu lớn.
• Tư duy giải quyết vấn đề: Giải quyết các vấn đề liên quan đến xử lý và quản lý dữ liệu lớn.
• Tư duy hệ thống: Hiểu và thiết kế các hệ thống dữ liệu phức tạp, đảm bảo sự hiệu quả và tối ưu của các quy trình xử lý dữ liệu.

- Kỹ năng:
• Kỹ năng lập trình: Lập trình với SQL, Python, và các công cụ Hadoop.
• Kỹ năng quản lý dữ liệu: Thiết kế, triển khai và quản lý cơ sở dữ liệu lớn, sử dụng các công cụ ETL và Data Warehousing.
• Kỹ năng sử dụng công nghệ đám mây: Triển khai và quản lý dữ liệu trên các nền tảng đám mây như AWS, Google Cloud, Azure.( Xây dựng được Data warehouse, Data lakehouse - Onpremis hoặc Cloud AWS)
• Kỹ năng trực quan hóa dữ liệu: Sử dụng Power BI để tạo báo cáo và dashboard trực quan.
• Kỹ năng làm việc nhóm: quản lý mã nguồn, làm việc cùng nhóm trong các dự án data engineering.

Công việc sau khi hoàn thành khóa học

Mong muốn của trung tâm sau khi học xong khóa học tại COLE là có thể được sử dụng những dự án thực tế làm kinh nghiệm để có thể ứng tuyển vào các vị trí: Kỹ sư dữ liệu (Data Engineer), Quản trị hệ thống dữ liệu (Database Administrator), Chuyên gia về Big Data (Big Data Specialist), Nhà phát triển ứng dụng dữ liệu (Data Application Developer). Đây là vị trí mà có rất nhiều công ty công nghệ lớn tại Việt Nam cũng như toàn cầu có công việc tuyển dụng với mức lương cực kì cạnh tranh ví dụ như: FPT Software, Viettel Group, VNG Corporation, Tiki Corporation, Shopee Vietnam, VinGroup, Grab Vietnam, ZaloPay, Lazada Vietnam, NashTech Vietnam…

Lộ trình học tập 

Data Warehousing
ETL
SQL
Business Intelligence
SQL Server
Framework ETL, ELT
Tổng quan về CSDL
Cài đặt Microsoft SQL Server
Cài đặt Tool SSMS
Cơ sở của truy vấn - Ngôn ngữ SQL
Các khái niệm, thành phần cơ bản trong SQL
Các nhóm lệnh cơ bản trong SQL
Kiểu dữ liệu trong SQL Server
Select statement
Bài tập thực hành
Select statement: Cú pháp câu điều kiện (DISTINCT, WHERE, IN, ORDER BY, AND, OR, NOT,...)
SQL statement with aggregate functions (COUNT, SUM, AVERAGE , MIN, MAX, ..)
SQL statement with datetime functions practice exercises DDL statement
Constraint
DML statement
Bài tập thực hành
Covering database design with multiple tables, foreign keys, and the JOIN operation, Relational Database Design, Normalization and Foreign Keys, Building a Physical Data Schema, Relational Database Design, SQL statement with JOIN operator (left join, right join, full join), SQL statement with UNION, 1 practice exercise
Procedure (Thủ tục)
Functioin (Hàm)
If ... else ...
case ... when ...
vòng lặp while
cursor (con trỏ)
bảng tạm with cte
Bài tập thực hành
View, Index, Transaction, Lock, Deadlock
Ôn tập, thực hành
Nguyên nhân gây chậm câu truy vấn SQL
Công cụ turning, debug, tracing
Tối ưu hóa câu lệnh SQL
Execution plan (Kế hoạch thực thi)
Bài tập thực hành
Thiết kế cơ sở dữ liệu và xây dựng các báo cáo cần thiết, chủ đề tùy chọn:
- bán hàng online
- book phòng khách sạn
- đặt vé sự kiện
- quản lý nhân sự...
- Tổng quan về DW
- Tổng quan về ETL
- Extract
- Transform
- Load
- SSIS
Xây dựng OLAP trên SQL server
Thực hành SSIS
Thực hành SSIS
Xây dựng data warehouse, luồng ETL xử lý dữ liệu và trực quan hóa bằng PowerBI cho bài toán bán hàng, mua hàng, kho vận (hoặc tự chọn chủ đề)
- Tổng quan về phân tích dữ liệu
- Tổng quan trực quan hóa dữ liệu
- Lấy dữ liệu vào power BI
- Xây dưng các biểu đồ
- Data Analysis Expression
- Overview
- AWS console
- IAM
- Các dịch vụ dữ liệu của AWS
- Các loại cơ sở dữ liệu được RDS hỗ trợ
- Cách tạo RDS và kết nối tới database
- Giám sát trạng thái hoạt động của server
- Backup dữ liệu định kỳ
- Bài tập thực hành
- Cách tạo bucket, upload, download file lên S3
- Sử dụng công cụ aws-cli để upload/download file
- Sử dụng athena để truy vấn dữ liệu trên S3
- Bài tập thực hành
- Cách tạo và kết nối database
- Một số cú pháp truy vấn cơ bản
- Backup định kỳ
- Bài tập thực hành
- Giới thiệu về AWS Glue
- Data Catalogue
- Crawler
- Visual ETL
- Bài tập thực hành
- Các phép biến đổi dữ liệu thông dụng
- Chạy job theo định kỳ
- Sử dụng workflow
- Bài tập thực hành
Xây dựng pipeline để tổng hợp và khai thác dữ liệu từ nhiều nguồn
Giới thiệu Google Cloud, Azure với các dịch vụ dữ liệu tương tự như của AWS
- Giới thiệu Big data
- Big data Case Study
- 5V's of Big data
- Các lĩnh vực áp dụng
- Quy trình xử lý big data
- Các công việc liên quan đến big data ở Việt Nam
- Tóm tắt các ý chính cần nhớ và hỏi đáp
- Giao nhiệm vụ cho phần tiếp theo
Giới thiệu Python, cài đặt môi trường, cú pháp cơ bản, kiểu dữ liệu, biến, toán tử, câu lệnh điều khiển
Hàm, module, class trong Python, làm việc với file và thư mục.
- Singleton, Factory
- Observer, Decorator.
- Làm việc với mạng trong Python: socket
- Programming, client-server model.
- Hệ thống phân tán
- Giới thiệu hadoop
- Các thành phần trong hệ sinh thái hadoop:
• HadoopMap-Reduce
• HDFS
• Hbase
• Sqoop
• Flume
• Spark
• Pig
• Impala
• OOzie
• HUE
- Áp dụng hệ sinh thái công nghệ Hadoop Ecosystem vào trong quy trình xử lý bigdata.
- Tóm tắt các ý chính cần nhớ và hỏi đáp, chia sẻ tài liệu liên quan.
-Giao nhiệm vụ cho phần tiếp theo
- Thảo luận về Hadoop Distributed File System (HDFS)
- Giải thích kiến trúc và các thành phần trong HDFS
- Mô tả YARN và các tính năng của YARN
- Giải thích kiến trúc của YARN
- Demo cài đặt hadoop với các cấu hình cơ bản (package sẵn hướng dẫn cài đặt hadoop trên môi trường linux)
- Tóm tắt các ý chính cần nhớ và hỏi đáp, chia sẻ tài liệu liên quan
- Giao nhiệm vụ cho phần tiếp theo
- Tìm hiểu về tính toán Tuần tự, đồng thời & song song (Sequense, Concurrency & Parallelism)
- Diễn giải map-reduce
- Ví dụ map/reduce và một số trường hợp sử dụng trong thực tế
- Tìm hiểu mã lập trình mapreduce sử dụng thư viện của hadoop (JAVA)
- Tóm tắt các ý chính cần nhớ và hỏi đáp, chia sẻ tài liệu tham khảo
- Giao nhiệm vụ cho phần tiếp theo
- Sqoop (what, when, why, who, when)
- Các trường hợp sử dụng Sqoop (có gợi ý thêm công cụ spark để làm pipeline với một số thế mạnh, chia sẻ bài tham khảo)
- Kiến trúc của Sqoop
- Demo Sqoop: (cài đặt sqoop, các thông số cấu hình cần quan tâm, pack sẵn gói cài đặt sqoop trên môi trường linux)
• Sử dụng Sqoop import dữ liệu từ RDBMS tới:
HDFS
HBASE (tùy chọn)
HIVE (tùy chọn)
• Export dữ liệu trong hadoop sử dụng sqoop
- Một số command line của sqoop
- Tóm tắt các ý chính cần nhớ và hỏi đáp, chia sẻ tài liệu liên quan
- Giao nhiệm vụ cho phần tiếp theo
- Các tính năng của hive & impala
- Các tác động qua lại giữa hive & impala
- Demo
- Tóm tắt các ý chính cần nhớ và hỏi đáp, chia sẻ tài liệu liên quan
- Giao nhiệm vụ cho phần tiếp theo
- Metastore
- Định nghĩa cơ sở dữ liệu và bảng
- Data Types trong Hive
- Demo
• Tạo CSDL và bảng trong HIVE
• Mô tả các tables
- Data validation
- Demo
• Load data trong HIIVE
• Query data ở HIVE và Impala
- Tóm tắt các ý chính cần nhớ và hỏi đáp, chia sẻ tài liệu liên quan
- Giao nhiệm vụ cho phần tiếp theo
- Types of Big Data Format
• Text
• Sequense
• Parquet
• Avro
• Ocr (optional)
- Data Serialization
- Demo
• Tạo Hive table với Avro
• Avro với Sqoop
• Import dữ liệu từ RDBMS (Mysql) và HDFS sử dụng Avro
• Làm lặp lại các demo trên bằng Parquet
- Tóm tắt các ý chính cần nhớ và hỏi đáp, chia sẻ tài liệu liên quan
- Giao nhiệm vụ cho phần tiếp theo
- Cải thiện hiệu suất với các khái niệm về File Partitioning
- Học về Hive Query Language (HiveQL)
- HiveQL Extensibility
- Tóm tắt các ý chính cần nhớ và hỏi đáp
- Giao nhiệm vụ cho phần tiếp theo
- Ý nghĩa, khả năng mở rộng và các thành phần trong Flume
- Demo Flume
- Ý nghĩa, kiến trúc và các thành phần trong Hbase
- Demo Hbase
- Tóm tắt các ý chính cần nhớ và hỏi đáp, chia sẻ tài liệu liên quan
- Giao nhiệm vụ cho phần tiếp theo
- Giới thiệu Pig
- Pig Architecture & Operations
- Pig Commands & Demo
- Tóm tắt các ý chính cần nhớ và hỏi đáp, chia sẻ tài liệu liên quan
- Giao nhiệm vụ cho phần tiếp theo
- Introduction to Spark
- Spark: Architecture, Execution, and Related Concepts
- RDD Basic
- Spark Example with python
- Tóm tắt các ý chính cần nhớ và hỏi đáp, chia sẻ tài liệu liên quan
- Giao nhiệm vụ cho phần tiếp theo
- RDD Data Types and RDD Creation
• Data Types Supported by RDD
• Pair RDDs and Double RDDs
• Creating RDD from a Text File, Collection, Whole Files
• Creating Pair RDDs
With Examples
- Input and Output Formats in Spark
- Operations in RDD - Transfomrmation & Action (implemention)
- Spark RDD Closure & Shared Variable
- Tóm tắt các ý chính cần nhớ và hỏi đáp, chia sẻ tài liệu liên quan
- Giao nhiệm vụ cho phần tiếp theo
- SparkContext and Spark Application Cluster Options
- Running Spark on Yarn
- Running Spark Application
- Dynamic Resource Allocation
- Configuring the Spark Application
- Tóm tắt các ý chính cần nhớ và hỏi đáp, chia sẻ tài liệu liên quan
- Giao nhiệm vụ cho phần tiếp theo
- Spark Cluster
- Spark Partitions
- Demo: Creating Partition
- Spark Terminology
- How Spark Calculates Stages
- Controlling the Level of Parallelism
- Spark Application UI
- Tóm tắt các ý chính cần nhớ và hỏi đáp, chia sẻ tài liệu liên quan
- Giao nhiệm vụ cho phần tiếp theo
- Concept of RDD Lineage
- RDD Persistence
- Demo
- Tóm tắt các ý chính cần nhớ và hỏi đáp
- Tóm tắt các ý chính cần nhớ và hỏi đáp, chia sẻ tài liệu liên quan
- Giao nhiệm vụ cho phần tiếp theo
- PySpark DataFrame
Introduction to PySpark DataFrame
Features and Advantages
Working with PySpark DataFrame
a. Create DataFrame: createDataFrame(), spark.read.csv(), spark.read.json()
b. printSchema(), show()
c. count()
d. describe()
e. crosstab()
f. groupby()
g. select(), select() và agg, count, max, mean, min, sum..., select().distinct()
h. orderby().asc()/desc()
i. withColumn(), withColumnRenamed()
j. drop(), dropDuplicates(), dropna()
k. filter(), where()
l. Column string transformation
m. Conditional clauses: .when(, ), .otherwise()
n. User defined functions (UDF)
Data Visualization in PySpark using DataFrames
a. hist(), distplot()
b. pandas_histogram()
- Tóm tắt các ý chính cần nhớ và hỏi đáp, chia sẻ tài liệu liên quan
- Giao bài tập về nhà và nhiệm vụ cho buổi tiếp theo
- PySpark SQL
Introduction to PySpark SQL
Running SQL Queries Programmatically
a. select()
b. when()
c. like()
d. startswith(), endswith()
e. substr(), between()
Manipulating data
a. Group by
b. Filtering
c. Sorting
d. Missing and replacing value
e. Joining Data
f. Repartitioning
g. Registering DataFrames as Views
- Tóm tắt các ý chính cần nhớ và hỏi đáp, chia sẻ tài liệu liên quan
- Giao bài tập về nhà và nhiệm vụ cho buổi tiếp theo
- Tìm hiểu Stream Processing vs BatchProcessing
- Dstream
- Spark Struct Streaming
- Tóm tắt các ý chính cần nhớ và hỏi đáp, chia sẻ tài liệu liên quan
- Giao bài tập về nhà
- Tổng hợp kiến thức
- Đưa ra các đánh giá về công nghệ, một số gợi ý lựa chọn công nghệ phù hợp đối với từng mục đích khác nhau
- Tóm tắt các ý chính cần nhớ và hỏi đáp, chia sẻ tài liệu liên qua

Giảng viên

TS.Nguyễn Thế Anh

Data Architecture tại Tập đoàn BRG

  • 15+ năm kinh nghiệm làm việc thực tế về chuyển đổi số, tham gia phát triển nhiều dự án CNTT lớn. Tham gia đánh giá, tư vấn hỗ trợ trong việc mua sắm phần mềm cho doanh nghiệp.
  • Đã có kinh nghiêm làm việc chuyển đổi số trong và ngoài nước (Mỹ và Malaysia) - Tập đoàn BestBuy.Com với vai trò là key chính (kỹ sư dữ liệu.)
  • Đã chuyển đổi số trong nhiều lĩnh vực từ doanh nghiệp nước ngoài, chính phủ, và doanh nghiệp tư nhân
  • Làm việc với nhiều vai trò khác nhau từ nhân viên, thầy giáo, tư vấn, quản trị dự án, lãnh đạo CNTT trong doanh nghiệp, chủ doanh nghiệp, làm các dự án startup
  • Đã làm các dự án phần mềm (chuyển đổi số) cho chính phủ (Chính phủ điện tử Đà Nẵng, Một cửa quốc gia, Chính phủ điện tử cho bộ Y tế, Bộ giao thông vận tải, Văn phòng chính phủ…).
  • Đã đào tạo đội làm chính phủ điện tử bên VNPT , đào tạo STEM và có đưa team học sinh Việt Nam đi thi đấu tại Indonesia.
  • Hiện tại phụ trách phần mềm, EA (enterprise architecture) của Tập đoàn BRG (Công ty đa ngành sở hữu ngân hàng SeaBank, Golf, Khách sạn, BDS, Dược phẩm……)
  • Tốt nghiệp kỹ sư CNTT ngành ngành Toán - Tin Đại học Bách khoa Hà Nội
  • Từng làm giảng viên tại Aptech
Chuyên gia Tạ Minh Tùng

Senior Data Analyst - Business Inteligence tại Corp360

Senior Data Analyst - Business Inteligence tại Corp360

Thầy Đỗ Đình Tấn

Principal Engineer tại IX - Công ty chuyển đổi số hàng đầu Nhật Bản

- Xây dựng các hệ thống Data Warehouse, Big Data tại tập đoàn Mynavi (công ty tuyển dụng lớn nhất Nhật Bản)              
- 5 năm kinh nghiệm làm việc trực tiếp tại Nhật Bản                        
- 12 năm kinh nghiệm làm chuyển đổi số khách hàng Nhật Bản

Thầy Huỳnh Ngọc Phiên

Data Architect at Bosch Digital

  • 7+ năm kinh nghiệm xây dựng và phát triển Big Data Platform tại ACB Bank và Bosch.
  • 2+ năm phát triển và vận hành quy trình tự động hóa với vai trò RPA Engineer tại FPT và Bosch.
  • Chứng chỉ:
    - Big Data Specialization - Đại học California, San Diego.
    - BI Foundations with SQL, ETL and Data Warehousing - IBM.

Trợ giảng

Đỗ Huy Chúc
Bùi Quang Cường

Feedback học viên 

Nguyễn Thùy Linh

Intern Data Engineer tại tập đoàn FPT

Là một sinh viên mới ra trường, mình đã rất băn khoăn không biết nên bắt đầu sự nghiệp của mình như thế nào trong lĩnh vực dữ liệu. Nhưng sau khi tham gia khóa học Data Engineer tại Cole.vn, mọi thứ đã rõ ràng hơn rất nhiều. Khóa học không chỉ cung cấp kiến thức mà còn giúp mình hiểu sâu về cách tư duy trong ngành này. Mình đã học được cách xử lý dữ liệu lớn, thiết kế pipeline và sử dụng những công cụ như SQL, Python, và đặc biệt là AWS. Điều tuyệt vời nhất là giảng viên luôn đồng hành, giải đáp mọi thắc mắc dù nhỏ nhất, giúp mình cảm thấy tự tin hơn khi bước chân vào công việc đầu tiên. Nếu bạn là sinh viên như mình, đừng ngần ngại mà hãy đầu tư vào khóa học này, nó thật sự thay đổi cuộc chơi!

Ngô Thái Huy

Fresher Data Engineer tại Viettel

Sau 7 tháng học tập tại Cole.vn, mình thật sự cảm thấy rất may mắn khi được tham gia khóa học Data Engineer này. Kiến thức không chỉ rất thực tế mà còn áp dụng được ngay vào công việc. Giảng viên hướng dẫn tận tình, từ các kỹ thuật nền tảng đến các công cụ tiên tiến như AWS, giúp mình tự tin hơn khi làm việc với dữ liệu lớn. Khóa học đã giúp mình mở rộng cơ hội nghề nghiệp và phát triển bản thân rất nhiều. Mình tin rằng khóa học sẽ là một lựa chọn tuyệt vời cho những ai muốn theo đuổi con đường Data Engineer.

Thái Thùy Trang

Junior Data Engineer tại CMC

Sau khi hoàn thành khóa học Data Engineer tại Cole.vn, mình thật sự cảm thấy như mở ra một chân trời mới. Ban đầu, mình rất lo lắng vì kiến thức về dữ liệu khá phức tạp, nhưng nhờ vào sự hướng dẫn chi tiết và cách giảng dạy dễ hiểu của giảng viên, mình đã nắm bắt được từ những nền tảng cơ bản đến các công cụ hiện đại như AWS hay Python. Điều mình ấn tượng nhất là cách chương trình học được thiết kế rất logic và thực tiễn, giúp mình tự tin giải quyết các bài toán dữ liệu thực tế. Mình đã áp dụng được rất nhiều vào công việc hiện tại và cảm thấy rất hài lòng. Mình tin chắc rằng khóa học này sẽ là một bước đệm vững chắc cho những ai muốn thăng tiến trong lĩnh vực Data Engineer.

Dự án học viên

Thông tin khóa học

Thời lượng

8 Module - 60 buổi

Địa điểm học

Online qua nền tảng Zoom

Lịch khai giảng

Hàng tháng Thời gian học: Từ 20h- 22h

Công cụ

Có LMS hỗ trợ video, record, nội dung, làm bài thi, đánh giá năng lực và hơn thế nữa, tài liệu học tập

Chứng nhận

Được cấp bởi Sở GDĐT HN chứng nhận hoàn thành khóa học

Hỗ trợ

Hỗ trợ trọn đời sau khóa học qua zoom, LMS

Lợi ích chỉ có tại COLE

Giới thiệu việc làm sau khóa học

Học lại free

Cộng đồng chuyển đổi số 1

Câu hỏi thường gặp

Với khóa học căn bản/ kỹ năng mới trại hè thì khóa hiện tại không yêu cầu đầu vào. Tùy theo lộ trình học để học viên lựa chọn, ví dụ với trình độ và nhu cầu học nâng cao học viên sẽ có yêu cầu đầu vào ở một số khóa.
Sau khi kết thúc khóa học, học viên sẽ được cấp giấy chứng nhận hoàn thành - chương trình đào tạo kỹ năng của trung tâm. Học viên cần làm qua 1 số bài test theo yêu cầu của giáo viên để trung tâm dựa trên đó làm kết quả cấp chứng nhận sau khóa học.
Khi tham gia lớp học, các học viên sẽ được add vào một group trao đổi chung để hỏi đáp các câu hỏi cần hỗ trợ. Các câu hỏi sẽ được giảng viên và chuyên gia trả lời thắc mắc trên nhóm chung này vĩnh viễn.
Đối với các khóa học được tuyển sinh liên tục và đều đặn, Cole có chính sách cho học viên học lại khóa thứ 2 hoặc thứ 3 nếu chưa nắm vững kiến thức. Nhưng với khóa tổ chức một lần thì có thể sắp xếp được sang các lớp khác cùng chủ đề.
Đối với các khóa học tương tác trực tuyến qua zoom, Ms tearm - Cole.vn lưu lại video cho các học viên tham gia khóa học. Đối với các lớp tổ chức offline nếu các lớp trung tâm cũng có record và upload lên nền tảng để học viên xem lại. Tuy nhiên có một số lớp mà không quay video lại được thì không xem được.
Một số khóa lộ trình nghề nghiệp cụ thể, Cole có hợp tác với một số doanh nghiệp để giới thiệu ứng viên tham gia thực tập và làm việc. Có rất nhiều các học viên sau khi học xong các khóa học tại Cole đã kiếm được các cơ hội nghề nghiệp mới.
- Khóa học tại Cole sẽ học trực tiếp offline tại Hà Nội (các địa điểm trung tâm liên kết của Cole), đào tạo trực tiếp tại doanh nghiệp. Và các khóa học dạng tương tác trực tuyến thì được học qua nền tảng Zoom, MS Tearm. Hoặc 1 số dạng khóa học đã quay sẵn qua video. - Một số khóa học có công cụ để thhuwcj hành, các GV sẽ chuẩn bị trước thông tin và hướng dẫn cài đặt công cụ để học viên tham gia học tập một cách hiệu quả nhất.
Project hoặc bài Test của mỗi khóa học đều được dựa trên bài học mà mục tiêu khi xây dựng khung chương trình đào tạo có sẵn. Vì vậy các học viên hoàn toàn có thể hoàn thiện được Project để đạt được 1 kỹ năng cụ thể nào đó.
Cole có đội ngũ chuyên gia hàng đầu tại đang đi làm tại các tổ chức doanh nghiệp, ngoài ra Cole có hoạt động mentoring, hỗ trợ giúp ứng viên đánh giá/ Review CV để thi tuyển vào các công ty và tổ chức. Các hoạt động kết nối nhà tuyển dụng, giới thiệu việc làm chia sẻ cơ hội nghề nghiệp cho ứng viên.
Liên hệ với chúng tôi

Để biết thêm thông tin chi tiết đừng ngần ngại gọi cho chúng tôi.

Hoặc để lại thông tin

COLE - Lựa chọn hàng đầu cho nhân
sự về Digital Skills

5000+

Học viên theo học

30%

Thu nhập học viên tăng lên sau khi học

30+ Khóa học

Hàng đầu về ứng dụng công nghệ

50+

Chuyên gia hàng đầu về chuyển đổi số

300+ Doanh nghiệp hàng đầu lựa chọn Cole để nâng cấp kỹ năng

Hình ảnh lớp học