Bootcamp Databricks Lakehouse

Thời lượng

06 buổi

Hình thức đào tạo

Online qua Video

Học phí

600.000đ

Tổng quan

Databricks, với kiến trúc Lakehouse đột phá, đang là nền tảng dẫn đầu trong việc hợp nhất Data Warehouse và Data Lake, tạo ra một môi trường duy nhất cho Data Engineering, Business Intelligence (BI) và Machine Learning (ML). Nền tảng này đã trở thành tiêu chuẩn cho nhiều doanh nghiệp toàn cầu muốn xử lý dữ liệu lớn theo thời gian thực (Streaming) và triển khai AI quy mô. Tuy nhiên, để làm chủ Databricks, kỹ sư dữ liệu cần nắm vững không chỉ Spark mà còn cả Delta Lake, Unity Catalog và quy trình Medallion Architecture.

Bootcamp Databricks Lakehouse (thuộc Series BigData Platform Master) là chương trình đào tạo chuyên sâu kéo dài 6 buổi, giúp học viên đi từ khái niệm đến vận hành một hệ thống dữ liệu toàn diện. Với sự hướng dẫn của Mentor là Senior Data Engineer từ Rightship (Úc), học viên sẽ thực hành xây dựng các pipeline chất lượng cao: từ việc tự động nạp dữ liệu bằng Auto Loader, áp dụng Medallion Architecture (Bronze → Silver → Gold), quản trị tập trung bằng Unity Catalog, đến việc triển khai mô hình học máy với MLflow.

Lợi ích khóa học

Học tập linh hoạt, chủ động thời gian

Khóa học được triển khai hoàn toàn qua video bài giảng đã ghi hình, học viên có thể học mọi lúc, mọi nơi, phù hợp với lịch trình cá nhân.

Nội dung kết hợp lý thuyết & thực hành

Mỗi buổi học được thiết kế theo tỉ lệ 60% kiến thức lý thuyết – 40% thực hành, đi kèm ví dụ và case study thực tế. Học viên vừa nắm được nền tảng, vừa biết cách áp dụng ngay.

Tài liệu học tập đầy đủ

Khóa học cung cấp slide, file thực hành, và hướng dẫn chi tiết để học viên dễ dàng theo dõi và thực hành song song với video.

Hỗ trợ học viên qua cộng đồng & trợ giảng

Mặc dù không học live, học viên vẫn được tham gia vào nhóm cộng đồng để đặt câu hỏi và trao đổi cùng trợ giảng, mentor và các học viên khác.

Thực hành với các project thực tế

Học viên không chỉ học lý thuyết mà còn được tự tay xây dựng dự án thực tế cuối khóa, giúp củng cố kỹ năng và tạo ra sản phẩm cuối khóa cho portfolio.

Mục tiêu học tập

Hiểu rõ cấu trúc và vận hành của kiến trúc Lakehouse, áp dụng thành thạo mô hình dữ liệu phân lớp Medallion (Bronze, Silver, Gold).
Nắm vững các tính năng cốt lõi của Delta Lake (ACID, Time Travel) và xây dựng pipeline xử lý dữ liệu incremental/real-time với Auto Loader và Structured Streaming.
Sử dụng Unity Catalog để quản trị tập trung (Data Governance), phân quyền bảo mật và áp dụng các công cụ Data Quality (DQX) để đảm bảo dữ liệu sạch.
Ứng dụng MLflow để quản lý vòng đời Machine Learning trong môi trường Lakehouse, từ huấn luyện, đăng ký mô hình (Model Registry) đến triển khai.

Đối tượng học tập

Data Engineer/Analytics Engineer muốn chuyên sâu vào Databricks và Delta Lake, nâng cấp kỹ năng xử lý dữ liệu lớn (Big Data) theo thời gian thực và tự động hóa.
Data Analyst có nền tảng SQL muốn mở rộng phạm vi công việc sang việc xây dựng và quản trị các bảng Gold phục vụ BI, làm quen với môi trường Cloud/Lakehouse.
Data Scientist/ML Engineer cần hiểu cách tích hợp các mô hình ML vào hệ thống dữ liệu, sử dụng MLflow để theo dõi và triển khai mô hình hiệu quả.
Kỹ sư Hạ tầng (SRE/Platform Engineer) muốn tìm hiểu về kiến trúc và cách tối ưu vận hành (Jobs, Workflows, FinOps) trên nền tảng Databricks.

Chuẩn đầu ra 

Kỹ năng Xây dựng Pipeline Lakehouse

Kỹ năng Xây dựng Pipeline Lakehouse

Tự tay thiết kế và triển khai một pipeline dữ liệu end-to-end trên Databricks, tuân thủ Medallion Architecture, có khả năng xử lý cả Batch và Streaming Data.

Năng lực Quản trị Dữ liệu tập trung

Năng lực Quản trị Dữ liệu tập trung

Thành thạo việc sử dụng Unity Catalog để quản lý metadata, kiểm soát quyền truy cập và đảm bảo chất lượng dữ liệu sạch thông qua các công cụ Data Quality (DQX).

Thực hành Tích hợp AI/ML

Thực hành Tích hợp AI/ML

Vận hành được quy trình ML end-to-end trong Lakehouse: Huấn luyện mô hình, sử dụng MLflow để tracking thử nghiệm và đăng ký/triển khai model vào Model Registry.

Sản phẩm thực tế

Sản phẩm thực tế

Hoàn thành 01 mini project Lakehouse pipeline đầy đủ: Ingest → Medallion Layer → Data Quality → Unity Catalog → Dashboard/Alert, một bằng chứng năng lực mạnh mẽ cho hồ sơ cá nhân.

Giảng viên

Nguyễn Đình Tương

Senior Data Engineer tại Rightship

- Hơn 6+ năm kinh nghiệm trong lĩnh vực Data Engineering, từng làm việc tại các tập đoàn lớn (Viettel, BIDV, MB Bank) và công ty quốc tế (Rightship, Sleek, Setel, Zuellig Pharma).
- Xuất phát từ Data Analyst chuyển sang Data Engineer, từng đảm nhiệm nhiều vai trò: Senior Data Engineer, Data Team Leader, Senior BI Engineer.
- Kinh nghiệm làm việc cả onsite tại doanh nghiệp trong nước và remote cho nhiều khách hàng quốc tế.

Dự án học viên

Feedback học viên 

Lợi ích chỉ có tại COLE

Giới thiệu việc làm sau khóa học

Học lại free

Cộng đồng chuyển đổi số 1

Câu hỏi thường gặp

Không. Đây là khóa học online qua video đã được ghi hình, học viên có thể học theo tốc độ của riêng mình, không phụ thuộc vào lịch học live.
Video được cung cấp trọn đời, bạn có thể xem lại không giới hạn số lần cho đến khi nắm vững kiến thức.
Có. Học viên sẽ được nhận slide bài giảng, file dữ liệu thực hành, hướng dẫn chi tiết để dễ dàng thực hành song song với video.
Nội dung được thiết kế theo tỉ lệ 60% lý thuyết – 40% thực hành, kèm các bài tập & case study từ tình huống thực tế.
Bạn có thể đặt câu hỏi và nhận hỗ trợ từ trợ giảng & cộng đồng học viên riêng.
Có. Bạn sẽ nhận toàn bộ video, tài liệu và quyền tham gia cộng đồng học viên.
Liên hệ với chúng tôi

Để biết thêm thông tin chi tiết đừng ngần ngại gọi cho chúng tôi.

Hoặc để lại thông tin

COLE - Lựa chọn hàng đầu cho nhân
sự về Digital Skills

5000+

Học viên theo học

30%

Thu nhập học viên tăng lên sau khi học

30+ Khóa học

Hàng đầu về ứng dụng công nghệ

50+

Chuyên gia hàng đầu về chuyển đổi số

300+ Doanh nghiệp hàng đầu lựa chọn Cole để nâng cấp kỹ năng

Hình ảnh lớp học