Khóa Học Bootcamp LLMOps & AgentOps Thực Chiến 2026

Thời lượng

12 buổi

Hình thức đào tạo

Online qua Video

Học phí

Liên hệ

Tổng quan

Hầu hết các kỹ sư đều có thể chạy được một demo LLM. Nhưng rất ít người biết cách đưa nó vào production thực sự — nơi latency, chi phí inference, chất lượng output, bảo mật prompt và khả năng mở rộng đều phải được kiểm soát chặt chẽ.

Bootcamp LLMOps & AgentOps được thiết kế dành riêng cho AI Engineer muốn làm chủ toàn bộ vòng đời của một hệ thống LLM thực chiến: từ kiến trúc Transformer và fine-tuning, đến triển khai GPU, xây dựng AI Agent với LangGraph, RAG nâng cao, EvalOps, Guardrails, Multi-Agent và Production MVP.

Không dừng lại ở lý thuyết — kết thúc khóa học, bạn hoàn thành Capstone Project: "Advanced Agent Engineering: Building Reliable AI Systems".

Trong Capstone này, bạn tự tay xây dựng một hệ thống AI Agent chuẩn production — nơi LLM, Agent workflow, RAG pipeline, Evaluation và Guardrails được tích hợp thống nhất thành một kiến trúc có thể vận hành thực tế. Cụ thể, bạn sẽ:
- Triển khai LLM (self-host hoặc API) và nắm rõ trade-off giữa chi phí, latency, kiểm soát hạ tầng và độ phức tạp vận hành
- Thiết kế Agent workflow bằng LangGraph, xử lý edge case khi state machine lệch hướng, tool-call sai schema hoặc memory gây nhiễu hành vi
- Xây dựng hệ thống RAG nâng cao có thể mở rộng, đo được tác động của retrieval, re-ranking và query rewriting lên chất lượng đầu ra
- Tích hợp MCP tools và external tools, kiểm soát rủi ro tool misuse và side effects ngoài mong muốn
- Thiết lập Observability đầy đủ — khi agent hành xử bất thường, bạn có trace rõ ràng để debug thay vì đoán mò
- Xây dựng pipeline EvalOps với LLM-as-a-judge và regression tests để phát hiện sớm khi chất lượng output suy giảm
- Triển khai Guardrails toàn diện: kiểm soát input/output, schema validation và phòng thủ prompt injection

Lợi ích khóa học

Học tập linh hoạt, chủ động thời gian

Khóa học được triển khai hoàn toàn qua video bài giảng đã ghi hình, học viên có thể học mọi lúc, mọi nơi, phù hợp với lịch trình cá nhân.

Nội dung kết hợp lý thuyết & thực hành

Mỗi buổi học được thiết kế theo tỉ lệ 60% kiến thức lý thuyết – 40% thực hành, đi kèm ví dụ và case study thực tế. Học viên vừa nắm được nền tảng, vừa biết cách áp dụng ngay.

Tài liệu học tập đầy đủ

Khóa học cung cấp slide, file thực hành, và hướng dẫn chi tiết để học viên dễ dàng theo dõi và thực hành song song với video.

Hỗ trợ học viên qua cộng đồng & trợ giảng

Mặc dù không học live, học viên vẫn được tham gia vào nhóm cộng đồng để đặt câu hỏi và trao đổi cùng trợ giảng, mentor và các học viên khác.

Thực hành với các project thực tế

Học viên không chỉ học lý thuyết mà còn được tự tay xây dựng dự án thực tế cuối khóa, giúp củng cố kỹ năng và tạo ra sản phẩm cuối khóa cho portfolio.

Mục tiêu học tập

Xây dựng các hệ thống AI hiện đại, tin cậy, từ hiểu sâu bên trong LLM đến phát triển các agent có khả năng suy nghĩ, lập luận, truy xuất thông tin và hành động trong môi trường thực.
Làm chủ bộ công cụ AI engineering toàn diện: fine-tuning, triển khai, đánh giá, guardrails, observability, RAG, MCP và điều phối đa agent.
Kết thúc khóa học, bạn có thể tự tin thiết kế, debug, tối ưu và triển khai các hệ thống agent ở mức production với tư duy của AI engineer.

Đối tượng học tập

Bất kỳ ai muốn xây dựng hệ thống AI và agent hiện đại.
Sinh viên hoặc người đi làm đang chuyển hướng sang lĩnh vực AI.
Kỹ sư phần mềm, data engineer, product builder muốn ứng dụng LLM vào sản phẩm thực tế.
Founder, technical lead hoặc PM kỹ thuật muốn hiểu sâu để thiết kế và dẫn dắt các dự án AI.

Chuẩn đầu ra 

Chuẩn đầu ra

Sau khóa học, bạn có thể làm được gì?

7 năng lực thực chiến được xây dựng qua 12 buổi học và 1 Capstone Project hoàn chỉnh

🧠

Hiểu sâu kiến trúc LLM

Nắm vững Transformer, Self-Attention, KV Cache, RoPE, MoE — đủ để tự triển khai và debug inference pipeline

⚙️

Fine-tune LLM thực chiến

Fine-tune với QLoRA, LoRA, DPO — chuẩn bị data, huấn luyện và đánh giá mô hình trước/sau trên task thực tế

🖥️

Deploy LLM lên GPU production

Triển khai bằng vLLM/SGLang, tối ưu latency p50/p99, quantization, batching và theo dõi chi phí thực tế

🤖

Xây AI Agent với LangGraph

Thiết kế agent workflow, quản lý state, memory, HITL — xử lý được edge case thực tế trong môi trường production

🔍

Xây RAG nâng cao (Agentic RAG)

Từ chunking, vector DB, hybrid search đến query rewriting, reranking, GraphRAG — đo được tác động lên output

📊

Thiết lập Observability & EvalOps

Trace đầy đủ khi agent lỗi, LLM-as-a-judge, regression test và CI/CD pipeline để đánh giá chất lượng liên tục

🛡️

Triển khai Guardrails & Multi-Agent

Kiểm soát input/output, chống prompt injection, phối hợp nhiều agent qua MCP/A2A trong hệ thống production

Công nghệ & công cụ bạn sẽ thực chiến

Toàn bộ tech stack được dùng trong bài lab và Capstone Project

🧪 LLM & Fine-tune
QLoRA LoRA Unsloth Axolotl LLaMA-Factory Transformers DPO / GRPO
🖥️ Serving & Infra
vLLM SGLang TensorRT-LLM LiteLLM Quantization PagedAttention
🤖 Agent & RAG
LangGraph LangChain LlamaIndex LightRAG GraphRAG RAGFlow MCP Protocol A2A
📊 Observability & Eval
LangSmith Langfuse PromptLayer Promptfoo DeepEval LangGraph Studio
🛡️ Guardrails & Safety
NeMo Guardrails Schema Validation Prompt Injection Defense Moderation Pipeline

Lộ trình học tập 

Theory
* Lịch sử phát triển của mô hình ngôn ngữ và hệ sinh thái LLMs hiện đại
* Tokenization, Embeddings và cách mô hình hiểu và biểu diễn ngôn ngữ
* Self-Attention, Multi-Head Attention và kiến trúc Transformer
* Các kỹ thuật quan trọng trong LLMs hiện đại: RMSNorm, RoPE, KV Cache, Sliding Window Attention, Mixture of Experts
* Hành trình từ mô hình văn bản đơn phương thức đến mô hình đa phương thức (multimodal/omni models)

Lab
* Triển khai các thuật toán cốt lõi trong LLM từ đầu để hiểu sâu cơ chế hoạt động
* Thực hành cơ chế Q–K–V và Multi-Head Attention
* Xây dựng quy trình sinh văn bản (Text Generation Pipeline)
* Thực hành normalization và decoding strategies trong quá trình inference
Theory
* Vai trò của dữ liệu và prompt trong hệ thống LLM hiện đại
* Các giai đoạn dữ liệu trong quá trình huấn luyện LLM
* Xây dựng data pipeline cho AI systems từ ingestion đến storage
* Context Engineering và Prompt Engineering cho AI Engineer hiện đại
* Các kỹ thuật prompting: Few-shot, Chain-of-Thought, ReAct, RAG

Lab
* So sánh nhiều chiến lược prompting trên cùng một bài toán
* Thực hành thiết kế prompt tối ưu cho nhiều task khác nhau
* Xây dựng pipeline tiền xử lý dữ liệu cho dataset nhỏ
Theory
* Khi nào nên dùng Prompting, RAG hoặc Fine-tuning
* Full Fine-tuning và các kỹ thuật PEFT như LoRA, QLoRA, Adapters
* Preference Optimization, DPO và Reinforcement Learning với GRPO
* Distributed Training cho LLMs
* Các framework phổ biến: Unsloth, Axolotl, LLaMA-Factory, Transformers

Lab
* Chuẩn bị dữ liệu để Fine-tune LLM
* Fine-tune mô hình bằng QLoRA cho một task thực tế
* Đánh giá mô hình trước và sau Fine-tuning bằng metrics và test set
Theory
* Tổng quan hệ thống triển khai LLM trong production
* GPU/TPU và các framework serving hiện đại: vLLM, SGLang, TensorRT-LLM
* Quantization, PagedAttention, Continuous Batching, Speculative Decoding
* LiteLLM: Routing, Fallback, Cost Tracking và Latency Monitoring
* Tối ưu throughput, latency và chi phí cho hệ thống AI inference quy mô lớn

Lab
* Deploy một mô hình LLM bằng API hoặc self-hosted
* Load testing và đo latency p50/p90/p99
* So sánh hiệu năng dưới các cấu hình tối ưu khác nhau
* Theo dõi tài nguyên GPU/CPU và phân tích bottleneck hệ thống
Theory
* Tổng quan về AI Agents và Agentic Workflows
* Nền tảng LangGraph và kiến trúc agent workflow hiện đại
* Node, Edge, State Management và Tool Calling trong LangGraph
* Memory Management cho AI Agents: short-term memory và long-term memory
* Human-in-the-loop (HITL) và Streaming Responses trong hệ thống agent
* Debugging các vấn đề phổ biến như infinite loop, memory reset và missing approval steps

Lab
* Xây dựng AI Agent bằng LangGraph
* Kết nối tool calling và quản lý state cho agent
* Debug lỗi memory reset, infinite loop và missing HITL
* Triển khai streaming response cho agent workflow
Theory
* Tổng quan kiến trúc Retrieval-Augmented Generation (RAG)
* Chunking, Indexing, Retrieval và Generation trong RAG pipeline
* Embedding models và cách đo similarity trong không gian vector
* Vector Database: collection, index, filter, hybrid search
* So sánh vector database với relational database và document store
* Cách tích hợp RAG vào LLM hoặc Agent system

Lab
* Xây dựng hệ thống RAG end-to-end
* Ingest tài liệu, tạo embeddings và lưu vào vector database
* Kết nối retrieval pipeline với LLM để sinh câu trả lời
* Kiểm thử chất lượng truy xuất và cải thiện pipeline cơ bản
Theory
* Các vấn đề thường gặp của RAG truyền thống: thiếu ngữ cảnh, chunking kém, dữ liệu lỗi thời
* Query rewriting và các kỹ thuật tối ưu truy vấn
* Multi-hop retrieval, retrieval loop và verification loop
* Reranking, ensemble retrieval và routing theo domain
* Knowledge Graph và kiến trúc GraphRAG
* Tổng quan các framework: LangChain, LlamaIndex, LightRAG, RAGFlow

Lab
* Nâng cấp hệ thống RAG với ít nhất một kỹ thuật retrieval nâng cao
* Thực hành query rewriting hoặc multi-step retrieval
* Xây dựng mini graph index hoặc reranking pipeline
* So sánh kết quả trước và sau tối ưu retrieval
Theory
* Vòng đời prompt: design → testing → versioning → deployment
* Trace, span và metadata trong hệ thống LLM/Agent
* Quan sát và debug pipeline AI trong production
* Các công cụ: LangSmith, LangGraph Studio, Langfuse, PromptLayer, Promptfoo
* Phân tích nguyên nhân lỗi regression trong prompt hoặc model change

Lab
* Debug một lỗi regression bằng tracing
* Versioning prompt và so sánh các phiên bản
* Thiết kế metadata và logging cho hệ thống AI
* Xây dựng pipeline observability đơn giản cho LLM app
Theory
* Evaluation pyramid: unit test → component test → system test → dataset evaluation
* Phân biệt deterministic metrics và probabilistic evaluation
* LLM-as-a-Judge: cách hoạt động, ưu điểm và hạn chế
* Thiết kế evaluation dataset cho LLM/Agent system
* Công cụ EvalOps: Promptfoo, DeepEval, LangSmith
* Tích hợp evaluation vào CI/CD pipeline cho AI systems

Lab
* Xây dựng regression test cho LLM outputs
* Thiết kế bộ dataset evaluation cho một use case cụ thể
* Chẩn đoán và cải thiện output không nhất quán
* Thiết lập pipeline đánh giá tự động cơ bản
Theory
* Kiến trúc guardrails trong hệ thống LLM/Agent production
* Moderation pipeline cho input và output
* JSON schema enforcement và tool-call validation
* Prompt injection, jailbreak và các chiến lược phòng thủ
* Semantic safety rules và kiểm soát hành vi mô hình
* Trade-off giữa safety, latency và cost trong hệ thống AI
* Tổng quan các framework: NeMo Guardrails và các giải pháp tương tự

Lab
* Bổ sung guardrails cho một AI agent chưa an toàn
* Validate input/output bằng schema và rule-based checks
* Xây dựng moderation pipeline nhiều tầng
* Tối ưu hệ thống để cân bằng giữa an toàn và hiệu năng
Theory
* Tổng quan Model Context Protocol (MCP) và vai trò trong hệ sinh thái AI
* Tool discovery, permission và security trong MCP
* Agent-to-Agent (A2A) communication: khái niệm và kiến trúc
* Multi-agent patterns: peer, supervisor, swarm
* Thiết kế hệ thống agent có khả năng mở rộng và tái sử dụng
* Tích hợp nhiều công cụ và hệ thống trong cùng một agent ecosystem

Lab
* Chạy MCP tool trên local environment
* Kết nối MCP tool với AI agent
* Xây dựng hệ thống multi-agent đơn giản bằng A2A
* Thực hành phối hợp nhiều agent trong một workflow
Theory
* Kiến trúc tổng thể của một AI system production-ready
* Thiết kế UX, data flow, inference pipeline và caching layer
* Tích hợp RAG, Agent, MCP và multi-tool orchestration
* Observability, evaluation và guardrails trong production
* Best practices để xây dựng hệ thống AI dễ mở rộng, dễ debug

Lab
* Xây dựng MVP AI system end-to-end
* Tích hợp LLM + Agent workflow + RAG hoặc MCP
* Thiết lập observability, evaluation và guardrails
* Demo sản phẩm và trình bày kiến trúc hệ thống

Giảng viên

Phạm Thanh Danh

Senior AI/ML Engineer

- Senior AI Engineer tại Backbase – phát triển sản phẩm Conversational Banking, tích hợp LLMs vào hệ thống tài chính.
- Senior Lead Data Engineer tại Zalo Adtima – thiết kế hệ thống quảng cáo real-time & A/B testing framework.
- Machine Learning Engineer tại Momo eWallet – xây dựng recommendation system, search engine & notification system cho hàng triệu người dùng.
- Machine Learning Engineer & R&D Lead tại Mimosa Technology – triển khai AI trong nông nghiệp chính xác (dự báo, computer vision UAV).
- Thành thạo MLOps, LLMs, Deep Learning pipelines, Kubernetes, Cloud (AWS, GCP, Azure).
- Giàu kinh nghiệm mentoring & đào tạo kỹ sư AI, ứng dụng đa lĩnh vực: tài chính, thương mại điện tử, nông nghiệp.

Xem thêm

Dự án học viên

Feedback học viên 

Vũ Hoàng Long

Senior DevOps Engineer lên AI Infrastructure - ★★★★★

"Là một DevOps lâu năm, khi công ty yêu cầu nhảy vào vận hành hệ thống AI, mình đã cực kỳ bối rối trước việc tối ưu hóa vLLM hay kiểm soát chi phí token. May mắn là mình đã đăng ký Bootcamp LLMOps & AgentOps Thực Chiến tại Cole. Lộ trình thực hành cực kỳ sâu về tracing hệ thống bằng Langfuse, giám sát hành vi của Agent để tránh vòng lặp vô hạn (infinite loops), và áp dụng Guardrails bảo mật dữ liệu. Khóa học thực sự đã giúp mình nâng cấp từ DevOps truyền thống lên vị trí AI Infrastructure cao cấp!"

Đỗ Thùy Chi

AI Tech Lead / Machine Learning Engineer - ★★★★★

"Xây dựng một bản demo AI Agent thì dễ, nhưng để chạy ổn định ở môi trường thực tế (production) là một bài toán hoàn toàn khác. Khóa học LLMOps & AgentOps của Cole.vn đã giải quyết triệt để vấn đề này cho team mình. Khung chương trình thực chiến giúp tụi mình biết cách thiết lập hệ thống Evaluation (đánh giá tự động), tracking lỗi ở từng bước gọi tool của Agent và quản lý prompt versioning bài bản. Sau khóa học, chúng mình đã tự tin tối ưu hóa được 40% chi phí vận hành hệ thống AI hiện tại."

Vũ Quang Huy

Solutions Architect / AI Product Owner - ★★★★★

"Chương trình học thực sự bắt kịp xu hướng công nghệ 2026 toàn cầu. Khóa học không chỉ dừng lại ở viết code mà hướng thẳng vào cách đóng gói, deploy hạ tầng AI với Docker, Kubernetes và giám sát hiệu năng thực tế. Mình rất ấn tượng với phần học về AgentOps – cách theo vết và debug chuỗi suy nghĩ (Chain-of-Thought) của hệ thống Multi-Agent phức tạp. Link đăng ký khóa Bootcamp LLMOps & AgentOps này xứng đáng được ghim trên màn hình của bất kỳ Software Architect nào muốn chinh phục làn sóng AI."

Lợi ích chỉ có tại COLE

Giới thiệu việc làm sau khóa học

Học lại free

Cộng đồng chuyển đổi số 1

Câu hỏi thường gặp

Không. Đây là khóa học online qua video đã được ghi hình, học viên có thể học theo tốc độ của riêng mình, không phụ thuộc vào lịch học liv
Video được cung cấp trọn đời, bạn có thể xem lại không giới hạn số lần cho đến khi nắm vững kiến thức.
Có. Học viên sẽ được nhận slide bài giảng, file dữ liệu thực hành, hướng dẫn chi tiết để dễ dàng thực hành song song với video.
Nội dung được thiết kế theo tỉ lệ 60% lý thuyết – 40% thực hành, kèm các bài tập & case study từ tình huống thực tế.
Bạn có thể đặt câu hỏi và nhận hỗ trợ từ trợ giảng & cộng đồng học viên riêng.
Có. Bạn sẽ nhận toàn bộ video, tài liệu và quyền tham gia cộng đồng học viên.
Liên hệ với chúng tôi

Để biết thêm thông tin chi tiết đừng ngần ngại gọi cho chúng tôi.

Hoặc để lại thông tin

COLE - Lựa chọn hàng đầu cho nhân
sự về Digital Skills

5000+

Học viên theo học

30%

Thu nhập học viên tăng lên sau khi học

30+ Khóa học

Hàng đầu về ứng dụng công nghệ

50+

Chuyên gia hàng đầu về chuyển đổi số

300+ Doanh nghiệp hàng đầu lựa chọn Cole để nâng cấp kỹ năng

Hình ảnh lớp học