Khóa Học Bootcamp LLMOps & AgentOps Thực Chiến 2026
Thời lượng
12 buổi
Hình thức đào tạo
Online qua Video
Học phí
Liên hệ
Tổng quan
Bootcamp LLMOps & AgentOps được thiết kế dành riêng cho AI Engineer muốn làm chủ toàn bộ vòng đời của một hệ thống LLM thực chiến: từ kiến trúc Transformer và fine-tuning, đến triển khai GPU, xây dựng AI Agent với LangGraph, RAG nâng cao, EvalOps, Guardrails, Multi-Agent và Production MVP.
Không dừng lại ở lý thuyết — kết thúc khóa học, bạn hoàn thành Capstone Project: "Advanced Agent Engineering: Building Reliable AI Systems".
Trong Capstone này, bạn tự tay xây dựng một hệ thống AI Agent chuẩn production — nơi LLM, Agent workflow, RAG pipeline, Evaluation và Guardrails được tích hợp thống nhất thành một kiến trúc có thể vận hành thực tế. Cụ thể, bạn sẽ:
- Triển khai LLM (self-host hoặc API) và nắm rõ trade-off giữa chi phí, latency, kiểm soát hạ tầng và độ phức tạp vận hành
- Thiết kế Agent workflow bằng LangGraph, xử lý edge case khi state machine lệch hướng, tool-call sai schema hoặc memory gây nhiễu hành vi
- Xây dựng hệ thống RAG nâng cao có thể mở rộng, đo được tác động của retrieval, re-ranking và query rewriting lên chất lượng đầu ra
- Tích hợp MCP tools và external tools, kiểm soát rủi ro tool misuse và side effects ngoài mong muốn
- Thiết lập Observability đầy đủ — khi agent hành xử bất thường, bạn có trace rõ ràng để debug thay vì đoán mò
- Xây dựng pipeline EvalOps với LLM-as-a-judge và regression tests để phát hiện sớm khi chất lượng output suy giảm
- Triển khai Guardrails toàn diện: kiểm soát input/output, schema validation và phòng thủ prompt injection

Lợi ích khóa học
Học tập linh hoạt, chủ động thời gian
Khóa học được triển khai hoàn toàn qua video bài giảng đã ghi hình, học viên có thể học mọi lúc, mọi nơi, phù hợp với lịch trình cá nhân.
Nội dung kết hợp lý thuyết & thực hành
Mỗi buổi học được thiết kế theo tỉ lệ 60% kiến thức lý thuyết – 40% thực hành, đi kèm ví dụ và case study thực tế. Học viên vừa nắm được nền tảng, vừa biết cách áp dụng ngay.
Tài liệu học tập đầy đủ
Khóa học cung cấp slide, file thực hành, và hướng dẫn chi tiết để học viên dễ dàng theo dõi và thực hành song song với video.
Hỗ trợ học viên qua cộng đồng & trợ giảng
Mặc dù không học live, học viên vẫn được tham gia vào nhóm cộng đồng để đặt câu hỏi và trao đổi cùng trợ giảng, mentor và các học viên khác.
Thực hành với các project thực tế
Học viên không chỉ học lý thuyết mà còn được tự tay xây dựng dự án thực tế cuối khóa, giúp củng cố kỹ năng và tạo ra sản phẩm cuối khóa cho portfolio.
Mục tiêu học tập
Đối tượng học tập
Chuẩn đầu ra
Chuẩn đầu ra
Sau khóa học, bạn có thể làm được gì?
7 năng lực thực chiến được xây dựng qua 12 buổi học và 1 Capstone Project hoàn chỉnh
Hiểu sâu kiến trúc LLM
Nắm vững Transformer, Self-Attention, KV Cache, RoPE, MoE — đủ để tự triển khai và debug inference pipeline
Fine-tune LLM thực chiến
Fine-tune với QLoRA, LoRA, DPO — chuẩn bị data, huấn luyện và đánh giá mô hình trước/sau trên task thực tế
Deploy LLM lên GPU production
Triển khai bằng vLLM/SGLang, tối ưu latency p50/p99, quantization, batching và theo dõi chi phí thực tế
Xây AI Agent với LangGraph
Thiết kế agent workflow, quản lý state, memory, HITL — xử lý được edge case thực tế trong môi trường production
Xây RAG nâng cao (Agentic RAG)
Từ chunking, vector DB, hybrid search đến query rewriting, reranking, GraphRAG — đo được tác động lên output
Thiết lập Observability & EvalOps
Trace đầy đủ khi agent lỗi, LLM-as-a-judge, regression test và CI/CD pipeline để đánh giá chất lượng liên tục
Triển khai Guardrails & Multi-Agent
Kiểm soát input/output, chống prompt injection, phối hợp nhiều agent qua MCP/A2A trong hệ thống production
Công nghệ & công cụ bạn sẽ thực chiến
Toàn bộ tech stack được dùng trong bài lab và Capstone Project
Lộ trình học tập
* Lịch sử phát triển của mô hình ngôn ngữ và hệ sinh thái LLMs hiện đại
* Tokenization, Embeddings và cách mô hình hiểu và biểu diễn ngôn ngữ
* Self-Attention, Multi-Head Attention và kiến trúc Transformer
* Các kỹ thuật quan trọng trong LLMs hiện đại: RMSNorm, RoPE, KV Cache, Sliding Window Attention, Mixture of Experts
* Hành trình từ mô hình văn bản đơn phương thức đến mô hình đa phương thức (multimodal/omni models)
Lab
* Triển khai các thuật toán cốt lõi trong LLM từ đầu để hiểu sâu cơ chế hoạt động
* Thực hành cơ chế Q–K–V và Multi-Head Attention
* Xây dựng quy trình sinh văn bản (Text Generation Pipeline)
* Thực hành normalization và decoding strategies trong quá trình inference
* Vai trò của dữ liệu và prompt trong hệ thống LLM hiện đại
* Các giai đoạn dữ liệu trong quá trình huấn luyện LLM
* Xây dựng data pipeline cho AI systems từ ingestion đến storage
* Context Engineering và Prompt Engineering cho AI Engineer hiện đại
* Các kỹ thuật prompting: Few-shot, Chain-of-Thought, ReAct, RAG
Lab
* So sánh nhiều chiến lược prompting trên cùng một bài toán
* Thực hành thiết kế prompt tối ưu cho nhiều task khác nhau
* Xây dựng pipeline tiền xử lý dữ liệu cho dataset nhỏ
* Khi nào nên dùng Prompting, RAG hoặc Fine-tuning
* Full Fine-tuning và các kỹ thuật PEFT như LoRA, QLoRA, Adapters
* Preference Optimization, DPO và Reinforcement Learning với GRPO
* Distributed Training cho LLMs
* Các framework phổ biến: Unsloth, Axolotl, LLaMA-Factory, Transformers
Lab
* Chuẩn bị dữ liệu để Fine-tune LLM
* Fine-tune mô hình bằng QLoRA cho một task thực tế
* Đánh giá mô hình trước và sau Fine-tuning bằng metrics và test set
* Tổng quan hệ thống triển khai LLM trong production
* GPU/TPU và các framework serving hiện đại: vLLM, SGLang, TensorRT-LLM
* Quantization, PagedAttention, Continuous Batching, Speculative Decoding
* LiteLLM: Routing, Fallback, Cost Tracking và Latency Monitoring
* Tối ưu throughput, latency và chi phí cho hệ thống AI inference quy mô lớn
Lab
* Deploy một mô hình LLM bằng API hoặc self-hosted
* Load testing và đo latency p50/p90/p99
* So sánh hiệu năng dưới các cấu hình tối ưu khác nhau
* Theo dõi tài nguyên GPU/CPU và phân tích bottleneck hệ thống
* Tổng quan về AI Agents và Agentic Workflows
* Nền tảng LangGraph và kiến trúc agent workflow hiện đại
* Node, Edge, State Management và Tool Calling trong LangGraph
* Memory Management cho AI Agents: short-term memory và long-term memory
* Human-in-the-loop (HITL) và Streaming Responses trong hệ thống agent
* Debugging các vấn đề phổ biến như infinite loop, memory reset và missing approval steps
Lab
* Xây dựng AI Agent bằng LangGraph
* Kết nối tool calling và quản lý state cho agent
* Debug lỗi memory reset, infinite loop và missing HITL
* Triển khai streaming response cho agent workflow
* Tổng quan kiến trúc Retrieval-Augmented Generation (RAG)
* Chunking, Indexing, Retrieval và Generation trong RAG pipeline
* Embedding models và cách đo similarity trong không gian vector
* Vector Database: collection, index, filter, hybrid search
* So sánh vector database với relational database và document store
* Cách tích hợp RAG vào LLM hoặc Agent system
Lab
* Xây dựng hệ thống RAG end-to-end
* Ingest tài liệu, tạo embeddings và lưu vào vector database
* Kết nối retrieval pipeline với LLM để sinh câu trả lời
* Kiểm thử chất lượng truy xuất và cải thiện pipeline cơ bản
* Các vấn đề thường gặp của RAG truyền thống: thiếu ngữ cảnh, chunking kém, dữ liệu lỗi thời
* Query rewriting và các kỹ thuật tối ưu truy vấn
* Multi-hop retrieval, retrieval loop và verification loop
* Reranking, ensemble retrieval và routing theo domain
* Knowledge Graph và kiến trúc GraphRAG
* Tổng quan các framework: LangChain, LlamaIndex, LightRAG, RAGFlow
Lab
* Nâng cấp hệ thống RAG với ít nhất một kỹ thuật retrieval nâng cao
* Thực hành query rewriting hoặc multi-step retrieval
* Xây dựng mini graph index hoặc reranking pipeline
* So sánh kết quả trước và sau tối ưu retrieval
* Vòng đời prompt: design → testing → versioning → deployment
* Trace, span và metadata trong hệ thống LLM/Agent
* Quan sát và debug pipeline AI trong production
* Các công cụ: LangSmith, LangGraph Studio, Langfuse, PromptLayer, Promptfoo
* Phân tích nguyên nhân lỗi regression trong prompt hoặc model change
Lab
* Debug một lỗi regression bằng tracing
* Versioning prompt và so sánh các phiên bản
* Thiết kế metadata và logging cho hệ thống AI
* Xây dựng pipeline observability đơn giản cho LLM app
* Evaluation pyramid: unit test → component test → system test → dataset evaluation
* Phân biệt deterministic metrics và probabilistic evaluation
* LLM-as-a-Judge: cách hoạt động, ưu điểm và hạn chế
* Thiết kế evaluation dataset cho LLM/Agent system
* Công cụ EvalOps: Promptfoo, DeepEval, LangSmith
* Tích hợp evaluation vào CI/CD pipeline cho AI systems
Lab
* Xây dựng regression test cho LLM outputs
* Thiết kế bộ dataset evaluation cho một use case cụ thể
* Chẩn đoán và cải thiện output không nhất quán
* Thiết lập pipeline đánh giá tự động cơ bản
* Kiến trúc guardrails trong hệ thống LLM/Agent production
* Moderation pipeline cho input và output
* JSON schema enforcement và tool-call validation
* Prompt injection, jailbreak và các chiến lược phòng thủ
* Semantic safety rules và kiểm soát hành vi mô hình
* Trade-off giữa safety, latency và cost trong hệ thống AI
* Tổng quan các framework: NeMo Guardrails và các giải pháp tương tự
Lab
* Bổ sung guardrails cho một AI agent chưa an toàn
* Validate input/output bằng schema và rule-based checks
* Xây dựng moderation pipeline nhiều tầng
* Tối ưu hệ thống để cân bằng giữa an toàn và hiệu năng
* Tổng quan Model Context Protocol (MCP) và vai trò trong hệ sinh thái AI
* Tool discovery, permission và security trong MCP
* Agent-to-Agent (A2A) communication: khái niệm và kiến trúc
* Multi-agent patterns: peer, supervisor, swarm
* Thiết kế hệ thống agent có khả năng mở rộng và tái sử dụng
* Tích hợp nhiều công cụ và hệ thống trong cùng một agent ecosystem
Lab
* Chạy MCP tool trên local environment
* Kết nối MCP tool với AI agent
* Xây dựng hệ thống multi-agent đơn giản bằng A2A
* Thực hành phối hợp nhiều agent trong một workflow
* Kiến trúc tổng thể của một AI system production-ready
* Thiết kế UX, data flow, inference pipeline và caching layer
* Tích hợp RAG, Agent, MCP và multi-tool orchestration
* Observability, evaluation và guardrails trong production
* Best practices để xây dựng hệ thống AI dễ mở rộng, dễ debug
Lab
* Xây dựng MVP AI system end-to-end
* Tích hợp LLM + Agent workflow + RAG hoặc MCP
* Thiết lập observability, evaluation và guardrails
* Demo sản phẩm và trình bày kiến trúc hệ thống
Giảng viên
Senior AI/ML Engineer
- Senior AI Engineer tại Backbase – phát triển sản phẩm Conversational Banking, tích hợp LLMs vào hệ thống tài chính.
- Senior Lead Data Engineer tại Zalo Adtima – thiết kế hệ thống quảng cáo real-time & A/B testing framework.
- Machine Learning Engineer tại Momo eWallet – xây dựng recommendation system, search engine & notification system cho hàng triệu người dùng.
- Machine Learning Engineer & R&D Lead tại Mimosa Technology – triển khai AI trong nông nghiệp chính xác (dự báo, computer vision UAV).
- Thành thạo MLOps, LLMs, Deep Learning pipelines, Kubernetes, Cloud (AWS, GCP, Azure).
- Giàu kinh nghiệm mentoring & đào tạo kỹ sư AI, ứng dụng đa lĩnh vực: tài chính, thương mại điện tử, nông nghiệp.
Dự án học viên
Feedback học viên

Vũ Hoàng Long
Senior DevOps Engineer lên AI Infrastructure - ★★★★★
"Là một DevOps lâu năm, khi công ty yêu cầu nhảy vào vận hành hệ thống AI, mình đã cực kỳ bối rối trước việc tối ưu hóa vLLM hay kiểm soát chi phí token. May mắn là mình đã đăng ký Bootcamp LLMOps & AgentOps Thực Chiến tại Cole. Lộ trình thực hành cực kỳ sâu về tracing hệ thống bằng Langfuse, giám sát hành vi của Agent để tránh vòng lặp vô hạn (infinite loops), và áp dụng Guardrails bảo mật dữ liệu. Khóa học thực sự đã giúp mình nâng cấp từ DevOps truyền thống lên vị trí AI Infrastructure cao cấp!"

Đỗ Thùy Chi
AI Tech Lead / Machine Learning Engineer - ★★★★★
"Xây dựng một bản demo AI Agent thì dễ, nhưng để chạy ổn định ở môi trường thực tế (production) là một bài toán hoàn toàn khác. Khóa học LLMOps & AgentOps của Cole.vn đã giải quyết triệt để vấn đề này cho team mình. Khung chương trình thực chiến giúp tụi mình biết cách thiết lập hệ thống Evaluation (đánh giá tự động), tracking lỗi ở từng bước gọi tool của Agent và quản lý prompt versioning bài bản. Sau khóa học, chúng mình đã tự tin tối ưu hóa được 40% chi phí vận hành hệ thống AI hiện tại."

Vũ Quang Huy
Solutions Architect / AI Product Owner - ★★★★★
"Chương trình học thực sự bắt kịp xu hướng công nghệ 2026 toàn cầu. Khóa học không chỉ dừng lại ở viết code mà hướng thẳng vào cách đóng gói, deploy hạ tầng AI với Docker, Kubernetes và giám sát hiệu năng thực tế. Mình rất ấn tượng với phần học về AgentOps – cách theo vết và debug chuỗi suy nghĩ (Chain-of-Thought) của hệ thống Multi-Agent phức tạp. Link đăng ký khóa Bootcamp LLMOps & AgentOps này xứng đáng được ghim trên màn hình của bất kỳ Software Architect nào muốn chinh phục làn sóng AI."
Lợi ích chỉ có tại COLE
Giới thiệu việc làm sau khóa học
Học lại free
Cộng đồng chuyển đổi số 1
Câu hỏi thường gặp
Để biết thêm thông tin chi tiết đừng ngần ngại gọi cho chúng tôi.
-
Hotline
-
Email
-
Trang tin chính thức
Hoặc để lại thông tin
COLE - Lựa chọn hàng đầu cho nhân
sự về Digital Skills
5000+
Học viên theo học
30%
Thu nhập học viên tăng lên sau khi học
30+ Khóa học
Hàng đầu về ứng dụng công nghệ
50+
Chuyên gia hàng đầu về chuyển đổi số
300+ Doanh nghiệp hàng đầu lựa chọn Cole để nâng cấp kỹ năng
Hình ảnh lớp học