Khóa học Phân tích dữ liệu định lượng với ngôn ngữ lập trình R


Thời lượng
20 Buổi

Hình thức đào tạo
Online

Số tín chỉ
8
Tổng quan
Khóa học "Ngôn ngữ R" của Cole được thiết kế nhằm trang bị cho học viên kiến thức và kỹ năng phân tích dữ liệu chuyên sâu bằng R – một công cụ mạnh mẽ trong lĩnh vực thống kê và khoa học dữ liệu. Khóa học tập trung vào cách sử dụng R để xử lý dữ liệu, trực quan hóa, và phân tích dữ liệu định lượng, hỗ trợ đưa ra quyết định chính xác. Nội dung bao gồm từ các bước cơ bản trong lập trình R đến các phương pháp phân tích dữ liệu nâng cao và dự báo xu hướng. Thông qua các dự án thực tế, học viên sẽ thành thạo ngôn ngữ R, sẵn sàng ứng dụng vào công việc phân tích tại doanh nghiệp.

Những xu hướng sử dụng ngôn ngữ R:
Mục tiêu học tập
Đối tượng học tập

Sinh viên nghiên cứu sinh nhóm ngành kinh tế, chính trị, xã hội, khoa học, etc. cần kỹ năng lập trình ứng dụng cho việc làm bài tập nghiên cứu, khóa luận tốt nghiệp và học bổ trợ cho công việc sau này.

Viện nghiên cứu khoa học, giảng viên trường đại học thực hiện nghiên cứu đăng báo trong nước và quốc tế.

Người đi làm trong ngành kinh tế, tài chính, thống kê, khoa học xã hội cần học kỹ năng phân tích thống kê dữ liệu để bổ trợ cho công việc.

Những người đang muốn theo nghề Data Analyst, Data Scientist chuyên nghiệp.

Bất cứ ai muốn hiểu biết về ứng dụng của ngôn ngữ R cho việc phân tích thống kê, phân tích dữ liệu bắt đầu học từ số 0.
Chuẩn đầu ra

Theo chuẩn BLOOM 3 mốc đầu
Biết:
• Hiểu rõ các khái niệm cơ bản về ngôn ngữ R và các thư viện phổ biến như ggplot2, dplyr, và tidyr trong phân tích dữ liệu.
• Nắm được quy trình cơ bản về làm sạch dữ liệu, xử lý dữ liệu và trực quan hóa dữ liệu trong R.
• Biết cách sử dụng R để thực hiện các phân tích thống kê cơ bản và phân tích dữ liệu khám phá, bao gồm các phép tính và hàm thông dụng trong R.
Hiểu:
• Hiểu cách áp dụng các gói thư viện R vào quy trình phân tích dữ liệu, từ việc xử lý dữ liệu cho đến phân tích và trực quan hóa.
• Nhận diện được các tình huống cần sử dụng R để phân tích và đánh giá dữ liệu, đưa ra được lựa chọn công cụ R phù hợp với từng bài toán cụ thể.
• Phân biệt các kỹ thuật phân tích cơ bản trong R, từ trực quan hóa dữ liệu đến mô hình hóa thống kê, và hiểu rõ cách chúng hỗ trợ ra quyết định.
Áp dụng:
• Thực hành làm sạch và chuẩn bị dữ liệu thực tế, từ đó thực hiện các phân tích thống kê cơ bản với R.
• Sử dụng R để tạo ra các biểu đồ, bảng thống kê và báo cáo trực quan, dễ hiểu cho người dùng cuối.
• Xây dựng các quy trình phân tích dữ liệu chuẩn với R, từ thu thập dữ liệu, làm sạch, phân tích đến xuất bản báo cáo, áp dụng trong các dự án công việc hàng ngày.



Chuẩn đầu ra theo tư duy, công cụ, kỹ năng
Công cụ:
• Sử dụng thành thạo R và các gói thư viện phân tích dữ liệu phổ biến như dplyr, ggplot2, tidyr để xử lý, phân tích và trực quan hóa dữ liệu.
• Biết cách khai thác RStudio và các công cụ hỗ trợ khác để viết mã, kiểm thử và triển khai mã R hiệu quả.
• Làm quen với công cụ quản lý gói như CRAN và GitHub để cài đặt và cập nhật các thư viện R cần thiết cho các dự án phân tích.
Tư duy:
• Phát triển tư duy phân tích dữ liệu, tư duy thống kê và khoa học dữ liệu để tiếp cận và giải quyết các vấn đề phân tích dữ liệu từ góc nhìn hệ thống.
• Tư duy trực quan hóa dữ liệu: hiểu và biết cách chọn biểu đồ phù hợp cho các loại dữ liệu khác nhau, nhằm truyền tải thông tin rõ ràng, chính xác.
• Xây dựng tư duy logic khi tổ chức, lọc, tổng hợp và đánh giá dữ liệu để đưa ra kết luận hợp lý và khoa học.
Kỹ năng:
• Kỹ năng phân tích dữ liệu: Có khả năng thu thập, làm sạch và chuẩn bị dữ liệu từ các nguồn khác nhau để đưa vào quy trình phân tích.
• Kỹ năng trực quan hóa dữ liệu: Tạo các biểu đồ và bảng thống kê rõ ràng, hiệu quả, và phù hợp với mục tiêu báo cáo.
• Kỹ năng giải quyết vấn đề: Phân tích, đánh giá và sử dụng các kỹ thuật R khác nhau để giải quyết các bài toán cụ thể trong công việc, từ các bài toán thống kê đơn giản đến phức tạp.

Công việc sau khi hoàn thành khóa học
Sau khi hoàn thành khóa học "Ngôn ngữ R," học viên sẽ có thể sử dụng R để thực hiện phân tích dữ liệu chuyên sâu và trực quan hóa thông tin một cách hiệu quả. Cụ thể, họ sẽ biết cách xử lý dữ liệu lớn, xây dựng các báo cáo trực quan hấp dẫn, và thực hiện phân tích thống kê để hỗ trợ ra quyết định trong doanh nghiệp. Học viên cũng sẽ có khả năng ứng dụng R vào phân tích dữ liệu tài chính, phân tích dữ liệu sinh học và áp dụng các mô hình dự báo. Khóa học mang đến kỹ năng thực tiễn, giúp học viên sẵn sàng giải quyết các vấn đề phân tích dữ liệu phức tạp và tạo ra giá trị cho tổ chức thông qua dữ liệu.

Lộ trình học tập
1.2. Tóm tắt về thống kê.
1.3. Ngôn ngữ thống kê R.
1.4. Ngôn ngữ R và phần mềm RStudio.
1.5. Nhập liệu biên tập và lưu trữ dữ liệu với R.
1.6. Làm bài tập với R
2.2. Các đại lượng thống kê.
2.3. Phân phối mẫu.
2..4. Ước lượng và kiểm định.
2.5. Thực hành trên R.
3.2. Mất mát dữ liệu và xử lý.
3.3. Thực hành.
4.2. Diễn giải mô hình hồi quy tuyến tính.
4.3. Đánh giá mô hình.
4.4. Thực hành trên R.
5.2. Diễn giải mô hình.
5.3. Cộng tuyến trong hồi quy đa biến.
5.4. Tìm mô hình tối ưu.
5.5. Thực hành trên R.
6.2. Diễn giải mô hình.
6.3. Giới thiệu các độ đo.
6.4. Lựa chọn mô hình theo chỉ số AIC và BIC.
6.5. Thực hành trên R.
7.2. Diễn giải mô hình.
7.3. Thực hành trên R.
8.2. Xây dựng mô hình.
8.3. Diễn giải mô hình.
8.4. Thực hành trên R.
9.2. So sánh trường phái thống kê Bayes và trường phái thống kê tần suất.
9.3. Tính toán Bayes.
9.4. Thực hành trên R.
10.2. Quá trình tự hồi quy AR: phân tích và dự báo.
10.3. Quá trình ARMA: phân tích và dự báo.
10.4. Quá trình ARIMA: phân tích và dự báo.
10.5. Thực hành trên R.
Giảng viên

Giảng viên Bộ môn Khoa Học Máy Tính - Đại học Bách Khoa Hà Nội
Sở hữu 15+ công trình nghiên cứu khoa học được công nhận; phát triển các kỹ thuật metaheuristic giải các bài toán tối ưu trong các hệ thống phân tán và hệ thống phần mềm.
Kinh nghiệm dày dặn trong tư vấn và triển khai công nghệ số hóa cho nhiều tập đoàn và doanh nghiệp lớn.
Năm 2010, thầy và cộng sự đạt giải nhất Nhân tài đất Việt; với sản phẩm hệ thống số hóa tư duy con người.
Trợ giảng

Feedback học viên

Nguyễn Trúc Phương
Data Engineer tại VinGroup

Trần Xuân Tiến
Data Analyst tại TP Bank

Trịnh Lan Anh
Data Science tại Úc
Video học thử
Thông tin khóa học
Đào tạo trực tuyến
Các buổi học sẽ diễn ra qua các nền tảng trực tuyến như Zoom, Microsoft Teams, và Google Meet. Học viên tham gia các buổi học trực tiếp với giảng viên qua hình thức online.
Nội dung buổi học
Sẽ bao gồm trung bình 60% lý thuyết và 40% thực hành. Các bài thực hành được lấy từ các bài toán thực tế, giúp học viên áp dụng ngay kiến thức vào công việc.
Tài liệu học tập
Slide bài giảng, hướng dẫn thực hành chi tiết.
Video bài giảng
Học viên có thể xem lại video các buổi học để ôn tập và nắm vững kiến thức.
Tương tác trực tiếp
Học viên có thể trao đổi trực tiếp 1-1 với giảng viên hoặc trợ giảng để được giải đáp thắc mắc và hỗ trợ trong quá trình học.
Lợi ích chỉ có tại COLE

Giới thiệu việc làm sau khóa học

Học lại free

Cộng đồng chuyển đổi số 1
Câu hỏi thường gặp
- Một số khóa học có công cụ để thhuwcj hành, các GV sẽ chuẩn bị trước thông tin và hướng dẫn cài đặt công cụ để học viên tham gia học tập một cách hiệu quả nhất.
Để biết thêm thông tin chi tiết đừng ngần ngại gọi cho chúng tôi.
-
Hotline
-
Email
-
Trang tin chính thức
Hoặc để lại thông tin
COLE - Lựa chọn hàng đầu cho nhân
sự về Digital Skills

5000+
Học viên theo học

30%
Thu nhập học viên tăng lên sau khi học

30+ Khóa học
Hàng đầu về ứng dụng công nghệ

50+
Chuyên gia hàng đầu về chuyển đổi số
300+ Doanh nghiệp hàng đầu lựa chọn Cole để nâng cấp kỹ năng
Hình ảnh lớp học