Practice #1 Hướng dẫn Xây dựng hệ thống OCR với ảnh Căn cước công dân - Cole

Practice #1 Hướng dẫn Xây dựng hệ thống OCR với ảnh Căn cước công dân

24/06/2024


Practice #1 Hướng dẫn Xây dựng hệ thống OCR với ảnh Căn cước công dân

OCR là một bài toán phổ biến và có tính ứng dụng thực tế cao trong mảng Computer Vision. Mặc dù OCR không phải bài toán mới nhưng chắc chắn ai học AI cũng sẽ thử làm 1 lần và thực tế nó cũng không phải bài toán đơn giản vì ở mỗi bước chúng ta sẽ gặp phải những lỗi khác nhau cần giải quyết.


🔍Nội dung chính của buổi Hướng dẫn Xây dựng hệ thống OCR với ảnh Căn cước công dân:


1. Xác định các bước để xây dựng hệ thống OCR

- Chuẩn bị các dữ liệu cần thiết cho các task Text Detection, Text

Recognition

- Chuẩn hóa các ảnh dữ liệu đầu vào

- Huấn luyện mô hình Text Detection

- Huấn luyện mô hình Text Recognition

- Ghép các khối đã huấn luyện


2. Chuẩn bị dữ liệu

- Thu thập dữ liệu từ các nguồn trên mạng

- Gán nhãn bounding box cho các ảnh

- Gán nhãn nội dung text cho các bounding box text


3. Huấn luyện mô hình Text Detection

- Huấn luyện mô hình DBNet cho module Text Detection

- Nắm được các metrics đánh giá chất lượng của mô hình đã huấn luyện

- Chạy mô hình DBNet đã huấn luyện với các dữ liệu mới

- Chạy thử mô hình CRAFT với weight đã có sẵn


4. Huấn luyện mô hình Text Recognition

- Sử dụng mô hình Text Detection đã huấn luyện để tạo dữ liệu cho task Text Recognition

- Huấn luyện mô hình VietOCR


5. Ghép các module đã có xây dựng demo


Thông tin chi tiết buổi hướng dẫn:


📅 Thời gian: Thứ Năm ngày 27.06

⏰ Khung giờ: 20:00 - 22:00

🌐 Hình thức: Online qua Zoom

🔑 Người hướng dẫn: Đặng Quang Minh - AI Engineer tại VCCorp

ℹ️ Link đăng ký tham gia: https://forms.gle/VKLM7SvdaDZ1vRSA6 


Đây là một buổi hướng dẫn nho nhỏ dành cho các bạn đang tìm hiểu về AI và muốn thử sức xây dựng các dự án AI cá nhân, buổi này sẽ hướng dẫn step-by-step từ bước cơ bản đến hoàn thiện 1 dự án OCR (BTC giả sử các bạn tham gia đã có kiến thức nền tảng về Python và Machine Learning cơ bản) 


BTC sẽ gửi lại các tài liệu liên quan có trong buổi hướng dẫn bao gồm Slide + code + tài liệu hướng dẫn + video record.


Mong rằng buổi hướng dẫn sẽ mang lại nhiều kiến thức hữu ích cho cộng đồng AI và hãy cho BTC biết hiệu quả của buổi này để chúng mình có kế hoạch tổ chức các buổi tiếp theo nhé!


Có thể bạn quan tâm