Đồ án cuối khóa

Sau khi đã chinh phục các module chuyên sâu về Machine Learning, Deep Learning, Computer Vision, NLP, Generative AI và MLOps, đã đến lúc kết nối tất cả các mảnh ghép lại thành một bức tranh hoàn chỉnh. Đồ án cuối khóa không chỉ là một môn học tổng kết; đây là một sân khấu thực chiến, một kỳ thực tập mô phỏng được thiết kế để chuyển hóa bạn từ một người học lý thuyết sang một kỹ sư AI tự tin, có năng lực giải quyết vấn đề một cách toàn diện. Đây chính là thử thách cuối cùng, nơi kiến thức của bạn được kiểm chứng và kỹ năng của bạn được mài giũa để tạo ra một sản phẩm công nghệ hoàn chỉnh, có giá trị thực tiễn và sẵn sàng để trình diễn.

Bạn sẽ làm việc theo nhóm, trải qua toàn bộ vòng đời của một dự án AI thực tế, bắt đầu từ việc xác định và làm rõ yêu cầu bài toán kinh doanh. Giai đoạn tiếp theo đòi hỏi sự kiên trì trong việc thu thập, làm sạch và chuẩn bị dữ liệu – thường là phần thách thức nhất trong thực tế. Sau đó, nhóm của bạn sẽ tiến hành thử nghiệm, lựa chọn kiến trúc mô hình phù hợp nhất, huấn luyện và tinh chỉnh để đạt được hiệu suất tối ưu. Quan trọng hơn cả, dự án không dừng lại ở một file notebook; bạn sẽ phải áp dụng các nguyên tắc MLOps đã học để đóng gói mô hình, xây dựng API và triển khai thành một ứng dụng demo có thể tương tác, mô phỏng một sản phẩm thực thụ.

Thời lượng: 30h

KẾT QUẢ ĐẠT ĐƯỢC

Yêu cầu tiên quyết:

    • Hoàn thành kiến thức của 7 module trước trong lộ trình AI Engineer.
    • Nắm vững kiến thức về Machine Learning, Deep Learning, và các mô hình Transformer.
    • Hiểu biết về các công cụ MLOps cơ bản như Docker, FastAPI để có thể triển khai sản phẩm.

Nội dung khóa học

 1. Quy trình thực hiện chi tiết
  • Quy trình đồ án được chia thành các giai đoạn chính, giúp học viên hệ thống hóa công việc một cách chuyên nghiệp.
    • Giai đoạn 1: Khởi động và Lập kế hoạch Dự án
      • Thành lập nhóm và phân công vai trò.
      • Thảo luận và lựa chọn đề tài từ danh sách gợi ý hoặc tự đề xuất.
      • Phân tích yêu cầu, xác định mục tiêu và phạm vi của dự án.
      • Thiết lập môi trường làm việc: Khởi tạo kho lưu trữ trên GitHub, thiết lập project board.
    • Giai đoạn 2: Thu thập và Xử lý Dữ liệu
      • Xác định và thu thập các nguồn dữ liệu cần thiết.
      • Thực hiện khám phá dữ liệu (EDA) để hiểu rõ đặc tính của dữ liệu.
      • Làm sạch, tiền xử lý và chuẩn bị dữ liệu cho việc huấn luyện mô hình.
    • Giai đoạn 3: Xây dựng và Huấn luyện Mô hình
      • Lựa chọn kiến trúc mô hình AI phù hợp với bài toán (ví dụ: RAG, YOLO, Transformer-based Agent).
      • Sử dụng PyTorch và các thư viện liên quan để xây dựng và huấn luyện mô hình.
      • Thử nghiệm, tinh chỉnh các siêu tham số và đánh giá hiệu năng mô hình.
    • Giai đoạn 4: Đóng gói và Triển khai Demo
      • Xây dựng API cho mô hình đã huấn luyện bằng FastAPI.
      • Đóng gói toàn bộ ứng dụng bằng Docker để đảm bảo tính nhất quán.
      • Xây dựng một giao diện người dùng đơn giản (sử dụng Streamlit hoặc HTML/CSS/JS cơ bản) để demo sản phẩm.
      • Triển khai ứng dụng demo lên một nền tảng cloud.
    • Giai đoạn 5: Hoàn thiện và Bảo vệ Đồ án
      • Viết tài liệu dự án chi tiết (file README.md) trên GitHub.
      • Chuẩn bị slide thuyết trình và quay video demo sản phẩm.
      • Trình bày và bảo vệ đồ án trước hội đồng giảng viên.
 2. Đề tài gợi ý
  • Học viên có thể lựa chọn một trong các đề tài sau:
    • Hệ thống RAG cho Doanh nghiệp: Xây dựng một chatbot có khả năng trả lời các câu hỏi dựa trên kho tài liệu nội bộ của một công ty (chính sách, báo cáo,…).
    • Hệ thống Kiểm soát Chất lượng bằng Hình ảnh: Xây dựng mô hình CV (sử dụng YOLO) để tự động phát hiện sản phẩm lỗi trên dây chuyền sản xuất từ ảnh hoặc video.
    • AI Agent tự động hóa: Xây dựng một agent đơn giản sử dụng LLM có khả năng nhận một yêu cầu (ví dụ: “Tìm cho tôi các bài báo mới nhất về AI”), tự tìm kiếm trên web, và tóm tắt kết quả.
 3. Yêu cầu đầu ra
  • Để hoàn thành môn học, mỗi nhóm cần nộp các sản phẩm sau:
    • Mã nguồn dự án: Được quản lý chuyên nghiệp trên GitHub.
    • Ứng dụng Demo: Một ứng dụng có thể tương tác được, đã được triển khai trên cloud hoặc một nền tảng phù hợp.
    • Tài liệu dự án: Một file README.md trên GitHub giải thích chi tiết về dự án, kiến trúc hệ thống, hướng dẫn cài đặt và cách sử dụng.

Bài viết liên quan