Retrieval-Augmented Generation (RAG)

RobustX / Chương trình học / Chuyên đề / Trí tuệ nhân tạo (AI) / Retrieval-Augmented Generation (RAG)

Các Mô hình Ngôn ngữ Lớn (LLMs) vô cùng mạnh mẽ, nhưng chúng có hai điểm yếu cố hữu: chúng có thể tự “bịa” ra thông tin (hallucination) và kiến thức của chúng bị giới hạn tại thời điểm huấn luyện. Retrieval-Augmented Generation (RAG) ra đời như một giải pháp kỹ thuật đột phá và thanh lịch để giải quyết triệt để vấn đề này. Khóa học này sẽ trang bị cho bạn năng lực xây dựng các ứng dụng AI thế hệ mới, có khả năng “đối chiếu” và trả lời dựa trên các nguồn tri thức riêng của doanh nghiệp, biến một LLM đa năng thành một chuyên gia đáng tin cậy.

Chương trình sẽ dẫn dắt bạn qua toàn bộ quy trình xây dựng một hệ thống RAG từ đầu đến cuối một cách bài bản. Bạn sẽ bắt đầu bằng việc học cách xử lý và chuyển đổi các tài liệu (PDF, text,…) thành các vector embedding. Sau đó, bạn sẽ làm chủ việc lưu trữ và truy vấn các vector này trên những Vector Database hiện đại như ChromaDB và Qdrant. Trọng tâm của khóa học là việc sử dụng các framework tiêu chuẩn của ngành như LangChain và LlamaIndex để kết nối các thành phần này lại, xây dựng một pipeline hoàn chỉnh có khả năng truy xuất thông tin liên quan và cung cấp cho LLM để tạo ra câu trả lời chính xác.

Thời lượng: 30h

Hình thức đào tạo:

- Đào tạo trực tiếp tại lớp học
- Đào tạo trực tuyến
- Đào tạo hybrid (trực tuyến kết hợp trực tiếp)
- Đào tạo tại văn phòng khách hàng

KẾT QUẢ ĐẠT ĐƯỢC:

HIỂU SÂU VỀ KIẾN TRÚC VÀ NGUYÊN LÝ RAG
Nắm vững cách RAG kết hợp giữa truy xuất thông tin và sinh văn bản để tạo ra câu trả lời chính xác, đáng tin cậy.
LÀM CHỦ CÔNG NGHỆ VECTOR DATABASE
Thành thạo việc lựa chọn mô hình embedding, xử lý, chunking dữ liệu, và vận hành các vector database như ChromaDB, Qdrant.
XÂY DỰNG RAG PIPELINE CHUYÊN NGHIỆP
Sử dụng thành thạo LangChain và LlamaIndex để xây dựng các pipeline RAG hoàn chỉnh, có khả năng xử lý nhiều loại tài liệu phức tạp.
TRIỂN KHAI CÁC KỸ THUẬT RAG NÂNG CAO
Áp dụng các kỹ thuật tối ưu như re-ranking, advanced retrieval để tăng độ chính xác và hiệu quả của hệ thống.
ĐÁNH GIÁ VÀ TỐI ƯU HÓA HỆ THỐNG RAG
Sử dụng các framework và tiêu chí đánh giá chuyên dụng (RAGAs, Faithfulness, Answer Relevancy) để đo lường và cải thiện hiệu năng của ứng dụng.

Đối tượng tham gia

Sinh viên ngành CNTT

Đã có kiến thức AI/ML, muốn xây dựng một dự án portfolio ấn tượng và có tính thực tiễn cao.

Lập trình viên

Muốn phát triển các sản phẩm AI giải quyết bài toán hỏi-đáp thông minh cho người dùng.

Kỹ sư AI

Muốn xây dựng các ứng dụng LLM thực tiễn, có khả năng kết nối an toàn với dữ liệu nội bộ.

Kiến trúc sư giải pháp

Cần hiểu sâu về RAG để thiết kế các hệ thống AI tạo sinh đáng tin cậy cho doanh nghiệp.

Nội dung khóa học

1. Nền tảng về RAG

- Vấn đề cốt lõi của LLMs: Hallucination và Knowledge Cut-off.
- Kiến trúc RAG chi tiết: Vai trò của Retriever, Generator, và Re-ranker.
- Giới thiệu về Vector Embeddings: Biến văn bản thành các vector toán học.
- Nguyên lý tìm kiếm tương đồng (Vector Similarity Search).

2. Làm chủ Vector Database

- Chiến lược xử lý tài liệu: Các kỹ thuật chia nhỏ văn bản (Chunking).
- Lựa chọn mô hình Embedding: So sánh và lựa chọn model phù hợp.
- Thực hành sâu với Vector Database:
  - - ChromaDB: Cài đặt, tạo collection, nạp và truy vấn dữ liệu.
    - Qdrant: Tìm hiểu các tính năng nâng cao như metadata filtering.

3. Xây dựng RAG Pipeline từ A-Z

- Sử dụng LangChain để xây dựng nhanh RAG pipeline:
  - Document Loaders, Text Splitters, Retrievers.
  - Xây dựng các chuỗi (Chains) hỏi-đáp.
- Sử dụng LlamaIndex để tối ưu hóa việc nạp và truy vấn:
  - Xử lý các loại tài liệu phức tạp (PDF có bảng biểu, PowerPoint).
  - Tìm hiểu các loại Index khác nhau.

4. Kỹ thuật RAG Nâng cao

- Advanced Retrieval Strategies:
  - Parent Document Retriever: Lấy ngữ cảnh rộng hơn để tăng độ chính xác.
  - Self-Querying Retriever: Cho phép LLM tự viết bộ lọc để truy vấn.
- Re-ranking: Tích hợp một mô hình Cross-encoder để sắp xếp lại các kết quả truy xuất, đưa thông tin liên quan nhất lên đầu.
- Xử lý hội thoại đa lượt (Multi-turn Conversation) trong RAG.

5. Đánh giá và Vận hành Hệ thống RAG

- Tại sao cần đánh giá RAG?
- Sử dụng bộ công cụ đánh giá RAGAs:
  - Đo lường các chỉ số: Faithfulness, Answer Relevancy, Context Precision.
- Tối ưu hóa pipeline: Debugging, phân tích các điểm nghẽn và cải thiện hiệu suất.
- Giới thiệu các phương án triển khai (deployment) ứng dụng RAG.

6. BÀI THỰC HÀNH CUỐI KHÓA

- Xây dựng Chatbot Hỏi-đáp cho Doanh nghiệp
  - Thiết kế và Xây dựng Pipeline:
    - Thu thập một bộ tài liệu nội bộ (ví dụ: chính sách nhân sự, tài liệu kỹ thuật sản phẩm).
    - Xây dựng pipeline nạp dữ liệu, vector hóa và lưu trữ trên Qdrant.
  - Phát triển Ứng dụng:
    - Xây dựng một backend API (sử dụng FastAPI) cho phép nhận câu hỏi và trả về câu trả lời từ hệ thống RAG.
    - Tạo một giao diện người dùng đơn giản (sử dụng Streamlit) để tương tác với chatbot.
  - Đánh giá và Báo cáo:
    - Tạo một bộ câu hỏi kiểm thử để đo lường độ chính xác của chatbot.
    - Trình bày sản phẩm, kiến trúc hệ thống, và kết quả đánh giá.