Đồ án tốt nghiệp: Tìm hiểu Retrieval Augmented Generation và ứng dụng cho bài toán trả lời câu hỏi

2024

74
0
0

Phí lưu trữ

30 Point

Mục lục chi tiết

LỜI CAM ĐOAN

LỜI CẢM ƠN

1. PHẦN MỞ ĐẦU

1.1. Tính cấp thiết của đề tài

1.2. Mục tiêu và nhiệm vụ nghiên cứu

1.3. Phương pháp nghiên cứu

1.4. Kết quả dự kiến đạt được

2. PHẦN NỘI DUNG

3. CHƯƠNG 1: MÔ HÌNH NGÔN NGỮ LỚN

3.1. MÔ HÌNH NGÔN NGỮ LỚN

3.2. Các thành phần chính

3.3. Mô hình ngôn ngữ lớn hoạt động như thế nào?

3.4. Một số mô hình ngôn ngữ lớn hiện nay

3.5. TỔNG QUAN KIẾN TRÚC TRANSFORMER

3.5.1. Encoder và Decoder

3.5.2. The Residual Connection

3.5.3. Linear and Softmax

4. CHƯƠNG 2: TRUY XUẤT THÔNG TIN

4.1. Một số phương pháp truy xuất thông tin

4.2. Các thành phần của hệ thống truy xuất thông tin

4.3. MÔ HÌNH TRUY XUẤT

4.4. Các loại mô hình truy xuất thông tin

4.5. Các mô hình và kỹ thuật truy xuất thông tin

4.5.1. Mô hình Boolean

4.5.2. MÔ HÌNH VECTOR SPACE

4.5.2.1. Tần số xuất hiện của từ
4.5.2.2. Tần số nghịch đảo xuất hiện của từ
4.5.2.3. Cách tính trọng số tf-idf

4.5.3. Phương pháp xếp hạng (Ranking function)

5. CHƯƠNG 3: TÌM HIỂU VỀ KỸ THUẬT RETRIEVAL AUGMENTED GENERATION

5.1. KỸ THUẬT NHÚNG TỪ

5.2. Các kỹ thuật nhúng từ

5.2.1. Mô hình Word2Vec

5.2.2. Mô hình CBOW

5.2.3. Mô hình Skip-gram

5.2.4. Đánh giá mô hình CBOW và Skip-gram

5.3. TỔNG QUAN VỀ RETRIEVAL AUGMENTED GENERATION

5.3.1. Lợi ích và hạn chế

6. CHƯƠNG 4: ỨNG DỤNG BÀI TOÁN TRẢ LỜI CÂU HỎI DỰA TRÊN TÀI LIỆU ĐÃ CUNG CẤP

6.1. MÔI TRƯỜNG CÀI ĐẶT VÀ CÁC THƯ VIỆN LIÊN QUAN

6.1.1. Môi trường cài đặt

6.1.2. Một số thư viện quan trọng

6.2. CÁC MÔ HÌNH ĐƯỢC SỬ DỤNG

6.2.1. Mô hình nhúng Bge-base-en-v1

6.2.2. Mô hình ngôn ngữ lớn Meta-Llama-3-8B-Instruct

6.3. XÂY DỰNG ỨNG DỤNG RAG

6.3.1. Hệ thống truy xuất

6.3.2. Xử lí tài liệu

6.3.3. Xếp hạng lại các tài liệu liên quan

6.3.4. Hệ thống tạo sinh

6.3.4.1. Thiết lập thông số cho mô hình Llama3
6.3.4.2. Kỹ thuật nhắc nhở (Prompt Engineering)
6.3.4.3. Thiết lập hệ thống RAG

6.3.5. Đánh giá hệ thống RAG

6.3.5.1. Các Metric đánh giá
6.3.5.2. Tập dữ liệu
6.3.5.3. Đánh giá và so sánh

6.3.6. Xây dựng API

6.3.7. Triển khai API và ứng dụng chat

7. PHẦN KẾT LUẬN

7.1. KẾT QUẢ ĐẠT ĐƯỢC

7.2. ƯU ĐIỂM VÀ NHƯỢC ĐIỂM

7.3. HƯỚNG PHÁT TRIỂN

TÀI LIỆU THAM KHẢO

Đồ án tốt nghiệp kỹ thuật dữ liệu tìm hiểu retrieval augmented generationrag và ứng dụng cho bài toán trả lời các câu hỏi

Tài liệu "Tìm hiểu Retrieval Augmented Generation và ứng dụng trong trả lời câu hỏi" cung cấp cái nhìn sâu sắc về mô hình RAG (Retrieval Augmented Generation), một phương pháp kết hợp tìm kiếm thông tin và tạo văn bản để cải thiện khả năng trả lời câu hỏi tự động. Tài liệu giải thích cách RAG tận dụng các nguồn dữ liệu bên ngoài để tạo ra câu trả lời chính xác và phù hợp hơn, đồng thời làm nổi bật các ứng dụng thực tế của nó trong lĩnh vực xử lý ngôn ngữ tự nhiên (NLP). Độc giả sẽ hiểu rõ hơn về cách RAG hoạt động, lợi ích của nó trong việc nâng cao chất lượng chatbot và hệ thống hỏi đáp, cũng như tiềm năng của nó trong tương lai.

Nếu bạn quan tâm đến các ứng dụng học sâu trong NLP, hãy khám phá thêm về Luận văn thạc sĩ phát triển chatbot trên nền tảng transformers ứng dụng trong tìm kiếm tra cứu thông tin về trường đại học công nghệ đông á, nơi bạn sẽ tìm thấy cách thức xây dựng chatbot hiệu quả. Bên cạnh đó, Luận văn thạc sĩ khoa học máy tính ứng dụng học sâu vào xây dựng mô hình rút trích thông tin sẽ giúp bạn hiểu sâu hơn về các mô hình học sâu trong việc trích xuất thông tin. Cuối cùng, Luận văn thạc sĩ khoa học máy tính phân loại văn bản dựa trên mô hình tiền xử lý transformer cung cấp thêm góc nhìn về cách transformer được áp dụng trong phân loại văn bản. Mỗi liên kết là cơ hội để bạn mở rộng kiến thức và khám phá sâu hơn về các chủ đề liên quan.