Nghiên Cứu và Thiết Kế Mô Hình Học Tăng Cường Trên FPGA Với Môi Trường Cartpole

Chuyên ngành

Kỹ thuật máy tính

Người đăng

Ẩn danh

2022

109
0
0

Phí lưu trữ

30.000 VNĐ

Mục lục chi tiết

LỜI CẢM ƠN

1. CHƯƠNG 1: GIỚI THIỆU TỔNG QUAN ĐỀ TÀI

1.1. Đặt vấn đề

1.2. Hướng nghiên cứu đề tài

1.3. Mục tiêu đề tài

1.4. Phương pháp thực hiện

2. CHƯƠNG 2: CƠ SỞ LÝ THUYẾT

2.1. Thuật toán Feed-forward

2.2. Artificial Neural Network - ANN

2.3. Các hàm kích hoạt

2.4. Thuật toán Back-Propagation

2.5. Main Network — Mạng chính

2.6. Target Network — Mạng mục tiêu

2.7. Temporal Difference

2.8. Experience Replay — Bộ đệm phát lại

2.9. Chiến lược — Policy

2.10. Learning rate — Tốc độ học

3. CHƯƠNG 3: ĐỀ XUẤT KIẾN TRÚC THIẾT KẾ

3.1. Đề xuất kiến trúc tổng quan

3.2. Mô tả hệ thống

3.3. Mô tả interface của DQN TOP

3.4. Kiến trúc thiết kế của DQN TOP

3.5. Đề xuất kiến trúc chi tiết

3.5.1. Thiết kế khối Main Network

3.5.2. Thiết kế của Feedforward

3.5.3. Thiết kế khối PE — Perceptron Element

3.5.4. Thiết kế khối Leaky ReLU

3.5.5. Thiết kế của Backpropagation

3.5.6. Thiết kế khối CEN — Calculate Error on Node

3.5.7. Thiết kế khối CDUW — Calculator Delta and Update Weight

3.5.8. Thiết kế khối Target Network

3.5.9. Thiết kế khối Target Update

3.5.10. Thiết kế khối Experience Replay

3.5.11. Thiết kế khối Epsilon Greedy

3.5.12. Thiết kế khối Changing Learning Rate

3.5.13. Thiết kế khối Temporal Difference

3.5.14. Thiết kế khối RNG — Random Number Generator

3.5.15. Thiết kế khối RNG-FP

3.5.16. Thiết kế khối Multiplier Floating Point Single Precision

3.5.17. Thiết kế khối Adder Floating Point Single Precision

4. CHƯƠNG 4: KẾT QUẢ MÔ PHỎNG - TỔNG HỢP TÀI NGUYÊN

4.1. Phương pháp đánh giá

4.2. Kết quả mô phỏng và tổng hợp tài nguyên

4.2.1. Multiplier Floating Point Single Precision

4.2.2. Adder Floating Point Single Precision

4.2.3. Perceptron Element — PIE

4.2.4. Random Number Generator Floating Point — RNG-EP

4.2.5. Cal Delta and Update Weights — CDUW

4.2.6. Changing Learning Rate

4.2.7. Temporal Difference

4.3. Đánh giá độ chính xác và đường cong đào tạo

4.4. So sánh với kết quả của các nghiên cứu liên quan

5. CHƯƠNG 5: KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN ĐỀ TÀI

5.1. Khó khăn gặp phải

5.2. Hướng phát triển

DANH MỤC HÌNH ẢNH

DANH MỤC BẢNG

DANH MỤC TỪ VIẾT TẮT

TÓM TẮT KHÓA LUẬN

Khóa luận tốt nghiệp kỹ thuật máy tính nghiên cứu và thiết kế mô hình học tăng cường trên fpga với môi trường cartpole

Bạn đang xem trước tài liệu:

Khóa luận tốt nghiệp kỹ thuật máy tính nghiên cứu và thiết kế mô hình học tăng cường trên fpga với môi trường cartpole

Tài liệu "Mô Hình Học Tăng Cường Trên FPGA Với Môi Trường Cartpole" trình bày một cách tiếp cận mới trong việc áp dụng học tăng cường trên nền tảng FPGA, với mục tiêu tối ưu hóa hiệu suất và tốc độ xử lý. Bài viết không chỉ giải thích chi tiết về mô hình học tăng cường mà còn cung cấp các ví dụ thực tiễn về cách mà công nghệ này có thể được triển khai trong môi trường Cartpole. Độc giả sẽ nhận thấy những lợi ích rõ rệt từ việc áp dụng mô hình này, bao gồm khả năng cải thiện hiệu suất tính toán và giảm thiểu thời gian phản hồi trong các ứng dụng thực tế.

Để mở rộng thêm kiến thức về học tăng cường và các ứng dụng của nó, bạn có thể tham khảo tài liệu Khóa luận tốt nghiệp kỹ thuật máy tính một hiện thực phần cứng cho bài toán tìm đường đi ngắn nhất trong mê cung 10x10 bằng deep q learning, nơi bạn sẽ tìm hiểu về việc áp dụng deep Q-learning trong việc tìm đường đi ngắn nhất. Ngoài ra, tài liệu Khóa luận tốt nghiệp khoa học máy tính khảo sát và nghiên cứu tính khả thi của hướng tiếp cận học tăng cường trong giải quyết các tác vụ thị giác máy tính sẽ giúp bạn khám phá thêm về khả năng của học tăng cường trong lĩnh vực thị giác máy tính. Cuối cùng, tài liệu Khóa luận tốt nghiệp học tăng cường kết hợp tính toán tiến hóa cho bài toán điều khiển liên tục với các phép biến đổi kiểu hình ổn định sẽ cung cấp cái nhìn sâu sắc về việc kết hợp học tăng cường với các phương pháp tính toán tiến hóa trong điều khiển liên tục. Những tài liệu này sẽ là cơ hội tuyệt vời để bạn mở rộng kiến thức và hiểu biết về các ứng dụng của học tăng cường trong nhiều lĩnh vực khác nhau.