I. Giới thiệu và lý do chọn đề tài
Luận văn tập trung vào việc xây dựng bộ tính toán Sine và Cosine dựa trên lõi xử lý dấu chấm tĩnh 32-bit. Các hàm lượng giác như Sine và Cosine đóng vai trò quan trọng trong kỹ thuật và công nghệ. Giải thuật CORDIC, mặc dù hiệu quả, không đáp ứng được nhu cầu tính toán trong các hệ thống lớn. Do đó, nghiên cứu này đề xuất một giải thuật mới kết hợp phương pháp tra bảng và xấp xỉ đa thức, tận dụng tài nguyên sẵn có của lõi xử lý 32-bit. Mục tiêu là tối ưu hóa hiệu suất tính toán mà không cần sử dụng bộ tính toán dấu chấm động.
1.1. Mục tiêu nghiên cứu
Mục tiêu chính của luận văn là xây dựng giải thuật hiệu quả để tính toán Sine và Cosine trên lõi xử lý dấu chấm tĩnh 32-bit. Giải thuật được thiết kế để tận dụng các tài nguyên phần cứng sẵn có như bộ nhân và bộ cộng, đồng thời đảm bảo tính chính xác và tốc độ tính toán cao.
1.2. Phạm vi và phương pháp nghiên cứu
Nghiên cứu tập trung vào việc xây dựng giải thuật phần cứng để tính toán Sine và Cosine. Phương pháp nghiên cứu bao gồm việc kết hợp tra bảng và xấp xỉ đa thức, đồng thời tận dụng các tài nguyên sẵn có của lõi xử lý 32-bit. Giải thuật được hiện thực bằng ngôn ngữ Verilog và kiểm chứng trên phần mềm Quartus II và ModelSim.
II. Tổng quan về lõi xử lý tín hiệu số dấu chấm tĩnh 32 bit
Chương này trình bày tổng quan về các kiến trúc DSP hiện đại, đặc biệt là lõi xử lý dấu chấm tĩnh 32-bit. Các kiến trúc DSP được phân loại thành DSP truyền thống, DSP tầm trung, và DSP cao cấp. Mỗi loại có những ưu điểm và hạn chế riêng, phù hợp với các ứng dụng khác nhau. Lõi xử lý 32-bit được chọn trong nghiên cứu này có khả năng xử lý tín hiệu số hiệu quả, đặc biệt là trong các ứng dụng yêu cầu tính toán chính xác và tốc độ cao.
2.1. Các kiến trúc DSP cao cấp
Các kiến trúc DSP cao cấp như VLIW và Multi-Issue được thiết kế để tăng hiệu suất tính toán bằng cách thực thi nhiều lệnh song song. Các lõi xử lý này thường được sử dụng trong các ứng dụng yêu cầu xử lý tín hiệu số phức tạp như FFT và DCT.
2.2. Lõi DSP 32 bit của đề tài
Lõi DSP 32-bit được sử dụng trong nghiên cứu này có kiến trúc RISC, hỗ trợ thực thi lệnh có điều kiện và song song. Các khối chức năng như FALU, MAC, và LSU được thiết kế để tối ưu hóa hiệu suất tính toán, đặc biệt là trong việc xử lý các hàm lượng giác.
III. Phương pháp tính toán dựa trên phần cứng
Chương này trình bày các phương pháp tính toán phần cứng được sử dụng trong nghiên cứu. Phương pháp tra bảng và xấp xỉ đa thức được kết hợp để tối ưu hóa hiệu suất tính toán. Phương pháp tra bảng giúp giảm thời gian tính toán bằng cách lưu trữ các giá trị đã tính toán trước, trong khi xấp xỉ đa thức đảm bảo độ chính xác cao. Sự kết hợp này giúp cân bằng giữa tài nguyên phần cứng và thời gian tính toán.
3.1. Phương pháp tra bảng
Phương pháp tra bảng sử dụng bộ nhớ ROM để lưu trữ các giá trị Sine và Cosine đã tính toán trước. Phương pháp này giúp giảm thời gian tính toán nhưng yêu cầu bộ nhớ lớn. Trong nghiên cứu này, kích thước bảng tra được giới hạn dưới 2 Kbytes để tối ưu hóa tài nguyên.
3.2. Phương pháp xấp xỉ đa thức
Phương pháp xấp xỉ đa thức sử dụng các đa thức bậc cao để tính toán các giá trị Sine và Cosine. Phương pháp này đảm bảo độ chính xác cao nhưng yêu cầu nhiều tài nguyên tính toán. Trong nghiên cứu, phương pháp này được kết hợp với tra bảng để tối ưu hóa hiệu suất.
IV. Hiện thực hệ thống và kết quả
Giải thuật được hiện thực bằng ngôn ngữ Verilog trên phần mềm Quartus II. Tính đúng đắn của giải thuật được kiểm chứng bằng phần mềm ModelSim-Altera. Kết quả cho thấy giải thuật đạt được độ chính xác cao và tốc độ tính toán nhanh, phù hợp với các ứng dụng thực tế như DCT và FFT. Nghiên cứu cũng đề xuất các hướng phát triển trong tương lai, bao gồm việc tối ưu hóa thêm tài nguyên phần cứng và mở rộng ứng dụng cho các hàm lượng giác khác.
4.1. Hiện thực giải thuật
Giải thuật được hiện thực bằng ngôn ngữ Verilog, sử dụng các tài nguyên phần cứng sẵn có như bộ nhân và bộ cộng. Các bước hiện thực bao gồm thiết kế khối tính toán, kiểm tra tính đúng đắn, và tối ưu hóa hiệu suất.
4.2. Kết quả kiểm chứng
Kết quả kiểm chứng trên ModelSim cho thấy giải thuật đạt được độ chính xác cao và tốc độ tính toán nhanh. Các giá trị Sine và Cosine được tính toán chính xác với sai số nhỏ, phù hợp với các ứng dụng thực tế.