I. Tăng tốc kết chuỗi con trên dữ liệu chuỗi thời gian
Luận văn tập trung vào việc tăng tốc kết chuỗi con trên dữ liệu chuỗi thời gian bằng cách sử dụng công nghệ GPU. Bài toán kết chuỗi con là một bài toán nền tảng trong nhiều ứng dụng khai phá dữ liệu, đặc biệt là trong các lĩnh vực như tài chính, y tế, và thiên văn học. Tăng tốc kết chuỗi con giúp cải thiện hiệu suất tính toán, đặc biệt khi xử lý các bộ dữ liệu lớn. Luận văn đề xuất một phương pháp kết hợp giữa tối ưu hóa hiệu suất bằng phần mềm và sức mạnh tính toán song song của GPU để giải quyết bài toán này.
1.1. Bài toán kết chuỗi con
Bài toán kết chuỗi con được định nghĩa là việc tìm kiếm các cặp chuỗi con tương tự trên hai chuỗi thời gian. Đây là bài toán tổng quát hơn so với bài toán so trùng chuỗi con, vốn chỉ tập trung vào việc tìm kiếm một chuỗi con trong một chuỗi thời gian lớn hơn. Bài toán này đòi hỏi việc phân đoạn chuỗi thời gian và tính toán độ tương tự giữa các chuỗi con, thường sử dụng độ đo Dynamic Time Warping (DTW).
1.2. Tối ưu hóa hiệu suất
Để tối ưu hóa hiệu suất, luận văn sử dụng các kỹ thuật như cắt tỉa các phép tính DTW không cần thiết và tính toán song song trên GPU. Các kỹ thuật này giúp giảm thiểu thời gian tính toán và tăng tốc độ xử lý dữ liệu. Đặc biệt, việc sử dụng GPU cho phép thực hiện hàng nghìn phép tính song song, giúp cải thiện đáng kể hiệu suất của bài toán.
II. Phương pháp đề xuất
Luận văn đề xuất một phương pháp kết hợp giữa tối ưu hóa thuật toán và tính toán song song trên GPU để giải quyết bài toán kết chuỗi con. Phương pháp này bao gồm các bước như chuẩn hóa dữ liệu, phân đoạn chuỗi thời gian, và tính toán độ đo DTW song song trên GPU. Kết quả thực nghiệm cho thấy phương pháp này đạt được hiệu suất cao trên các bộ dữ liệu lớn.
2.1. Chuẩn hóa dữ liệu
Quá trình chuẩn hóa dữ liệu giúp đảm bảo các chuỗi thời gian có cùng tỷ lệ và phạm vi giá trị, giúp việc tính toán độ tương tự chính xác hơn. Đây là bước quan trọng trước khi thực hiện các phép tính toán phức tạp như DTW.
2.2. Tính toán song song trên GPU
Việc sử dụng GPU cho phép thực hiện hàng nghìn phép tính DTW song song, giúp giảm thiểu thời gian tính toán. Luận văn sử dụng các kỹ thuật lập trình song song trên GPU để tối ưu hóa hiệu suất, đặc biệt là khi xử lý các bộ dữ liệu lớn.
III. Kết quả và đánh giá
Kết quả thực nghiệm cho thấy phương pháp đề xuất đạt được hiệu suất cao trên các bộ dữ liệu lớn, với thời gian tính toán được cải thiện đáng kể so với các phương pháp truyền thống. Luận văn cũng đánh giá tính khả thi và hiệu quả của việc sử dụng GPU trong việc tăng tốc kết chuỗi con trên dữ liệu chuỗi thời gian.
3.1. Hiệu suất tính toán
Kết quả thực nghiệm cho thấy phương pháp đề xuất giảm thiểu thời gian tính toán đáng kể, đặc biệt khi xử lý các bộ dữ liệu lớn. Việc sử dụng GPU giúp tăng tốc độ tính toán lên nhiều lần so với các phương pháp truyền thống.
3.2. Ứng dụng thực tiễn
Phương pháp đề xuất có nhiều ứng dụng thực tiễn trong các lĩnh vực như tài chính, y tế, và thiên văn học. Việc tăng tốc kết chuỗi con giúp cải thiện hiệu suất của các ứng dụng khai phá dữ liệu, đặc biệt là khi xử lý các bộ dữ liệu lớn và phức tạp.