Nghiên cứu phân lớp dữ liệu chuỗi thời gian với tổ hợp 1NN và công nghệ GPU

Chuyên ngành

Khoa học máy tính

Người đăng

Ẩn danh

2022

64
2
0

Phí lưu trữ

30.000 VNĐ

Tóm tắt

I. Giới thiệu về phân lớp dữ liệu chuỗi thời gian

Trong bối cảnh hiện nay, phân lớp dữ liệu chuỗi thời gian trở thành một lĩnh vực nghiên cứu quan trọng với sự phát triển nhanh chóng của công nghệ và lượng dữ liệu khổng lồ từ nhiều thiết bị. Các phương pháp phân lớp dữ liệu chuỗi thời gian đã được áp dụng rộng rãi trong nhiều lĩnh vực như khai phá dữ liệu, thống kê và machine learning. Nghiên cứu cho thấy rằng bộ phân lớp 1-NN (một lân cận gần nhất) là một trong những phương pháp hiệu quả nhất cho phân loại dữ liệu chuỗi thời gian. Tuy nhiên, các nghiên cứu trước đây chưa tối ưu hóa tốc độ thực thi của bộ phân lớp, điều này làm hạn chế khả năng ứng dụng trong thực tế. Do đó, việc kết hợp giữa tổ hợp 1NN và công nghệ GPU được xem là một giải pháp khả thi để nâng cao hiệu suất phân lớp.

II. Cơ sở lý thuyết về chuỗi thời gian và phân lớp dữ liệu

Chuỗi thời gian là một chuỗi các điểm dữ liệu có thứ tự, mỗi điểm đại diện cho một giá trị đo được tại những thời điểm cách đều nhau. Các ứng dụng của chuỗi thời gian rất đa dạng, từ tài chính, dự đoán thời tiết đến nhận dạng mẫu. Trong nghiên cứu này, việc áp dụng các độ đo khoảng cách khác nhau như DTW (Dynamic Time Warping) và CID (Complexity-invariant Distance) được xem là rất quan trọng để cải thiện độ chính xác của phân lớp dữ liệu. Đặc biệt, thuật toán 1-NN đã được chứng minh là có hiệu suất cao trong việc phân loại chuỗi thời gian. Sự kết hợp giữa các độ đo này với công nghệ GPU không chỉ giúp tăng tốc độ xử lý mà còn nâng cao độ chính xác của kết quả phân lớp.

III. Phương pháp tổ hợp 1NN và ứng dụng công nghệ GPU

Phương pháp tổ hợp 1NN sử dụng nhiều độ đo khoảng cách khác nhau để phân lớp dữ liệu chuỗi thời gian. Việc bổ sung độ đo mới như CRD (Compression Rate Distance) giúp tăng cường tính đa dạng và độ chính xác của tổ hợp. Công nghệ GPU với khả năng xử lý song song đã được áp dụng để tối ưu hóa tốc độ thực thi của tổ hợp bộ phân lớp. Kết quả thực nghiệm cho thấy rằng thời gian phân lớp trên GPU nhanh hơn trung bình 48 lần so với CPU, đồng thời độ chính xác đạt được là 92%. Điều này chứng tỏ rằng việc sử dụng GPU không chỉ cải thiện hiệu suất mà còn mở ra nhiều cơ hội ứng dụng trong các lĩnh vực yêu cầu xử lý dữ liệu lớn.

IV. Kết quả thực nghiệm và đánh giá hiệu quả của phương pháp

Nghiên cứu đã tiến hành thực nghiệm trên 14 tập dữ liệu mẫu từ website UCR. Kết quả cho thấy tổ hợp bộ phân lớp 1-NN với các độ đo khoảng cách khác nhau đạt được độ chính xác cao và thời gian thực thi được tối ưu hóa đáng kể. Cụ thể, độ chính xác phân lớp trung bình đạt 92% và thời gian thực thi trên GPU nhanh hơn trung bình 48 lần so với trên CPU. Những kết quả này không chỉ khẳng định tính khả thi của phương pháp mà còn mở ra hướng đi mới cho các nghiên cứu tiếp theo trong lĩnh vực phân lớp dữ liệu chuỗi thời gian.

V. Ý nghĩa và ứng dụng thực tiễn của nghiên cứu

Nghiên cứu về phân lớp dữ liệu chuỗi thời gian dựa vào tổ hợp 1-NN và công nghệ GPU có ý nghĩa lớn trong việc cải thiện hiệu suất phân lớp cho các ứng dụng thực tiễn. Việc tối ưu hóa tốc độ và độ chính xác trong phân lớp dữ liệu chuỗi thời gian có thể giúp ích cho nhiều lĩnh vực như phân tích tài chính, dự đoán thời tiết và nhận diện mẫu trong các hệ thống thông minh. Hơn nữa, việc áp dụng công nghệ GPU vào nghiên cứu sẽ tiếp tục mở rộng khả năng xử lý dữ liệu lớn trong tương lai, đáp ứng nhu cầu ngày càng cao trong thế giới số hiện đại.

09/01/2025
Luận văn thạc sĩ khoa học máy tính phân lớp dữ liệu chuỗi thời gian dựa vào một tổ hợp phân lớp 1nn với các độ đo khoảng cách khác nhau và công nghệ gpu
Bạn đang xem trước tài liệu : Luận văn thạc sĩ khoa học máy tính phân lớp dữ liệu chuỗi thời gian dựa vào một tổ hợp phân lớp 1nn với các độ đo khoảng cách khác nhau và công nghệ gpu

Để xem tài liệu hoàn chỉnh bạn click vào nút

Tải xuống

Bài luận văn thạc sĩ mang tiêu đề "Nghiên cứu phân lớp dữ liệu chuỗi thời gian với tổ hợp 1NN và công nghệ GPU" của tác giả Võ Đại Dương, dưới sự hướng dẫn của PGS.TS Dương Tuấn Anh tại Đại học Bách Khoa - ĐHQG - HCM, tập trung vào việc áp dụng các công nghệ hiện đại để phân lớp dữ liệu chuỗi thời gian. Nghiên cứu này không chỉ trình bày các phương pháp phân lớp dựa trên tổ hợp 1-NN mà còn khai thác sức mạnh của công nghệ GPU để tăng tốc độ xử lý và cải thiện độ chính xác trong việc phân loại dữ liệu.

Đối với những ai quan tâm đến lĩnh vực khoa học máy tính và các ứng dụng của công nghệ trong phân tích dữ liệu, bài viết này sẽ mang lại những hiểu biết sâu sắc và ứng dụng thực tiễn.

Nếu bạn muốn khám phá thêm về các phương pháp phân lớp và khai thác dữ liệu trong khoa học máy tính, bạn có thể tham khảo bài viết Nghiên Cứu Khai Phá Luật Trên Chuỗi Thời Gian Trong Khoa Học Máy Tính, nơi trình bày các kỹ thuật khai thác luật trong dữ liệu chuỗi thời gian, hoặc bài viết Luận văn thạc sĩ: Cấu trúc chỉ mục cho dữ liệu chuỗi thời gian sử dụng độ đo khoảng cách động, giúp bạn hiểu rõ hơn về việc tổ chức và truy xuất dữ liệu chuỗi thời gian. Cuối cùng, bài viết Luận văn thạc sĩ về nhận dạng mô típ trong dữ liệu chuỗi thời gian hình ảnh sẽ mở rộng kiến thức của bạn về nhận dạng và phân tích dữ liệu hình ảnh trong bối cảnh chuỗi thời gian. Những tài liệu này sẽ cung cấp cho bạn cái nhìn đa chiều về các ứng dụng của công nghệ trong lĩnh vực này.