Luận văn thạc sĩ về phân lớp dữ liệu chuỗi thời gian sử dụng bộ phân lớp 1-NN

Trường đại học

Đại học Quốc gia TP.HCM

Chuyên ngành

Khoa học máy tính

Người đăng

Ẩn danh

Thể loại

luận văn thạc sĩ

2020

78
1
0

Phí lưu trữ

30.000 VNĐ

Tóm tắt

I. Giới thiệu về phân lớp dữ liệu chuỗi thời gian

Phân lớp dữ liệu chuỗi thời gian ngày càng trở nên quan trọng trong bối cảnh công nghệ phát triển nhanh chóng. Dữ liệu chuỗi thời gian được thu thập từ nhiều nguồn khác nhau, từ cảm biến đến các thiết bị thông minh. Việc phân lớp dữ liệu này không chỉ giúp trong việc phân tích mà còn trong việc dự đoán các xu hướng tương lai. Phân lớp dữ liệu chuỗi thời gian được thực hiện thông qua việc xây dựng các bộ phân lớp dựa trên các chuỗi thời gian đã được gán nhãn. Tuy nhiên, các phương pháp truyền thống thường gặp khó khăn trong việc xử lý loại dữ liệu này do tính chất đặc thù của nó, bao gồm số chiều lớn và mối tương quan cao giữa các điểm dữ liệu. Các phương pháp phân lớp hiện tại có thể chia thành ba loại chính: dựa vào đặc trưng, mô hình và khoảng cách. Đặc biệt, phương pháp dựa vào khoảng cách cho thấy hiệu quả cao trong việc xử lý dữ liệu chuỗi thời gian. Do đó, nghiên cứu này tập trung vào việc phát triển một bộ tổ hợp phân lớp 1-NN với các độ đo khoảng cách khác nhau nhằm tăng cường độ chính xác trong phân lớp.

II. Các phương pháp đo khoảng cách trong phân lớp dữ liệu

Độ đo khoảng cách là yếu tố quyết định trong việc phân lớp dữ liệu chuỗi thời gian. Các độ đo phổ biến bao gồm khoảng cách Euclidean, khoảng cách Manhattan, và Dynamic Time Warping (DTW). Mỗi độ đo có ưu điểm và nhược điểm riêng, phù hợp với các loại dữ liệu khác nhau. Đặc biệt, DTW được ưa chuộng do khả năng xử lý các biến thể về độ dài chuỗi và sự dịch chuyển trong thời gian. Nghiên cứu cho thấy rằng việc áp dụng các độ đo khoảng cách này trong bộ phân lớp 1-NN có thể cải thiện đáng kể độ chính xác phân lớp. Việc kết hợp các độ đo này thành một tổ hợp giúp tận dụng được ưu điểm của từng phương pháp, từ đó tăng cường khả năng phân lớp. Kết quả thực nghiệm cho thấy tổ hợp các độ đo khoảng cách mang lại độ chính xác cao hơn so với việc sử dụng từng độ đo riêng lẻ.

III. Kỹ thuật xử lý song song trong phân lớp

Kỹ thuật xử lý song song là một phương pháp quan trọng nhằm cải thiện hiệu suất của các thuật toán phân lớp. Trong nghiên cứu này, kỹ thuật xử lý song song đa luồng được áp dụng để giảm thời gian thực thi của bộ phân lớp 1-NN. Kết quả cho thấy rằng việc áp dụng kỹ thuật này giúp giảm thời gian phân lớp từ 2 đến 3 lần so với phương pháp phân lớp truyền thống. Điều này đặc biệt quan trọng trong các ứng dụng thực tế, nơi mà thời gian xử lý nhanh chóng là một yếu tố then chốt. Việc cải tiến này không chỉ mang lại hiệu quả trong xử lý mà còn nâng cao khả năng ứng dụng của phương pháp phân lớp trong các lĩnh vực khác nhau như y tế, tài chính và dự báo thời tiết.

IV. Đánh giá và kết quả thực nghiệm

Nghiên cứu đã thực hiện đánh giá hiệu suất của các thuật toán phân lớp 1-NN với các độ đo khác nhau trên 28 tập dữ liệu mẫu từ website UCR. Kết quả cho thấy rằng bộ phân lớp 1-NN với tổ hợp các độ đo khoảng cách đạt được độ chính xác cao hơn so với từng độ đo riêng lẻ. Đặc biệt, độ đo CID được xác định là có độ chính xác tốt và thời gian xử lý nhanh nhất. Những kết quả này không chỉ khẳng định tính khả thi của phương pháp mà còn mở ra hướng đi mới trong nghiên cứu và ứng dụng phân lớp dữ liệu chuỗi thời gian. Việc áp dụng các kỹ thuật cải tiến như xử lý song song đa luồng cũng cho thấy tiềm năng lớn trong việc nâng cao hiệu suất của các thuật toán phân lớp.

V. Kết luận và hướng phát triển

Luận văn đã trình bày một cách tiếp cận mới trong phân lớp dữ liệu chuỗi thời gian dựa trên tổ hợp bộ phân lớp 1-NN với các độ đo khoảng cách khác nhau. Kết quả thực nghiệm cho thấy rằng phương pháp này không chỉ cải thiện độ chính xác mà còn giảm thiểu thời gian xử lý. Hướng phát triển trong tương lai có thể bao gồm việc áp dụng các kỹ thuật học sâu để cải thiện khả năng phân lớp và mở rộng nghiên cứu sang các loại dữ liệu khác. Việc tiếp tục nghiên cứu và phát triển các phương pháp phân lớp mới sẽ góp phần quan trọng vào việc nâng cao hiệu quả trong phân tích dữ liệu chuỗi thời gian.

05/01/2025
Luận văn thạc sĩ khoa học máy tính phân lớp dữ liệu chuỗi thời gian dựa vào tổ hợp bộ phân lớp 1 nn với độ đo khoảng cách khác nhau
Bạn đang xem trước tài liệu : Luận văn thạc sĩ khoa học máy tính phân lớp dữ liệu chuỗi thời gian dựa vào tổ hợp bộ phân lớp 1 nn với độ đo khoảng cách khác nhau

Để xem tài liệu hoàn chỉnh bạn click vào nút

Tải xuống

Bài viết "Luận văn thạc sĩ về phân lớp dữ liệu chuỗi thời gian sử dụng bộ phân lớp 1-NN" của tác giả Phạm Minh Trí, dưới sự hướng dẫn của PGS.TS Dương Tuấn Anh, trình bày một nghiên cứu sâu sắc về phương pháp phân lớp dữ liệu chuỗi thời gian thông qua bộ phân lớp 1-NN. Luận văn này không chỉ cung cấp cái nhìn tổng quan về các kỹ thuật phân lớp mà còn chỉ ra tầm quan trọng của việc áp dụng độ đo khoảng cách khác nhau trong quá trình phân lớp. Độc giả sẽ thấy được lợi ích của việc ứng dụng phương pháp này trong nhiều lĩnh vực khác nhau như phân tích dữ liệu, nhận diện mẫu và dự đoán xu hướng.

Để mở rộng thêm kiến thức về lĩnh vực này, bạn có thể tham khảo các bài viết liên quan như "Luận Văn Thạc Sĩ: Ứng Dụng Active Learning trong Lựa Chọn Dữ Liệu Gán Nhãn cho Bài Toán Nhận Diện Giọng Nói", nơi khám phá ứng dụng của học máy trong việc chọn lọc dữ liệu, và "Nghiên cứu tìm kiếm tương tự trên dữ liệu chuỗi thời gian sử dụng phép biến đổi PLA và chỉ mục Skyline", cung cấp cái nhìn sâu sắc về tìm kiếm dữ liệu trong chuỗi thời gian. Cuối cùng, bạn cũng nên xem qua "Luận văn thạc sĩ: Cấu trúc chỉ mục cho dữ liệu chuỗi thời gian sử dụng độ đo khoảng cách động", để hiểu rõ hơn về cách tổ chức và truy xuất dữ liệu trong các ứng dụng thực tế.

Tải xuống (78 Trang - 1.92 MB)