Luận Văn Thạc Sĩ Về Phân Lớp Dữ Liệu Chuỗi Thời Gian Sử Dụng Mạng Nơron Tích Chập CNN

Luận văn thạc sĩ nghiên cứu máy tính phân lớp dữ liệu chuỗi thời gian dựa vào mạng nơron tích chập cnn, đánh giá hiện trạng, phân tích vấn đề, đề xuất biện pháp hoàn thiện trong

Trường đại học

Đại học Quốc gia TP. Hồ Chí Minh

Chuyên ngành

Khoa học máy tính

Người đăng

Ẩn danh

Thể loại

luận văn thạc sĩ

2023

Phí lưu trữ

30 Point

Mục lục chi tiết

LỜI CẢM ƠN

TÓM TẮT

ABSTRACT

LỜI CAM ĐOAN

1. CHƯƠNG 1: GIỚI THIỆU ĐỀ TÀI

1.1. Động cơ nghiên cứu

1.2. Mục tiêu và phạm vi nghiên cứu

1.3. Những kết quả đạt được của luận văn

1.4. Cấu trúc của luận văn

2. CHƯƠNG 2: CƠ SỞ LÝ THUYẾT

2.1. Chuỗi thời gian

2.2. Phân lớp dữ liệu

2.2.1. Khái niệm phân lớp dữ liệu

2.2.2. Phương pháp phân lớp k lân cận gần nhất (k-NN)

2.2.3. Độ đo xoắn thời gian động

2.2.4. Mạng nơron đa tầng (MLP)

2.2.5. Mạng nơ ron tích chập (CNN)

2.2.6. Tinh chỉnh các siêu tham số và giải thuật Grid Search

2.2.7. Chuẩn hóa dữ liệu

3. CHƯƠNG 3: CÁC CÔNG TRÌNH LIÊN QUAN

3.1. Phân lớp chuỗi thời gian dựa vào shapelet

3.2. Phân lớp chuỗi thời gian bằng phương pháp SAX-VSM

3.3. Phân lớp chuỗi thời gian bằng mạng nơ ron tích chập FCN

3.4. Mạng nơ ron tích chập một chiều

4. CHƯƠNG 4: PHƯƠNG PHÁP PHÂN LỚP ĐỀ XUẤT

4.1. Phương pháp tiếp cận

4.2. Ứng dụng kỹ thuật grid search

4.3. Các bộ dữ liệu thực nghiệm

4.4. Thư viện phần mềm hỗ trợ

4.5. Cách đánh giá chất lượng phương pháp phân lớp

5. CHƯƠNG 5: THỰC NGHIỆM ĐÁNH GIÁ

5.1. Cấu hình hệ thống sử dụng trong thực nghiệm

5.2. Các phương pháp đối sánh và các bộ dữ liệu thực nghiệm

5.2.1. Các phương pháp đối sánh cho công tác phân lớp dữ liệu chuỗi thời gian

5.2.2. Các bộ dữ liệu thực nghiệm

5.2.3. Bộ dữ liệu nhịp tim ECGFiveDays

5.2.4. Bộ dữ liệu Fish

5.2.5. Bộ dữ liệu CBF

5.2.6. Bộ dữ liệu Trace

5.3. Giá trị siêu tham số cho các bộ dữ liệu thực nghiệm

5.4. Kết quả thực nghiệm của ba bộ dữ liệu ArrowHead, BeeFl và ECGFiveDays

5.4.1. Kết quả thực nghiệm của bộ dữ liệu ArrowHead

5.4.2. Kết quả thực nghiệm của bộ dữ liệu BeeFl

5.4.3. Kết quả thực nghiệm của bộ dữ liệu ECGFiveDays

5.5. Kết quả tổng hợp tỷ lệ lỗi của các bộ dữ liệu thực nghiệm

5.6. Kết quả tổng hợp thời gian thực thi của các bộ dữ liệu thực nghiệm

6. CHƯƠNG 6: KẾT QUẢ ĐẠT ĐƯỢC VÀ HƯỚNG PHÁT TRIỂN

6.1. Kết quả đạt được của luận văn

6.2. Hướng phát triển trong tương lai

TÀI LIỆU THAM KHẢO

Tóm tắt

I. Tổng quan về phân lớp dữ liệu chuỗi thời gian bằng CNN

Phân lớp dữ liệu chuỗi thời gian là một lĩnh vực nghiên cứu quan trọng trong khoa học dữ liệu. Với sự phát triển của công nghệ, việc phân tích và phân lớp dữ liệu chuỗi thời gian ngày càng trở nên cần thiết. Mạng nơ ron tích chập (CNN) đã trở thành một công cụ mạnh mẽ trong việc giải quyết bài toán này. Bài viết này sẽ khám phá cách mà CNN có thể cải thiện hiệu suất phân lớp dữ liệu chuỗi thời gian.

1.1. Định nghĩa và ứng dụng của chuỗi thời gian

Chuỗi thời gian là một tập hợp các điểm dữ liệu được thu thập theo thời gian. Chúng được sử dụng rộng rãi trong các lĩnh vực như tài chính, y tế và dự báo thời tiết. Việc phân lớp chuỗi thời gian giúp xác định các mẫu và xu hướng trong dữ liệu.

1.2. Tại sao sử dụng mạng nơ ron tích chập cho phân lớp

Mạng nơ ron tích chập (CNN) có khả năng tự động học các đặc trưng từ dữ liệu mà không cần phải thiết kế thủ công. Điều này giúp cải thiện độ chính xác và hiệu suất trong việc phân lớp dữ liệu chuỗi thời gian.

II. Thách thức trong phân lớp dữ liệu chuỗi thời gian

Phân lớp dữ liệu chuỗi thời gian đối mặt với nhiều thách thức, bao gồm độ phức tạp của dữ liệu và sự biến đổi theo thời gian. Các phương pháp truyền thống như k-NN và DTW có thể không đủ hiệu quả trong nhiều trường hợp. Việc áp dụng CNN có thể giúp giải quyết những vấn đề này.

2.1. Vấn đề về độ chính xác trong phân lớp

Nhiều phương pháp truyền thống gặp khó khăn trong việc đạt được độ chính xác cao khi phân lớp dữ liệu chuỗi thời gian. CNN có thể cải thiện điều này nhờ khả năng học sâu.

2.2. Thời gian xử lý và hiệu suất

Thời gian xử lý là một yếu tố quan trọng trong phân lớp dữ liệu chuỗi thời gian. CNN có thể yêu cầu thời gian huấn luyện lâu hơn, nhưng kết quả phân lớp thường tốt hơn.

III. Phương pháp phân lớp dữ liệu chuỗi thời gian bằng CNN

Phương pháp sử dụng mạng nơ ron tích chập (CNN) cho phân lớp dữ liệu chuỗi thời gian đã được chứng minh là hiệu quả. Mô hình 1D-CNN được áp dụng để xử lý dữ liệu chuỗi thời gian, cho phép khai thác các đặc trưng quan trọng từ dữ liệu.

3.1. Cấu trúc của mạng nơ ron tích chập

Mạng nơ ron tích chập bao gồm nhiều lớp, mỗi lớp có khả năng học các đặc trưng khác nhau từ dữ liệu. Cấu trúc này giúp cải thiện khả năng phân lớp.

3.2. Quy trình huấn luyện mạng nơ ron

Quy trình huấn luyện bao gồm việc tối ưu hóa các siêu tham số và sử dụng các bộ dữ liệu mẫu để đánh giá hiệu suất của mô hình. Kỹ thuật grid search thường được áp dụng để tìm kiếm các tham số tối ưu.

IV. Kết quả nghiên cứu và ứng dụng thực tiễn

Nghiên cứu cho thấy rằng việc áp dụng mạng nơ ron tích chập (CNN) cho phân lớp dữ liệu chuỗi thời gian mang lại kết quả khả quan. Các thử nghiệm trên nhiều bộ dữ liệu cho thấy mô hình CNN vượt trội hơn so với các phương pháp truyền thống.

4.1. So sánh hiệu suất giữa các phương pháp

Kết quả thực nghiệm cho thấy mô hình 1D-CNN đạt độ chính xác cao hơn so với phương pháp k-NN và DTW. Điều này chứng tỏ sức mạnh của CNN trong việc phân lớp dữ liệu chuỗi thời gian.

4.2. Ứng dụng trong các lĩnh vực khác nhau

Mô hình CNN không chỉ áp dụng trong phân lớp chuỗi thời gian mà còn có thể được sử dụng trong nhiều lĩnh vực khác như nhận dạng mẫu và dự đoán xu hướng.

V. Kết luận và hướng phát triển tương lai

Phân lớp dữ liệu chuỗi thời gian bằng mạng nơ ron tích chập (CNN) đã mở ra nhiều cơ hội mới trong nghiên cứu và ứng dụng. Hướng phát triển tương lai có thể bao gồm việc cải thiện hiệu suất và giảm thời gian huấn luyện.

5.1. Tiềm năng nghiên cứu tiếp theo

Nghiên cứu có thể tiếp tục mở rộng để khám phá các kiến trúc mạng nơ ron mới và cải thiện độ chính xác trong phân lớp dữ liệu chuỗi thời gian.

5.2. Ứng dụng trong công nghiệp

Việc áp dụng CNN trong phân lớp dữ liệu chuỗi thời gian có thể mang lại lợi ích lớn cho các ngành công nghiệp như tài chính, y tế và sản xuất.

10/01/2025

Bạn đang xem trước tài liệu:

Luận văn thạc sĩ khoa học máy tính phân lớp dữ liệu chuỗi thời gian dựa vào mạng nơron tích chập cnn

Tải đầy đủ

Nội dung chính

Tổng quan nghiên cứu

Phân lớp dữ liệu chuỗi thời gian là một lĩnh vực nghiên cứu quan trọng trong khoa học máy tính, đặc biệt trong bối cảnh dữ liệu chuỗi thời gian ngày càng được thu thập rộng rãi từ nhiều thiết bị và ứng dụng như tài chính, y tế, dự báo thời tiết. Theo ước tính, có hàng trăm bộ dữ liệu chuỗi thời gian chuẩn được sử dụng để đánh giá các thuật toán phân lớp, trong đó các phương pháp truyền thống như 1-lân cận gần nhất (1-NN) kết hợp với độ đo xoắn thời gian động (DTW) được xem là tiêu chuẩn vàng. Mục tiêu của luận văn là đề xuất và đánh giá hiệu năng của mạng nơ ron tích chập một chiều (1D-CNN) trong phân lớp dữ liệu chuỗi thời gian, so sánh với hai phương pháp truyền thống là 1-NN + DTW và SAX kết hợp mô hình không gian vectơ (SAX-VSM). Nghiên cứu thực nghiệm trên 14 bộ dữ liệu mẫu từ kho dữ liệu UCR trong khoảng thời gian từ tháng 2 đến tháng 6 năm 2023 tại Đại học Bách Khoa, ĐHQG TP. Hồ Chí Minh. Kết quả cho thấy 1D-CNN đạt độ chính xác phân lớp vượt trội trên phần lớn các bộ dữ liệu, mặc dù thời gian huấn luyện cao hơn do việc tinh chỉnh siêu tham số bằng kỹ thuật grid search. Nghiên cứu có ý nghĩa quan trọng trong việc mở rộng ứng dụng học sâu cho bài toán phân lớp chuỗi thời gian, góp phần nâng cao hiệu quả khai phá dữ liệu trong nhiều lĩnh vực ứng dụng.

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Luận văn dựa trên các lý thuyết và mô hình sau:

Chuỗi thời gian (Time Series): Dữ liệu được biểu diễn dưới dạng chuỗi các điểm dữ liệu theo thứ tự thời gian, có thể là chuỗi thời gian đều hoặc không đều. Chuỗi thời gian thường bao gồm các thành phần xu hướng, chu kỳ, mùa vụ và nhiễu bất quy tắc.
Phân lớp dữ liệu (Classification): Quá trình xác định nhãn lớp cho mẫu dữ liệu dựa trên các thuộc tính đặc trưng. Các phương pháp truyền thống như k-lân cận gần nhất (k-NN), máy vectơ hỗ trợ (SVM), cây quyết định, mạng nơ ron đa tầng (MLP) được sử dụng phổ biến.
Độ đo khoảng cách: Độ đo Euclid và độ đo xoắn thời gian động (DTW) là hai phương pháp phổ biến để tính khoảng cách giữa các chuỗi thời gian, trong đó DTW cho phép so sánh chuỗi có độ dài khác nhau và có tính linh hoạt cao hơn.
Mạng nơ ron tích chập một chiều (1D-CNN): Mạng CNN được thiết kế để xử lý dữ liệu một chiều như chuỗi thời gian, với các tầng tích chập, gộp (pooling), và kết nối đầy đủ (dense). 1D-CNN có ưu điểm về độ phức tạp tính toán thấp, phù hợp cho các ứng dụng thời gian thực và chi phí thấp.
Hàm Softmax: Được sử dụng ở tầng cuối cùng của mạng để chuyển đổi đầu ra thành xác suất phân lớp.
Tinh chỉnh siêu tham số (Hyperparameter tuning) và Grid Search: Grid search được áp dụng để tìm bộ siêu tham số tối ưu cho mạng 1D-CNN, bao gồm số lượng bộ lọc, kích thước kernel, số lượng neuron ở lớp dense và tỷ lệ dropout.

Phương pháp nghiên cứu

Nguồn dữ liệu: 14 bộ dữ liệu chuỗi thời gian chuẩn từ kho dữ liệu UCR, bao gồm các bộ dữ liệu đa dạng về số lớp, kích thước mẫu và chiều dài chuỗi như ArrowHead, BeeFl, ECGFiveDays, Fish, CBF, Trace.
Phương pháp phân tích: Hiện thực và đánh giá mô hình 1D-CNN sử dụng thư viện Keras trên nền tảng Google Colab với cấu hình CPU Intel Xeon và GPU Tesla K80. So sánh với hai phương pháp truyền thống: 1-NN + DTW và SAX-VSM, hiện thực bằng thư viện Tslearn.
Quy trình thực nghiệm: Áp dụng kiểm tra chéo k-phần (k-fold cross-validation) với k=5 để đánh giá độ chính xác phân lớp. Thực hiện tinh chỉnh siêu tham số bằng grid search để tối ưu hiệu năng mạng 1D-CNN.
Timeline nghiên cứu: Từ tháng 2 đến tháng 6 năm 2023, hoàn thành việc thiết kế, hiện thực, tinh chỉnh và đánh giá mô hình.

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

Hiệu quả phân lớp của 1D-CNN vượt trội: Trên bộ dữ liệu ArrowHead, tỷ lệ lỗi phân lớp của 1D-CNN là 21.7%, thấp hơn so với 1-NN + DTW (29.7%) và SAX-VSM (70%). Tương tự, trên bộ dữ liệu BeeFl, 1D-CNN đạt tỷ lệ lỗi 10%, trong khi 1-NN + DTW và SAX-VSM lần lượt là 90% và cao hơn. Bộ dữ liệu ECGFiveDays cũng cho thấy 1D-CNN có tỷ lệ lỗi thấp nhất 7.9%, so với 23.2% của 1-NN + DTW và 11% của SAX-VSM.
Thời gian huấn luyện và phân lớp: Mặc dù 1D-CNN cho kết quả chính xác hơn, thời gian thực thi của phương pháp này cao hơn đáng kể so với hai phương pháp truyền thống, do việc huấn luyện mạng và tinh chỉnh siêu tham số bằng grid search. Ví dụ, trên bộ dữ liệu ArrowHead, thời gian phân lớp của 1D-CNN cao hơn khoảng 2-3 lần so với 1-NN + DTW và SAX-VSM.
Tính đa dạng của bộ dữ liệu: 14 bộ dữ liệu thực nghiệm có số lớp từ 2 đến 37, chiều dài chuỗi từ 24 đến 577 điểm, cho thấy tính ứng dụng rộng rãi của mô hình 1D-CNN trên nhiều dạng dữ liệu chuỗi thời gian khác nhau.
Tác động của siêu tham số: Việc tinh chỉnh các siêu tham số như số bộ lọc, kích thước kernel, số neuron dense và tỷ lệ dropout ảnh hưởng rõ rệt đến hiệu năng phân lớp, đòi hỏi quá trình grid search tốn thời gian nhưng cần thiết để đạt kết quả tối ưu.

Thảo luận kết quả

Nguyên nhân chính giúp 1D-CNN vượt trội là khả năng tự động trích xuất đặc trưng từ dữ liệu chuỗi thời gian, không phụ thuộc vào các phép đo khoảng cách thủ công như DTW hay các biến đổi đặc trưng như SAX. Mạng CNN tận dụng các bộ lọc tích chập để phát hiện các mẫu cục bộ và kết hợp nhiều tầng để nhận diện các đặc trưng phức tạp hơn, từ đó nâng cao độ chính xác phân lớp.

So sánh với các nghiên cứu trước đây, kết quả này phù hợp với xu hướng ứng dụng học sâu trong phân lớp chuỗi thời gian, đồng thời khẳng định tính hiệu quả của mạng 1D-CNN so với các phương pháp truyền thống. Tuy nhiên, thời gian huấn luyện cao hơn là một hạn chế cần được cân nhắc, đặc biệt trong các ứng dụng thời gian thực hoặc tài nguyên hạn chế.

Dữ liệu có thể được trình bày qua các biểu đồ tỷ lệ lỗi và thời gian thực thi trên từng bộ dữ liệu, giúp minh họa rõ ràng sự khác biệt hiệu năng giữa các phương pháp. Bảng tổng hợp tỷ lệ lỗi và thời gian cũng hỗ trợ đánh giá toàn diện.

Đề xuất và khuyến nghị

Tối ưu hóa cấu trúc mạng 1D-CNN: Đề xuất nghiên cứu thêm các kiến trúc mạng nhẹ hơn hoặc kỹ thuật pruning để giảm thời gian huấn luyện và phân lớp, hướng tới ứng dụng thời gian thực. Chủ thể thực hiện: nhóm nghiên cứu, thời gian 6-12 tháng.
Áp dụng kỹ thuật tăng cường dữ liệu (data augmentation): Sử dụng các phương pháp tăng cường dữ liệu chuỗi thời gian để cải thiện độ chính xác và khả năng tổng quát của mô hình, đặc biệt với các bộ dữ liệu nhỏ. Chủ thể thực hiện: nhà phát triển mô hình, thời gian 3-6 tháng.
Kết hợp mạng 1D-CNN với các mô hình học sâu khác: Nghiên cứu tích hợp mạng LSTM hoặc Transformer để khai thác thêm thông tin tuần tự và ngữ cảnh trong chuỗi thời gian, nâng cao hiệu quả phân lớp. Chủ thể thực hiện: nhóm nghiên cứu, thời gian 12 tháng.
Phát triển công cụ tự động tinh chỉnh siêu tham số: Áp dụng các thuật toán tối ưu hóa như Bayesian optimization thay cho grid search để giảm chi phí tính toán trong quá trình tinh chỉnh siêu tham số. Chủ thể thực hiện: nhà phát triển phần mềm, thời gian 6 tháng.

Đối tượng nên tham khảo luận văn

Nhà nghiên cứu và sinh viên ngành khoa học máy tính: Có thể áp dụng kiến thức và phương pháp 1D-CNN để phát triển các bài toán phân lớp chuỗi thời gian trong học máy và học sâu.
Chuyên gia phân tích dữ liệu và kỹ sư dữ liệu: Sử dụng mô hình và kết quả nghiên cứu để cải thiện các hệ thống phân tích dữ liệu chuỗi thời gian trong tài chính, y tế, công nghiệp.
Nhà phát triển phần mềm và ứng dụng AI: Tham khảo cấu trúc mạng và kỹ thuật tinh chỉnh siêu tham số để xây dựng các ứng dụng phân lớp chuỗi thời gian hiệu quả, đặc biệt trong các hệ thống thời gian thực.
Các tổ chức nghiên cứu và doanh nghiệp: Áp dụng mô hình 1D-CNN để nâng cao chất lượng phân tích dữ liệu chuỗi thời gian, từ đó hỗ trợ ra quyết định chính xác hơn trong các lĩnh vực như dự báo, giám sát thiết bị, nhận dạng mẫu.

Câu hỏi thường gặp

Mạng 1D-CNN có ưu điểm gì so với các phương pháp truyền thống?
1D-CNN tự động trích xuất đặc trưng từ dữ liệu chuỗi thời gian, giúp nâng cao độ chính xác phân lớp so với các phương pháp dựa trên khoảng cách như 1-NN + DTW. Ví dụ, trên bộ dữ liệu ECGFiveDays, 1D-CNN giảm tỷ lệ lỗi từ 23.2% xuống còn 7.9%.
Tại sao thời gian huấn luyện của 1D-CNN lại cao hơn?
Do mạng 1D-CNN có nhiều tham số cần huấn luyện và việc tinh chỉnh siêu tham số bằng grid search là quá trình tốn thời gian. Điều này là điểm hạn chế khi áp dụng trong môi trường tài nguyên hạn chế.
Grid search là gì và tại sao cần thiết?
Grid search là phương pháp tìm kiếm vét cạn các tổ hợp siêu tham số để chọn bộ tham số tối ưu cho mô hình. Nó giúp cải thiện hiệu năng phân lớp nhưng gây tốn kém về thời gian tính toán.
Các bộ dữ liệu thực nghiệm có đặc điểm như thế nào?
Các bộ dữ liệu có số lớp từ 2 đến 37, chiều dài chuỗi từ 24 đến 577 điểm, bao gồm dữ liệu hình ảnh, tín hiệu ECG, hình dạng cá, mô phỏng thiết bị công nghiệp, thể hiện tính đa dạng và thực tế của bài toán.
Có thể áp dụng mô hình này cho các ứng dụng thời gian thực không?
Mô hình 1D-CNN có độ phức tạp thấp hơn so với 2D-CNN và có thể chạy trên CPU, tuy nhiên cần tối ưu thêm về cấu trúc mạng và giảm thời gian huấn luyện để phù hợp với các ứng dụng thời gian thực.

Kết luận

Mạng nơ ron tích chập một chiều (1D-CNN) được đề xuất và hiện thực thành công cho bài toán phân lớp dữ liệu chuỗi thời gian.
Thực nghiệm trên 14 bộ dữ liệu chuẩn cho thấy 1D-CNN đạt độ chính xác phân lớp vượt trội so với phương pháp 1-NN + DTW và SAX-VSM.
Thời gian huấn luyện và phân lớp của 1D-CNN cao hơn do việc tinh chỉnh siêu tham số bằng grid search.
Nghiên cứu góp phần mở rộng ứng dụng học sâu trong phân lớp chuỗi thời gian, có ý nghĩa thực tiễn trong nhiều lĩnh vực.
Các bước tiếp theo bao gồm tối ưu cấu trúc mạng, áp dụng kỹ thuật tăng cường dữ liệu và phát triển công cụ tự động tinh chỉnh siêu tham số để nâng cao hiệu quả và tính ứng dụng của mô hình.

Để tiếp tục nghiên cứu và ứng dụng, độc giả và nhà nghiên cứu được khuyến khích tham khảo chi tiết luận văn và triển khai các đề xuất nhằm phát triển các giải pháp phân lớp chuỗi thời gian hiệu quả hơn.

Trích đoạn nội dung tài liệu

CHƯƠNG 1. GIỚI THIỆU ĐỀ TÀI .1 Động cơ nghiên cứu.2 Mục tiêu và phạm vi nghiên cứu .3 Những kết quả đạt được của luận văn.4 Cấu trúc của luận văn .1 Chuỗi thời gian .2 Phân lớp dữ liệu .1 Khái niệm phân lớp dữ liệu .2 Phương pháp phân lớp k lân cận gần nhất (k-NN) .2 Độ đo xoắn thời gian động .4 Mạng nơron đa tầng (MLP) .6 Mạng nơ ron tích chập (CNN) .8 Tinh chỉnh các siêu tham số và giải thuật Grid Search .9 Chuẩn hóa dữ liệu. CÁC CÔNG TRÌNH LIÊN QUAN .1 Phân lớp chuỗi thời gian dựa vào shapelet .2 Phân lớp chuỗi thời gian bằng phương pháp SAX-VSM .3 Phân lớp chuỗi thời gian bằng mạng nơ ron tích chập FCN .4 Mạng nơ ron tích chập một chiều. PHƯƠNG PHÁP PHÂN LỚP ĐỀ XUẤT.1 Phương pháp tiếp cận .2 Ứng dụng kỹ thuật grid search.3 Các bộ dữ liệu thực nghiệm .4 Thư viện phần mềm hỗ trợ .5 Cách đánh giá chất lượng phương pháp phân lớp.

THỰC NGHIỆM ĐÁNH GIÁ .1 Cấu hình hệ thống sử dụng trong thực nghiệm .2 Các phương pháp đối sánh và các bộ dữ liệu thực nghiệm .1 Các phương pháp đối sánh cho công tác phân lớp dữ liệu chuỗi thời gian .2 Các bộ dữ liệu thực nghiệm .3 Bộ dữ liệu nhịp tim ECGFiveDays .4 Bộ dữ liệu Fish .5 Bộ dữ liệu CBF .6 Bộ dữ liệu Trace .3 Giá trị siêu tham số cho các bộ dữ liệu thực nghiệm .4 Kết quả thực nghiệm của ba bộ dữ liệu ArrowHead, BeeFl và ECGFiveDays .1 Kết quả thực nghiệm của bộ dữ liệu ArrowHead .2 Kết quả thực nghiệm của bộ dữ liệu BeeFl .3 Kết quả thực nghiệm của bộ dữ liệu ECGFiveDays .5 Kết quả tổng hợp tỷ lệ lỗi của các bộ dữ liệu thực nghiệm .6 Kết quả tổng hợp thời gian thực thi của các bộ dữ liệu thực nghiệm .1 Kết quả đạt được của luận văn.2 Hướng phát triển trong tương lai. 42 TÀI LIỆU THAM KHẢO. 50 viii DANH MỤC HÌNH Hình 2.1: Chuỗi thời gian giá cổ phiếu của một công ty .2: Minh hoạ giải thuật k-NN .3: So sánh độ đo DTW với độ đo Euclid .4: Mạng nơ ron đa tầng truyền thẳng .5: Sự khác biệt giữa mô hình học sâu và mô hình không sâu .6: Mạng nơ ron tích chập .7 : Mô hình hồi quy softmax dưới dạng mạng nơ ron .8 : Ví dụ về grid search .1: Tổng quan về thuật toán SAX-VSM .2 : Kiến trúc mạng tích chập FCN để phân lớp chuỗi thời gian ([3]) .3 : Kiến trúc mẫu của mạng nơ ron tích chập một chiều (1D CNN) với 3 tầng CNN và 2 tầng MLP .4 : Sơ đồ tính toán mạng nơ ron tích chập một chiều (1D CNN) .1: Kiểm tra chéo k-phần với k = 4 .1: Một số hình minh họa bộ dữ liệu ArrowHead .2 : Một số hình minh họa bộ dữ liệu BeeFl .3: Một số hình minh họa bộ dữ liệu ECGFiveDays .4: Hình chụp của một con cá và biểu diễn thành chuỗi thời gian [25] 32 Hình 5.5: Biểu diễn ba lớp của dữ liệu CBF.6: Ví dụ về bốn nhóm lớp của bộ dữ liệu Trace .7 : Tỉ lệ lỗi phân lớp trên bộ dữ liệu ArrowHead .8 : Thời gian phân lớp trên bộ dữ liệu ArrowHead .9 : Tỉ lệ lỗi phân lớp trên bộ dữ liệu BeeFl .10 : Thời gian phân lớp trên bộ dữ liệu BeeFl .11 : Tỉ lệ lỗi phân lớp trên bộ dữ liệu ECGFiveDays .12 : Thời gian phân lớp trên bộ dữ liệu ECGFiveDays .38 ix DANH MỤC BẢNG Bảng 4.1: Cấu hình dự kiến của mạng 1D-CNN .1: Ký hiệu các bộ dữ liệu .2: Thông tin các bộ dữ liệu sử dụng trong thực nghiệm .3 : Cấu hình siêu tham số mạng 1D-CNN cho từng bộ dữ liệu .4 : Tổng hợp tỷ lệ lỗi phân lớp trên bộ dữ liệu thực nghiệm .5: Tổng hợp thời gian phân lớp trên bộ dữ liệu thực nghiệm. GIỚI THIỆU ĐỀ TÀI 1.1 Động cơ nghiên cứu Ngày nay, việc phân tích, khai phá dữ liệu chuỗi thời gian (time series) mang lại nhiều lợi ích to lớn trong các lĩnh vực tài chính, y tế, dự báo thời tiết.

Một trong các phương pháp phân tích chuỗi thời gian là xây dựng một bộ phân lớp (classifier) trên một tập dữ liệu đã được gắn nhãn lớp, cho phép phân loại các dữ liệu chuỗi thời gian chưa biết lớp theo các lớp đã định trước. Một số phương pháp phân lớp truyền thống có thể kể đến như : cây quyết định, k- lân cận gần nhất,v. Năm 2013, Wang và các cộng sự [1] đã cho thấy giải thuật 1-lân cận gần nhất (1-NN) kết hợp với độ đo DTW là một cách tiếp cận hiệu quả và được xem là tiêu chuẩn vàng cho bài toán phân lớp chuỗi thời gian. Phương pháp phân lớp chuỗi thời gian dựa vào phép biến đổi SAX và mô hình không gian véc-tơ trong công trình của Senin và Malinchink [2] cũng đưa ra kết quả khả quan và thời gian thực thi tối ưu hơn.

Trong những năm gần đây, sự bùng nổ của học sâu (deep learning) đã tạo ra bước ngoặt mới trong lĩnh vực trí tuệ nhân tạo. Trong một công trình của Wang và các cộng sự (2016) [3], các tác giả đã đề xuất mô hình mạng nơ ron tích chập FCN (Fully Convolutional Network) để phân lớp dữ liệu chuỗi thời gian và so sánh phương pháp đề xuất với các thuật toán phân lớp truyền thống áp dụng trên các tập dữ liệu chuỗi thời gian khác nhau. Kết quả của thực nghiệm cho thấy phương pháp phân lớp dựa vào mạng FCN (Fully Convolutional Network) là một hướng tiếp cận khả quan mới, đạt kết quả phân lớp vượt trội trên một số tập dữ liệu. Theo xu hướng ấy, đề tài nghiên cứu áp dụng mạng nơ ron tích chập (CNN) vào việc phân lớp dữ liệu chuỗi thời gian và so sánh hiệu quả của phương pháp đề xuất với phương pháp k-lân cận gần nhất kết hợp độ đo xoắn thời gian động (DTW), phương pháp SAX kết hợp mô hình không gian vectơ.2 Mục tiêu và phạm vi nghiên cứu Chúng tôi thực hiện đề tài này để đánh giá hiệu năng khi áp dụng mạng nơ ron tích chập một chiều (1D-CNN) cho bài toán phân lớp chuỗi thời gian so với phương pháp truyền 1 thống 1-lân cận gần nhất (1-NN) kết hợp với độ đo DTW và phương pháp SAX kết hợp mô hình không gian vectơ.

Phương pháp đề xuất thực nghiệm trên nhiều tập chuỗi thời gian mẫu khác nhau. Đề tài đưa ra kết quả so sánh giữa các phương pháp, để làm rõ tiềm năng trong phương hướng tiếp cận mới cho bài toán phân lớp chuỗi thời gian.3 Những kết quả đạt được của luận văn Sau thời gian nghiên cứu và thực nghiệm, chúng tôi đạt được những kết quả sau : - Hiểu rõ về mô hình mạng nơ ron tích chập một chiều (1D-CNN). - Hiểu rõ phương pháp 1-lân cận gần nhất (1-NN) kết hợp với độ đo DTW. - Hiểu rõ phương pháp SAX kết hợp mô hình không gian vectơ.

- Hiện thực thành công 3 phương pháp trên lên 14 bộ dữ liệu chuỗi thời gian mẫu khác nhau từ website UCR. - So sánh độ chính xác phân lớp, kết quả thực nghiệm cho thấy việc áp dụng mạng nơ ron tích chập một chiều (1D-CNN) cho kết quả phân lớp chính xác tốt hơn so với 2 phương pháp truyền thống là 1-lân cận gần nhất (1-NN) kết hợp với độ đo DTW và phương pháp SAX kết hợp mô hình không gian vectơ trên phần lớp các bộ dữ liệu thực nghiệm. - So sánh thời gian phân lớp , kết quả thực nghiệm cho thấy với việc nâng cao độ chính xác phân lớp, việc áp dụng mạng nơ ron tích chập (CNN) cần nhiều thời gian hơn để huấn luyện mạng, đặc biệt trong việc áp dụng kỹ thuật grid search để tìm các siêu tham số phù hợp cho từng tập dữ liệu.4 Cấu trúc của luận văn Phần còn lại của luận văn này gồm các chương: Chương 2 giới thiệu các cơ sở lý thuyết của đề tài như chuỗi thời gian, phân lớp dữ liệu, các độ đo khoảng cách, mạng nơ ron đa tầng, học sâu, mạng nơ ron tích chập, hàm softmax, tinh chỉnh các siêu tham số, giải thuật Grid Search và chuẩn hóa dữ liệu. Chương 3 giới thiệu các công trình liên quan như phương pháp phân lớp chuỗi thời gian dựa vào shapelet, phương pháp phân lớp chuỗi thời gian SAX-VSM, phương pháp phân lớp chuỗi thời gian dựa vào mạng nơ ron tích chập FCN, và mạng nơ ron tích chập một chiều (1D CNN).

2 Chương 4 đề xuất phương pháp giải quyết vấn đề. Chương 5 trình bày kết quả thực nghiệm so sánh phương pháp đề xuất với hai phương pháp phân lớp chuỗi thời gian đối sánh. Chương 6 trình bày những kết quả đạt được của luận văn và hướng phát triển trong tương lai. Cuối cùng là thư mục tài liệu tham khảo và phụ lục A, phụ lục B, phụ lục C.

CƠ SỞ LÝ THUYẾT Chương này giới thiệu các cơ sở lý thuyết của đề tài như chuỗi thời gian, phân lớp dữ liệu, các độ đo khoảng cách, mạng nơ ron đa tầng, học sâu, mạng nơ ron tích chập, hàm softmax, tinh chỉnh các siêu tham số, giải thuật Grid Search và chuẩn hóa dữ liệu.1 Chuỗi thời gian Một chuỗi thời gian (time series) là một chuỗi các điểm dữ liệu có thứ tự, mỗi điểm biểu diễn một giá trị là số thực được đo tại những thời điểm cách đều nhau. Chuỗi thời gian được sử dụng trong xác suất thống kê, tài chính, nhận dạng mẫu, dự đoán thời tiết, v.v… và được sử dụng nhiều trong các lĩnh vực khoa học ứng dụng và kỹ thuật. Chuỗi thời gian thường được giả định là được sinh ra tại những thời điểm cách đều nhau, do đó được gọi là chuỗi thời gian thông thường (regular time series). Một chuỗi thời gian bất quy tắc (irregular time series) là một chuỗi các điểm dữ liệu có thứ tự nhưng không được đo tại các thời điểm cách đều nhau.

Có vô số cách thể hiện một chuỗi thời gian. Tuy nhiên, khi chúng ta quan sát chuỗi thời gian, chúng ta nhận thấy rằng dữ liệu chuỗi thời gian thường bao gồm bốn thành phần phổ biến đó là xu hướng (trend), chu kỳ (cyclical), mùa (seasonal) và bất quy tắc (irregular).1 minh họa đường biểu diễn của chuỗi thời gian giá cổ phiếu của một công ty.1: Chuỗi thời gian giá cổ phiếu của một công ty 4 2.2 Phân lớp dữ liệu 2.1 Khái niệm phân lớp dữ liệu Phân lớp dữ liệu là công tác xác định một mẫu dữ liệu thuộc vào lớp nào trong một tập các lớp thông qua việc phân tích các thuộc tính quan trọng của mẫu dữ liệu đó. Một số bộ phân lớp làm việc bằng cách so sánh khoảng cách giữa các mẫu với nhau.

Nội dung được bảo vệ bản quyền — Tải xuống đầy đủ

Bài luận văn thạc sĩ mang tiêu đề Luận Văn Thạc Sĩ Về Phân Lớp Dữ Liệu Chuỗi Thời Gian Sử Dụng Mạng Nơron Tích Chập CNN của tác giả Lý Minh Trí, dưới sự hướng dẫn của PGS.TS Dương Tuấn Anh và TS. Nguyễn Đức Dũng, được thực hiện tại Đại học Bách Khoa - ĐHQG TP. Hồ Chí Minh vào năm 2023. Bài viết tập trung vào việc áp dụng mạng nơron tích chập (CNN) để phân lớp dữ liệu chuỗi thời gian, một lĩnh vực đang thu hút nhiều sự quan tâm trong khoa học máy tính. Nội dung nghiên cứu không chỉ cung cấp cái nhìn sâu sắc về các kỹ thuật phân lớp hiện đại mà còn mở ra hướng đi mới cho các ứng dụng trong thực tiễn.

Nếu bạn muốn tìm hiểu thêm về các ứng dụng và nghiên cứu liên quan trong lĩnh vực khoa học máy tính, hãy tham khảo các bài viết sau đây: Luận văn về tâm lý học mạng xã hội và ảnh hưởng đến người lớn, nơi nghiên cứu về tác động của mạng xã hội đến hành vi con người, hay Luận văn thạc sĩ về nhận dạng mô típ trong dữ liệu chuỗi thời gian hình ảnh, một nghiên cứu chuyên sâu về nhận diện mô típ trong dữ liệu hình ảnh. Cuối cùng, bạn cũng có thể tham khảo Nghiên cứu thuật toán mã hóa có xác thực Norx trong luận văn thạc sĩ, nơi khám phá các thuật toán mã hóa và ứng dụng của chúng trong bảo mật thông tin. Những bài viết này sẽ giúp bạn mở rộng hiểu biết về các công nghệ và phương pháp hiện đại trong lĩnh vực khoa học máy tính.

#Phân tích dữ liệu

#chuỗi thời gian

#phân lớp dữ liệu

#mạng nơron tích chập

#dự đoán chuỗi thời gian

Chủ đề

Khoa học Dữ liệu

Phân tích dữ liệu lớn

Công nghệ học máy

Mạng nơron và ứng dụng