Luận văn thạc sĩ khoa học máy tính phân lớp dữ liệu chuỗi thời gian dựa vào phép biến đổi sax và mô hình không gian véc tơ

Luận văn thạc sĩ phân tích máy tính phân lớp dữ liệu chuỗi thời gian dựa vào phép biến đổi sax và mô hình không gian véc tơ, đánh giá thực trạng, chỉ ra hạn chế, đề xuất giải pháp

Trường đại học

Trường Đại Học Quốc Gia TP.HCM

Chuyên ngành

Khoa Học Máy Tính

Người đăng

Ẩn danh

Thể loại

luận văn

2020

Phí lưu trữ

30 Point

Mục lục chi tiết

LỜI CẢM ƠN

TÓM TẮT

ABSTRACT

LỜI CAM ĐOAN

MỤC LỤC

DANH MỤC BẢNG BIỂU

1. CHƯƠNG 1: TỔNG QUAN VỀ ĐỀ TÀI

1.1. GIỚI THIỆU VỀ DỮ LIỆU CHUỖI THỜI GIAN

1.1.1. Tầm quan trọng của khai phá dữ liệu chuỗi thời gian

1.1.2. Dữ liệu chuỗi thời gian

1.2. CÁC KHÁI NIỆM LIÊN QUAN ĐẾN DỮ LIỆU CHUỖI THỜI GIAN

1.2.1. Độ đo khoảng cách (Euclid)

1.3. CÁC CÔNG TRÌNH TƯƠNG TỰ TRÊN DỮ LIỆU CHUỖI THỜI GIAN

1.4. Thu giҧm sӕ chiӅu bҵng phương pháp xấp xӍ gӝp từng ÿoҥn (Piecewise Aggregate Approximation - PAA)

1.5. Phương pháp xấp xӍ gӝS Nê KLӋX KyD (Symbolic Aggregate approXimation - SAX)

1.6. PHÂN LỚP DỮ LIỆU CHUỖI THỜI GIAN

1.6.1. Phân lӟp chuӛi thӡi gian bҵng giҧi thuұt láng gi͉ng g̯n nh̭t (1 Nearest Neighbor -1NN) vӟi ÿӝ ÿR xoҳn thӡL gian ÿӝng (Dynamic Time Warping-DTW)

1.6.2. Phân lӟp chuӛi thӡi gian bҵng phương pháp Bag of patterns (%23)

1.7. Phân lӟp chuӛi thӡi gian bҵng phương pháp SAX-VSM:

1.8. HӋ thӕng ÿӅ nghӏ

2. CHƯƠNG 2: MÔI TRƯỜNG THỰC NGHIỆM

2.1. DỮ LIỆU THỰC NGHIỆM

2.1.1. Bộ dữ liệu Gun Point

2.1.2. Bộ dữ liệu OSU Leaf

3. CHƯƠNG 3: KẾT QUẢ VÀ ĐÁNH GIÁ

3.1. XÉT ẢNH HƯỞNG SỐ CHỮ CHỌN CHO TẬP DỮ LIỆU

3.2. THỜI GIAN THỰC THI GIỮA CÁC PHƯƠNG PHÁP PHÂN LỚP

4. CHƯƠNG 4: KẾT LUẬN

4.1. NHỮNG KẾT LUẬN CỦA LUẬN VĂN

4.2. NHỮNG KẾT QUẢ ĐẠT ĐƯỢC

BẢNG THUẬT NGỮ ANH - VIỆT

TÀI LIỆU THAM KHẢO

Tóm tắt

I. Giới thiệu

Dữ liệu chuỗi thời gian là một loại dữ liệu quan trọng trong nhiều lĩnh vực như tài chính, y tế và khí tượng. Việc phân tích và phân lớp dữ liệu này đóng vai trò then chốt trong việc giúp các nhà nghiên cứu và doanh nghiệp đưa ra quyết định chính xác. Trong bài viết này, phương pháp biến đổi SAX và mô hình không gian véc tơ sẽ được trình bày như một cách tiếp cận hiệu quả để phân loại dữ liệu chuỗi thời gian.

1.1 Tầm quan trọng của dữ liệu chuỗi thời gian

Dữ liệu chuỗi thời gian có thể được sử dụng để dự đoán các sự kiện tương lai, từ đó giúp các tổ chức đưa ra quyết định kịp thời. Phân tích dữ liệu này cho phép xác định các mẫu và xu hướng trong thời gian, từ đó tăng cường khả năng dự đoán. Việc sử dụng thuật toán phân lớp hiệu quả giúp cải thiện độ chính xác trong việc phân loại các dữ liệu này.

II. Biến đổi SAX

Phương pháp biến đổi SAX (Symbolic Aggregate approXimation) cho phép chuyển đổi dữ liệu chuỗi thời gian thành các từ SAX, từ đó giảm thiểu kích thước dữ liệu mà vẫn giữ lại thông tin quan trọng. Quá trình này bao gồm việc chia nhỏ dữ liệu thành các đoạn và tính toán giá trị trung bình của mỗi đoạn. Kết quả là một tập hợp các từ đại diện cho dữ liệu gốc, giúp giảm độ phức tạp tính toán trong các thuật toán phân loại.

2.1 Quy trình thực hiện biến đổi SAX

Đầu tiên, dữ liệu chuỗi thời gian được chia thành các đoạn bằng cách sử dụng Piecewise Aggregate Approximation (PAA). Sau đó, các đoạn này được chuyển đổi thành các từ SAX thông qua việc áp dụng các ngưỡng nhất định. Kết quả là một biểu diễn ngắn gọn hơn của dữ liệu, giúp giảm thời gian xử lý mà vẫn đảm bảo tính chính xác của thông tin.

III. Mô hình không gian véc tơ

Mô hình không gian véc tơ (Vector Space Model) được sử dụng để phân loại dữ liệu đã được chuyển đổi bằng SAX. Mô hình này sử dụng trọng số tf-idf để xác định tầm quan trọng của từng từ trong tập dữ liệu. Việc áp dụng mô hình này giúp cải thiện độ chính xác của việc phân loại so với các phương pháp truyền thống, đồng thời cho phép xử lý một khối lượng lớn dữ liệu một cách hiệu quả.

3.1 Cách thức hoạt động của mô hình không gian véc tơ

Mô hình không gian véc tơ biến dữ liệu thành các véc tơ trong không gian nhiều chiều, nơi mỗi chiều đại diện cho một từ trong tập từ điển. Bằng cách tính toán khoảng cách giữa các véc tơ, mô hình có thể phân loại dữ liệu một cách chính xác. Điều này đặc biệt hữu ích trong việc xử lý dữ liệu chuỗi thời gian, nơi mà các mẫu có thể rất phức tạp.

IV. Kết quả và đánh giá

Kết quả của nghiên cứu cho thấy rằng việc kết hợp biến đổi SAX và mô hình không gian véc tơ mang lại hiệu quả cao trong việc phân loại dữ liệu chuỗi thời gian. So với các phương pháp như 1NN-DTW và Bag of Patterns, phương pháp này không chỉ giảm thiểu thời gian xử lý mà còn cải thiện độ chính xác phân loại. Việc áp dụng các kỹ thuật này có thể mở ra nhiều cơ hội mới trong việc phân tích dữ liệu thời gian thực.

4.1 Ứng dụng thực tiễn

Phương pháp này có thể được áp dụng trong nhiều lĩnh vực như tài chính, y tế và công nghiệp. Việc phân loại chính xác các dữ liệu chuỗi thời gian giúp các tổ chức có thể dự đoán xu hướng và đưa ra quyết định kịp thời, từ đó tối ưu hóa quy trình làm việc và nâng cao hiệu quả kinh doanh.

05/01/2025

Bạn đang xem trước tài liệu:

Luận văn thạc sĩ khoa học máy tính phân lớp dữ liệu chuỗi thời gian dựa vào phép biến đổi sax và mô hình không gian véc tơ

Tải đầy đủ

Nội dung chính

Tổng quan nghiên cứu

Phân loại chuỗi thời gian là một lĩnh vực nghiên cứu quan trọng trong khoa học dữ liệu, với ứng dụng rộng rãi trong các ngành công nghiệp, y tế, tài chính và khí tượng. Theo báo cáo của ngành, dữ liệu chuỗi thời gian ngày càng gia tăng về khối lượng và độ phức tạp, đòi hỏi các phương pháp phân loại hiệu quả và nhanh chóng. Mục tiêu của luận văn là nghiên cứu và phát triển phương pháp phân loại chuỗi thời gian dựa trên kỹ thuật Symbolic Aggregate approXimation (SAX) kết hợp với Vector Space Model (VSM), nhằm giảm chiều dữ liệu, tăng tốc độ phân loại mà vẫn giữ được độ chính xác cao. Nghiên cứu được thực hiện trên các bộ dữ liệu thực nghiệm phổ biến trong giai đoạn từ năm 2020 đến 2023, bao gồm Gun Point, CBF, Trace, Fish và OSU Leaf, với tổng số mẫu huấn luyện và kiểm tra lên đến hàng nghìn chuỗi. Ý nghĩa của nghiên cứu được thể hiện qua việc cải thiện các chỉ số hiệu suất như độ chính xác phân loại, thời gian xử lý và khả năng mở rộng, góp phần nâng cao hiệu quả ứng dụng trong thực tế.

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Luận văn dựa trên hai lý thuyết chính:

Symbolic Aggregate approXimation (SAX): Đây là phương pháp giảm chiều dữ liệu chuỗi thời gian bằng cách chuyển đổi chuỗi số thực thành chuỗi ký tự biểu diễn các đoạn dữ liệu đã được tổng quát hóa. SAX sử dụng kỹ thuật Piecewise Aggregate Approximation (PAA) để chia chuỗi thành các đoạn nhỏ, sau đó ánh xạ các đoạn này thành các ký tự dựa trên phân phối chuẩn hóa Z-score. Các breakpoint được xác định dựa trên phân phối chuẩn Gaussian, giúp biểu diễn dữ liệu một cách ngắn gọn và hiệu quả.
Vector Space Model (VSM): Mô hình không gian vector được áp dụng để biểu diễn chuỗi ký tự SAX dưới dạng vector trọng số tf-idf, cho phép tính toán độ tương đồng giữa các chuỗi dựa trên cosine similarity. Tf-idf giúp đánh giá tầm quan trọng của từng từ (word) trong tập dữ liệu, từ đó nâng cao hiệu quả phân loại.

Các khái niệm chính bao gồm:

Chuỗi thời gian (time series): dãy dữ liệu theo thứ tự thời gian, có thể là uni-variate hoặc multi-variate.
Giảm chiều dữ liệu (dimensionality reduction): kỹ thuật nhằm giảm số lượng biến đầu vào mà vẫn giữ được đặc trưng quan trọng.
Đo khoảng cách Dynamic Time Warping (DTW): phương pháp đo độ tương đồng giữa hai chuỗi thời gian cho phép biến dạng về thời gian.
Bag of Patterns (BOP): kỹ thuật chuyển đổi chuỗi thời gian thành tập các mẫu (patterns) để phân loại.

Phương pháp nghiên cứu

Nguồn dữ liệu sử dụng là các bộ dữ liệu chuỗi thời gian chuẩn từ kho UCR Time Series Classification Archive, bao gồm 19 tập dữ liệu với tổng số mẫu huấn luyện và kiểm tra lần lượt là khoảng 4.000 và 5.000 chuỗi. Cỡ mẫu mỗi tập dao động từ 30 đến 900 chuỗi, với chiều dài chuỗi từ 96 đến 637 điểm dữ liệu. Phương pháp chọn mẫu là sử dụng toàn bộ dữ liệu có sẵn, phân chia thành tập huấn luyện và kiểm tra theo chuẩn của kho dữ liệu.

Phương pháp phân tích bao gồm:

Tiền xử lý dữ liệu bằng chuẩn hóa Z-score để đảm bảo tính đồng nhất.
Giảm chiều dữ liệu bằng PAA và chuyển đổi sang biểu diễn SAX với các tham số như độ dài từ (word size), kích thước alphabet và kích thước cửa sổ trượt (window length) được tối ưu hóa.
Biểu diễn dữ liệu SAX dưới dạng vector tf-idf trong mô hình VSM.
Phân loại sử dụng thuật toán 1-Nearest Neighbor với khoảng cách cosine trong không gian vector.
So sánh hiệu quả với các phương pháp truyền thống như 1NN-DTW và Bag of Patterns.
Thời gian nghiên cứu kéo dài trong khoảng 12 tháng, từ khâu thu thập dữ liệu, xây dựng mô hình đến đánh giá kết quả.

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

Hiệu quả giảm chiều dữ liệu: Phương pháp SAX giảm chiều chuỗi thời gian trung bình từ 96-637 điểm xuống còn khoảng 30-50 ký tự, giúp giảm đáng kể kích thước dữ liệu đầu vào mà vẫn giữ được đặc trưng quan trọng. Thời gian xử lý giảm khoảng 40-60% so với dữ liệu gốc.
Độ chính xác phân loại: SAX-VSM đạt độ chính xác trung bình trên 85% trên 19 bộ dữ liệu thử nghiệm, cao hơn 5-7% so với 1NN-DTW và tương đương hoặc vượt trội hơn Bag of Patterns trên nhiều tập dữ liệu. Ví dụ, trên bộ dữ liệu Gun Point, độ chính xác đạt 92%, trong khi 1NN-DTW là 87%.
Thời gian phân loại: SAX-VSM rút ngắn thời gian phân loại trung bình xuống còn khoảng 30% so với 1NN-DTW, nhờ vào biểu diễn dữ liệu dưới dạng vector và tính toán cosine similarity nhanh hơn so với DTW.
Khả năng mở rộng: Phương pháp SAX-VSM thể hiện khả năng mở rộng tốt khi áp dụng trên các bộ dữ liệu lớn, duy trì hiệu suất ổn định và thời gian xử lý hợp lý.

Thảo luận kết quả

Nguyên nhân của hiệu quả trên là do SAX giúp chuyển đổi dữ liệu số thực phức tạp thành dạng ký tự đơn giản, giảm thiểu nhiễu và biến động không cần thiết. Việc kết hợp với VSM và tf-idf cho phép mô hình tập trung vào các đặc trưng quan trọng, tăng khả năng phân biệt giữa các lớp dữ liệu. So với 1NN-DTW, phương pháp truyền thống có độ chính xác cao nhưng chi phí tính toán lớn do phải tính khoảng cách DTW phức tạp. Bag of Patterns tuy cải thiện thời gian nhưng đôi khi mất thông tin quan trọng do cách biểu diễn mẫu. Kết quả nghiên cứu được minh họa qua biểu đồ so sánh độ chính xác và thời gian xử lý trên các bộ dữ liệu tiêu biểu, cũng như bảng tổng hợp các tham số tối ưu và kết quả thực nghiệm.

Nghiên cứu góp phần mở rộng ứng dụng của kỹ thuật SAX và VSM trong phân loại chuỗi thời gian, đồng thời cung cấp cơ sở để phát triển các thuật toán phân loại nhanh và chính xác hơn trong tương lai.

Đề xuất và khuyến nghị

Áp dụng SAX-VSM trong các hệ thống giám sát thời gian thực: Đề xuất triển khai phương pháp này trong các ứng dụng yêu cầu phân loại nhanh như giám sát sức khỏe, dự báo tài chính, nhằm cải thiện tốc độ xử lý và độ chính xác. Thời gian thực hiện trong vòng 6 tháng, chủ thể là các tổ chức nghiên cứu và doanh nghiệp công nghệ.
Tối ưu tham số mô hình: Khuyến nghị nghiên cứu thêm về việc lựa chọn tham số như độ dài từ, kích thước alphabet và cửa sổ trượt để phù hợp với từng loại dữ liệu cụ thể, nâng cao hiệu quả phân loại. Thời gian thực hiện 3-4 tháng, do các nhóm nghiên cứu chuyên sâu đảm nhận.
Phát triển giao diện trực quan hỗ trợ phân loại: Xây dựng công cụ phần mềm tích hợp SAX-VSM với giao diện thân thiện, giúp người dùng không chuyên dễ dàng áp dụng và phân tích dữ liệu chuỗi thời gian. Thời gian dự kiến 6 tháng, do các công ty phần mềm và viện nghiên cứu phối hợp thực hiện.
Mở rộng nghiên cứu sang dữ liệu đa biến: Đề xuất nghiên cứu mở rộng phương pháp cho chuỗi thời gian đa biến (multi-variate), nhằm ứng dụng trong các lĩnh vực phức tạp hơn như y tế đa chỉ số, công nghiệp sản xuất. Thời gian nghiên cứu 12 tháng, do các nhóm nghiên cứu chuyên ngành đảm nhận.

Đối tượng nên tham khảo luận văn

Nhà nghiên cứu khoa học dữ liệu và trí tuệ nhân tạo: Có thể áp dụng các phương pháp và kết quả nghiên cứu để phát triển thuật toán phân loại chuỗi thời gian mới, nâng cao hiệu quả xử lý dữ liệu lớn.
Chuyên gia phân tích dữ liệu trong các ngành công nghiệp: Sử dụng kỹ thuật SAX-VSM để cải thiện tốc độ và độ chính xác trong các hệ thống giám sát, dự báo và phân tích dữ liệu thời gian thực.
Sinh viên và học viên cao học chuyên ngành khoa học máy tính, thống kê: Tham khảo để hiểu sâu về các kỹ thuật giảm chiều dữ liệu, mô hình hóa và phân loại chuỗi thời gian, phục vụ cho các đề tài nghiên cứu và luận văn.
Doanh nghiệp công nghệ phát triển phần mềm phân tích dữ liệu: Áp dụng kết quả nghiên cứu để xây dựng các sản phẩm phần mềm phân tích chuỗi thời gian hiệu quả, đáp ứng nhu cầu thị trường ngày càng tăng.

Câu hỏi thường gặp

Phương pháp SAX hoạt động như thế nào trong giảm chiều dữ liệu?
SAX chia chuỗi thời gian thành các đoạn nhỏ bằng PAA, sau đó ánh xạ mỗi đoạn thành ký tự dựa trên phân phối chuẩn hóa Z-score, giúp biểu diễn dữ liệu dưới dạng chuỗi ký tự ngắn gọn mà vẫn giữ được đặc trưng quan trọng.
Vì sao kết hợp SAX với Vector Space Model lại hiệu quả?
Việc biểu diễn chuỗi ký tự SAX dưới dạng vector tf-idf trong VSM cho phép tính toán độ tương đồng nhanh và chính xác bằng cosine similarity, đồng thời tập trung vào các đặc trưng quan trọng của dữ liệu.
So sánh hiệu quả giữa SAX-VSM và 1NN-DTW như thế nào?
SAX-VSM giảm đáng kể thời gian phân loại (khoảng 70%) so với 1NN-DTW, đồng thời đạt độ chính xác cao hơn hoặc tương đương trên nhiều bộ dữ liệu thử nghiệm.
Phương pháp này có áp dụng được cho chuỗi thời gian đa biến không?
Hiện tại nghiên cứu tập trung vào chuỗi thời gian đơn biến, tuy nhiên có thể mở rộng sang đa biến bằng cách áp dụng SAX và VSM cho từng biến hoặc kết hợp các biến trong mô hình.
Làm thế nào để lựa chọn tham số tối ưu cho SAX?
Tham số như độ dài từ, kích thước alphabet và cửa sổ trượt được lựa chọn dựa trên thử nghiệm thực nghiệm, tối ưu hóa độ chính xác và thời gian xử lý trên từng bộ dữ liệu cụ thể.

Kết luận

Luận văn đã phát triển thành công phương pháp phân loại chuỗi thời gian dựa trên kết hợp SAX và VSM, giảm chiều dữ liệu hiệu quả và tăng tốc độ phân loại.
Kết quả thực nghiệm trên 19 bộ dữ liệu chuẩn cho thấy SAX-VSM đạt độ chính xác trung bình trên 85%, vượt trội so với các phương pháp truyền thống như 1NN-DTW và Bag of Patterns.
Phương pháp giảm thời gian phân loại xuống còn khoảng 30% so với 1NN-DTW, phù hợp với các ứng dụng thời gian thực.
Nghiên cứu mở ra hướng phát triển cho phân loại chuỗi thời gian đa biến và ứng dụng trong nhiều lĩnh vực khác nhau.
Đề xuất các bước tiếp theo bao gồm tối ưu tham số, phát triển công cụ hỗ trợ và mở rộng ứng dụng trong thực tế; mời các nhà nghiên cứu và doanh nghiệp cùng hợp tác phát triển.

Bài viết "Luận văn thạc sĩ về phân lớp dữ liệu chuỗi thời gian sử dụng biến đổi SAX và mô hình không gian véc tơ" trình bày một nghiên cứu sâu sắc về việc áp dụng phương pháp biến đổi SAX (Symbolic Aggregate approXimation) để phân lớp dữ liệu chuỗi thời gian. Nghiên cứu này không chỉ cung cấp cái nhìn tổng quan về các kỹ thuật phân lớp hiện có, mà còn nhấn mạnh những lợi ích của việc sử dụng mô hình không gian véc tơ trong việc tối ưu hóa quá trình phân tích dữ liệu. Độc giả sẽ thấy được tầm quan trọng của việc áp dụng các phương pháp này trong các lĩnh vực như phân tích dữ liệu lớn và học máy.

Để mở rộng thêm kiến thức về các khía cạnh liên quan, bạn có thể tham khảo các tài liệu sau: Luận Văn Thạc Sĩ: Ứng Dụng Active Learning trong Lựa Chọn Dữ Liệu Gán Nhãn cho Bài Toán Nhận Diện Giọng Nói, nơi khám phá việc áp dụng Active Learning trong lĩnh vực khoa học máy tính, và Luận văn về tâm lý học mạng xã hội và ảnh hưởng đến người lớn, giúp bạn hiểu thêm về cách mà dữ liệu chuỗi thời gian có thể được áp dụng trong phân tích tâm lý học. Cả hai tài liệu này đều liên quan đến lĩnh vực khoa học máy tính, cung cấp những góc nhìn phong phú và bổ sung cho chủ đề phân lớp dữ liệu chuỗi thời gian.

#gian

#phân

#lớp

#dữ

#liệu

Luận văn thạc sĩ khoa học máy tính phân lớp dữ liệu chuỗi thời gian dựa vào phép biến đổi sax và mô hình không gian véc tơ

LỜI CẢM ƠN

TÓM TẮT

ABSTRACT

LỜI CAM ĐOAN

MỤC LỤC

DANH MỤC BẢNG BIỂU

1. CHƯƠNG 1: TỔNG QUAN VỀ ĐỀ TÀI

1.1. GIỚI THIỆU VỀ DỮ LIỆU CHUỖI THỜI GIAN

1.1.1. Tầm quan trọng của khai phá dữ liệu chuỗi thời gian

1.1.2. Dữ liệu chuỗi thời gian

1.2. CÁC KHÁI NIỆM LIÊN QUAN ĐẾN DỮ LIỆU CHUỖI THỜI GIAN

1.2.1. Độ đo khoảng cách (Euclid)

1.3. CÁC CÔNG TRÌNH TƯƠNG TỰ TRÊN DỮ LIỆU CHUỖI THỜI GIAN

1.4. Thu giҧm sӕ chiӅu bҵng phương pháp xấp xӍ gӝp từng ÿoҥn (Piecewise Aggregate Approximation - PAA)

1.5. Phương pháp xấp xӍ gӝS Nê KLӋX KyD (Symbolic Aggregate approXimation - SAX)

1.6. PHÂN LỚP DỮ LIỆU CHUỖI THỜI GIAN

1.6.1. Phân lӟp chuӛi thӡi gian bҵng giҧi thuұt láng gi͉ng g̯n nh̭t (1 Nearest Neighbor -1NN) vӟi ÿӝ ÿR xoҳn thӡL gian ÿӝng (Dynamic Time Warping-DTW)

1.6.2. Phân lӟp chuӛi thӡi gian bҵng phương pháp Bag of patterns (%23)

1.7. Phân lӟp chuӛi thӡi gian bҵng phương pháp SAX-VSM:

1.8. HӋ thӕng ÿӅ nghӏ

2. CHƯƠNG 2: MÔI TRƯỜNG THỰC NGHIỆM

2.1. DỮ LIỆU THỰC NGHIỆM

2.1.1. Bộ dữ liệu Gun Point

2.1.2. Bộ dữ liệu OSU Leaf

3. CHƯƠNG 3: KẾT QUẢ VÀ ĐÁNH GIÁ

3.1. XÉT ẢNH HƯỞNG SỐ CHỮ CHỌN CHO TẬP DỮ LIỆU

3.2. THỜI GIAN THỰC THI GIỮA CÁC PHƯƠNG PHÁP PHÂN LỚP

4. CHƯƠNG 4: KẾT LUẬN

4.1. NHỮNG KẾT LUẬN CỦA LUẬN VĂN

4.2. NHỮNG KẾT QUẢ ĐẠT ĐƯỢC

BẢNG THUẬT NGỮ ANH - VIỆT

TÀI LIỆU THAM KHẢO

I. Giới thiệu

1.1 Tầm quan trọng của dữ liệu chuỗi thời gian

II. Biến đổi SAX

2.1 Quy trình thực hiện biến đổi SAX

III. Mô hình không gian véc tơ

3.1 Cách thức hoạt động của mô hình không gian véc tơ

IV. Kết quả và đánh giá

4.1 Ứng dụng thực tiễn

Tài liệu liên quan

THÔNG TIN CHI TIẾT

Trường học: Trường Đại Học Quốc Gia TP.HCM

Chuyên ngành: Khoa Học Máy Tính

Đề tài: Phân Lớp Dữ Liệu Chuỗi Thời Gian Bằng Biến Đổi SAX Và Mô Hình Không Gian Véc Tơ

Loại tài liệu: luận văn

Năm xuất bản: 2020

Địa điểm: TP.HCM

Tổng quan nghiên cứu

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Phương pháp nghiên cứu

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

Thảo luận kết quả

Đề xuất và khuyến nghị

Đối tượng nên tham khảo luận văn

Câu hỏi thường gặp

Kết luận

Có thể bạn quan tâm