Luận án tiến sĩ về khai phá tập mục phổ biến mờ sử dụng cấu trúc cây và kỹ thuật xử lý song song

Chuyên ngành

Máy tính

Người đăng

Ẩn danh

Thể loại

luận án tiến sĩ

2023

115
0
0

Phí lưu trữ

30.000 VNĐ

Mục lục chi tiết

LỜI CAM ĐOAN

LỜI CẢM ƠN

1. CHƯƠNG 1: CƠ SỞ LÝ THUYẾT

1.1. Các khái niệm cơ bản về luật kết hợp

1.2. Luật kết hợp trong cơ sở dữ liệu nhị phân

1.3. Luật kết hợp trong cơ sở dữ liệu định lượng

1.4. Tổng quan về Logic mờ

1.5. Hàm thành viên

1.6. Biến ngôn ngữ

1.7. Các phép toán logic mờ

1.8. Cơ sở dữ liệu giao dịch mờ

1.9. Độ hỗ trợ của tập mục mờ

1.10. Tập mục phổ biến mờ

1.11. Các nghiên cứu liên quan

1.11.1. Các nghiên cứu tiếp cận dựa trên Apriori

1.11.2. Các nghiên cứu mở rộng tử Apriori

1.11.3. Các phương pháp nghiên cứu dựa trên cây

1.11.3.1. Thuật toán FP-Tree mờ
1.11.3.2. Thuật toán CFFP-tree và UBFFP-tree
1.11.3.3. Thuật toán MFFP (Multiple Fuzzy Frequent Pattern)

1.12. Xác định vấn đề nghiên cứu

1.13. Kết luận chương 1

2. CHƯƠNG 2: KHAI PHÁ TẬP MỤC PHỔ BIẾN MỜ DỰA TRÊN CẤU TRÚC CÂY

2.1. Phát biểu bài toán khai phá luật kết hợp mờ

2.2. Thuật toán phân cụm dữ liệu và xác định các khoảng mờ

2.2.1. Các khái niệm cơ bản

2.2.1.1. Phân cụm dữ liệu
2.2.1.2. Xác định các khoảng mờ

2.2.2. Bài toán đặt ra

2.2.3. Thuật toán phân cụm dữ liệu EMC

2.2.3.1. Ý tưởng thuật toán
2.2.3.2. Thuật toán EMC
2.2.3.3. Đánh giá thuật toán EMC dựa trên Log Likehood

2.2.4. Thuật toán xác định các khoảng mờ

2.2.4.1. Xác định tâm
2.2.4.2. Xác định các khoảng mờ
2.2.4.3. Chuyển đổi CSDL định lượng sang CSDL mờ

2.3. Khai phá tập mục phổ biến mờ

2.3.1. Bài toán đặt ra

2.3.2. Khai phá tập mục phổ biến mờ sử dụng cấu trúc cây FPPC-tree

2.3.2.1. Ý tưởng thuật toán
2.3.2.2. Thuật toán xây dựng cây FPPC
2.3.2.3. Thuật toán xây dựng Nodelist của các mục phổ biến mờ dựa trên cây FFPC

2.3.3. Thuật toán NFFP

2.3.4. Khai phá tập mục phổ biến sử dụng cấu trúc cây FPOSC-tree

2.3.4.1. Ý tưởng thuật toán
2.3.4.2. Thuật toán xây dựng cây FPOSC (Fuzzy Pre-order Size Coding)
2.3.4.3. Thuật toán xây dựng Nodelist của các mục phổ biến mờ dựa trên cây FPOSC

2.3.5. Thuật toán NPSFF

2.3.6. Thuật toán khai phá luật kết hợp mờ

2.4. Kết luận chương 2

3. CHƯƠNG 3: KHAI PHÁ TẬP MỤC PHỔ BIẾN MỜ SỬ DỤNG KỸ THUẬT XỬ LÝ SONG SONG

3.1. Một số khái niệm liên quan về automata di động học (Cellular learning automata)

3.1.1. Automata học LA (Learning Automata)

3.1.1.1. Môi trường
3.1.1.2. Automata học ngẫu nhiên
3.1.1.3. Automata học ngẫu nhiên có cấu trúc thay đổi
3.1.1.4. Mô hình học P-model

3.1.2. Automata di động (CA – Cellular Automata)

3.1.3. Automata di động học – Cellular learning automata

3.1.3.1. Automata di động học có quy tắc
3.1.3.2. Automata di động học bất quy tắc

3.2. Thuật toán khai phá tập mục phổ biến mờ sử dụng CLA

3.2.1. Ý tưởng thuật toán

3.2.2. Tiền xử lý dữ liệu

3.2.3. Khai phá tập mục phổ biến mờ 1-item

3.2.4. Khai phá tập mục phổ biến n-itemset

3.2.5. Thuật toán CLA-FuzzyMining

3.3. Kết luận chương 3

KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN

DANH MỤC CÁC CÔNG TRÌNH CỦA TÁC GIẢ

TÀI LIỆU THAM KHẢO

Tóm tắt

I. Giới thiệu và cơ sở lý thuyết

Luận án tiến sĩ này tập trung vào việc khai phá tập mục phổ biến mờ dựa trên cấu trúc câyxử lý song song. Nghiên cứu này nhằm giải quyết các vấn đề liên quan đến việc xử lý dữ liệu định lượng trong các cơ sở dữ liệu lớn, nơi các phương pháp truyền thống không hiệu quả. Lý thuyết tập mờ được áp dụng để chuyển đổi dữ liệu định lượng thành các biến ngôn ngữ, giúp giảm thiểu tính toán và tăng cường khả năng phân tích. Các thuật toán như FP-Tree mờCFFP-tree đã được nghiên cứu để cải thiện hiệu suất khai phá dữ liệu.

1.1. Khái niệm cơ bản về luật kết hợp

Luật kết hợp là một phương pháp quan trọng trong khai thác dữ liệu, giúp tìm ra mối quan hệ giữa các mục trong cơ sở dữ liệu. Trong luận án tiến sĩ, các luật kết hợp được áp dụng để khai phá các tập mục phổ biến mờ, đặc biệt là trong các cơ sở dữ liệu định lượng. Các khái niệm như hàm thành viên, biến ngôn ngữ, và phép toán logic mờ được sử dụng để chuyển đổi dữ liệu định lượng thành dữ liệu mờ, giúp tăng cường khả năng phân tích và dự đoán.

1.2. Tổng quan về Logic mờ

Logic mờ là một công cụ mạnh mẽ trong việc xử lý dữ liệu không chắc chắn. Trong luận án tiến sĩ, logic mờ được sử dụng để chuyển đổi các giá trị định lượng thành các biến ngôn ngữ, giúp giảm thiểu tính toán và tăng cường khả năng phân tích. Các hàm thành viên như tam giác, hình thang, và Gauss được sử dụng để biểu diễn các biến ngôn ngữ, giúp tăng cường khả năng phân tích và dự đoán.

II. Khai phá tập mục phổ biến mờ dựa trên cấu trúc cây

Phần này tập trung vào việc khai phá tập mục phổ biến mờ sử dụng cấu trúc cây. Các thuật toán như FP-Tree mờCFFP-tree được nghiên cứu để cải thiện hiệu suất khai phá dữ liệu. Cấu trúc cây giúp giảm thiểu thời gian tính toán và tăng cường khả năng phân tích dữ liệu. Các thuật toán này được áp dụng để khai phá các tập mục phổ biến mờ trong các cơ sở dữ liệu định lượng, giúp tăng cường khả năng dự đoán và phân tích.

2.1. Thuật toán FP Tree mờ

Thuật toán FP-Tree mờ là một phương pháp hiệu quả để khai phá các tập mục phổ biến mờ. Thuật toán này sử dụng cấu trúc cây để giảm thiểu thời gian tính toán và tăng cường khả năng phân tích dữ liệu. Các biến ngôn ngữ được sắp xếp theo thứ tự tăng dần trong mỗi giao dịch, giúp duy trì tính chất đóng của cây và tăng cường khả năng khai phá dữ liệu.

2.2. Thuật toán CFFP tree

Thuật toán CFFP-tree được thiết kế để giảm kích thước của cây FP-Tree mờ, giúp tăng cường hiệu suất khai phá dữ liệu. Thuật toán này sử dụng một mảng để lưu trữ các giá trị mờ của các biến ngôn ngữ, giúp giảm thiểu dung lượng bộ nhớ và tăng cường khả năng phân tích dữ liệu.

III. Khai phá tập mục phổ biến mờ sử dụng kỹ thuật xử lý song song

Phần này tập trung vào việc khai phá tập mục phổ biến mờ sử dụng kỹ thuật xử lý song song. Các thuật toán như CLA-FuzzyMining được nghiên cứu để cải thiện hiệu suất khai phá dữ liệu. Kỹ thuật xử lý song song giúp tăng cường khả năng xử lý dữ liệu lớn và giảm thiểu thời gian tính toán. Các thuật toán này được áp dụng để khai phá các tập mục phổ biến mờ trong các cơ sở dữ liệu định lượng, giúp tăng cường khả năng dự đoán và phân tích.

3.1. Thuật toán CLA FuzzyMining

Thuật toán CLA-FuzzyMining là một phương pháp hiệu quả để khai phá các tập mục phổ biến mờ sử dụng kỹ thuật xử lý song song. Thuật toán này sử dụng automata di động học để tăng cường khả năng xử lý dữ liệu lớn và giảm thiểu thời gian tính toán. Các biến ngôn ngữ được sử dụng để chuyển đổi dữ liệu định lượng thành dữ liệu mờ, giúp tăng cường khả năng phân tích và dự đoán.

3.2. Ứng dụng thực tế

Kỹ thuật xử lý song song được áp dụng trong các hệ thống phân tán để tăng cường khả năng xử lý dữ liệu lớn. Các thuật toán như CLA-FuzzyMining được sử dụng để khai phá các tập mục phổ biến mờ trong các cơ sở dữ liệu định lượng, giúp tăng cường khả năng dự đoán và phân tích trong các ứng dụng thực tế.

01/03/2025

Luận án tiến sĩ: Khai phá tập mục phổ biến mờ với cấu trúc cây và xử lý song song là một nghiên cứu chuyên sâu về việc áp dụng cấu trúc cây và xử lý song song để khai phá các tập mục phổ biến trong dữ liệu mờ. Luận án này không chỉ giới thiệu các phương pháp tiên tiến mà còn đề xuất giải pháp tối ưu hóa hiệu suất xử lý dữ liệu lớn, mang lại giá trị thực tiễn cao trong lĩnh vực khai phá dữ liệu. Đây là tài liệu hữu ích cho các nhà nghiên cứu và chuyên gia muốn nâng cao hiểu biết về các kỹ thuật khai phá dữ liệu hiện đại.

Để mở rộng kiến thức về chủ đề này, bạn có thể tham khảo thêm Luận án khai phá luật quyết định trên mô hình dữ liệu dạng khối, nghiên cứu về các phương pháp khai phá luật quyết định trong dữ liệu phức tạp. Ngoài ra, Luận văn thạc sĩ khai phá dữ liệu với cây quyết định cung cấp cái nhìn chi tiết về ứng dụng cây quyết định trong khai phá dữ liệu. Cuối cùng, Luận án tiến sĩ khai phá dữ liệu tuần tự để dự đoán hành vi truy cập web là một tài liệu tham khảo tuyệt vời để hiểu sâu hơn về khai phá dữ liệu tuần tự và ứng dụng thực tế của nó.