I. Phương pháp khai phá dữ liệu cấu trúc trong luận án tiến sĩ kỹ thuật
Luận án tập trung vào khai phá dữ liệu trên dữ liệu có cấu trúc, đặc biệt là dữ liệu dạng bảng và đồ thị. Mục tiêu chính là tăng giá trị dữ liệu và tối ưu hóa tốc độ xử lý. Khai phá dữ liệu trong luận án được áp dụng để giải quyết các bài toán như rút gọn thuộc tính, rút gọn đối tượng, và tối ưu hóa thuật toán. Các phương pháp này giúp giảm thiểu dữ liệu dư thừa và cải thiện hiệu suất tính toán, đặc biệt trong các bài toán có độ phức tạp cao như khai phá đồ thị con thường xuyên đóng.
1.1. Khai phá dữ liệu dạng bảng
Trong phần này, luận án đề cập đến việc khai phá dữ liệu trên dữ liệu có cấu trúc dạng bảng. Các bài toán chính bao gồm rút gọn thuộc tính và rút gọn đối tượng để giảm thiểu dữ liệu dư thừa. Phương pháp rút gọn thuộc tính không heuristic được đề xuất, giúp tìm ra các thuộc tính quan trọng trong thời gian đa thức. Đồng thời, luận án cũng cải tiến thuật toán sinh cây quyết định, giúp tăng tốc độ xử lý so với thuật toán ID3 truyền thống.
1.2. Khai phá dữ liệu đồ thị
Phần này tập trung vào khai phá dữ liệu trên dữ liệu có cấu trúc dạng đồ thị. Luận án đề xuất các phương pháp tối ưu hóa thuật toán để giải quyết các bài toán có độ phức tạp cao như khai phá đồ thị con thường xuyên đóng. Đặc biệt, nghiên cứu sinh đã chứng minh rằng vấn đề đẳng cấu đồ thị con có thể được giải quyết trong thời gian đa thức, giúp cải thiện đáng kể hiệu suất tính toán. Ngoài ra, luận án cũng đề xuất phương pháp phân loại đa nhãn cho đồ thị dựa trên lý thuyết Dempster-Shafer.
II. Ứng dụng và ý nghĩa thực tiễn
Luận án không chỉ mang lại giá trị khoa học mà còn có nhiều ứng dụng thực tiễn. Các phương pháp khai phá dữ liệu được đề xuất có thể áp dụng trong nhiều lĩnh vực như y tế, tài chính, và giáo dục. Việc rút gọn thuộc tính và đối tượng giúp giảm thiểu chi phí lưu trữ và xử lý dữ liệu, trong khi các thuật toán tối ưu hóa giúp cải thiện tốc độ xử lý, đặc biệt trong các bài toán phức tạp như khai phá đồ thị con thường xuyên đóng.
2.1. Ứng dụng trong y tế
Các phương pháp khai phá dữ liệu trong luận án có thể được áp dụng để phân tích dữ liệu bệnh nhân, giúp xác định các yếu tố nguy cơ và hỗ trợ chẩn đoán. Việc rút gọn thuộc tính giúp tập trung vào các thông tin quan trọng, trong khi các thuật toán tối ưu hóa giúp xử lý dữ liệu lớn một cách hiệu quả.
2.2. Ứng dụng trong tài chính
Trong lĩnh vực tài chính, khai phá dữ liệu có thể được sử dụng để phân tích xu hướng thị trường và dự đoán rủi ro. Các phương pháp rút gọn dữ liệu giúp giảm thiểu thông tin dư thừa, trong khi các thuật toán tối ưu hóa giúp xử lý dữ liệu thời gian thực một cách nhanh chóng.
III. Kết quả và đóng góp khoa học
Luận án đã đạt được nhiều kết quả quan trọng trong lĩnh vực khai phá dữ liệu. Các phương pháp rút gọn thuộc tính và đối tượng giúp giảm thiểu dữ liệu dư thừa, trong khi các thuật toán tối ưu hóa giúp cải thiện tốc độ xử lý. Đặc biệt, nghiên cứu sinh đã chứng minh rằng vấn đề đẳng cấu đồ thị con có thể được giải quyết trong thời gian đa thức, mở ra hướng nghiên cứu mới trong khai phá đồ thị con thường xuyên đóng.
3.1. Đóng góp về phương pháp
Luận án đã đề xuất các phương pháp mới trong khai phá dữ liệu, bao gồm rút gọn thuộc tính không heuristic và tối ưu hóa thuật toán sinh cây quyết định. Các phương pháp này không chỉ giúp giảm thiểu dữ liệu dư thừa mà còn cải thiện hiệu suất tính toán.
3.2. Đóng góp về ứng dụng
Các kết quả nghiên cứu trong luận án có thể được áp dụng trong nhiều lĩnh vực thực tiễn, từ y tế đến tài chính. Việc rút gọn dữ liệu và tối ưu hóa thuật toán giúp cải thiện hiệu quả xử lý dữ liệu lớn, đặc biệt trong các bài toán phức tạp như khai phá đồ thị con thường xuyên đóng.