Luận Án Tiến Sĩ Về Phương Pháp Phân Cụm Mờ Theo Nhóm Trong Bài Toán Dữ Liệu Đa Nguồn

Luận án tiến sĩ toán học nghiên cứu một số phương pháp phân cụm mờ theo nhóm cho bài toán dữ liệu đa nguồn nhiều đặc trưng, phân tích chuyên sâu, xây dựng mô hình lý thuyết, đề

Trường đại học

Học viện Khoa học và Công nghệ Quân sự

Chuyên ngành

Công nghệ thông tin

Người đăng

Ẩn danh

Thể loại

luận án tiến sĩ

2023

155

Phí lưu trữ

45 Point

Mục lục chi tiết

LỜI CAM ĐOAN

LỜI CẢM ƠN

MỤC LỤC

DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT

DANH MỤC CÁC BẢNG

DANH MỤC CÁC HÌNH VẼ

1. CHƯƠNG 1: TỔNG QUAN VỀ PHÂN CỤM DỮ LIỆU

1.1. Giới thiệu chung và phân cụm dữ liệu

1.2. Phương pháp đánh giá trong phân cụm

1.3. Cơ sở toán học của luận án

1.4. Thuật toán tái cấu bầy đàn

1.5. Thuật toán đồng phân cụm mờ

1.6. Mô hình phân cụm mờ theo nhóm

1.7. Tri thức ẩn trong phân cụm dữ liệu. Dữ liệu nhiều đặc trưng

1.8. Kết luận chương 1

2. CHƯƠNG 2: MÔ TẢ CÀI TIẾN KỸ THUẬT PHÂN CỤM DỮ LIỆU

2.1. Đề xuất thuật toán đồng phân cụm mờ sử dụng PSO tái cấu tâm cụm với lập bài toán dữ liệu nhiều đặc trưng

2.2. Mô hình toán học tái cấu bầy đàn MPSO

2.3. Mô hình tâm cụm tái cấu OCM

2.4. Kết quả thực nghiệm

2.5. Thuật toán đồng phân cụm mờ dữ liệu đa nguồn MSFCoC

2.6. Mô hình toán học của MSFCoC

2.7. Chia sẻ tri thức trong phân cụm dữ liệu đa nguồn

2.8. Phương pháp tính toán điều kiện dừng

2.9. Thuật toán MSFCoC

2.10. Kết quả thực nghiệm

2.11. Kết luận chương 2

3. CHƯƠNG 3: MÔ HÌNH CÀI TIẾN PHÂN CỤM MỀ THEO NHÓM ĐA HÀM MỤC TIÊU

3.1. Mô hình toán học của FOMOCE

3.2. Bộ phân loại dữ liệu đầu vào

3.3. Mô đun đồng thuận

3.4. Mô đun đánh giá kết quả phân cụm

3.5. Sự đồng bộ mô hình phân cụm theo nhóm FOMOCE

3.6. Tri thức ẩn trong mô hình FOMOCE

3.7. Các quy tắc diễn xuất trong mô hình FOMOCE

3.8. Thuật toán FOMOCE

3.9. So sánh các mô hình phân cụm theo nhóm

3.10. Mặt sạ kết quả thực nghiệm

3.11. Kết quả thực nghiệm trên các mô hình phân cụm đơn hàm mục tiêu

3.12. Kết quả thực nghiệm trên các mô hình phân cụm đa hàm mục tiêu

3.13. Kết luận chương 3

DANH MỤC CÁC CÔNG TRÌNH KHOA HỌC ĐÃ CÔNG BÁ

TÀI LIỆU THAM KHẢO

Tóm tắt

I. Giới thiệu về phân cụm mờ

Phân cụm mờ là một kỹ thuật quan trọng trong khai thác dữ liệu, cho phép phân loại các đối tượng vào các nhóm khác nhau dựa trên các đặc điểm của chúng. Kỹ thuật này đặc biệt hữu ích trong việc xử lý dữ liệu đa nguồn, nơi mà dữ liệu có thể đến từ nhiều nguồn khác nhau và có nhiều đặc trưng khác nhau. Phân tích dữ liệu là một phần không thể thiếu trong quá trình này, giúp xác định các mẫu và xu hướng trong dữ liệu. Việc áp dụng phân cụm mờ cho dữ liệu đa nguồn không chỉ giúp cải thiện độ chính xác của các mô hình mà còn giúp phát hiện ra những thông tin tiềm ẩn mà có thể bị bỏ qua trong các phương pháp phân tích truyền thống. Theo nghiên cứu, việc sử dụng thuật toán phân cụm mờ có thể mang lại những kết quả khả quan hơn so với các phương pháp phân cụm khác, đặc biệt là trong các bài toán có tính phức tạp cao.

1.1. Tính cấp thiết của đề tài

Trong bối cảnh hiện nay, sự phát triển nhanh chóng của công nghệ thông tin đã dẫn đến sự gia tăng đáng kể về khối lượng dữ liệu được thu thập từ nhiều nguồn khác nhau. Điều này tạo ra một thách thức lớn trong việc phân tích và xử lý dữ liệu. Phân cụm dữ liệu trở thành một công cụ quan trọng giúp tổ chức và phân loại thông tin một cách hiệu quả. Việc áp dụng phân tích dữ liệu cho các nguồn dữ liệu đa dạng không chỉ giúp cải thiện khả năng ra quyết định mà còn tối ưu hóa quy trình làm việc. Nghiên cứu này nhằm phát triển các phương pháp phân cụm mờ theo nhóm để giải quyết các vấn đề liên quan đến dữ liệu đa nguồn, từ đó nâng cao hiệu quả và độ chính xác trong phân tích dữ liệu.

II. Phương pháp phân cụm mờ theo nhóm

Phương pháp phân cụm mờ theo nhóm được xây dựng dựa trên các nguyên lý của phân cụm mờ và các thuật toán tối ưu hóa hiện đại. Mô hình này cho phép phân loại dữ liệu từ nhiều nguồn khác nhau, đồng thời xem xét các đặc trưng riêng biệt của từng nguồn dữ liệu. Mô hình phân cụm này không chỉ giúp cải thiện độ chính xác mà còn tăng cường khả năng phát hiện các mẫu tiềm ẩn trong dữ liệu. Việc áp dụng thuật toán phân cụm mờ theo nhóm cho phép tối ưu hóa quá trình phân tích, giúp giảm thiểu sai số và tăng cường khả năng phân loại. Các nghiên cứu trước đây đã chỉ ra rằng việc sử dụng phân tích đa chiều trong phân cụm mờ có thể mang lại những kết quả khả quan hơn so với các phương pháp truyền thống.

2.1. Mô hình toán học của phương pháp

Mô hình toán học của phương pháp phân cụm mờ theo nhóm được xây dựng dựa trên các nguyên lý của phân cụm mờ và các thuật toán tối ưu hóa. Mô hình này cho phép xác định các tâm cụm và phân loại dữ liệu một cách hiệu quả. Các tham số trong mô hình được điều chỉnh để tối ưu hóa độ chính xác của việc phân loại. Việc áp dụng các thuật toán như PSO (Particle Swarm Optimization) trong mô hình này giúp cải thiện khả năng tìm kiếm và tối ưu hóa các tham số, từ đó nâng cao hiệu quả phân cụm. Nghiên cứu đã chỉ ra rằng việc sử dụng mô hình này có thể giúp phát hiện ra các mẫu tiềm ẩn trong dữ liệu, từ đó cung cấp thông tin hữu ích cho quá trình ra quyết định.

III. Kết quả thực nghiệm

Kết quả thực nghiệm cho thấy phương pháp phân cụm mờ theo nhóm mang lại hiệu quả cao trong việc phân loại dữ liệu đa nguồn. Các thử nghiệm được thực hiện trên nhiều tập dữ liệu khác nhau cho thấy độ chính xác của phương pháp này vượt trội hơn so với các phương pháp phân cụm truyền thống. Việc áp dụng phân tích nhóm trong phân cụm mờ đã giúp phát hiện ra các mẫu và xu hướng trong dữ liệu mà trước đây khó có thể nhận diện. Các chỉ số đánh giá như F1-score và Adjusted Rand Index cho thấy sự cải thiện rõ rệt trong độ chính xác và khả năng phân loại của mô hình. Điều này chứng tỏ rằng phương pháp phân cụm mờ theo nhóm không chỉ có giá trị lý thuyết mà còn có ứng dụng thực tiễn cao trong việc xử lý và phân tích dữ liệu đa nguồn.

3.1. So sánh với các phương pháp khác

Khi so sánh với các phương pháp phân cụm khác, phương pháp phân cụm mờ theo nhóm cho thấy những ưu điểm vượt trội. Các nghiên cứu đã chỉ ra rằng phương pháp này có khả năng xử lý tốt hơn các dữ liệu có tính phức tạp cao và đa dạng. Việc sử dụng thuật toán phân cụm mờ giúp giảm thiểu sai số và tăng cường khả năng phát hiện các mẫu tiềm ẩn trong dữ liệu. Các kết quả thực nghiệm cho thấy rằng phương pháp này không chỉ cải thiện độ chính xác mà còn giúp tối ưu hóa quy trình phân tích dữ liệu, từ đó mang lại giá trị thực tiễn cao cho các ứng dụng trong nhiều lĩnh vực khác nhau.

07/02/2025

Bạn đang xem trước tài liệu:

Luận án tiến sĩ một số phương pháp phân cụm mờ theo nhóm cho bài toán dữ liệu đa nguồn nhiều đặc trưng

Tải đầy đủ

Nội dung chính

Tổng quan nghiên cứu

Trong bối cảnh phát triển mạnh mẽ của công nghệ thông tin và truyền thông, lượng dữ liệu thu thập được ngày càng lớn và phức tạp, đặc biệt là dữ liệu đa nguồn và nhiều đặc trưng. Theo ước tính, việc xử lý và phân tích các loại dữ liệu này đang trở thành thách thức lớn do tính đa dạng, không đồng nhất và quy mô lớn của dữ liệu. Phân cụm dữ liệu là một kỹ thuật quan trọng trong khai phá dữ liệu, giúp phát hiện các cấu trúc tiềm ẩn trong tập dữ liệu không gán nhãn, từ đó cung cấp thông tin hữu ích cho việc ra quyết định trong nhiều lĩnh vực như y tế, sinh học, nhận dạng mẫu, xử lý ảnh và dự báo.

Mục tiêu chính của luận văn là phát triển một phương pháp phân cụm mờ theo nhóm tối ưu cho bài toán dữ liệu đa nguồn, nhiều đặc trưng nhằm khắc phục những hạn chế của các thuật toán phân cụm truyền thống khi áp dụng cho dữ liệu phức tạp. Phạm vi nghiên cứu tập trung vào các thuật toán phân cụm mờ, thuật toán tối ưu bầy đàn (PSO) và mô hình phân cụm theo nhóm, với các thử nghiệm thực nghiệm trên các tập dữ liệu đa nguồn và nhiều đặc trưng trong môi trường nghiên cứu tại Hà Nội năm 2023.

Ý nghĩa của nghiên cứu được thể hiện qua việc nâng cao chất lượng phân cụm, cải thiện độ chính xác và tính ổn định của các thuật toán phân cụm khi xử lý dữ liệu đa nguồn, nhiều đặc trưng. Các chỉ số đánh giá như Accuracy, Precision, Recall và F1-score được sử dụng để đo lường hiệu quả của phương pháp đề xuất, góp phần thúc đẩy ứng dụng phân cụm trong các lĩnh vực khoa học và công nghệ hiện đại.

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Luận văn dựa trên các lý thuyết và mô hình nghiên cứu sau:

Phân cụm mờ (Fuzzy Clustering): Phân cụm mờ cho phép một đối tượng dữ liệu thuộc về nhiều cụm với các mức độ khác nhau, phù hợp với dữ liệu không chắc chắn và phức tạp. Thuật toán Fuzzy C-Means (FCM) là nền tảng, được mở rộng thành thuật toán đồng phân cụm mờ (FCoC) để xử lý dữ liệu đa chiều và nhiều đặc trưng.
Thuật toán tối ưu bầy đàn (Particle Swarm Optimization - PSO): PSO mô phỏng hành vi bầy đàn trong tự nhiên để tìm kiếm tối ưu, được sử dụng để tối ưu hóa vị trí tâm cụm trong phân cụm mờ, giúp cải thiện chất lượng phân cụm và tránh các điểm khởi tạo không phù hợp.
Mô hình phân cụm theo nhóm (Ensemble Clustering): Kết hợp nhiều kết quả phân cụm từ các thuật toán hoặc tham số khác nhau để tạo ra kết quả phân cụm tổng thể chính xác và ổn định hơn. Mô hình phân cụm theo nhóm đa hàm mục tiêu (FOMOCE) được đề xuất nhằm xử lý dữ liệu đa nguồn, không đồng nhất.

Các khái niệm chính bao gồm: ma trận hàm thuộc của đối tượng và đặc trưng, hàm mục tiêu phân cụm mờ, không gian hoạt động của bầy đàn, tri thức ẩn trong phân cụm, và các chỉ số đánh giá chất lượng phân cụm như Accuracy, Precision, Recall, F1-score, Davies–Bouldin Index (DBI).

Phương pháp nghiên cứu

Nguồn dữ liệu sử dụng trong nghiên cứu bao gồm các tập dữ liệu mẫu chuẩn, dữ liệu thực tế đa nguồn và nhiều đặc trưng được thu thập từ các lĩnh vực khác nhau. Cỡ mẫu dao động từ vài trăm đến vài nghìn đối tượng dữ liệu, với số lượng đặc trưng từ vài chục đến hàng trăm.

Phương pháp phân tích chính là xây dựng và mô phỏng các thuật toán phân cụm mờ kết hợp với PSO và mô hình phân cụm theo nhóm đa hàm mục tiêu. Quá trình nghiên cứu gồm các bước:

Nghiên cứu và mô hình hóa toán học thuật toán PSO (MPSO) để tối ưu hóa vị trí tâm cụm.
Phát triển thuật toán đồng phân cụm mờ FCoC kết hợp với PSO nhằm nâng cao hiệu quả phân cụm dữ liệu nhiều đặc trưng.
Thiết kế mô hình phân cụm theo nhóm đa hàm mục tiêu FOMOCE để xử lý dữ liệu đa nguồn.
Thực hiện các thử nghiệm trên các tập dữ liệu đa nguồn, nhiều đặc trưng với các chỉ số đánh giá chất lượng phân cụm.
So sánh kết quả với các thuật toán phân cụm truyền thống và các mô hình phân cụm theo nhóm hiện có.

Timeline nghiên cứu kéo dài trong năm 2023, bao gồm giai đoạn thu thập dữ liệu, phát triển thuật toán, thực nghiệm và đánh giá kết quả.

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

Hiệu quả tối ưu tâm cụm bằng PSO: Thuật toán PSO cải tiến (MPSO) giúp lựa chọn tâm cụm khởi tạo tối ưu, giảm thiểu sai số phân cụm. Kết quả thực nghiệm cho thấy, so với thuật toán FCM truyền thống, phương pháp kết hợp PSO tăng độ chính xác phân cụm lên khoảng 14-31%.
Phân cụm mờ đồng thời đối tượng và đặc trưng: Thuật toán FCoC xử lý đồng thời ma trận hàm thuộc của đối tượng và đặc trưng, giúp phân cụm hiệu quả trên dữ liệu nhiều đặc trưng. Trên các tập dữ liệu kích thước lớn, FCoC đạt chỉ số Accuracy trung bình cao hơn 10% so với FCM.
Mô hình phân cụm theo nhóm đa hàm mục tiêu (FOMOCE): Mô hình này tích hợp nhiều hàm mục tiêu phân cụm khác nhau, khai thác tri thức ẩn giữa các phân cụm cơ sở, nâng cao độ chính xác và tính ổn định. Thử nghiệm trên dữ liệu đa nguồn cho thấy FOMOCE cải thiện chỉ số F1-score lên đến 15% so với các mô hình phân cụm theo nhóm đơn hàm mục tiêu.
Khả năng xử lý dữ liệu đa nguồn, không đồng nhất: Phương pháp đề xuất thích nghi tốt với dữ liệu đa nguồn, nhiều đặc trưng, không đồng nhất về định dạng và kích thước. Thời gian thực hiện phân cụm trên các tập dữ liệu đa nguồn được tối ưu, giảm trung bình 20% so với các thuật toán phân cụm đa khung nhìn hiện có.

Thảo luận kết quả

Nguyên nhân chính của sự cải tiến là do việc kết hợp thuật toán PSO tối ưu tâm cụm giúp tránh các điểm khởi tạo không phù hợp, đồng thời thuật toán FCoC khai thác đồng thời thông tin của đối tượng và đặc trưng, phù hợp với dữ liệu nhiều chiều và phức tạp. Mô hình phân cụm theo nhóm đa hàm mục tiêu tận dụng tri thức ẩn giữa các phân cụm cơ sở, giúp tổng hợp kết quả phân cụm chính xác và ổn định hơn.

So sánh với các nghiên cứu trước đây, phương pháp đề xuất vượt trội hơn về độ chính xác và khả năng xử lý dữ liệu đa nguồn phức tạp. Kết quả có thể được trình bày qua biểu đồ so sánh các chỉ số Accuracy, F1-score giữa các thuật toán, cũng như bảng tổng hợp thời gian thực hiện và độ ổn định phân cụm.

Ý nghĩa của kết quả nghiên cứu là mở rộng khả năng ứng dụng phân cụm mờ trong các lĩnh vực có dữ liệu phức tạp, đồng thời cung cấp nền tảng cho các nghiên cứu tiếp theo về phân tích dữ liệu đa nguồn, nhiều đặc trưng.

Đề xuất và khuyến nghị

Triển khai thuật toán PSO cải tiến trong các hệ thống phân tích dữ liệu lớn: Động từ hành động là "triển khai", mục tiêu là nâng cao độ chính xác phân cụm, thời gian thực hiện trong vòng 6 tháng, chủ thể thực hiện là các nhóm nghiên cứu và doanh nghiệp công nghệ.
Phát triển phần mềm phân cụm mờ đồng thời đối tượng và đặc trưng: Động từ "phát triển", mục tiêu cải thiện khả năng xử lý dữ liệu nhiều đặc trưng, hoàn thành trong 1 năm, chủ thể là các đơn vị phần mềm và viện nghiên cứu.
Áp dụng mô hình phân cụm theo nhóm đa hàm mục tiêu trong khai phá dữ liệu đa nguồn: Động từ "áp dụng", mục tiêu tăng tính ổn định và chính xác phân cụm, thời gian 9 tháng, chủ thể là các tổ chức nghiên cứu và doanh nghiệp khai thác dữ liệu.
Tổ chức đào tạo và hội thảo về kỹ thuật phân cụm mờ và tối ưu bầy đàn: Động từ "tổ chức", mục tiêu nâng cao nhận thức và kỹ năng cho cán bộ nghiên cứu, thời gian 3 tháng, chủ thể là các trường đại học và viện nghiên cứu.

Đối tượng nên tham khảo luận văn

Nhà nghiên cứu và sinh viên ngành khoa học máy tính, trí tuệ nhân tạo: Giúp hiểu sâu về các thuật toán phân cụm mờ, tối ưu bầy đàn và mô hình phân cụm theo nhóm, phục vụ cho nghiên cứu và phát triển thuật toán mới.
Chuyên gia phân tích dữ liệu và kỹ sư dữ liệu: Áp dụng các phương pháp phân cụm nâng cao để xử lý dữ liệu đa nguồn, nhiều đặc trưng trong thực tế, nâng cao hiệu quả khai thác dữ liệu.
Doanh nghiệp công nghệ và phần mềm: Tận dụng các giải pháp phân cụm mờ tối ưu để phát triển sản phẩm phân tích dữ liệu, cải thiện chất lượng dịch vụ và ra quyết định dựa trên dữ liệu.
Cơ quan quản lý và tổ chức đào tạo: Sử dụng kết quả nghiên cứu để xây dựng chương trình đào tạo, nâng cao năng lực cán bộ trong lĩnh vực khai phá dữ liệu và trí tuệ nhân tạo.

Câu hỏi thường gặp

Phân cụm mờ khác gì so với phân cụm rõ?
Phân cụm mờ cho phép một đối tượng dữ liệu thuộc về nhiều cụm với các mức độ khác nhau, phù hợp với dữ liệu không chắc chắn và phức tạp, trong khi phân cụm rõ chỉ gán đối tượng vào một cụm duy nhất. Ví dụ, Fuzzy C-Means là thuật toán phân cụm mờ phổ biến.
Tại sao cần sử dụng thuật toán PSO trong phân cụm?
PSO giúp tối ưu vị trí tâm cụm, tránh các điểm khởi tạo không phù hợp, từ đó nâng cao độ chính xác và ổn định của phân cụm. Thực nghiệm cho thấy PSO cải thiện độ chính xác phân cụm lên đến 31% so với thuật toán truyền thống.
Mô hình phân cụm theo nhóm có ưu điểm gì?
Mô hình này kết hợp nhiều kết quả phân cụm từ các thuật toán hoặc tham số khác nhau, tạo ra kết quả tổng thể chính xác và ổn định hơn, đặc biệt hiệu quả với dữ liệu phức tạp, đa nguồn.
Dữ liệu đa nguồn và nhiều đặc trưng là gì?
Dữ liệu đa nguồn là dữ liệu thu thập từ nhiều nguồn khác nhau, không đồng nhất về định dạng và đặc trưng. Dữ liệu nhiều đặc trưng có số lượng thuộc tính lớn, có thể chứa nhiều thông tin dư thừa hoặc không liên quan.
Làm thế nào để đánh giá chất lượng phân cụm?
Các chỉ số phổ biến gồm Accuracy, Precision, Recall, F1-score và Davies–Bouldin Index (DBI). Ví dụ, Accuracy đo lường tỷ lệ đối tượng được phân cụm đúng so với nhãn chuẩn, F1-score cân bằng giữa Precision và Recall.

Kết luận

Luận văn đã phát triển thành công phương pháp phân cụm mờ theo nhóm đa hàm mục tiêu, thích nghi với dữ liệu đa nguồn, nhiều đặc trưng.
Thuật toán PSO cải tiến giúp tối ưu vị trí tâm cụm, nâng cao hiệu quả phân cụm so với các phương pháp truyền thống.
Mô hình FOMOCE khai thác tri thức ẩn giữa các phân cụm cơ sở, cải thiện độ chính xác và tính ổn định của kết quả phân cụm.
Kết quả thực nghiệm trên các tập dữ liệu đa nguồn và nhiều đặc trưng chứng minh tính ưu việt của phương pháp đề xuất.
Các bước tiếp theo bao gồm triển khai ứng dụng thực tế, phát triển phần mềm hỗ trợ và đào tạo chuyên sâu cho cán bộ nghiên cứu và kỹ sư dữ liệu.

Hành động ngay: Các nhà nghiên cứu và chuyên gia phân tích dữ liệu nên áp dụng và phát triển thêm các kỹ thuật phân cụm mờ tối ưu để khai thác hiệu quả dữ liệu phức tạp trong thực tế.

Trích đoạn nội dung tài liệu

Bà GIÁO DĀC VÀ ĐÀO T¾O Bà QUàC PHÒNG VIàN KHOA HâC VÀ CÔNG NGHà QUÂN SĂ ------------------------- LÊ THà CÂM BÌNH MÞT Sà PH¯¡NG PHÁP PHÂN CĀM Mâ THEO NHÓM CHO BÀI TOÁN DĀ LIàU ĐA NGUâN, NHIÀU Đ¾C TR¯NG LU¾N ÁN TI¾N S) TOÁN HâC Hà Nßi – 2023 Bà GIÁO DĀC VÀ ĐÀO T¾O Bà QUàC PHÒNG VIàN KHOA HâC VÀ CÔNG NGHà QUÂN SĂ ------------------------- LÊ THà CÂM BÌNH MÞT Sà PH¯¡NG PHÁP PHÂN CĀM Mâ THEO NHÓM CHO BÀI TOÁN DĀ LIàU ĐA NGUâN, NHIÀU Đ¾C TR¯NG Ngành: C¢ sã toán hác cho tin hác Mã sá: 9 46 01 10 LU¾N ÁN TI¾N S) TOÁN HâC NG¯âI H¯àNG DÄN KHOA HâC: 1. NGÔ THÀNH LONG 2. LÊ XUÂN ĐĀC Hà Nßi - 2023 i LâI CAM ĐOAN Tôi xin cam đoan đây là công trình nghiên cāu cÿa tôi. Các sá liáu, các kÃt quÁ trình bày trong luÁn án hoàn toàn trung thực và ch°a từng đ°ÿc ai công bá trong b¿t kỳ các công trình nào khác, các dā liáu tham khÁo đ°ÿc trích d¿n đÁy đÿ.

Hà Nội, ngày 15 tháng 8 năm 2023 Nghiên cāu sinh Lê Thá CÃm Bình ii LâI CÀM ¡N LuÁn án này đ°ÿc thực hián và hoàn thành t¿i Vián Công nghá thông tin, Vián Khoa hác và Công nghá quân sự. Tr°ßc hÃt, nghiên cāu sinh xin bày tß lòng biÃt ¢n sâu sÃc tßi PGS.TS Ngô Thành Long và TS Lê Xuân Đāc đã đßnh h°ßng, chỉ bÁo và giúp đỡ trong quá trình nghiên cāu và hoàn thành luÁn án. Tôi xin bày tß lái cÁm ¢n sâu sÃc tßi lãnh đ¿o, tÁp thể cán bá giÁng viên cÿa Vián Khoa hác và Công nghá quân sự, Phòng Đào t¿o, Vián Công nghá thông tin đã t¿o điÅu kián thuÁn lÿi, hß trÿ, chia s¿ và giúp đỡ tôi trong thái gian hác tÁp và nghiên cāu t¿i Vián. Tôi cũng xin gÿi lái cÁm ¢n tßi các thành viên nhóm nghiên cāu seminar phân cām dā liáu đã t¿o ra môi tr°áng trao đái hác thuÁt th°áng xuyên và chia s¿ các ý t°ãng có giá trß cho các nghiên cāu cÿa luÁn án.

Tôi xin phép đ°ÿc gÿi lái cÁm ¢n chân thành tßi lãnh đ¿o Tr°áng Đ¿i hác Văn hóa, các đßng nghiáp t¿i Khoa Khoa hác C¢ bÁn, Khoa Thông tin, Th° vián đã t¿o điÅu kián thuÁn lÿi trong quá trình nghiên cāu và làm viác t¿i Tr°áng. Cuái cùng, xin cÁm ¢n tßi gia đình đã hß trÿ, đáng viên và giúp đỡ tôi r¿t nhiÅu vÅ tinh thÁn, vÁt ch¿t và thái gian để có thể hoàn thành luÁn án. Nghiên cāu sinh Lê Thá CÃm Bình iii MĀC LĀC Trang LàI CAM ĐOAN. iii DANH MĀC CÁC KÝ HIàU, CÁC CHĀ VIÂT TÂT.

vi DANH MĀC CÁC BÀNG. xiii DANH MĀC CÁC HÌNH VÀ. xv Mâ ĐÀU. 1 Ch°¢ng 1 TàNG QUAN VÄ PHÂN CĀM DĀ LIàU.

Gißi thiáu chung vÅ phân cām dā liáu. Ph°¢ng pháp đánh giá trong phân cām. C¢ sã toán hác cÿa luÁn án. ThuÁt toán tái °u bÁy đàn.

ThuÁt toán đßng phân cām má. Mô hình phân cām má theo nhóm. Tri thāc ẩn trong phân cām dā liáu. Dā liáu nhiÅu đặc tr°ng.

KÃt luÁn ch°¢ng 1 .29 Ch°¢ng 2 MàT Sà CÀI TIÂN KĀ THUÀT PHÂN CĀM DĀ LIàU. ĐÅ xu¿t thuÁt toán đßng phân cām má sÿ dāng PSO tái °u tâm cām vßi lßp bài toán dā liáu nhiÅu đặc tr°ng. Mô hình toán hác tái °u bÁy đàn MPSO. Mô hình tâm cām tái °u OCM.

KÃt quÁ thực nghiám. ThuÁt toán đßng phân cām má dā liáu đa ngußn MSFCoC. Mô hình toán hác cÿa MSFCoC. Chia s¿ tri thāc trong phân cām dā liáu đa ngußn.

Ph°¢ng pháp tính toán điÅu kián dừng. ThuÁt toán MSFCoC. KÃt quÁ thực nghiám. KÃt luÁn ch°¢ng 2 .75 Ch°¢ng 3 MÔ HÌNH CÀI TIÂN PHÂN CĀM Mà THEO NHÓM ĐA HÀM MĀC TIÊU.

Mô hình toán hác cÿa FOMOCE. Bá phân lo¿i dā liáu đÁu vào. Mô đun đßng thuÁn. Mô đun đánh giá kÃt quÁ phân cām.

S¢ đß mô hình phân cām theo nhóm FOMOCE. Tri thāc ẩn trong mô hình FOMOCE. Tri thāc ẩn trong mô hình FOMOCE. Các quy tÃc d¿n xu¿t trong mô hình FOMOCE.

ThuÁt toán FOMOCE. So sánh các mô hình phân cām theo nhóm. Mát sá kÃt quÁ thực nghiám. KÃt quÁ thực nghiám trên các mô hình phân cām đ¢n hàm māc tiêu.

KÃt quÁ thực nghiám trên các mô hình phân cām đa hàm māc tiêu. KÃt luÁn ch°¢ng 3. 122 DANH MĀC CÁC CÔNG TRÌNH KHOA HàC ĐÃ CÔNG Bà. 124 TÀI LIàU THAM KHÀO.

125 vi DANH MĀC CÁC KÝ HIàU, CÁC CHĀ VI¾T TÀT  Há sá gißi h¿n ch¿t l°ÿng cÿa giÁi pháp thông qua hàm thích āng trong thuÁt toán PSO  Không gian ho¿t đáng cÿa bÁy đàn trong thuÁt toán PSO M Mô hình toán hác cÿa FOMOCE  Sá vòng lặp  Há sá quán tính đ°ÿc sÿ dāng để điÅu khiển hành vi cÿa bÁy đàn trong thuÁt toán PSO  Há sá đ¿i dián cho lo¿i dā liáu đa ngußn  Phân cām c¢ sã cÿa thuÁt toán phân cām theo nhóm u,m entropy cÿa hàm thuác đái t°ÿng v,m entropy cÿa hàm thuác đặc tr°ng Im Chỉ sá ch¿t l°ÿng phân cām trung bình ã phân cām c¢ sã thā m m Chỉ sá cÿa phân cām c¢ sã tát nh¿t A TÁp các hàm māc tiêu đ°ÿc sÿ dāng cho M phân cām c¢ sã trong mô hình FOMOCE A* Hàm đßng thuÁn trong mô hình FOMOCE Am VÁn tác cÿa các phÁn tÿ bÁy đàn trong thuÁt toán PSO B Sá các chỉ sá đánh giá ch¿t l°ÿng phân cām cuái cùng trong mô hình FOMOCE C Sá cām dā liáu C* TÁp tâm cām kÃt quÁ cuái cùng trong mô hình FOMOCE vii Cm Vß trí cÿa các phÁn tÿ bÁy đàn trong thuÁt toán PSO CGB GiÁi pháp tâm cām tái °u D TÁp đặc tr°ng cÿa dā liáu d Ph°¢ng pháp đo khoÁng cách trong phân cām E Bá điÅu kián dừng cÿa phân cām c¢ sã trong mô hình FOMOCE F Mô đun đßng thuÁn cÿa mô hình FOMOCE f Hàm thích nghi G TÁp tâm cām gc Tâm cām thā c I Dā liáu đÁu vào cÿa bÁy đàn trong thuÁt toán PSO I* TÁp chỉ sá đánh giá ch¿t l°ÿng phân cām cuái cùng trong mô hình FOMOCE Im TÁp chỉ sá đánh giá ch¿t l°ÿng phân cām ã phân cām c¢ sã thā m J Hàm māc tiêu cÿa kā thuÁt xÿ lý dā liáu K Sá đặc tr°ng cÿa dā liáu L Bá liên kÃt phân cām c¢ sã trong mô hình FOMOCE M Sá ngußn cÿa dā liáu đa ngußn N Sá đái t°ÿng dā liáu O GiÁi pháp tiÅm năng toàn cāc trong thuÁt toán PSO OG KÃt quÁ phân cām tái °u toàn cāc t¿i các b°ßc lặp cÿa các phân cām c¢ sã trong mô hình FOMOCE viii Oi KÃt quÁ cÿa các phân cām c¢ sã trong mô hình FOMOCE P TÁp các phÁn tÿ cÿa bÁy đàn trong thuÁt toán PSO Pcj Đặc tr°ng thā j cÿa tâm cām c PGB PhÁn tÿ đ¿i dián cho phÁn tÿ tiÅm năng tát nh¿t cÿa toàn bá tiÃn trình ho¿t đáng cÿa bÁy đàn. PPB PhÁn tÿ đ¿i dián cho phÁn tÿ tiÅm năng tát nh¿t cāc bá t¿i mßi b°ßc di chuyển cÿa bÁy đàn.

Nội dung được bảo vệ bản quyền — Tải xuống đầy đủ

Bài viết "Phương Pháp Phân Cụm Mờ Theo Nhóm Cho Dữ Liệu Đa Nguồn" trình bày một phương pháp phân cụm mờ hiệu quả, giúp xử lý và phân tích dữ liệu từ nhiều nguồn khác nhau. Phương pháp này không chỉ cải thiện độ chính xác trong việc phân loại dữ liệu mà còn tối ưu hóa quy trình xử lý thông tin, mang lại lợi ích lớn cho các nhà nghiên cứu và chuyên gia trong lĩnh vực khoa học dữ liệu. Độc giả sẽ tìm thấy những ứng dụng thực tiễn và lý thuyết sâu sắc, từ đó có thể áp dụng vào các dự án của riêng mình.

Nếu bạn muốn mở rộng kiến thức về các phương pháp phân tích dữ liệu, hãy tham khảo bài viết "Kết hợp giải thuật gom cụm dựa vào độ dốc tích lũy có trọng số và kmeans để gom cụm dữ liệu chuỗi thời gian", nơi bạn sẽ tìm thấy những kỹ thuật tiên tiến trong phân tích chuỗi thời gian. Ngoài ra, bài viết "Advanced data mining techniques" sẽ cung cấp cho bạn cái nhìn tổng quan về các kỹ thuật khai thác dữ liệu hiện đại. Cuối cùng, bài viết "Gom cụm chuỗi thời gian dựa theo xu hướng" sẽ giúp bạn hiểu rõ hơn về cách phân tích dữ liệu theo xu hướng, một khía cạnh quan trọng trong nghiên cứu dữ liệu hiện nay.

#Phân tích dữ liệu

#luận án tiến sĩ

#khai thác dữ liệu

#thuật toán phân cụm

#phân cụm mờ

#dữ liệu đa nguồn

Chủ đề

Khoa học Dữ liệu

Phân tích dữ liệu

Machine Learning và AI

Phương pháp thống kê