1 ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG VŨ ĐỨC HẢI PHƯƠNG PHÁP TRÍCH RÚT CÁC LUẬT MỜ PHÂN LỚP DỰA TRÊN ĐẠI SỐ GIA TỬ VÀ ỨNG DỤNG LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH Thái Nguyên – 2015 Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.vn 2 ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG VŨ ĐỨC HẢI PHƯƠNG PHÁP TRÍCH RÚT CÁC LUẬT MỜ PHÂN LỚP DỰA TRÊN ĐẠI SỐ GIA TỬ VÀ ỨNG DỤNG Chuyên ngành: Khoa học máy tính Mã số: 60 48 0101 LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH NGƯỜI HƯỚNG DẪN KHOA HỌC TS. Dương Thăng Long Thái Nguyên – 2015 Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.vn 3 LỜI NÓI ĐẦU Trong cuộc sống loài người, ngôn ngữ được hình thành một cách tự nhiên để giải quyết nhu cầu trao đổi thông tin với nhau. Hơn thế, nó là công cụ để con người mô tả các sự vật, hiện tượng trong thế giới thực và dựa trên đó để tư duy, lập luận đưa ra những nhận định, phán quyết nhằm phục vụ cho cuộc sống xã hội. Ngày nay khoa học và công nghệ đã có những phát triển vượt bậc, nhiều máy móc thiết bị được tạo ra đã góp phần giải phóng sức lao động của con người. Trong đó lĩnh vực công nghệ thông tin đã có những đóng góp vô cùng to lớn cho sự phát triển kinh tế - xã hội nói chung và giúp giải phóng sức lao động không chỉ là lao động chân tay mà còn cả lao động trí óc của con người nói riêng. Công nghệ thông tin đã góp phần đưa khả năng tư duy, lập luận và sự sáng tạo kiểu như bộ não người vào máy móc thiết bị để “thông minh hơn”. Để thực hiện điều này, rất nhiều nhà khoa học đã và đang nghiên cứu cả về lý thuyết lẫn ứng dụng, đưa ra các phương pháp, các quy trình nhằm kế thừa, mô phỏng khả năng của con người vào các thiết bị máy móc. Trước hết, các nhà khoa học đã phải hình thức hóa toán học các vấn đề ngôn ngữ và xử lý ngôn ngữ mà con người vẫn làm. Người đi tiên phong trong lĩnh vực này là Lotfi A. Zadeh, ông đã đề xuất khái niệm mờ từ những khái niệm mơ hồ, không rõ ràng. Cho đến nay, hệ mờ phân lớp dạng luật (FRBCS) là mô hình được nhiều tác giả quan tâm nghiên cứu và sử dụng trong khai phá dữ liệu, tìm kiếm tri thức từ dữ liệu cho bài toán phân lớp. Thế mạnh của mô hình này là có thể cung cấp được cho người dùng cuối những tri thức dạng luật dễ hiểu , dễ sử dụng đối với con người như là những tri thức của họ . Với viê ̣c sử du ̣ng tâ ̣p mờ và lôgic mờ , các nghiên cứu đều tìm kiếm phương pháp xây dựng hệ mờ phân lớp dạng luật Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.vn 4 nhằm đa ̣t hai mu ̣c tiêu chính : thứ nhấ t , hiê ̣u quả phân lớp của hê ̣ càng cao càng tốt; thứ hai, tính phức tạp của hệ đồng thời càng nhỏ càng tốt. Mô hình xây dựng hệ luật mờ phân lớp dựa trên đại số gia tử được đề xuất với mục tiêu xây dựng hệ luật mờ để ứng dụng phân lớp cho các mẫu dữ liệu sao cho hệ luật phải có hiệu quả phân lớp cao, càng đơn giản, dễ hiểu và tường minh đối với người dùng càng tốt. Tên đề tài được lựa chọn là “Phương pháp trích rút các luật mờ phân lớp dựa trên đại số gia tử và ứng dụng”. Nội dung của luận văn được bố cục thành các phần như sau: Chương 1. Kiến thức cơ bản về hệ mờ và lập luận xấp xỉ. Phương pháp trích rút luật mờ phân lớp dựa trên đại số gia tử. Cài đặt thử nghiệm và đánh giá. Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.vn 5 CHƢƠNG 1: KIẾN THỨC CƠ BẢN VỀ HỆ MỜ VÀ LẬP LUẬN XẤP XỈ 1. Khái quát về lập luận xấp xỉ (lập luận mờ) Từ năm 1965 Zadeh đưa ra lý thuyết tập mờ, logic mờ nhưng phải đến những thập niên cuối của thế kỷ XX lý thuyết tập mờ, logic mờ mới được đặc biệt quan tâm nghiên cứu và ứng dụng vào trong lý thuyết điều khiển, hệ thống và trí tuệ nhân tạo. Tập mờ và logic mờ dựa trên các suy luận của con người về các thông tin không đầy đủ để hiểu biết và điều khiển hệ thống. Điều khiển mờ chính là mô phỏng cách xử lý thông tin và điều khiển của con người đối với các đối tượng, do vậy điều khiển mờ đã giải quyết thành công rất nhiều vấn đề điều khiển phức tạp trước đây chưa giải quyết được. Định nghĩa tập mờ Định nghĩa 1.1: [4] Cho tập vũ trụ U với các phần tử ký hiệu bởi x, U={x}. Một tập mờ A trên U là tập được đặc trưng bở một hàm (x) mà nó liên kết mỗi phần tử x U với một số thực trong đoạn [0,1]. Giá trị hàm (x) biểu diễn mức độ thuộc của x trong A. Hay A được gọi là tập mờ khi và chỉ khi: A = {(x, (x) x U, (x): U [0,1]} (1) Trong đó (x) được gọi là hàm thuộc của tập mờ A. Giá trị hàm (x) càng gần tới 1 thì mức độ thuộc của x trong A càng cao. Tập mờ là sự mở rộng của khái niệm tập hợp kinh điển. Khi A là tập hợp kinh điển thì A có thể được biểu diễn như sau Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.vn 6 A = {(x, (x) x U, (x): U {0,1}} (2) Khi đó hàm thuộc (x) chỉ nhận hai giá trị 0 và 1. Số mờ Định nghĩa 1.2: [4] Tập mờ A trên đường thẳng số thực R là một số mờ, nếu: 1.A chuẩn hóa, tức là có điểm x’ sao cho (x’) = 1. Ứng với mỗi R, tập mức {x: (x) } là đoạn đóng trên R. (x) là hàm liên tục. Một số dạng số mờ thường được sử dụng là số mờ dạng tam giác, hình thang và dạng hàm Gauss. Số mờ dạng tam giác được xác định bởi 3 tham số. Khi đó hàm thuộc của sô mờ tam giác A(a, b, c) cho bởi: 1 0 a z b c z Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.Số mờ hình thang A(a, b, c, d) được sác định bởi 4 tham số và hàm thuộc cho bởi: 1 0 z a b c d c.Số mờ dạng hàm Gauss có hàm thuộc cho bởi: Trong đó là số dương được chọn thích hợp. 1 0 z Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.vn 8 Khái niệm về phân hoạch mờ (fuzzy partition) cũng là một trong khái niệm quan trọng trong việc tiếp cận giải quyết bài toán phân lớp. Định nghĩa phân hoạch mờ Theo [4] Cho p điểm cố định m1<m2<…<mp trong tập U = [a, b] R. Khi đó tập gồm p tập mờ A1, A2,…, Ap(với , , …, là các hàm thuộc tương ứng) định nghĩa trên U được gọi là một phân hoạch mờ của U nếu các điều kiện sau thỏa mãn, k=1,…,p: 1) (mk) = 1 (mk được gọi là một điểm trong nhân của Ak); 2) Nếu x [mk-1, mk+1], = 0 (trong đó m0 = m1 = a và mp+1 = mp =b); 3) (x) liên tục 4) (x) đơn điệu tăng trên [mk-1, mk] và đơn điệu giảm trên [mk,mk+1]; 5) U, , sao cho (x) > 0 (tất cả mọi điểm trong U đều thuộc một lớp của phân hoạch này với độ thuộc nào đó khác 0) 1.4 Các phép tính trên tập mờ Zadeh 1.1 Các phép toán tập hợp: Cho A, B là 2 tập mờ trên cùng tập nền U: Phép giao (Intersection): Phép giao của tập A và B là tập mờ C được định nghĩa như sau: C = A B = {(x, (x))| x U, (x) = min{ (x), (x)}} Ví dụ: Cho U = {1, 2, 3, 4, 5} và hai tập mờ A, B như sau: A = {(1,0), (2,1), (3,0.2)} Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.2 Phép phủ định: Phủ định (negation) là một trong những phép toán logic cơ bản. Để suy rộng chúng ta cần tới toán tử v(Not P) xác định giá trị chân lý của Not P đối với mệnh đề P. Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.vn 10 Định nghĩa: Hàm n: [0, 1] [0, 1] không tăng thoả mãn các điều kiện n(0) = 1, n(1) =0 gọi là hàm phủ định. Hàm n là phép phủ định mạnh, nếu n giảm chặt và n(n(x)) = x với mỗi x Ví dụ: n(x) = 1- x, n(x) = 1- x2 1.3 Phép hội: Phép hội (vẫn quen gọi là phép AND – conjunction) là một trong những phép toán cơ bản nhất. Nó cũng là cơ sở để định nghĩa phép giao của hai tập mờ.4 Phép tuyển: Giống như phép hội, phép tuyển hay toán tử logic OR thông thường cần thoả mãn các tính chất sau: Định nghĩa 1.4: [4] Hàm S : [0, 1]x[0, 1] [0, 1] gọi là phép tuyển hay là t - đối chuẩn (t – conorm) nếu thoả mãn các tiên đề sau: 1) S(0, x) = x với mọi 0 x 1 2) S có tính giao hoán: S(x, y) = S(y, x) với mọi 0 x, y 1 3) S không giảm theo nghĩa s(x, y) s(u, v) với x u, y v Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.vn 11 4) S có tính kết hợp S(x, S(y,z)) = S(S(x, y), z) với mọi 0 x, y, z 1 Ví dụ: Một số phép tuyển: S(x, y) = max(x, y) ; S (x, y) = x+ y – xy ; S(x, y) = min( x+ y -1 , 0), ….5 Phép kéo theo: Phép kéo theo là một hàm số I: [0,1]2 [0,1] thoả các điều kiện sau: 1) I(0,y)=1, y [0,1] 2) I(x,1)=1, x [0,1] 3) 0 x1, x2 1 I(x1,y) I(x2,y), y [0,1] 4) 0 y1, y2 1 I(x,y1) I(x,y2), x [0,1] 5) I(1,0)=0 Cho:T là t-chuẩn; S là t-đối chuẩn; n là phép phủ định mạnh Phép kéo theo thứ nhất: Hàm IS(x,y) xác định trên [0, 1]2 bằng biểu thức IS(x,y) =S(n(x),y) Phép kéo theo thứ hai: Cho T là t-chuẩn, xác định IT(x,y) =Sup{z | 0 z 1 và T(x,y) y},x,y [0,1] Phép kéo theo thứ ba: Cho (T, S, n) là bộ 3 De Morgan, T là t-chuẩn, S là t-đối chuẩn, n là phép phủ định mạnh Phép kéo theo thứ ba: Hàm ITS(x,y) xác định trên [0, 1]2 bằng biểu thức ITS(x,y) =S(n(x),T(x,y)) 1. Biến ngôn ngữ Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.
## Tổng quan nghiên cứu
Trong bối cảnh phát triển mạnh mẽ của công nghệ thông tin và trí tuệ nhân tạo, việc ứng dụng các phương pháp phân lớp dữ liệu ngày càng trở nên quan trọng trong nhiều lĩnh vực như khai phá dữ liệu, xử lý ngôn ngữ tự nhiên, và hệ thống hỗ trợ quyết định. Theo ước tính, hiệu quả phân lớp dữ liệu có thể ảnh hưởng trực tiếp đến chất lượng các hệ thống thông minh, từ đó tác động đến năng suất và hiệu quả kinh tế - xã hội. Tuy nhiên, các phương pháp phân lớp truyền thống thường gặp khó khăn khi xử lý dữ liệu có tính mờ, không rõ ràng hoặc không chắc chắn.
Luận văn tập trung nghiên cứu phương pháp trích rút các luật mờ phân lớp dựa trên đại số gia tử (ĐSGT) nhằm xây dựng hệ luật mờ phân lớp có hiệu quả cao, đơn giản và dễ hiểu. Nghiên cứu được thực hiện trong phạm vi khoa học máy tính, với dữ liệu mẫu thu thập từ các bộ dữ liệu thực tế trong lĩnh vực khai phá dữ liệu, đặc biệt là bài toán phân loại vị trí protein vi khuẩn Ecoli với 336 mẫu dữ liệu phân thành 8 lớp khác nhau. Mục tiêu chính là phát triển thuật toán sinh luật mờ dựa trên hệ phân hoạch khoảng tính mờ trong ĐSGT, đồng thời đánh giá hiệu quả phân lớp qua các chỉ số như độ chính xác và tỉ lệ lỗi phân lớp.
Nghiên cứu có ý nghĩa quan trọng trong việc nâng cao khả năng xử lý dữ liệu mờ, cung cấp công cụ phân lớp hiệu quả cho các ứng dụng trí tuệ nhân tạo, đồng thời góp phần phát triển lý thuyết và ứng dụng của đại số gia tử trong khoa học máy tính.
## Cơ sở lý thuyết và phương pháp nghiên cứu
### Khung lý thuyết áp dụng
- **Lý thuyết tập mờ và logic mờ**: Được đề xuất bởi Lotfi A. Zadeh từ năm 1965, tập mờ mở rộng khái niệm tập cổ điển bằng cách cho phép phần tử thuộc tập với mức độ thuộc trong khoảng [0,1]. Logic mờ cho phép xử lý các thông tin không chắc chắn, không đầy đủ, mô phỏng cách suy luận của con người.
- **Đại số gia tử tuyến tính đầy đủ (ĐSGT)**: Là cấu trúc đại số tiên đề hóa miền giá trị ngôn ngữ, bao gồm tập các phần tử sinh, tập các gia tử (hedge) làm tăng hoặc giảm ngữ nghĩa, và quan hệ thứ tự cảm sinh ngữ nghĩa. ĐSGT cho phép mô hình hóa và định lượng ngữ nghĩa của các giá trị ngôn ngữ mờ, hỗ trợ xây dựng hệ luật mờ phân lớp hiệu quả.
- **Hệ luật mờ phân lớp (FRBCS)**: Mô hình phân lớp dựa trên các luật mờ dạng IF-THEN, trong đó phần điều kiện là các tập mờ trên các thuộc tính đầu vào, phần kết luận là nhãn lớp. Hệ luật này vừa đảm bảo hiệu quả phân lớp cao, vừa cung cấp tri thức dạng luật dễ hiểu cho người dùng.
- **Phân hoạch mờ và hệ khoảng tính mờ**: Phân hoạch mờ chia miền thuộc tính thành các tập mờ có tính chất liên tục, đơn điệu, đảm bảo tính bao phủ và phân biệt. Hệ khoảng tính mờ mức k là phân hoạch các khoảng trên miền giá trị của các hạng từ trong ĐSGT, giúp sinh luật mờ chính xác và có cấu trúc rõ ràng.
### Phương pháp nghiên cứu
- **Nguồn dữ liệu**: Sử dụng các bộ dữ liệu công khai trong lĩnh vực khai phá dữ liệu, tiêu biểu là bộ dữ liệu phân loại vị trí protein vi khuẩn Ecoli gồm 336 mẫu, phân thành 8 lớp với tỉ lệ mẫu phân bố cụ thể (ví dụ: 143 mẫu lớp cp, 77 mẫu lớp im,...).
- **Phương pháp phân tích**: Áp dụng thuật toán sinh luật IFRG1 dựa trên hệ khoảng tính mờ trong ĐSGT để tạo ra hệ luật mờ phân lớp. Thuật toán gồm các bước: xác định tập giá trị ngôn ngữ, phân hoạch mờ trên miền thuộc tính, sinh luật mờ từ dữ liệu mẫu, đánh giá trọng số luật dựa trên độ tin cậy và độ hỗ trợ.
- **Phương pháp thử nghiệm**: Sử dụng kỹ thuật k-fold cross-validation (k=10) để đánh giá hiệu quả mô hình, đồng thời áp dụng phương pháp LV1 (leave-one-out) cho các tập dữ liệu nhỏ hơn. Các chỉ số đánh giá bao gồm tỉ lệ phân lớp đúng, tỉ lệ lỗi phân lớp, số lượng luật và độ dài luật.
- **Timeline nghiên cứu**: Nghiên cứu được thực hiện trong khoảng thời gian từ năm 2013 đến 2015, bao gồm giai đoạn xây dựng lý thuyết, phát triển thuật toán, cài đặt thử nghiệm và đánh giá kết quả trên các bộ dữ liệu thực tế.
## Kết quả nghiên cứu và thảo luận
### Những phát hiện chính
- Thuật toán sinh luật IFRG1 dựa trên hệ khoảng tính mờ trong ĐSGT đã tạo ra hệ luật mờ phân lớp với số lượng luật hợp lý (ví dụ 85 luật cho bài toán Ecoli), đảm bảo tính đơn giản và dễ hiểu.
- Hiệu quả phân lớp đạt khoảng 77.3% trên bộ dữ liệu Ecoli với 336 mẫu, tỉ lệ lỗi phân lớp là 77/336 mẫu, cho thấy khả năng phân biệt các lớp dữ liệu mờ tốt.
- So sánh các phương pháp đánh giá trọng số luật, phương pháp CF3 (độ tin cậy trừ đi độ tin cậy lớn thứ hai) cho kết quả tốt hơn so với CF1, CF2 và CF4, giúp tăng độ chính xác phân lớp.
- Hệ khoảng tính mờ mức k giúp cải thiện độ chính xác của hàm định lượng ngữ nghĩa, từ đó nâng cao hiệu quả sinh luật và phân lớp.
### Thảo luận kết quả
Kết quả cho thấy việc ứng dụng đại số gia tử trong xây dựng hệ luật mờ phân lớp là hướng đi hiệu quả, vừa đảm bảo tính toán chính xác vừa giữ được tính đơn giản, dễ hiểu của hệ luật. Việc sử dụng hệ khoảng tính mờ giúp mô hình hóa chính xác hơn tính mờ của các giá trị ngôn ngữ, từ đó nâng cao hiệu quả phân lớp.
So với các nghiên cứu trước đây sử dụng các phương pháp phân lớp truyền thống hoặc các hệ luật mờ không dựa trên đại số gia tử, phương pháp này giảm thiểu số lượng luật cần thiết, đồng thời cải thiện độ chính xác phân lớp. Kết quả thử nghiệm trên bộ dữ liệu thực tế như Ecoli cũng chứng minh tính ứng dụng thực tiễn của phương pháp.
Dữ liệu có thể được trình bày qua biểu đồ tỉ lệ phân lớp đúng theo từng lớp, bảng so sánh số lượng luật và độ dài luật giữa các phương pháp, giúp minh họa rõ ràng hiệu quả và ưu điểm của phương pháp đề xuất.
## Đề xuất và khuyến nghị
- **Phát triển thuật toán tối ưu hóa hệ luật mờ**: Áp dụng các thuật toán di truyền hoặc học máy để tìm kiếm hệ luật tối ưu, giảm số lượng luật và điều kiện trong luật, nâng cao hiệu quả phân lớp trong thời gian ngắn.
- **Mở rộng ứng dụng sang các lĩnh vực khác**: Áp dụng phương pháp vào các bài toán phân lớp trong y sinh, tài chính, và xử lý ngôn ngữ tự nhiên nhằm khai thác tính mờ và không chắc chắn trong dữ liệu thực tế.
- **Cải tiến hàm định lượng ngữ nghĩa**: Nghiên cứu và thiết kế các hàm định lượng ngữ nghĩa dạng hình chuông hoặc các dạng hàm khác phù hợp hơn với đặc điểm dữ liệu, nhằm nâng cao độ chính xác của hệ luật.
- **Xây dựng công cụ phần mềm hỗ trợ**: Phát triển phần mềm tích hợp thuật toán sinh luật mờ dựa trên đại số gia tử, cung cấp giao diện thân thiện cho người dùng cuối, hỗ trợ phân tích và trực quan hóa kết quả phân lớp.
- **Đào tạo và phổ biến kiến thức**: Tổ chức các khóa đào tạo, hội thảo về lý thuyết tập mờ, đại số gia tử và ứng dụng trong phân lớp dữ liệu cho các nhà nghiên cứu và chuyên gia trong lĩnh vực khoa học máy tính và trí tuệ nhân tạo.
## Đối tượng nên tham khảo luận văn
- **Nhà nghiên cứu và sinh viên ngành Khoa học máy tính, Trí tuệ nhân tạo**: Nắm bắt kiến thức về lý thuyết tập mờ, đại số gia tử và ứng dụng trong phân lớp dữ liệu, phục vụ cho nghiên cứu và phát triển các mô hình thông minh.
- **Chuyên gia khai phá dữ liệu và học máy**: Áp dụng phương pháp xây dựng hệ luật mờ phân lớp để cải thiện hiệu quả phân loại trong các bài toán thực tế có dữ liệu mờ, không chắc chắn.
- **Nhà phát triển phần mềm và kỹ sư hệ thống thông minh**: Tích hợp thuật toán sinh luật mờ dựa trên đại số gia tử vào các hệ thống hỗ trợ quyết định, hệ thống phân loại tự động, nâng cao khả năng xử lý dữ liệu phức tạp.
- **Người quản lý và nhà hoạch định chính sách trong lĩnh vực công nghệ thông tin**: Hiểu rõ về các phương pháp phân lớp dữ liệu tiên tiến để đưa ra các quyết định đầu tư, phát triển công nghệ phù hợp với xu hướng hiện đại.
## Câu hỏi thường gặp
1. **Phương pháp đại số gia tử khác gì so với các phương pháp phân lớp truyền thống?**
Đại số gia tử cung cấp cấu trúc toán học để mô hình hóa ngữ nghĩa mờ của các giá trị ngôn ngữ, giúp xây dựng hệ luật mờ phân lớp vừa chính xác vừa dễ hiểu, trong khi các phương pháp truyền thống thường không xử lý tốt dữ liệu mờ và thiếu tính trực quan.
2. **Làm thế nào để đánh giá hiệu quả của hệ luật mờ phân lớp?**
Hiệu quả được đánh giá qua các chỉ số như tỉ lệ phân lớp đúng, tỉ lệ lỗi phân lớp, số lượng luật và độ dài luật. Phương pháp k-fold cross-validation được sử dụng để đảm bảo tính khách quan và tránh hiện tượng quá khớp.
3. **Phương pháp sinh luật IFRG1 hoạt động như thế nào?**
IFRG1 dựa trên hệ khoảng tính mờ trong đại số gia tử để phân hoạch miền thuộc tính, từ đó sinh các luật mờ dựa trên dữ liệu mẫu, đánh giá trọng số luật bằng độ tin cậy và độ hỗ trợ, tạo thành hệ luật phân lớp hiệu quả.
4. **Ứng dụng thực tế của phương pháp này là gì?**
Phương pháp được áp dụng thành công trong bài toán phân loại vị trí protein vi khuẩn Ecoli, giúp phân loại chính xác các mẫu dữ liệu mờ, đồng thời có thể mở rộng sang các lĩnh vực y sinh, tài chính, và xử lý ngôn ngữ tự nhiên.
5. **Làm sao để cải thiện hiệu quả phân lớp trong các bài toán phức tạp hơn?**
Có thể áp dụng các thuật toán tối ưu hóa như di truyền để tìm hệ luật tối ưu, cải tiến hàm định lượng ngữ nghĩa, và kết hợp với các kỹ thuật học máy hiện đại nhằm nâng cao độ chính xác và khả năng tổng quát của mô hình.
## Kết luận
- Đã xây dựng thành công phương pháp trích rút các luật mờ phân lớp dựa trên đại số gia tử, đáp ứng mục tiêu hiệu quả phân lớp cao và hệ luật đơn giản, dễ hiểu.
- Thuật toán sinh luật IFRG1 dựa trên hệ khoảng tính mờ cho phép sinh hệ luật mờ có cấu trúc rõ ràng, phù hợp với dữ liệu mờ và không chắc chắn.
- Kết quả thử nghiệm trên bộ dữ liệu phân loại vị trí protein vi khuẩn Ecoli với 336 mẫu cho thấy tỉ lệ phân lớp đúng đạt trên 77%, minh chứng tính khả thi và hiệu quả của phương pháp.
- Phương pháp đánh giá trọng số luật CF3 được chứng minh là phù hợp nhất trong việc nâng cao độ chính xác phân lớp.
- Đề xuất các hướng nghiên cứu tiếp theo bao gồm tối ưu hóa hệ luật, mở rộng ứng dụng và phát triển công cụ hỗ trợ nhằm nâng cao giá trị thực tiễn của nghiên cứu.
Khuyến khích các nhà nghiên cứu và chuyên gia trong lĩnh vực khoa học máy tính, trí tuệ nhân tạo tiếp cận và ứng dụng phương pháp này để phát triển các hệ thống phân lớp dữ liệu hiệu quả hơn trong tương lai.