Bài giảng Trí Tuệ Nhân Tạo - Nguyễn Nhật Quang (ĐH Bách Khoa Hà Nội)

Trường đại học

Đại Học Bách Khoa Hà Nội

Người đăng

Ẩn danh
51
0
0

Phí lưu trữ

30 Point

Tóm tắt

I. Tổng quan Trí tuệ nhân tạo của Nguyễn Nhật Quang DHBKHN

Tài liệu về Trí tuệ nhân tạo của tác giả Nguyễn Nhật Quang tại Trường Đại học Bách Khoa Hà Nội (DHBKHN) cung cấp một nền tảng kiến thức vững chắc về các nguyên lý cốt lõi của ngành. Trọng tâm của học phần này không chỉ dừng lại ở các thuật toán phức tạp mà đi sâu vào bản chất của trí tuệ: quá trình chuyển hóa từ dữ liệu thô thành tri thức có thể hành động. Một khái niệm trung tâm được nhấn mạnh là sự phân cấp giữa Dữ liệu (Data), Thông tin (Information), và Tri thức (Knowledge). Dữ liệu là các sự kiện hoặc ký hiệu rời rạc, chưa có ngữ cảnh. Thông tin là dữ liệu đã được xử lý, mang ý nghĩa đối với con người. Nhưng đỉnh cao nhất là tri thức, tức là sự hiểu biết về thông tin và cách áp dụng nó để giải quyết vấn đề. Ví dụ, 'nhiệt độ là 5 độ C' là dữ liệu, 'trời lạnh' là thông tin, và 'nếu trời lạnh thì nên mặc áo ấm' chính là tri thức. Chính vì vậy, một trong những nhiệm vụ quan trọng nhất của Trí tuệ nhân tạo, theo giáo trình của Nguyễn Nhật Quang, là xây dựng các hệ thống có khả năng biểu diễn và suy luận dựa trên tri thức, mô phỏng quá trình tư duy của con người. Lĩnh vực biểu diễn tri thức (Knowledge Representation) trở thành trụ cột, quyết định khả năng thông minh và hiệu quả của một hệ thống AI.

1.1. Từ Dữ liệu Thông tin đến Tri thức trong AI

Quá trình tiến hóa từ dữ liệu đến tri thức là nền tảng để xây dựng các hệ thống thông minh. Dữ liệu là các sự kiện thô, ví dụ như một con số hay một ký hiệu. Khi dữ liệu này được đặt trong ngữ cảnh và xử lý, nó trở thành thông tin. Ví dụ, con số '5' là dữ liệu, nhưng '5 độ C' là thông tin. Tuy nhiên, thông tin vẫn chưa đủ để một hệ thống tự đưa ra quyết định. Bước cuối cùng và quan trọng nhất là chuyển đổi thông tin thành tri thức. Tri thức là sự hiểu biết sâu sắc về một lĩnh vực, cho phép áp dụng thông tin để giải quyết vấn đề. Theo tài liệu của Nguyễn Nhật Quang DHBKHN, tri thức cho phép hệ thống đưa ra các quyết định hiệu quả, chẳng hạn như suy luận 'nếu nhiệt độ thấp thì cần bật máy sưởi'. Các hệ thống dựa trên tri thức (Knowledge-based systems) có giá trị cao hơn nhiều so với các hệ thống chỉ xử lý dữ liệu hoặc thông tin, vì chúng có khả năng mô phỏng suy luận của chuyên gia.

1.2. Vai trò của biểu diễn tri thức trong hệ thống AI

Biểu diễn tri thức là một lĩnh vực nghiên cứu trọng tâm của Trí tuệ nhân tạo. Nhiệm vụ của nó là phát triển các phương pháp và công cụ để mã hóa tri thức của con người thành một định dạng mà máy tính có thể hiểu và xử lý được. Một phương pháp biểu diễn tri thức hiệu quả phải đảm bảo tri thức có thể được lưu trữ, truy cập và sử dụng cho quá trình suy diễn (reasoning). Tầm quan trọng của nó nằm ở chỗ, nếu không có một cơ chế biểu diễn tri thức phù hợp, hệ thống AI chỉ là một cỗ máy xử lý dữ liệu mà không có khả năng 'hiểu'. Tài liệu giới thiệu nhiều phương pháp phổ biến như Luật sản xuất (Production rules), Khung (Frames), và Mạng ngữ nghĩa (Semantic networks). Mỗi phương pháp có ưu và nhược điểm riêng, phù hợp với các loại bài toán khác nhau. Việc lựa chọn đúng phương pháp biểu diễn là bước đầu tiên quyết định sự thành công của một dự án Trí tuệ nhân tạo.

II. Vấn đề cốt lõi trong biểu diễn tri thức Trí tuệ nhân tạo

Việc lựa chọn một phương pháp biểu diễn tri thức không phải là một nhiệm vụ đơn giản. Theo phân tích trong tài liệu Trí tuệ nhân tạo của Nguyễn Nhật Quang, một phương pháp lý tưởng cần đáp ứng được nhiều tiêu chí khắt khe để đảm bảo hệ thống hoạt động hiệu quả và đáng tin cậy. Các thách thức này là trọng tâm nghiên cứu nhằm hoàn thiện các hệ thống AI. Đầu tiên là tính hoàn chỉnh (Completeness), đòi hỏi phương pháp phải có khả năng thể hiện mọi khía cạnh của tri thức trong một lĩnh vực cụ thể. Thứ hai là tính ngắn gọn (Conciseness), nghĩa là tri thức cần được thu thập, lưu trữ và truy cập một cách hiệu quả, tránh dư thừa. Thách thức thứ ba là hiệu quả về tính toán (Computational efficiency), vì một hệ thống AI cần thực hiện suy luận một cách nhanh chóng. Cuối cùng, tính rõ ràng, dễ hiểu (Transparency) là yếu tố cực kỳ quan trọng, cho phép con người hiểu được cách hệ thống đưa ra kết luận, từ đó có thể kiểm tra, gỡ lỗi và cải tiến. Việc cân bằng giữa các yêu cầu này thường rất khó khăn. Ví dụ, một phương pháp biểu diễn rất đầy đủ và chi tiết có thể làm giảm hiệu quả tính toán. Những vấn đề này cho thấy sự phức tạp trong việc xây dựng một cơ sở tri thức (knowledge base) mạnh mẽ cho các ứng dụng Trí tuệ nhân tạo.

2.1. Yêu cầu về tính hoàn chỉnh và tính ngắn gọn

Tính hoàn chỉnh yêu cầu phương pháp biểu diễn phải đủ mạnh để nắm bắt tất cả các sắc thái tri thức cần thiết. Nếu một khía cạnh quan trọng của bài toán không thể được biểu diễn, hệ thống sẽ không thể đưa ra kết luận chính xác. Ngược lại, tính ngắn gọn tập trung vào hiệu quả. Một biểu diễn cồng kềnh sẽ gây tốn kém tài nguyên lưu trữ và làm chậm quá trình truy xuất thông tin. Ví dụ, trong một hệ thống chẩn đoán y khoa, tri thức cần được biểu diễn một cách đầy đủ về các triệu chứng và bệnh lý, nhưng cũng cần được cấu trúc gọn gàng để bác sĩ và hệ thống có thể truy vấn nhanh chóng. Sự xung đột giữa hai yêu cầu này là một thách thức thường trực trong kỹ thuật tri thức.

2.2. Đảm bảo hiệu quả tính toán và tính minh bạch

Hiệu quả tính toán là yếu tố sống còn đối với các ứng dụng AI thời gian thực. Quá trình suy diễn trên một cơ sở tri thức lớn có thể rất phức tạp và tốn thời gian. Do đó, phương pháp biểu diễn phải được thiết kế để tối ưu hóa các thuật toán tìm kiếm và so khớp. Song song với đó, tính minh bạch hay tính rõ ràng, dễ hiểu lại là yêu cầu về khả năng giải thích của hệ thống. Người dùng, đặc biệt là các chuyên gia, cần hiểu tại sao hệ thống lại đưa ra một kết luận cụ thể. Nếu các quy tắc và cấu trúc tri thức quá phức tạp và trừu tượng, hệ thống sẽ trở thành một 'hộp đen', gây khó khăn cho việc kiểm chứng và tin cậy. Việc tìm ra điểm cân bằng giữa tốc độ xử lý và khả năng diễn giải là mục tiêu quan trọng trong thiết kế các hệ thống AI.

III. Cách biểu diễn tri thức AI bằng luật sản xuất DHBKHN

Một trong những phương pháp biểu diễn tri thức phổ biến và trực quan nhất được trình bày trong giáo trình Trí tuệ nhân tạo tại DHBKHN là sử dụng luật sản xuất (Production Rules). Phương pháp này biểu diễn tri thức dưới dạng các cặp điều kiện - hành động, thường được viết theo cấu trúc IF-THEN (Nếu - Thì). Ví dụ: 'IF nhiệt độ > 37 THEN bệnh nhân bị sốt'. Mỗi luật chứa đựng một mảnh tri thức cụ thể về cách giải quyết một vấn đề. Ưu điểm lớn nhất của phương pháp này là sự gần gũi với ngôn ngữ tự nhiên và cách tư duy của con người, giúp các chuyên gia dễ dàng đóng góp, kiểm tra và hiệu chỉnh cơ sở tri thức. Một tập hợp các luật như vậy tạo thành cơ sở tri thức của Hệ thống suy diễn dựa trên luật (Rule-based system - RBS). Hệ thống này hoạt động bằng cách so khớp các sự kiện hiện có trong 'bộ nhớ làm việc' với vế IF của các luật, và khi một luật được kích hoạt, hành động ở vế THEN sẽ được thực thi. Quá trình này tạo ra một chuỗi suy diễn logic để đi đến kết luận cuối cùng, làm cho nó trở thành một công cụ mạnh mẽ trong các hệ thống chuyên gia và hệ thống hỗ trợ ra quyết định.

3.1. Cấu trúc luật IF THEN và đồ thị AND OR

Một luật sản xuất cơ bản có dạng: IF A1 AND A2 AND … AND An THEN B. Trong đó, A là các điều kiện (premises) và B là kết luận (conclusion). Tài liệu của Nguyễn Nhật Quang lưu ý rằng các mệnh đề điều kiện không nên chứa toán tử OR, thay vào đó, một luật IF A1 ∨ A2 THEN B sẽ được tách thành hai luật riêng biệt: IF A1 THEN BIF A2 THEN B. Tương tự, mệnh đề kết luận cũng không chứa toán tử AND. Để trực quan hóa các mối quan hệ phức tạp giữa các luật, đồ thị AND/OR được sử dụng. Đồ thị này biểu diễn các kết luận (nút) và các điều kiện cần thiết để đạt được chúng. Các liên kết AND cho thấy tất cả các điều kiện con phải đúng, trong khi liên kết OR cho thấy chỉ cần một trong các điều kiện con đúng là đủ.

3.2. Ưu và nhược điểm của hệ thống suy diễn dựa trên luật

Hệ thống suy diễn dựa trên luật (RBS) có nhiều ưu điểm nổi bật. Chúng có cách biểu diễn phù hợp, dễ hiểu đối với cả chuyên gia và người dùng cuối. Tri thức được biểu diễn theo kiểu khai báo (declarative), nghĩa là kỹ sư tri thức chỉ cần định nghĩa 'cái gì' (các luật), còn hệ thống sẽ tự quyết định 'làm thế nào' để sử dụng chúng. Điều này giúp việc mở rộng cơ sở tri thức trở nên đơn giản bằng cách thêm các luật mới. Tuy nhiên, RBS cũng có những nhược điểm. Khả năng biểu diễn bị giới hạn với những tri thức phức tạp không dễ dàng mô tả bằng dạng IF-THEN. Ngoài ra, sự tương tác giữa hàng trăm, hàng nghìn luật có thể gây ra các hiệu ứng không mong muốn như mâu thuẫn hoặc vòng lặp, khiến việc bảo trì hệ thống trở nên khó khăn và tốn kém.

IV. Giải pháp biểu diễn tri thức bằng Khung và Mạng ngữ nghĩa

Bên cạnh luật sản xuất, tài liệu Trí tuệ nhân tạo Nguyễn Nhật Quang DHBKHN còn giới thiệu hai phương pháp biểu diễn tri thức mạnh mẽ khác là Khung (Frames)Mạng ngữ nghĩa (Semantic Networks). Cả hai phương pháp này đều tiếp cận vấn đề theo hướng cấu trúc và mối quan hệ, phù hợp để mô tả các đối tượng và khái niệm trong thế giới thực. Khung là một cấu trúc dữ liệu mô tả một đối tượng hoặc một lớp đối tượng thông qua các thuộc tính (slots) và giá trị của chúng (fillers). Ví dụ, một khung 'SinhVien' có thể có các slot như 'Mã số', 'Họ tên', 'Chuyên ngành'. Phương pháp này hỗ trợ tính kế thừa (inheritance), cho phép một khung con thừa hưởng thuộc tính từ khung cha, giúp tổ chức tri thức một cách có hệ thống. Trong khi đó, Mạng ngữ nghĩa sử dụng đồ thị để biểu diễn tri thức. Mỗi nút trong mạng đại diện cho một khái niệm, và các cạnh có nhãn biểu diễn mối quan hệ giữa chúng (ví dụ: 'IS-A', 'HAS-PART'). Cách tiếp cận này rất trực quan và hiệu quả trong việc thể hiện các mối quan hệ phân cấp và liên kết trong một lĩnh vực tri thức rộng lớn, đặc biệt hữu ích cho các bài toán xử lý ngôn ngữ tự nhiên.

4.1. Biểu diễn hướng đối tượng với Khung Frames

Khung (Frame) là một phương pháp biểu diễn hướng đối tượng, trong đó tri thức được tổ chức xoay quanh các đối tượng. Mỗi khung đại diện cho một khái niệm và chứa các 'slots' để lưu trữ các thuộc tính của khái niệm đó. Ví dụ, khung 'XeHoi' có các slot 'MauSac', 'SoBanh', 'HangSanXuat'. Một điểm mạnh của khung là khả năng kết hợp cả tri thức khai báo (giá trị trong slots) và tri thức thủ tục (các thủ tục IF-ADDED hoặc IF-NEEDED được gắn vào slots). Thủ tục IF-NEEDED sẽ được thực thi khi cần giá trị của một slot chưa được điền, trong khi IF-ADDED được kích hoạt khi một giá trị mới được gán vào slot. Cơ chế này cho phép hệ thống tự động tính toán và duy trì sự nhất quán của tri thức, tạo ra một mô hình biểu diễn linh hoạt và mạnh mẽ.

4.2. Cơ chế kế thừa và suy diễn trong Mạng ngữ nghĩa

Mạng ngữ nghĩa (Semantic Network) biểu diễn tri thức dưới dạng một đồ thị gồm các nút và các cung có nhãn. Các nút là các khái niệm, và các cung thể hiện mối quan hệ giữa chúng. Mối quan hệ quan trọng nhất là 'IS-A' (là một loại) và 'INSTANCE-OF' (là một thể hiện), tạo nên một cấu trúc phân cấp. Cơ chế kế thừa cho phép một nút con thừa hưởng các thuộc tính từ nút cha. Ví dụ, nếu 'Chim' có thuộc tính 'có thể bay', và 'Canary' là một loại ('IS-A') 'Chim', thì hệ thống có thể suy diễn rằng 'Canary' cũng 'có thể bay' mà không cần khai báo tường minh. Quá trình suy diễn trong mạng ngữ nghĩa thường được thực hiện thông qua lan truyền kích hoạt (spreading activation), khi một nút được kích hoạt, nó sẽ lan truyền ảnh hưởng đến các nút liên quan, giúp tìm kiếm các mối liên hệ ngữ nghĩa.

V. Cơ chế suy diễn trong các hệ thống Trí tuệ nhân tạo DHBKHN

Quá trình suy diễn (reasoning) là linh hồn của một hệ thống Trí tuệ nhân tạo, cho phép nó đi từ những sự kiện đã biết đến những kết luận mới. Dù sử dụng phương pháp biểu diễn tri thức nào, hệ thống đều cần một cơ chế suy diễn hiệu quả. Trong các hệ thống dựa trên luật, quá trình này được thực hiện thông qua một chuỗi suy diễn, tức là xác định trật tự áp dụng các luật. Có hai chiến lược chính: suy diễn tiến (forward chaining)suy diễn lùi (backward chaining). Suy diễn tiến bắt đầu từ các sự kiện ban đầu và áp dụng các luật để sinh ra các sự kiện mới cho đến khi đạt được mục tiêu. Ngược lại, suy diễn lùi bắt đầu từ một giả thuyết (mục tiêu) và tìm kiếm các luật có thể chứng minh giả thuyết đó. Một vấn đề quan trọng trong quá trình suy diễn là xung đột (conflict), xảy ra khi có nhiều luật cùng có thể được áp dụng tại một thời điểm. Để giải quyết vấn đề này, hệ thống cần các chiến lược giải quyết xung đột, chẳng hạn như ưu tiên luật có nhiều điều kiện nhất (cụ thể nhất) hoặc luật vừa được kích hoạt gần đây. Những cơ chế này đảm bảo quá trình suy luận của hệ thống AI diễn ra một cách logic và có trật tự.

5.1. So khớp mẫu và chuỗi suy diễn tiến lùi

So khớp mẫu (Pattern matching) là bước đầu tiên trong chu trình suy diễn của một hệ thống dựa trên luật. Hệ thống sẽ kiểm tra các sự kiện trong bộ nhớ làm việc (working memory) để xem chúng có khớp với phần điều kiện (vế IF) của bất kỳ luật nào trong cơ sở tri thức hay không. Các luật được khớp sẽ tạo thành một 'tập xung đột'. Sau đó, chuỗi suy diễn sẽ được áp dụng. Suy diễn tiến phù hợp với các bài toán cần dự đoán kết quả từ một tập dữ liệu đầu vào, như giám sát và điều khiển. Trong khi đó, suy diễn lùi lại hiệu quả cho các bài toán chẩn đoán, nơi cần xác minh một giả thuyết, ví dụ: 'Bệnh nhân có bị bệnh X không?'.

5.2. Các chiến lược giải quyết xung đột trong cơ sở tri thức

Khi có nhiều hơn một luật thỏa mãn điều kiện để được thực thi, một xung đột xảy ra. Việc lựa chọn luật nào để áp dụng tiếp theo có thể ảnh hưởng lớn đến hiệu quả và kết quả của quá trình suy diễn. Một số chiến lược giải quyết xung đột (conflict resolution strategy) phổ biến bao gồm: áp dụng luật xuất hiện đầu tiên; ưu tiên luật cụ thể nhất (có nhiều điều kiện nhất); ưu tiên các luật phù hợp với các sự kiện mới được thêm vào bộ nhớ; hoặc áp dụng luật có độ tin cậy cao nhất. Việc lựa chọn chiến lược phù hợp phụ thuộc vào đặc thù của bài toán. Một chiến lược tốt sẽ giúp hệ thống suy diễn nhanh hơn và đưa ra các quyết định hợp lý hơn, tránh đi vào các nhánh suy luận không cần thiết hoặc bị lặp.

24/07/2025