I. Luận văn thạc sĩ
Luận văn thạc sĩ của Lưu Mỹ Hòa với chủ đề Cơ sở toán học trong lý thuyết học máy được thực hiện tại Trường Đại học Bách Khoa, Đại học Quốc gia TP Hồ Chí Minh. Luận văn tập trung vào việc xây dựng nền tảng toán học cho các khái niệm cơ bản trong học máy, bao gồm lý thuyết độ đo, xác suất, và các mô hình toán học liên quan. Luận văn được bảo vệ vào ngày 22 tháng 6 năm 2024 dưới sự hướng dẫn của TS. Phùng Trọng Thực.
1.1. Mục tiêu luận văn
Mục tiêu chính của luận văn là trình bày các kiến thức toán học cơ bản làm nền tảng cho lý thuyết học máy. Cụ thể, luận văn tập trung vào các khái niệm như tối thiểu rủi ro thực nghiệm (ERM), mô hình học xấp xỉ đúng với xác suất cao (PAC), và chiều VC. Các kiến thức này được áp dụng để giải quyết các bài toán dự đoán và phân lớp trong học máy.
1.2. Phương pháp nghiên cứu
Luận văn sử dụng phương pháp nghiên cứu lý thuyết kết hợp với các ví dụ thực tiễn. Các khái niệm toán học như lý thuyết độ đo, xác suất, và thuật toán học máy được phân tích chi tiết. Các ví dụ minh họa như bài toán dự đoán mua nhà và bài toán phân loại Bắc hay Nam được sử dụng để làm rõ các khái niệm lý thuyết.
II. Toán ứng dụng trong học máy
Luận văn nhấn mạnh vai trò của toán học ứng dụng trong việc xây dựng các mô hình học máy. Các khái niệm toán học như lý thuyết độ đo, xác suất, và thuật toán học máy được sử dụng để phân tích và giải quyết các bài toán thực tế. Luận văn cũng đề cập đến các mô hình toán học như naive Bayes classifiers (NBC) và các phương pháp toán học để tối ưu hóa các thuật toán.
2.1. Lý thuyết độ đo và xác suất
Luận văn trình bày chi tiết về lý thuyết độ đo và xác suất, hai nền tảng quan trọng trong học máy. Các khái niệm như không gian đo được, hàm đo được, và tích phân được giải thích rõ ràng. Các phân phối xác suất thường gặp như phân phối Bernoulli, phân phối Poisson, và phân phối Gaussian cũng được đề cập.
2.2. Thuật toán học máy
Luận văn phân tích các thuật toán học máy dựa trên nền tảng toán học. Các khái niệm như tối thiểu rủi ro thực nghiệm (ERM), mô hình học xấp xỉ đúng với xác suất cao (PAC), và chiều VC được trình bày chi tiết. Các ví dụ minh họa như bài toán dự đoán mua nhà và bài toán phân loại Bắc hay Nam được sử dụng để làm rõ các khái niệm lý thuyết.
III. Ứng dụng thực tiễn
Luận văn không chỉ tập trung vào lý thuyết mà còn đề cập đến các ứng dụng thực tiễn của toán học trong học máy. Các ví dụ như bài toán dự đoán mua nhà và bài toán phân loại Bắc hay Nam được sử dụng để minh họa cách áp dụng các khái niệm toán học vào thực tế. Luận văn cũng nhấn mạnh tầm quan trọng của việc kết hợp lý thuyết toán học với thực tiễn để giải quyết các vấn đề phức tạp.
3.1. Bài toán dự đoán mua nhà
Luận văn trình bày một ví dụ cụ thể về bài toán dự đoán mua nhà sử dụng mô hình naive Bayes classifiers (NBC). Các bước thực hiện bao gồm thu thập dữ liệu, xây dựng mô hình, và đánh giá kết quả. Ví dụ này minh họa cách áp dụng các khái niệm toán học như xác suất và thuật toán học máy vào thực tế.
3.2. Bài toán phân loại Bắc hay Nam
Một ví dụ khác được đề cập trong luận văn là bài toán phân loại Bắc hay Nam. Luận văn sử dụng mô hình naive Bayes classifiers (NBC) để phân loại dữ liệu văn bản. Các bước thực hiện bao gồm tiền xử lý dữ liệu, xây dựng mô hình, và đánh giá kết quả. Ví dụ này minh họa cách áp dụng các khái niệm toán học vào xử lý ngôn ngữ tự nhiên.