## Tổng quan nghiên cứu

Trong bối cảnh sự bùng nổ dữ liệu và nhu cầu xử lý thông tin ngày càng tăng, điện toán đám mây (Cloud Computing) đã trở thành giải pháp thiết yếu cho việc lưu trữ và phân phối tài nguyên máy tính. Theo ước tính, các doanh nghiệp và tổ chức trên toàn cầu đang phải đối mặt với lượng dữ liệu khổng lồ, đòi hỏi hệ thống điện toán đám mây phải hoạt động hiệu quả, ổn định và linh hoạt. Tuy nhiên, vấn đề quá tải tài nguyên và mất cân bằng tải trong các trung tâm dữ liệu đám mây vẫn là thách thức lớn, ảnh hưởng trực tiếp đến chất lượng dịch vụ và hiệu suất hoạt động.

Mục tiêu chính của nghiên cứu là đề xuất thuật toán cân bằng tải trên điện toán đám mây dựa trên công nghệ trí tuệ nhân tạo (AI) hiện đại nhằm nâng cao hiệu quả phân phối tài nguyên, giảm thiểu thời gian xử lý và ngăn ngừa tình trạng quá tải. Nghiên cứu tập trung xây dựng mô hình mô phỏng với quy mô khoảng 10-20 máy ảo, xử lý các yêu cầu có dung lượng dữ liệu khoảng 1 Mb, trong môi trường điện toán đám mây tại Việt Nam giai đoạn 2020-2022. Ý nghĩa của nghiên cứu được thể hiện qua các chỉ số như giảm thiểu thời gian phản hồi (makespan), tăng tỷ lệ sử dụng tài nguyên và đảm bảo tính ổn định của hệ thống.

## Cơ sở lý thuyết và phương pháp nghiên cứu

### Khung lý thuyết áp dụng

- **Điện toán đám mây (Cloud Computing):** Mô hình cung cấp tài nguyên máy tính, lưu trữ và dịch vụ qua Internet theo yêu cầu, với các mô hình dịch vụ chính gồm IaaS, PaaS và SaaS. Điện toán đám mây giúp tiết kiệm chi phí, tăng khả năng truy cập và mở rộng linh hoạt.

- **Cân bằng tải (Load Balancing):** Kỹ thuật phân phối đồng đều khối lượng công việc giữa các máy chủ hoặc tài nguyên trong hệ thống để tối ưu hóa hiệu suất, tránh quá tải và nâng cao tính sẵn sàng.

- **Trí tuệ nhân tạo (AI) và Học máy (Machine Learning):** AI được ứng dụng để dự báo và phân loại các yêu cầu xử lý, trong đó học máy giúp xây dựng các mô hình dự báo dựa trên dữ liệu lịch sử nhằm tối ưu hóa việc phân bổ tài nguyên.

- **Thuật toán K-means:** Thuật toán phân cụm không giám sát, dùng để phân loại các máy ảo theo mức độ sử dụng tài nguyên (cao, trung bình, thấp), hỗ trợ trong việc lựa chọn máy chủ phù hợp cho từng loại yêu cầu.

- **Thuật toán Decision Trees (Cây quyết định):** Thuật toán giám sát dùng để phân loại các yêu cầu dựa trên các đặc trưng như kích thước, thời gian phản hồi, giúp dự báo thời gian xử lý và ưu tiên phân bổ tài nguyên.

### Phương pháp nghiên cứu

Nghiên cứu sử dụng phương pháp luận kết hợp giữa lý thuyết và thực nghiệm:

- **Nguồn dữ liệu:** Dữ liệu mô phỏng các yêu cầu (requests) trong môi trường điện toán đám mây, với kích thước file từ 1 Mb trở lên, số lượng yêu cầu từ 20 đến 1000, được tạo ngẫu nhiên dựa trên hàm random trong Java.

- **Phương pháp phân tích:** Áp dụng thuật toán dự báo Regression để phân loại yêu cầu theo các chỉ số Power, CPU Usage, RAM Usage; kết hợp thuật toán Decision Trees để phân loại và dự báo thời gian xử lý; sử dụng thuật toán K-means để phân cụm máy ảo theo mức độ sử dụng tài nguyên.

- **Mô hình mô phỏng:** Xây dựng mô hình mô phỏng trên nền tảng CloudSim với cấu hình 5 máy chủ vật lý, mỗi máy có 4 nhân CPU, RAM 16GB, sử dụng hệ điều hành Linux và công nghệ ảo hóa Xen.

- **Timeline nghiên cứu:** Nghiên cứu được thực hiện trong giai đoạn 2020-2022, bao gồm các bước thu thập dữ liệu, xây dựng mô hình, cài đặt thuật toán, thực nghiệm mô phỏng và phân tích kết quả.

## Kết quả nghiên cứu và thảo luận

### Những phát hiện chính

- Thuật toán DTLBA (Decision Trees in Load Balancing Algorithm) đề xuất đã giảm đáng kể thời gian xử lý yêu cầu so với các thuật toán truyền thống như Round Robin, MaxMin, MinMin và FCFS. Ví dụ, với 30 yêu cầu, thời gian xử lý của DTLBA duy trì ở mức trung bình thấp, trong khi MinMin và FCFS có thời gian xử lý cao hơn lần lượt khoảng 20-30%.

- Khi số lượng yêu cầu tăng lên 1000, DTLBA vẫn giữ được tính ổn định và hiệu quả, giảm thời gian xử lý trung bình xuống khoảng 40% so với MaxMin và FCFS, đồng thời tăng tỷ lệ sử dụng tài nguyên lên gần 68%.

- Thuật toán kết hợp Regression và Decision Trees giúp dự báo chính xác thời gian xử lý và phân loại yêu cầu, từ đó phân bổ tài nguyên hợp lý, giảm thiểu hiện tượng quá tải và deadlock trong hệ thống.

- Phân cụm máy ảo bằng K-means theo mức độ sử dụng tài nguyên giúp tối ưu hóa việc lựa chọn máy chủ phù hợp cho từng loại yêu cầu, nâng cao hiệu suất tổng thể của hệ thống.

### Thảo luận kết quả

Kết quả mô phỏng cho thấy việc ứng dụng AI trong cân bằng tải trên điện toán đám mây mang lại hiệu quả vượt trội so với các phương pháp truyền thống. Việc dự báo thời gian xử lý và phân loại yêu cầu giúp hệ thống chủ động điều phối tài nguyên, tránh tình trạng quá tải cục bộ và giảm thiểu độ trễ dịch vụ. So sánh với các nghiên cứu trước đây, thuật toán DTLBA không chỉ cải thiện thời gian xử lý mà còn nâng cao tính ổn định và khả năng mở rộng của hệ thống.

Biểu đồ so sánh thời gian xử lý giữa các thuật toán thể hiện rõ sự vượt trội của DTLBA, đặc biệt khi số lượng yêu cầu lớn, điều này chứng tỏ tính khả thi và hiệu quả của mô hình trong môi trường thực tế. Ngoài ra, việc phân cụm máy ảo giúp giảm thiểu chi phí truyền thông và tăng hiệu quả sử dụng tài nguyên, phù hợp với xu hướng phát triển điện toán đám mây hiện đại.

## Đề xuất và khuyến nghị

- **Triển khai thuật toán DTLBA trong các trung tâm dữ liệu đám mây:** Áp dụng thuật toán này để nâng cao hiệu quả phân phối tài nguyên, giảm thiểu thời gian phản hồi và tăng tính ổn định hệ thống. Thời gian thực hiện: 6-12 tháng, chủ thể: các nhà cung cấp dịch vụ đám mây.

- **Phát triển hệ thống giám sát và dự báo dựa trên AI:** Xây dựng hệ thống thu thập dữ liệu thời gian thực và sử dụng mô hình học máy để dự báo tải và điều phối tài nguyên. Mục tiêu giảm thiểu hiện tượng deadlock và quá tải. Thời gian: 12 tháng, chủ thể: nhóm nghiên cứu và phát triển công nghệ.

- **Tối ưu hóa phân cụm máy ảo theo mức độ sử dụng tài nguyên:** Áp dụng thuật toán K-means để phân loại và quản lý máy ảo, giúp cân bằng tải hiệu quả hơn. Thời gian: 6 tháng, chủ thể: bộ phận quản lý hạ tầng CNTT.

- **Đào tạo và nâng cao nhận thức về AI trong quản lý điện toán đám mây:** Tổ chức các khóa đào tạo cho kỹ sư và quản trị viên về ứng dụng AI trong cân bằng tải và quản lý tài nguyên. Thời gian: liên tục, chủ thể: các tổ chức đào tạo và doanh nghiệp.

## Đối tượng nên tham khảo luận văn

- **Nhà cung cấp dịch vụ đám mây:** Nghiên cứu giúp cải thiện hiệu suất và chất lượng dịch vụ, giảm chi phí vận hành và tăng sự hài lòng khách hàng.

- **Nhà phát triển phần mềm và kỹ sư hệ thống:** Áp dụng các thuật toán AI để tối ưu hóa phân phối tài nguyên và nâng cao hiệu quả xử lý trong môi trường đám mây.

- **Nhà nghiên cứu và học viên ngành công nghệ thông tin:** Cung cấp cơ sở lý thuyết và thực nghiệm về ứng dụng AI trong cân bằng tải, mở rộng nghiên cứu trong lĩnh vực điện toán đám mây.

- **Doanh nghiệp sử dụng dịch vụ đám mây:** Hiểu rõ hơn về cách thức hoạt động và tối ưu hóa tài nguyên, từ đó lựa chọn giải pháp phù hợp với nhu cầu kinh doanh.

## Câu hỏi thường gặp

1. **Thuật toán DTLBA là gì và có ưu điểm gì?**  
DTLBA là thuật toán cân bằng tải sử dụng Decision Trees kết hợp với K-means để phân loại và phân bổ tài nguyên trên điện toán đám mây. Ưu điểm là giảm thời gian xử lý, tăng hiệu quả sử dụng tài nguyên và ngăn ngừa quá tải.

2. **Mô hình mô phỏng được xây dựng như thế nào?**  
Mô hình sử dụng CloudSim với cấu hình 5 máy chủ vật lý, mỗi máy có 4 nhân CPU, RAM 16GB, chạy hệ điều hành Linux và công nghệ ảo hóa Xen, mô phỏng từ 20 đến 1000 yêu cầu với kích thước dữ liệu ngẫu nhiên.

3. **Làm thế nào để dự báo thời gian xử lý yêu cầu?**  
Sử dụng thuật toán Regression để dự báo các thông số như Power, CPU Usage, RAM Usage, kết hợp với Decision Trees để phân loại yêu cầu theo thời gian xử lý dự kiến, giúp phân bổ tài nguyên hợp lý.

4. **Thuật toán này có thể áp dụng cho các loại dịch vụ đám mây nào?**  
Thuật toán phù hợp với các mô hình IaaS, PaaS và SaaS, đặc biệt hiệu quả trong môi trường có nhiều máy ảo và yêu cầu xử lý đa dạng, giúp tối ưu hóa tài nguyên và nâng cao chất lượng dịch vụ.

5. **Kết quả thực nghiệm cho thấy hiệu quả như thế nào?**  
Thực nghiệm trên CloudSim cho thấy DTLBA giảm thời gian xử lý trung bình từ 20% đến 40% so với các thuật toán truyền thống, đồng thời tăng tỷ lệ sử dụng tài nguyên lên gần 68%, đảm bảo tính ổn định và khả năng mở rộng.

## Kết luận

- Đã xây dựng và đề xuất thành công thuật toán cân bằng tải DTLBA dựa trên AI, kết hợp Decision Trees và K-means, nâng cao hiệu quả phân phối tài nguyên trên điện toán đám mây.  
- Thuật toán giảm thiểu thời gian xử lý và ngăn ngừa tình trạng quá tải, tăng tính ổn định và khả năng mở rộng của hệ thống.  
- Mô hình mô phỏng với quy mô 5 máy chủ và đến 1000 yêu cầu cho thấy tính khả thi và hiệu quả thực tiễn của thuật toán.  
- Đề xuất các giải pháp triển khai và đào tạo nhằm ứng dụng rộng rãi thuật toán trong các trung tâm dữ liệu đám mây.  
- Khuyến khích các nhà nghiên cứu và doanh nghiệp tiếp tục phát triển và ứng dụng AI trong quản lý tài nguyên điện toán đám mây để đáp ứng nhu cầu ngày càng tăng.

**Hành động tiếp theo:** Triển khai thử nghiệm thuật toán trong môi trường thực tế, mở rộng quy mô mô phỏng và phát triển hệ thống giám sát dự báo thông minh nhằm hoàn thiện giải pháp cân bằng tải trên điện toán đám mây.