Luận văn thạc sĩ về phát hiện sớm mã độc IoT botnet trên các thiết bị IoT

Trường đại học

Học viện Công nghệ Bưu chính Viễn thông

Chuyên ngành

Hệ thống thông tin

Người đăng

Ẩn danh

Thể loại

luận văn thạc sĩ

2021

Phí lưu trữ

30 Point

Mục lục chi tiết

LỜI CAM ĐOAN

LỜI CẢM ƠN

1. CHƯƠNG 1: TỔNG QUAN VỀ PHÁT HIỆN SỚM MÃ ĐỘC TRÊN CÁC THIẾT BỊ IOT

1.1. Tổng quan về các thiết bị IoT và IoT Botnet

1.2. Tổng quan về thiết bị IoT

1.2.1. Khái niệm thiết bị IoT

1.3. Phân loại thiết bị IoT

1.4. Đặc điểm của thiết bị IoT cỡ nhỏ

1.5. Tổng quan về mã độc IoT Botnet

1.5.1. Khái niệm mã độc IoT Botnet

1.5.2. Cấu trúc và nguyên lý hoạt động của IoT Botnet

2. CHƯƠNG 2: XÂY DỰNG MÔ HÌNH HỌC MÁY PHÁT HIỆN SỚM MÃ ĐỘC IOT BOTNET

2.1. Tổng quan mô hình học máy cộng tác

2.2. Mô hình ứng dụng

2.2.1. Bộ phận thu thập dữ liệu

2.2.2. Bộ phận tiền xử lý và chuẩn hóa dữ liệu

2.2.3. Bộ phận trích chọn đặc trưng

2.2.4. Bộ tổng hợp dự đoán

3. CHƯƠNG 3: THỰC NGHIỆM VÀ ĐÁNH GIÁ

3.1. Bộ dữ liệu

3.2. Môi trường triển khai thực nghiệm

3.3. Kết quả thực nghiệm

3.4. Đánh giá kết quả thực nghiệm

MỞ ĐẦU

DANH MỤC TỪ VIẾT TẮT

DANH MỤC HÌNH ẢNH

DANH MỤC BẢNG BIỂU

DANH MỤC TÀI LIỆU THAM KHẢO

KẾT LUẬN VÀ KIẾN NGHỊ

Tóm tắt

I. Tổng quan về mã độc IoT botnet

Mã độc IoT botnet là một trong những mối đe dọa lớn nhất đối với an ninh mạng hiện nay. Mã độc IoT được thiết kế để lây nhiễm vào các thiết bị IoT, tạo thành một mạng lưới botnet có khả năng thực hiện các cuộc tấn công quy mô lớn. Theo báo cáo của Kaspersky, số lượng mã độc trên thiết bị IoT đã tăng gấp 37 lần từ năm 2016 đến 2018. Điều này cho thấy sự gia tăng đáng kể trong việc sử dụng botnet IoT để thực hiện các cuộc tấn công từ chối dịch vụ phân tán (DDoS). Các thiết bị IoT thường có phần cứng hạn chế, khiến cho việc bảo mật trở nên khó khăn hơn. Do đó, việc phát hiện sớm mã độc là rất cần thiết để bảo vệ an ninh mạng. "Mã độc IoT botnet không chỉ gây thiệt hại cho các thiết bị mà còn có thể ảnh hưởng đến toàn bộ hệ thống mạng".

1.1. Khái niệm mã độc IoT

Mã độc IoT là các chương trình độc hại được thiết kế để lây nhiễm vào các thiết bị IoT. Theo định nghĩa, mã độc là các đoạn mã được chèn vào hệ thống nhằm gây hại cho máy tính hoặc mạng. Mã độc IoT botnet là một loại mã độc cho phép xây dựng mạng lưới botnet từ các thiết bị IoT. Các thiết bị này thường không được bảo vệ tốt, khiến chúng trở thành mục tiêu lý tưởng cho các cuộc tấn công. "Mã độc IoT botnet có thể kiểm soát hàng triệu thiết bị, tạo ra một sức mạnh tấn công khổng lồ".

1.2. Nguy cơ bảo mật từ mã độc IoT

Nguy cơ từ mã độc IoT botnet không chỉ dừng lại ở việc lây nhiễm thiết bị mà còn có thể dẫn đến các cuộc tấn công lớn trên toàn cầu. Các thiết bị IoT thường có tài nguyên hạn chế, không đủ khả năng để chạy các phần mềm bảo mật mạnh mẽ. Điều này tạo ra một lỗ hổng lớn cho các kẻ tấn công. "Sự gia tăng của mã độc IoT botnet đã đặt ra thách thức lớn cho các chuyên gia an ninh mạng trong việc phát hiện và ngăn chặn các cuộc tấn công".

II. Phương pháp phát hiện mã độc IoT botnet

Phát hiện sớm mã độc IoT botnet là một nhiệm vụ quan trọng trong việc bảo vệ an ninh mạng. Các phương pháp phát hiện hiện tại chủ yếu dựa trên hai kỹ thuật: phân tích tĩnh và phân tích động. Phân tích tĩnh thường gặp khó khăn trong việc phát hiện mã độc mới, trong khi phân tích động cho phép theo dõi hành vi của mã độc trong thời gian thực. "Phân tích động có thể giúp phát hiện các hành vi bất thường của thiết bị, từ đó nhận diện mã độc một cách hiệu quả hơn". Việc áp dụng các mô hình học máy trong phát hiện mã độc cũng đang được nghiên cứu và triển khai.

2.1. Phân tích tĩnh

Phân tích tĩnh là phương pháp kiểm tra mã độc mà không cần thực thi mã. Phương pháp này thường sử dụng các công cụ để quét mã và tìm kiếm các dấu hiệu của mã độc. Tuy nhiên, phương pháp này có nhược điểm là không thể phát hiện các mã độc được mã hóa hoặc các mã độc mới chưa được biết đến. "Phân tích tĩnh có thể giúp phát hiện các mẫu mã độc đã biết, nhưng không đủ hiệu quả để phát hiện mã độc IoT botnet mới".

2.2. Phân tích động

Phân tích động cho phép theo dõi hành vi của mã độc trong môi trường thực thi. Phương pháp này có thể phát hiện các hành vi bất thường của thiết bị, từ đó nhận diện mã độc một cách hiệu quả hơn. Việc sử dụng các công cụ như sandbox để phân tích hành vi của mã độc trong môi trường an toàn là một trong những cách tiếp cận hiệu quả. "Phân tích động giúp phát hiện mã độc IoT botnet ngay cả khi chúng chưa được biết đến, từ đó nâng cao khả năng bảo mật cho hệ thống".

III. Ứng dụng thực tiễn của phát hiện mã độc IoT botnet

Việc phát hiện sớm mã độc IoT botnet không chỉ có ý nghĩa trong việc bảo vệ các thiết bị IoT mà còn góp phần bảo vệ toàn bộ hệ thống mạng. Các giải pháp phát hiện mã độc có thể được áp dụng trong nhiều lĩnh vực, từ quản lý năng lượng đến y tế. "Sự phát triển của công nghệ IoT đang mở ra nhiều cơ hội, nhưng cũng đặt ra nhiều thách thức về an ninh mạng". Việc áp dụng các phương pháp phát hiện mã độc hiệu quả sẽ giúp giảm thiểu rủi ro và bảo vệ thông tin nhạy cảm.

3.1. Ứng dụng trong quản lý năng lượng

Trong lĩnh vực quản lý năng lượng, các thiết bị IoT thường được sử dụng để giám sát và điều khiển hệ thống. Việc phát hiện mã độc IoT botnet có thể giúp bảo vệ các hệ thống này khỏi các cuộc tấn công, đảm bảo hoạt động liên tục và an toàn. "Các thiết bị IoT trong quản lý năng lượng cần được bảo vệ để tránh bị tấn công và gây ra thiệt hại lớn".

3.2. Ứng dụng trong y tế

Trong lĩnh vực y tế, các thiết bị IoT được sử dụng để theo dõi sức khỏe bệnh nhân và quản lý thông tin y tế. Việc phát hiện mã độc IoT botnet có thể giúp bảo vệ thông tin nhạy cảm và đảm bảo an toàn cho bệnh nhân. "An ninh mạng trong y tế là rất quan trọng, và việc phát hiện mã độc IoT botnet là một phần không thể thiếu trong chiến lược bảo mật".

25/01/2025

Bạn đang xem trước tài liệu:

Luận văn thạc sĩ phát hiện sớm mã độc iot botnet trên các thiết bị iot

Tải đầy đủ

Nội dung chính

Tổng quan nghiên cứu

Trong bối cảnh sự phát triển nhanh chóng của các thiết bị Internet of Things (IoT) trên toàn cầu, số lượng và tính năng của các thiết bị này ngày càng gia tăng, kéo theo sự xuất hiện và tiến hóa phức tạp của các loại mã độc IoT Botnet. Theo báo cáo của ngành, số lượng mã độc trên thiết bị IoT đã tăng gấp hơn 37 lần trong giai đoạn 2016-2018, gây ra những hậu quả nghiêm trọng như vụ tấn công DDoS quy mô lớn với lưu lượng lên đến hàng terabit mỗi giây, làm gián đoạn mạng Internet toàn cầu. Vấn đề phát hiện sớm mã độc IoT Botnet trên các thiết bị IoT cỡ nhỏ, vốn có tài nguyên phần cứng hạn chế, trở thành một thách thức lớn do các giải pháp bảo mật truyền thống như phần mềm diệt virus, hệ thống phát hiện xâm nhập mạng (IDS/IPS) và tường lửa thường chỉ phát hiện được khi mã độc đã thực hiện tấn công.

Mục tiêu nghiên cứu của luận văn là xây dựng và đánh giá một mô hình học máy cộng tác nhằm phát hiện sớm mã độc IoT Botnet trên các thiết bị IoT cỡ nhỏ, sử dụng phương pháp phân tích động dựa trên dữ liệu hành vi thu thập từ môi trường sandbox. Phạm vi nghiên cứu tập trung vào các thiết bị IoT có phần cứng hạn chế tài nguyên, với dữ liệu thu thập trong môi trường giả lập V-Sandbox, sử dụng bộ dữ liệu các tệp thực thi ELF thu thập trong giai đoạn gần đây. Nghiên cứu có ý nghĩa quan trọng trong việc nâng cao khả năng bảo vệ hệ thống mạng IoT, giảm thiểu thiệt hại do các cuộc tấn công mạng gây ra, đồng thời góp phần phát triển các giải pháp an ninh mạng phù hợp với đặc thù của thiết bị IoT cỡ nhỏ.

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Luận văn dựa trên hai lý thuyết chính: lý thuyết về mã độc IoT Botnet và mô hình học máy cộng tác. Mã độc IoT Botnet được định nghĩa là mạng lưới các thiết bị IoT bị xâm nhập và lây nhiễm mã độc nhằm thực hiện các cuộc tấn công mạng, đặc biệt là tấn công từ chối dịch vụ phân tán (DDoS). Các đặc điểm chính của mã độc này bao gồm khả năng quét lỗ hổng, leo thang đặc quyền, ẩn mình trong bộ nhớ RAM và thực hiện các lệnh từ máy chủ điều khiển (C&C).

Mô hình học máy cộng tác được áp dụng nhằm cải thiện hiệu suất phát hiện bằng cách kết hợp dự đoán từ nhiều bộ phân loại con khác nhau. Ba phương pháp hợp nhất dữ liệu được khảo sát gồm: hợp nhất sớm (kết hợp đặc trưng đầu vào), hợp nhất muộn (kết hợp kết quả phân loại) và hợp nhất trung gian (kết hợp qua lớp ẩn). Luận văn lựa chọn phương pháp hợp nhất muộn để tận dụng ưu điểm trong việc giảm thiểu quá khớp và tăng độ chính xác dự đoán.

Ba khái niệm chuyên ngành quan trọng được sử dụng là:

Phân tích động (Dynamic Analysis): Giám sát hành vi của tệp tin khi thực thi trong môi trường giả lập để phát hiện hành vi độc hại.
Đặc trưng hành vi (Behavioral Features): Bao gồm lời gọi hệ thống, luồng mạng và sử dụng tài nguyên hệ thống, được trích xuất để làm đầu vào cho mô hình học máy.
Sandbox V-Sandbox: Môi trường ảo hóa dựa trên QEMU, hỗ trợ thu thập dữ liệu hành vi đa chiều của tệp ELF trên nền tảng Linux.

Phương pháp nghiên cứu

Nguồn dữ liệu chính là bộ dữ liệu các tệp thực thi ELF được thu thập và xử lý trong môi trường V-Sandbox, bao gồm dữ liệu lời gọi hệ thống, luồng mạng và sử dụng tài nguyên hệ thống. Cỡ mẫu gồm hàng nghìn tệp tin, trong đó có cả mã độc và tệp lành tính, được lựa chọn ngẫu nhiên từ bộ dữ liệu thu thập thực tế.

Phương pháp phân tích dữ liệu bao gồm:

Tiền xử lý và chuẩn hóa dữ liệu nhằm loại bỏ nhiễu và đồng nhất định dạng.
Trích chọn đặc trưng bằng phương pháp Information Gain để giảm chiều dữ liệu, tăng hiệu quả mô hình.
Áp dụng mô hình học máy cộng tác với các bộ phân loại như Random Forest, AdaBoost, Gradient Boosting, và Bagging.
Kết hợp dự đoán từ các bộ phân loại con theo phương pháp hợp nhất muộn để đưa ra quyết định cuối cùng.

Timeline nghiên cứu kéo dài trong khoảng 12 tháng, bao gồm các giai đoạn thu thập dữ liệu, xây dựng mô hình, thực nghiệm và đánh giá kết quả.

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

Hiệu quả phát hiện sớm dựa trên dữ liệu lời gọi hệ thống: Số lượng lời gọi hệ thống của tệp chứa mã độc trung bình trên 300, trong khi tệp lành tính dưới 100. Sử dụng 300 lời gọi hệ thống đầu tiên làm dữ liệu đầu vào, mô hình đạt độ chính xác phát hiện trên 95%.
Đặc trưng luồng mạng giúp phân biệt mã độc và tệp lành tính: Số lượng gói tin mạng của mã độc thường vượt ngưỡng 50 gói tin, trong khi tệp lành tính thấp hơn. Bộ đặc trưng gồm 14 đặc trưng có giá trị thông tin cao nhất được chọn từ tổng số 49 đặc trưng, giúp mô hình đạt độ chính xác trên 93%.
Dữ liệu sử dụng tài nguyên hệ thống phản ánh hành vi mã độc: Mã độc yêu cầu sử dụng tài nguyên nhiều hơn, đặc biệt trong 20 trạng thái đầu tiên. Bộ đặc trưng thống kê gồm 80 đặc trưng được sử dụng, giúp mô hình phân biệt hiệu quả với độ chính xác trên 90%.
Mô hình học máy cộng tác với hợp nhất muộn cải thiện hiệu suất: So với các bộ phân loại đơn lẻ, mô hình cộng tác tăng độ chính xác phát hiện lên khoảng 3-5%, đồng thời giảm tỷ lệ báo động giả. Kết quả thực nghiệm cho thấy mô hình đạt độ chính xác tổng thể trên 97%, F1-score trên 96%.

Thảo luận kết quả

Nguyên nhân chính của hiệu quả cao là do mô hình tận dụng được đa dạng đặc trưng hành vi thu thập từ nhiều nguồn dữ liệu khác nhau, đồng thời phương pháp hợp nhất muộn giúp giảm thiểu sai số và tăng tính ổn định của dự đoán. So sánh với các nghiên cứu trước đây chủ yếu tập trung vào phân tích tĩnh hoặc chỉ sử dụng một loại dữ liệu hành vi, nghiên cứu này đã mở rộng phạm vi và nâng cao độ chính xác phát hiện sớm.

Dữ liệu có thể được trình bày qua biểu đồ so sánh số lượng lời gọi hệ thống, số gói tin mạng giữa mã độc và tệp lành tính, cũng như bảng thống kê các đặc trưng được chọn lọc và hiệu suất các bộ phân loại. Điều này giúp minh họa rõ ràng sự khác biệt hành vi và hiệu quả mô hình.

Kết quả nghiên cứu có ý nghĩa thực tiễn lớn trong việc phát hiện sớm mã độc IoT Botnet, góp phần giảm thiểu thiệt hại do các cuộc tấn công mạng gây ra, đồng thời cung cấp cơ sở khoa học cho việc phát triển các giải pháp bảo mật IoT hiệu quả hơn.

Đề xuất và khuyến nghị

Triển khai mô hình học máy cộng tác trên các thiết bị IoT cỡ nhỏ: Áp dụng mô hình phát hiện sớm mã độc dựa trên dữ liệu hành vi thu thập từ môi trường sandbox, nhằm phát hiện và ngăn chặn mã độc trước khi thực hiện tấn công DDoS. Thời gian thực hiện: 6-12 tháng; Chủ thể: các nhà phát triển phần mềm bảo mật và nhà sản xuất thiết bị IoT.
Phát triển hệ thống giám sát hành vi đa chiều: Tích hợp thu thập dữ liệu lời gọi hệ thống, luồng mạng và sử dụng tài nguyên hệ thống để nâng cao độ chính xác phát hiện. Thời gian: 12 tháng; Chủ thể: các tổ chức an ninh mạng và trung tâm giám sát mạng.
Cập nhật và mở rộng bộ dữ liệu mẫu mã độc IoT: Thu thập dữ liệu đa dạng từ nhiều loại thiết bị và kiến trúc vi xử lý khác nhau để cải thiện khả năng tổng quát của mô hình. Thời gian: liên tục; Chủ thể: các viện nghiên cứu và cộng đồng bảo mật.
Tăng cường đào tạo và nâng cao nhận thức về an ninh IoT: Đào tạo kỹ thuật viên, quản trị viên mạng về các phương pháp phát hiện sớm mã độc IoT Botnet và cách ứng dụng mô hình học máy trong thực tế. Thời gian: 6 tháng; Chủ thể: các cơ sở đào tạo và doanh nghiệp công nghệ.

Đối tượng nên tham khảo luận văn

Nhà nghiên cứu và phát triển công nghệ bảo mật IoT: Luận văn cung cấp cơ sở lý thuyết và phương pháp thực nghiệm về phát hiện sớm mã độc IoT Botnet, hỗ trợ nghiên cứu và phát triển các giải pháp bảo mật mới.
Nhà sản xuất thiết bị IoT: Thông tin về đặc điểm thiết bị IoT cỡ nhỏ và các nguy cơ bảo mật giúp nhà sản xuất thiết kế sản phẩm an toàn hơn, tích hợp các giải pháp phát hiện mã độc hiệu quả.
Chuyên gia an ninh mạng và quản trị hệ thống: Mô hình học máy cộng tác và phương pháp phân tích động cung cấp công cụ hỗ trợ phát hiện và ngăn chặn mã độc IoT Botnet trong môi trường mạng thực tế.
Cơ quan quản lý và chính sách công: Nghiên cứu giúp xây dựng các chính sách, quy định về an toàn thông tin cho hệ sinh thái IoT, đồng thời định hướng phát triển công nghệ bảo mật phù hợp.

Câu hỏi thường gặp

Phân tích động khác gì so với phân tích tĩnh trong phát hiện mã độc IoT Botnet?
Phân tích động giám sát hành vi khi mã độc thực thi, giúp phát hiện các kỹ thuật gây rối mã nguồn và mã độc chỉ tồn tại trong bộ nhớ, trong khi phân tích tĩnh dựa trên mã nguồn hoặc tệp tin mà không cần thực thi, dễ bị hạn chế bởi mã hóa và đóng gói.
Tại sao mô hình học máy cộng tác được ưu tiên sử dụng?
Mô hình học máy cộng tác kết hợp dự đoán từ nhiều bộ phân loại giúp tăng độ chính xác, giảm quá khớp và cải thiện khả năng tổng quát so với các bộ phân loại đơn lẻ.
Làm thế nào để thu thập dữ liệu hành vi từ thiết bị IoT cỡ nhỏ?
Sử dụng môi trường giả lập sandbox như V-Sandbox để thực thi tệp tin ELF và giám sát các hành vi như lời gọi hệ thống, luồng mạng và sử dụng tài nguyên hệ thống, từ đó trích xuất đặc trưng phục vụ phân tích.
Mô hình có thể áp dụng cho các thiết bị IoT với kiến trúc vi xử lý khác nhau không?
Mô hình được thiết kế để xử lý đa kiến trúc nhờ sử dụng dữ liệu hành vi và phương pháp học máy, tuy nhiên cần mở rộng bộ dữ liệu huấn luyện để đảm bảo hiệu quả trên nhiều nền tảng.
Giải pháp này có thể phát hiện mã độc mới (zero-day) không?
Phương pháp dựa trên hành vi và học máy có khả năng phát hiện các biến thể mã độc mới dựa trên đặc trưng hành vi tương đồng, vượt trội hơn so với phương pháp dựa trên chữ ký truyền thống.

Kết luận

Luận văn đã xây dựng thành công mô hình học máy cộng tác phát hiện sớm mã độc IoT Botnet trên thiết bị IoT cỡ nhỏ, đạt độ chính xác trên 97%.
Phương pháp phân tích động dựa trên dữ liệu hành vi thu thập từ môi trường V-Sandbox giúp phát hiện mã độc ngay từ giai đoạn đầu của hành vi độc hại.
Việc trích chọn đặc trưng hiệu quả từ lời gọi hệ thống, luồng mạng và sử dụng tài nguyên hệ thống góp phần nâng cao hiệu suất mô hình.
Mô hình hợp nhất muộn trong học máy cộng tác giúp cải thiện độ chính xác và giảm tỷ lệ báo động giả so với các bộ phân loại đơn lẻ.
Các bước tiếp theo bao gồm mở rộng bộ dữ liệu đa nền tảng, triển khai thực tế và đào tạo chuyên gia để ứng dụng mô hình trong bảo vệ hệ sinh thái IoT.

Để bảo vệ hệ thống IoT trước các mối đe dọa ngày càng tinh vi, các nhà nghiên cứu và chuyên gia an ninh mạng nên tiếp tục phát triển và ứng dụng các giải pháp phát hiện sớm dựa trên học máy như mô hình được trình bày trong luận văn này.

Bài luận văn thạc sĩ mang tiêu đề "Luận văn thạc sĩ về phát hiện sớm mã độc IoT botnet trên các thiết bị IoT" của tác giả Nguyễn Việt Dũng, dưới sự hướng dẫn của PGS TS Phạm Văn Cường, được thực hiện tại Học viện Công nghệ Bưu chính Viễn thông vào năm 2021. Bài viết tập trung vào việc phát hiện sớm mã độc botnet trên các thiết bị IoT, một vấn đề ngày càng trở nên nghiêm trọng trong bối cảnh công nghệ phát triển nhanh chóng. Bằng cách áp dụng các phương pháp và công nghệ hiện đại, nghiên cứu này không chỉ giúp nâng cao khả năng bảo mật cho các thiết bị IoT mà còn cung cấp những giải pháp thiết thực cho việc phòng ngừa và ứng phó với các mối đe dọa an ninh mạng.

Để mở rộng thêm kiến thức về an toàn thông tin và bảo mật mạng, bạn có thể tham khảo các tài liệu liên quan như Nghiên Cứu Triển Khai Hệ Thống Giám Sát An Ninh Mạng Dựa Trên Phần Mềm Wazuh, nơi nghiên cứu về hệ thống giám sát an ninh mạng, hay Luận văn thạc sĩ về bảo mật truyền tin giữa các nút mạng IoT, cung cấp cái nhìn sâu sắc về bảo mật trong mạng IoT. Cuối cùng, bạn cũng có thể tìm hiểu thêm về Luận văn thạc sĩ về phát hiện mã độc dựa trên phân tích mẫu, một nghiên cứu liên quan đến việc phát hiện mã độc, giúp bạn có cái nhìn tổng quát hơn về các phương pháp bảo mật hiện nay.

#an ninh mạng

#Nghiên cứu thạc sĩ

#tấn công mạng

#thiết bị IoT

#bảo mật IoT

#phát hiện mã độc

Chủ đề

Nghiên cứu và phát triển công nghệ bảo mật

An ninh mạng trong IoT

Bảo mật thiết bị IoT

Xu hướng tấn công mạng hiện nay