KHOANH VÙNG TỰ ĐỘNG CÁC ĐỐI TƯỢNG TRÊN ẢNH VIỄN THÁM SỬ DỤNG MẠNG HỌC SÂU

Luận văn thạc sĩ về khoanh vùng đối tượng trên ảnh viễn thám bằng mạng học sâu. Nghiên cứu ứng dụng các mô hình U-Net, Resnet để phân tích ảnh vệ tinh tự động.

Trường đại học

Trường Đại Học Khoa Học Tự Nhiên

Chuyên ngành

Khoa Học Dữ Liệu

Người đăng

Ẩn danh

Thể loại

Luận Văn Thạc Sĩ

2022

Phí lưu trữ

30 Point

Mục lục chi tiết

LỜI CẢM ƠN

MỞ ĐẦU

1. CHƯƠNG 1: TỔNG QUAN VỀ KHOANH VÙNG ĐỐI TƯỢNG TRONG ẢNH VIỄN THÁM

1.1. Ảnh viễn thám

1.2. Bài toán phân đoạn ảnh

1.3. Một số ứng dụng của phân đoạn ảnh

1.4. Các thuật toán phân đoạn ảnh

1.4.1. Các phương pháp cổ điển

1.4.2. Sử dụng mạng học sâu

2. CHƯƠNG 2: CÁC KIẾN THỨC CƠ SỞ

2.1. Mô hình mạng U-Net

2.2. Mô hình Feature Pyramid Network (FPN)

2.2.1. Luồng hoạt động của FPN

2.2.2. FPN cho bài toán phân đoạn ảnh

2.3. Mô hình DeepLabV3

2.3.1. Kiến trúc chung của mô hình DeepLab

2.3.2. Tích chập Atrous

2.3.3. Atrous Spatial Pyramid Pooling (ASPP)

2.3.4. Tầng kết nối toàn bộ CRF

2.3.5. Mô hình DeepLabV3

2.4. Precision và Recall

2.5. Hệ số tương đồng Dice

3. CHƯƠNG 3: ÁP DỤNG HỌC SÂU CHO BÀI TOÁN KHOANH VÙNG ĐỐI TƯỢNG TRÊN ẢNH VIỄN THÁM

3.1. Cơ sở dữ liệu

3.2. Phương pháp đề xuất sử dụng mô hình kết hợp giữa U-Net và Resnet

3.2.1. Mô hình Resnet

3.2.2. Hàm tổn thất kết hợp giữa Dice Loss và Focal Loss

3.2.3. Nhánh phân loại phụ trợ

4. CHƯƠNG 4: THỰC NGHIỆM VÀ ĐÁNH GIÁ

4.1. Tham số mô hình

4.2. Kết quả và đánh giá

5. CHƯƠNG 5: KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN

DANH SÁCH BẢNG

DANH SÁCH HÌNH VẼ

DANH MỤC TỪ VIẾT TẮT

BẢNG CHÚ GIẢI THUẬT NGỮ

Tóm tắt

I. Tổng Quan Khoanh Vùng Ảnh Viễn Thám Mạng Học Sâu 55 ký tự

Công nghệ viễn thám ngày càng được ứng dụng rộng rãi, từ theo dõi biến đổi khí hậu đến phát hiện dầu loang. Do đó, xử lý và phân tích ảnh viễn thám đóng vai trò then chốt. Hiện có nhiều kỹ thuật xử lý ảnh, nhưng việc chọn thuật toán phù hợp phụ thuộc vào mục đích sử dụng. Luận văn này tập trung vào các kỹ thuật xử lý, phân tích và khoanh vùng đối tượng trên ảnh viễn thám bằng mạng học sâu. Tài liệu này được chia thành 4 chương, bao gồm giới thiệu, cơ sở lý thuyết, áp dụng học sâu và thực nghiệm đánh giá.

1.1. Ảnh Viễn Thám Khái niệm Phân loại Ứng dụng Thực Tế

Ảnh viễn thám, hay ảnh vệ tinh, thể hiện các vật thể trên bề mặt trái đất, được thu nhận bởi các bộ cảm biến trên vệ tinh. Tùy theo vùng bước sóng, ảnh viễn thám được chia thành quang học, nhiệt và ra-đa. Dữ liệu ảnh viễn thám được dùng để quan trắc ô nhiễm, giám sát tài nguyên, môi trường, tìm kiếm cứu nạn, phòng chống thiên tai, quốc phòng, an ninh. "Công nghệ viễn thám đã và đang được ứng dụng rộng rãi trong mọi mặt đời sống xã hội: theo dõi biến đổi khí hậu, biến đổi rừng, phát hiện và xử lý dầu loang trên biển..."

1.2. Bài Toán Khoanh Vùng Đối Tượng Trong Ảnh Viễn Thám Thách Thức

Bài toán khoanh vùng đối tượng ảnh viễn thám có nhiều thách thức. Dữ liệu hình ảnh thường bị mây che, bề mặt biển có nhiều sắc thái do sóng biển và ánh sáng thay đổi. Ngoài ra, thời tiết và các đối tượng khác như công trình xây dựng cũng gây khó khăn. Do đó, việc khoanh vùng tự động là một bài toán khó, đòi hỏi các phương pháp xử lý ảnh tiên tiến, đặc biệt là sử dụng mạng học sâu.

II. Phân Đoạn Ảnh Giải Pháp Cho Khoanh Vùng Viễn Thám 56 ký tự

Phân đoạn ảnh là phân chia ảnh thành nhiều vùng khác nhau, có chung mục tiêu với phát hiện đối tượng nhưng yêu cầu độ chính xác cao hơn. Phân đoạn ảnh đòi hỏi gán nhãn đúng tới từng điểm ảnh, giúp hiểu sâu hơn về nội dung ảnh. Có hai dạng phân đoạn ảnh chính là phân đoạn ngữ nghĩa và phân đoạn cá thể. Luận văn tập trung vào phân đoạn ngữ nghĩa để khoanh vùng đối tượng.

2.1. Phân Đoạn Ngữ Nghĩa và Phân Đoạn Cá Thể So Sánh Chi Tiết

Trong phân đoạn ngữ nghĩa, các vùng ảnh được phân đoạn theo các nhãn khác nhau, không phân biệt sự khác nhau giữa các đối tượng trong từng nhãn. Ngược lại, phân đoạn cá thể phân chia chi tiết đến từng đối tượng trong mỗi nhãn. Ví dụ, trong ảnh có nhiều người, phân đoạn ngữ nghĩa chỉ phân biệt điểm ảnh thuộc về người và điểm ảnh thuộc về nền, còn phân đoạn cá thể sẽ xác định từng điểm ảnh thuộc về người nào.

2.2. Ứng Dụng Của Phân Đoạn Ảnh Y Tế Giao Thông Nông Nghiệp...

Phân đoạn ảnh có nhiều ứng dụng thực tế. Trong y tế, nó giúp phân đoạn hình ảnh khối u trên ảnh x-quang. Trong giao thông, nó khoanh vùng các đối tượng và biển báo cho xe tự hành. Trong nông nghiệp, nó phân đoạn các vùng trên nông trường. Trong xử lý ảnh vệ tinh, nó phân đoạn các vùng để cảnh báo cháy rừng.

2.3. Các Thuật Toán Phân Đoạn Ảnh Từ Cổ Điển Đến Mạng Học Sâu

Các thuật toán phân đoạn ảnh bao gồm các phương pháp cổ điển và các phương pháp sử dụng mạng học sâu. Các phương pháp cổ điển bao gồm sử dụng bộ lọc theo ngưỡng nhị phân, hoặc sử dụng phân cụm (k-means, EM, mean shift). Tuy nhiên, các phương pháp sử dụng mạng học sâu đang trở nên phổ biến hơn vì hiệu quả cao hơn.

III. Mạng U Net Giải Pháp Học Sâu Cho Ảnh Viễn Thám 53 ký tự

Luận văn sử dụng mạng U-Net, một kiến trúc mạng học sâu phổ biến, để giải quyết bài toán khoanh vùng đối tượng trên ảnh viễn thám. Mạng U-Net có kiến trúc đối xứng, bao gồm một nhánh co và một nhánh giãn. Nhánh co trích xuất các đặc trưng từ ảnh, còn nhánh giãn phục hồi độ phân giải. Kết nối tắt giữa hai nhánh giúp truyền thông tin chi tiết.

3.1. Kiến Trúc Mạng U Net Ưu Điểm Vượt Trội Cho Phân Đoạn Ảnh

Mạng U-Net có kiến trúc đối xứng, bao gồm một nhánh co (encoding) và một nhánh giãn (decoding). Nhánh co trích xuất các đặc trưng từ ảnh bằng cách sử dụng các lớp tích chập và gộp. Nhánh giãn phục hồi độ phân giải bằng cách sử dụng các lớp giải tích chập và gộp ngược.

3.2. Kết Nối Tắt Skip Connection Tăng Cường Độ Chính Xác

Kết nối tắt (Skip Connection) là một phần quan trọng của kiến trúc mạng U-Net. Chúng kết nối các lớp tương ứng giữa nhánh co và nhánh giãn. Điều này giúp truyền thông tin chi tiết từ nhánh co sang nhánh giãn, giúp cải thiện độ chính xác của kết quả phân đoạn ảnh.

3.3. Mô Hình Feature Pynamic Network FPN

Mô hình Feature Pynamic Network(FPN) được giới thiệu trong luận văn. FPN cho bài toán phân đoạn ảnh, Luồng hoạt động của FPN, Các nhánh mô hình từ dưới lên và từ trên xuống. Luồng dữ liệu giữa hai nhánh đi lên và đi xuống của FPN,Sử dụng Feature Pyramid Network cho bài toán phân đoạn ảnh.

IV. Thực Nghiệm Đánh Giá Hiệu Quả Khoanh Vùng Mạng Học Sâu 54 ký tự

Luận văn thực hiện thực nghiệm trên bộ dữ liệu Airbus Ship Detection Challenge để đánh giá hiệu quả của phương pháp đề xuất. Kết quả cho thấy mạng U-Net đạt độ chính xác cao trong việc khoanh vùng tàu thuyền trên ảnh viễn thám. Tuy nhiên, mô hình gặp khó khăn với các tàu thuyền nhỏ và trong điều kiện thời tiết xấu. Việc sử dụng hàm mất mát kết hợp và nhánh phân loại phụ trợ giúp cải thiện kết quả.

4.1. Bộ Dữ Liệu Airbus Phân Tích Đặc Điểm Thống Kê Chi Tiết

Bộ dữ liệu Airbus Ship Detection Challenge chứa ảnh viễn thám chụp tàu thuyền trên biển. Bộ dữ liệu bao gồm ảnh có tàu thuyền và ảnh không có tàu thuyền. Phân tích đặc điểm và thống kê chi tiết bộ dữ liệu giúp hiểu rõ hơn về dữ liệu và lựa chọn phương pháp phù hợp.

4.2. Đánh Giá Độ Chính Xác Precision Recall Hệ Số Dice

Độ chính xác của mô hình được đánh giá bằng các chỉ số như Precision, Recall và hệ số Dice. Precision đo lường tỷ lệ các điểm ảnh được dự đoán là tàu thuyền thực sự là tàu thuyền. Recall đo lường tỷ lệ các điểm ảnh tàu thuyền thực tế được dự đoán đúng.

4.3. So Sánh Kết Quả U Net ResNet Các Phương Pháp Cải Tiến

So sánh kết quả giữa mạng U-Net, ResNet và các phương pháp cải tiến như sử dụng hàm mất mát kết hợp và nhánh phân loại phụ trợ. Phân tích ưu nhược điểm của từng phương pháp để tìm ra phương pháp tốt nhất cho bài toán khoanh vùng tàu thuyền trên ảnh viễn thám.

V. Kết Luận Hướng Phát Triển Khoanh Vùng Ảnh Viễn Thám 52 ký tự

Luận văn đã trình bày phương pháp sử dụng mạng học sâu để khoanh vùng đối tượng trên ảnh viễn thám, cụ thể là khoanh vùng tàu thuyền. Kết quả thực nghiệm cho thấy phương pháp này có tiềm năng lớn. Hướng phát triển tiếp theo bao gồm cải thiện độ chính xác cho các đối tượng nhỏ, xử lý ảnh trong điều kiện thời tiết xấu và ứng dụng cho các đối tượng khác.

5.1. Tổng Kết Kết Quả Nghiên Cứu Đóng Góp Hạn Chế

Tổng kết các kết quả đạt được và các hạn chế của phương pháp đã được nghiên cứu. Nêu rõ đóng góp của luận văn vào lĩnh vực khoanh vùng đối tượng trên ảnh viễn thám và các vấn đề cần giải quyết trong tương lai.

5.2. Hướng Nghiên Cứu Tiếp Theo Tối Ưu Mở Rộng Ứng Dụng

Đề xuất các hướng nghiên cứu tiếp theo để cải thiện phương pháp đã được trình bày. Bao gồm tối ưu hóa kiến trúc mạng học sâu, sử dụng các bộ dữ liệu lớn hơn và đa dạng hơn, và mở rộng ứng dụng cho các đối tượng khác trên ảnh viễn thám.

27/04/2025

Bạn đang xem trước tài liệu:

Khoanh vùng tự động các đối tượng trên ảnh viễn thám sử dụng mạng học sâu

Tải đầy đủ

Nội dung chính

Tổng quan nghiên cứu

Trong bối cảnh công nghệ viễn thám phát triển mạnh mẽ, việc xử lý và phân tích ảnh viễn thám trở thành một lĩnh vực nghiên cứu quan trọng, đặc biệt trong việc khoanh vùng tự động các đối tượng trên ảnh. Theo ước tính, hiện nay có hàng trăm nghìn ảnh vệ tinh được thu thập hàng ngày với độ phân giải không gian cao đến từng centimet và độ phân giải thời gian khoảng 5-6 ngày. Tuy nhiên, việc khai thác hiệu quả các dữ liệu này vẫn còn nhiều thách thức do tính phức tạp của ảnh viễn thám, như sự đa dạng về kích thước, hình dạng đối tượng, ảnh hưởng của điều kiện thời tiết, ánh sáng và các yếu tố nhiễu khác.

Luận văn tập trung nghiên cứu bài toán khoanh vùng tự động các đối tượng trên ảnh viễn thám, cụ thể là phát hiện và phân đoạn tàu thuyền trên biển, sử dụng các mô hình mạng học sâu hiện đại. Mục tiêu chính là phát triển một phương pháp kết hợp giữa mô hình U-Net và ResNet, cùng với hàm tổn thất kết hợp Dice Loss và Focal Loss nhằm xử lý hiệu quả vấn đề mất cân bằng dữ liệu. Phạm vi nghiên cứu sử dụng bộ dữ liệu Airbus Ship Detection Challenge với hơn 190.000 ảnh vệ tinh kích thước 768x768, trong đó khoảng 22% ảnh chứa tàu thuyền và 78% không có tàu, thu thập từ các vùng biển khác nhau.

Nghiên cứu có ý nghĩa quan trọng trong việc nâng cao độ chính xác và hiệu quả của các hệ thống giám sát biển, hỗ trợ công tác phòng chống thiên tai, tìm kiếm cứu nạn, và quản lý tài nguyên biển. Các chỉ số đánh giá như Precision, Recall, Dice và IoU được sử dụng để đo lường hiệu suất mô hình, góp phần cải thiện các ứng dụng thực tiễn trong lĩnh vực viễn thám và khoa học dữ liệu.

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Luận văn dựa trên ba mô hình học sâu chủ đạo trong bài toán phân đoạn ảnh theo ngữ nghĩa:

Mô hình U-Net: Được thiết kế với kiến trúc hình chữ U gồm hai phần chính là encoder (phần co lại) và decoder (phần giãn ra). U-Net nổi bật với khả năng trích xuất đặc trưng chi tiết và tái tạo lại ảnh phân đoạn với độ chính xác cao, đặc biệt phù hợp với ảnh y tế và ảnh viễn thám có kích thước lớn. Mô hình sử dụng hàm mất mát Cross Entropy truyền thống, tuy nhiên tốc độ xử lý khoảng 5 fps với ảnh đầu vào 572x572.
Feature Pyramid Network (FPN): Mô hình này xây dựng kim tự tháp các bản đồ đặc trưng đa tỉ lệ, kết hợp luồng dữ liệu từ dưới lên và từ trên xuống để giữ lại thông tin chi tiết của các đối tượng có kích thước khác nhau, đặc biệt là các đối tượng nhỏ. FPN được ứng dụng hiệu quả trong việc phát hiện và phân đoạn đối tượng trên ảnh viễn thám.
DeepLabV3: Cải tiến từ các phiên bản trước, DeepLabV3 sử dụng tích chập Atrous và cơ chế Atrous Spatial Pyramid Pooling (ASPP) để mở rộng tầm nhìn của bộ lọc mà không làm giảm độ phân giải bản đồ đặc trưng. Mô hình loại bỏ bước xử lý Fully Connected CRF nhằm tăng tốc độ tính toán, đồng thời duy trì độ chính xác cao trong phân đoạn ảnh.

Các khái niệm chính được sử dụng bao gồm: Precision, Recall, F1 Score, Dice coefficient, Intersection over Union (IoU), hàm tổn thất Dice Loss, Focal Loss, và các kỹ thuật tích chập giãn nở (Atrous Convolution).

Phương pháp nghiên cứu

Nguồn dữ liệu chính là bộ dữ liệu Airbus Ship Detection Challenge, gồm 192.556 ảnh vệ tinh kích thước 768x768, trong đó 42.556 ảnh có tàu thuyền và 150.000 ảnh không có tàu. Bộ dữ liệu có sự mất cân bằng rõ rệt giữa hai nhóm ảnh, đồng thời các tàu thuyền có kích thước và số lượng đa dạng, tạo nên thách thức lớn cho bài toán phân đoạn.

Phương pháp nghiên cứu đề xuất là kết hợp mô hình U-Net với ResNet làm encoder nhằm tận dụng khả năng trích xuất đặc trưng sâu sắc của ResNet. Hàm tổn thất được thiết kế kết hợp giữa Dice Loss và Focal Loss để xử lý vấn đề mất cân bằng dữ liệu, đồng thời bổ sung nhánh phân loại phụ trợ nhằm phân biệt chính xác ảnh có đối tượng và không có đối tượng.

Phân tích dữ liệu được thực hiện thông qua thống kê số lượng ảnh, số lượng tàu trên mỗi ảnh, độ dài tàu và tỷ lệ diện tích tàu so với mặt biển. Phương pháp phân tích sử dụng các chỉ số Precision, Recall, Dice và IoU để đánh giá hiệu suất mô hình. Cỡ mẫu nghiên cứu là toàn bộ bộ dữ liệu, với phương pháp chọn mẫu ngẫu nhiên để huấn luyện và kiểm thử. Timeline nghiên cứu kéo dài trong năm 2022, bao gồm các giai đoạn thu thập dữ liệu, xây dựng mô hình, huấn luyện, đánh giá và hoàn thiện luận văn.

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

Hiệu quả mô hình kết hợp U-Net và ResNet: Mô hình đề xuất đạt được độ chính xác phân đoạn cao hơn so với các mô hình truyền thống. Cụ thể, Dice coefficient đạt khoảng 0.85, tăng 7% so với mô hình U-Net thuần túy. Precision và Recall lần lượt đạt 0.88 và 0.83, cho thấy mô hình cân bằng tốt giữa phát hiện đúng và giảm bỏ sót.
Tác động của hàm tổn thất kết hợp: Việc sử dụng hàm tổn thất kết hợp Dice Loss và Focal Loss giúp cải thiện đáng kể hiệu suất trên các ảnh có sự mất cân bằng dữ liệu. So với chỉ dùng Dice Loss, mô hình có F1 Score tăng khoảng 5%, giảm hiện tượng phân đoạn sai đối tượng nhỏ và vùng nền.
Nhánh phân loại phụ trợ nâng cao độ chính xác: Việc thêm nhánh phân loại phụ trợ giúp mô hình phân biệt chính xác ảnh có tàu và không có tàu, giảm tỷ lệ False Positive xuống dưới 10%. Điều này đặc biệt quan trọng khi số lượng ảnh không có tàu chiếm tới 78% tổng số ảnh.
Thách thức từ dữ liệu thực tế: Các ảnh có mây che phủ, bề mặt biển biến đổi do sóng và ánh sáng ngày đêm làm giảm độ chính xác phân đoạn. Mô hình vẫn gặp khó khăn trong việc phân biệt các đối tượng nhỏ hoặc bị che khuất, thể hiện qua một số trường hợp kết quả phân đoạn thấp dưới 70% Dice.

Thảo luận kết quả

Nguyên nhân chính của sự cải thiện hiệu suất là do mô hình kết hợp tận dụng được khả năng trích xuất đặc trưng sâu sắc của ResNet và kiến trúc đối xứng của U-Net giúp tái tạo chi tiết vùng đối tượng. Hàm tổn thất kết hợp giúp mô hình tập trung hơn vào các vùng đối tượng nhỏ và giảm ảnh hưởng của lớp nền chiếm đa số.

So sánh với các nghiên cứu gần đây trong lĩnh vực phân đoạn ảnh viễn thám, kết quả này tương đồng hoặc vượt trội hơn về các chỉ số Dice và IoU, cho thấy tính khả thi và hiệu quả của phương pháp đề xuất. Việc bổ sung nhánh phân loại phụ trợ là một điểm mới, giúp giảm thiểu sai sót trong phân loại ảnh có và không có đối tượng, điều mà nhiều mô hình trước đây chưa khai thác triệt để.

Dữ liệu có thể được trình bày qua các biểu đồ so sánh hiệu suất các mô hình, bảng thống kê số liệu Precision, Recall, Dice và F1 Score, cũng như hình ảnh minh họa kết quả phân đoạn trên các ảnh mẫu. Các biểu đồ này giúp trực quan hóa sự khác biệt và ưu điểm của mô hình đề xuất.

Đề xuất và khuyến nghị

Tăng cường thu thập và đa dạng hóa dữ liệu: Động viên các tổ chức, cơ quan liên quan mở rộng bộ dữ liệu ảnh viễn thám có gán nhãn chính xác, đặc biệt là các ảnh có điều kiện thời tiết phức tạp và đối tượng nhỏ. Mục tiêu nâng cao chất lượng dữ liệu đầu vào trong vòng 1-2 năm tới, do các viện nghiên cứu và doanh nghiệp viễn thám thực hiện.
Phát triển mô hình học sâu đa nhiệm: Kết hợp thêm các nhiệm vụ như phát hiện, phân loại và phân đoạn trong cùng một mô hình để tăng hiệu quả xử lý và giảm sai số. Thời gian triển khai dự kiến 1 năm, do nhóm nghiên cứu khoa học dữ liệu và kỹ sư AI thực hiện.
Tối ưu hóa thuật toán và tăng tốc xử lý: Áp dụng các kỹ thuật giảm độ phức tạp tính toán như pruning, quantization để mô hình có thể chạy nhanh hơn trên các thiết bị có tài nguyên hạn chế, phục vụ ứng dụng thời gian thực. Khuyến nghị thực hiện trong 6-12 tháng, do các kỹ sư phần mềm và chuyên gia AI đảm nhiệm.
Xây dựng hệ thống giám sát và cảnh báo tự động: Ứng dụng mô hình phân đoạn trong hệ thống giám sát biển, cảnh báo vi phạm, thiên tai và tìm kiếm cứu nạn. Hệ thống cần được thử nghiệm và vận hành trong vòng 1 năm, phối hợp giữa các cơ quan quản lý biển và đơn vị phát triển công nghệ.

Đối tượng nên tham khảo luận văn

Nhà nghiên cứu và sinh viên ngành Khoa học dữ liệu, Trí tuệ nhân tạo: Nghiên cứu các mô hình học sâu ứng dụng trong xử lý ảnh viễn thám, phát triển thuật toán phân đoạn ảnh chính xác.
Chuyên gia và kỹ sư công nghệ viễn thám: Áp dụng các phương pháp phân đoạn tự động để nâng cao hiệu quả khai thác dữ liệu ảnh vệ tinh trong giám sát môi trường, quản lý tài nguyên biển.
Cơ quan quản lý và tổ chức giám sát biển: Sử dụng kết quả nghiên cứu để xây dựng hệ thống giám sát tàu thuyền, cảnh báo vi phạm và hỗ trợ công tác phòng chống thiên tai, cứu hộ cứu nạn.
Doanh nghiệp phát triển phần mềm và dịch vụ viễn thám: Tích hợp mô hình học sâu vào sản phẩm, dịch vụ phân tích ảnh vệ tinh, nâng cao giá trị và tính cạnh tranh trên thị trường.

Câu hỏi thường gặp

Tại sao cần kết hợp U-Net và ResNet trong mô hình?
Kết hợp U-Net và ResNet tận dụng khả năng trích xuất đặc trưng sâu sắc của ResNet và kiến trúc đối xứng của U-Net giúp mô hình vừa học được đặc trưng phức tạp vừa tái tạo chi tiết vùng đối tượng, nâng cao độ chính xác phân đoạn.
Hàm tổn thất kết hợp Dice Loss và Focal Loss có ưu điểm gì?
Dice Loss giúp tối ưu hóa sự tương đồng giữa dự đoán và nhãn thật, còn Focal Loss tập trung vào các mẫu khó phân loại, đặc biệt hữu ích khi dữ liệu mất cân bằng, giúp giảm bỏ sót và sai phân đoạn.
Làm thế nào để xử lý ảnh viễn thám có nhiều nhiễu như mây che hoặc ánh sáng thay đổi?
Cần áp dụng các kỹ thuật tiền xử lý như lọc nhiễu, tăng cường dữ liệu, kết hợp mô hình học sâu có khả năng học đặc trưng bền vững và sử dụng dữ liệu đa phổ để giảm ảnh hưởng của nhiễu.
Mô hình có thể áp dụng cho các đối tượng khác ngoài tàu thuyền không?
Có thể, với việc điều chỉnh lại bộ dữ liệu huấn luyện và tham số mô hình, phương pháp này có thể mở rộng cho các đối tượng khác như công trình, phương tiện giao thông hoặc vùng đất nông nghiệp.
Thời gian huấn luyện và yêu cầu phần cứng của mô hình như thế nào?
Thời gian huấn luyện phụ thuộc vào kích thước dữ liệu và cấu hình phần cứng, thường mất vài ngày trên GPU hiện đại. Mô hình yêu cầu GPU có bộ nhớ lớn để xử lý ảnh độ phân giải cao và mạng sâu.

Kết luận

Đã phát triển thành công mô hình kết hợp U-Net và ResNet với hàm tổn thất kết hợp, nâng cao hiệu quả phân đoạn đối tượng trên ảnh viễn thám.
Mô hình đạt Dice coefficient khoảng 0.85, Precision 0.88 và Recall 0.83, vượt trội so với các phương pháp truyền thống.
Nhánh phân loại phụ trợ giúp giảm tỷ lệ False Positive, cải thiện khả năng phân biệt ảnh có và không có đối tượng.
Nghiên cứu góp phần quan trọng vào lĩnh vực xử lý ảnh viễn thám, hỗ trợ các ứng dụng giám sát biển và quản lý tài nguyên.
Đề xuất các hướng phát triển tiếp theo bao gồm mở rộng dữ liệu, tối ưu mô hình và ứng dụng thực tiễn trong hệ thống giám sát tự động.

Khuyến khích các nhà nghiên cứu và chuyên gia trong lĩnh vực viễn thám, khoa học dữ liệu tiếp tục phát triển và ứng dụng các mô hình học sâu để nâng cao hiệu quả khai thác dữ liệu ảnh vệ tinh.

Trích đoạn nội dung tài liệu

Chương 1: Tổng quan về khoanh vùng đối tượng trong ảnh viễn thám: Chương này sẽ trình bày các kiến thức cơ bản về ảnh viễn thám. Các hướng tiếp cận để trích xuất thông tin trên với ảnh viễn thám. • Chương 2: Các kiến thức cơ sở: Chương này sẽ trình bày các kiến thức cơ bản về ảnh viễn thám. Các hướng tiếp cận để trích xuất thông tin trên với ảnh viễn thám và các độ đo thường được dùng trong bài toán này để đánh giá.

Giới thiệu các phương pháp học sâu để giải quyết bài toán khoanh vùng đối tượng trên ảnh viễn thám. • Chương 3: Áp dụng học sâu cho bài toán khoanh vùng đối tượng trên ảnh viễn thám: Trong chương này, sẽ là phần đánh giá và phân tích về bộ dữ liệu ảnh viễn thám, kèm với đó là các thống kê và phân tích đánh giá về dữ liệu. Chương này cũng tập trung giới thiệu phương pháp đề xuất nhằm khoanh vùng đối tượng sử dụng mô hình kết hợp. Cụ thể, mô hình đề xuất được phát triển từ mô hình U-Net và Resnet kết hợp với hàm tổn thất mới cho phép xử lý tốt hơn trường hợp dữ liệu thiếu cân bằng.

Bên cạnh đó luận văn cũng đề xuất sử dụng nhánh phân 1 loại phụ trợ nhằm tăng độ chính xác trên những ảnh không có đối tượng. • Chương 4: Thực nghiệm và đánh giá: Cách thức triển khai, chạy thực nghiệm trên bộ dữ liệu và đưa ra kết quả kèm phân tích các phương pháp với nhau. • Chương 5: Kết luận và hướng phát triển: Nêu các kết quả đạt được và các hướng phát triển trong tương lai. 2 Tổng quan về khoanh vùng đối tượng 1 trong ảnh viễn thám Trong vài năm qua, các cơ quan vũ trụ đã triển khai một số lượng lớn các vệ tinh lên quỹ đạo Trái Đất.

Do một lượng lớn thông tin từ các vệ tinh ảnh viễn thám cung cấp, người sử dụng có điều kiện tiếp cận với nhiều loại dữ liệu ảnh vệ tinh viễn thám khác nhau, từ quang học đến ra-đa, từ đơn phổ đến đa phổ, từ thương mại đến miễn phí. Trí tuệ nhân tạo, và cụ thể hơn là học máy nổi lên như một bằng chứng của cuộc cách mạng công nghiệp lần thứ tư. Trí tuệ nhân tạo đang len lỏi vào mọi lĩnh vực trong đời sống. Và từ đó, trí tuệ nhân tạo trong viễn thám được xem là một ngành khoa học quan trọng.

Các thuật toán học máy có khả năng xử lý dữ liệu lớn, phức tạp. Trong vài năm gần đây, việc ứng dụng trí tuệ nhân tạo đã và đang trở thành trọng tâm và hướng phát triển chính trong các nghiên cứu khai thác dữ liệu ảnh viễn thám. Trong chương này, luận văn sẽ cung cấp các kiến thức cơ bản về ảnh viễn thám, một số ứng dụng của ảnh viễn thám và các hướng tiếp cận khác nhau được sử dụng trong khai thác thông tin trên loại dữ liệu này.1 Ảnh viễn thám Ảnh viễn thám hay ảnh vệ tinh là ảnh số thể hiện các vật thể trên bề mặt trái đất được thu nhận bởi các bộ cảm biến đặt trên vệ tinh. Tùy thuộc vào vùng bước sóng được sử dụng để thu nhận, ảnh viễn thám có thể được phân thành ba loại cơ bản là ảnh quang học, ảnh nhiệt và ảnh ra-đa (xem hình 1.

Ảnh viễn thám quang học là 3 loại ảnh được tạo ra bởi việc thu nhận các bước sóng ánh sáng nhìn thấy (0,4 - 0,76 micromet) qua vệ tinh sử dụng các ống kính quang học. Trong ảnh nhiệt thì nguồn năng lượng chính là bức xạ nhiệt của các vật thể, và ảnh ra-đa thì nguồn năng lượng là sóng ra-đa phản xạ từ các vật thể do vệ tinh tự phát xuống theo những bước sóng đã được xác định.1: Ví dụ các loại ảnh viễn thám: (a) ảnh quang học, (b) ảnh nhiệt, và (c) ảnh ra-đa Dữ liệu ảnh viễn thám và các sản phẩm phần mềm được nghiên cứu, phát triển nhằm khai thác nguồn dữ liệu ảnh lớn, được cập nhật liên tục nhằm phục vụ yêu cầu phát triển kinh tế - xã hội, quan trắc, giám sát tài nguyên, môi trường, tìm kiếm cứu nạn, phòng chống thiên tai, quốc phòng, an ninh. Một số ứng dụng của ảnh viễn thám bao gồm: 1. Quan trắc, giám sát về ô nhiễm môi trường: đất, nước do chất thải sinh hoạt và chất thải công nghiệp; không khí do khí phát thải công nghiệp và sinh hoạt; ô nhiễm môi trường do thiên tai, các khoáng chất tự nhiên độc hại phát tán vào môi trường, khai thác khoáng sản; kiểm kê khí nhà kính.

Công tác thu thập thông tin, dữ liệu, phân tích, điều tra, đánh giá, theo dõi diễn biến tài nguyên, môi trường định kỳ và đột xuất nhằm đưa ra các báo cáo phục vụ phát triển kinh tế - xã hội; phòng, chống thiên tai; giám sát hạn hán, cảnh báo cháy rừng, diễn biến lũ lụt, cứu hộ cứu nạn và ứng phó với biến đổi khí hậu; hiện trạng sản xuất nông nghiệp. Xây dựng, cập nhật bản đồ chuyên đề và cơ sở dữ liệu chuyên đề về hiện trạng tài nguyên thiên nhiên và môi trường, thực trạng biến đổi khí hậu; lập bản đồ địa chất các tỷ lệ. Cập nhật cơ sở dữ liệu nền địa lý quốc gia, hệ thống bản đồ địa hình quốc gia. Phục vụ công tác quốc phòng, an ninh, cứu nạn cứu hộ trên biển v.

Do có nhiều ứng dụng nên ảnh viễn thám đã và đang được sử dụng rộng rãi trong các nghiên cứu liên quan đến giám sát bề mặt trái đất với độ phân giải không gian và thời gian ngày càng được cải thiện. Với sự phát triển của công nghệ viễn thám, các ảnh viễn thám cho phép quan sát trái đất ở độ phân giải không gian rất cao, đến hàng centimet, và có độ phân giải thời gian (thời gian chụp lại cùng một vị trí) tốt, trong khoảng 5 đến 6 ngày. Vì vậy, ảnh viễn thám đóng vai trò nguồn dữ liệu quan trọng trong các nghiên cứu trái đất, đặc biệt là các nghiên cứu liên quan đến lớp phủ bề mặt của trái đất, một trong các thành phần quan trọng của hệ sinh thái, từ đó có thể đưa ra các dự báo, giám sát môi trường ngày càng chính xác hơn. Để khai thác thông tin từ ảnh vệ tinh, trước đây thường sử dụng phương pháp giải đoán ảnh thủ công, theo đó, dựa vào kinh nghiệm của người giải đoán và bảng mẫu địa vật đặc trưng cho trước, ảnh vệ tinh sẽ được giải đoán thành các yếu tố địa hình, địa vật tương ứng, từ đó trích xuất các thông tin có ích.

Phương pháp thủ công có nhược điểm là thời gian để giải đoán ảnh lâu, phụ thuộc vào kinh nghiệm của chuyên gia (cùng một đối tượng trên ảnh, các chuyên gia khác nhau có thể cho ra kết quả khác nhau). Ngoài ra, giải đoán ảnh bằng phương pháp thủ công chỉ sử dụng hạn chế số lượng kênh ảnh, chủ yếu là các kênh ảnh trong khoảng phổ nhìn thấy của mắt người, do đó bỏ phí khối lượng lớn các kênh ảnh khác mà các ảnh vệ tinh hiện đại ngày này cung cấp. Với sự phát triển của khoa học và công nghệ, đặc biệt là sự phát triển của các phương pháp dựa trên học máy, trí tuệ nhân tạo cùng với năng lực tính toán ngày càng mạnh của máy tính, việc giải đoán hình ảnh vệ tinh tự động đang được nghiên cứu phát triển và sẽ thay thế quá trình giải đoán thủ công. Trong luận văn này, bài toán 5 nghiên cứu là bài toán khoanh vùng tự động đối tượng trên ảnh viễn thám, cụ thể các đối tượng tìm hiểu là tàu thuyền trên bờ và mặt biển (xem hình 1.

Việc xác định tự động được đối tượng mang lại nhiều giá trị đối với lĩnh vực giám sát, cảnh báo thiên tai, tìm kiếm cứu hộ cứu nạn, v. Tuy nhiên, đây là bài toán khó, có nhiều thách thức do dữ liệu hình ảnh thường có mây che, bề mặt biển có nhiều sắc thái do ảnh hưởng bởi sóng biển, ánh sáng ngày đêm thay đối khác nhau, ảnh hưởng bởi thời tiết, hay có nhiều đối tượng khác như các công trình cùng xuất hiện trên ảnh v.1: Các đối tượng trên biển thông qua ảnh viễn thám Phần 1.3 tiếp theo sẽ tập trung giới thiệu bài toán phân đoạn ảnh và các hướng tiếp cận khác nhau giải quyết bài toán này. Việc hiểu bài toán, phân tích ưu và nhược điểm của các hướng tiếp cận đã có sẽ giúp định hướng cách tiếp cận cận tối ưu, phù hợp nhất nhằm giải quyết bài toán khoanh vùng tự động đối tượng trên ảnh viễn thám.2 Bài toán phân đoạn ảnh Phân đoạn ảnh có thể được hiểu là phân chia ảnh thành nhiều vùng ảnh khác nhau. Phân đoạn ảnh cũng có chung mục tiêu như bài toán phát hiện đối tượng là phát hiện ra vùng ảnh chứa vật thể và gán nhãn phù hợp cho chúng.

Tuy nhiên tiêu chuẩn về độ chính xác của phân đoạn đối tượng trên ảnh ở mức cao hơn so với phát hiện đối tượng khi nó yêu cầu nhãn dự báo đúng tới từng điểm ảnh (hình 1. (a) Phát hiện đối tượng (b) Phân đoạn đối tượng Hình 1.2: Phân biệt giữa Phát hiện đối tượng và Phân đoạn đối tượng Mặc dù phân đoạn yêu cầu về mức độ chi tiết cao hơn nhưng bù lại sẽ giúp ta hiểu được nội dung của bức ảnh ở mức độ sâu hơn khi chúng ta biết được đồng thời: Vị trí của đối tượng trong ảnh, hình dạng của đối tượng và từng điểm nào thuộc về đối tượng nào. Đầu vào và đầu ra của bài toán phân đoạn ảnh Phân đoạn ảnh nếu được thực hiện sử dụng hướng tiếp cận học có giám sát thì dữ liệu cần được gán nhãn. Đầu vào của bài toán là một bức ảnh và đầu ra là một ma trận 7 mặt nạ mà giá trị của từng điểm ảnh đã được gãn nhãn trên đó.3 minh họa Hình 1.3: Đầu vào (bên trái) và đầu ra (bên phải) của bài toán phân đoạn ảnh.

ảnh đầu vào và đầu ra của bài toán phân đoạn ảnh trong trường hợp có duy nhất 1 đối tượng trên ảnh. Mỗi nhãn phân đoạn được thể hiện bởi các màu sắc khác nhau: màu xám là nền, màu vàng là đường viền của ảnh và màu tím là nằm bên trong đối tượng. Các dạng phân đoạn ảnh khác nhau Trong phân đoạn ảnh, có hai bài toán phân đoạn ảnh chính là phân đoạn ngữ nghĩa1 và phân đoạn cá thể2. Trong phân đoạn ngữ nghĩa, các các vùng ảnh được phân đoạn theo các nhãn khác nhau mà không phân biệt sự khác nhau giữa các đối tượng trong từng nhãn.

Ví dụ trong hình 1.

Nội dung được bảo vệ bản quyền — Tải xuống đầy đủ

Tài liệu "Khoanh Vùng Đối Tượng Ảnh Viễn Thám Bằng Mạng Học Sâu: Luận Văn Thạc Sĩ" trình bày một nghiên cứu sâu sắc về việc áp dụng mạng học sâu trong việc khoanh vùng đối tượng trong ảnh viễn thám. Luận văn này không chỉ cung cấp các phương pháp và kỹ thuật tiên tiến mà còn phân tích hiệu quả của chúng trong việc cải thiện độ chính xác và tốc độ xử lý dữ liệu. Độc giả sẽ tìm thấy những lợi ích rõ ràng từ việc áp dụng công nghệ này trong các lĩnh vực như nông nghiệp, quản lý tài nguyên và bảo vệ môi trường.

Để mở rộng kiến thức của bạn về các ứng dụng của mạng học sâu trong lĩnh vực viễn thám, bạn có thể tham khảo tài liệu Đồ án tốt nghiệp công nghệ kỹ thuật điện tử viễn thông phân loại ảnh ung thư vú từ xa sử dụng mạng học. Tài liệu này cung cấp cái nhìn sâu sắc về việc sử dụng mạng học sâu trong phân loại ảnh y tế, mở ra những cơ hội mới cho nghiên cứu và ứng dụng trong các lĩnh vực khác nhau. Hãy khám phá thêm để nâng cao hiểu biết của bạn về công nghệ này!

#Luận văn Thạc sĩ

#ảnh viễn thám

#mạng học sâu

#xử lý ảnh viễn thám

#khoanh vùng đối tượng

#phân loại ảnh viễn thám

Chủ đề

ứng dụng mạng học sâu

khoanh vùng ảnh viễn thám

xử lý ảnh viễn thám tự động

nghiên cứu về học sâu và viễn thám