Luận văn thạc sĩ HCMUTE: Ứng dụng mạng học sâu để nhận diện bệnh cây từ ảnh lá

Trường đại học

Trường Đại Học Sư Phạm Kỹ Thuật Thành Phố Hồ Chí Minh

Chuyên ngành

Kỹ Thuật Điện Tử

Người đăng

Ẩn danh

Thể loại

luận văn thạc sĩ

2021

118

Phí lưu trữ

35 Point

Mục lục chi tiết

LỜI CAM ĐOAN

LỜI CÁM ƠN

TÓM TẮT

ABSTRACT

1. CHƯƠNG 1: TỔNG QUAN

1.1. Các nghiên cứu được công bố

1.2. Nhiệm vụ và giới hạn

1.3. Phương pháp nghiên cứu

1.4. Cấu trúc luận văn

2. CHƯƠNG 2: CƠ SỞ LÝ THUYẾT

2.1. Giới thiệu một số hình ảnh bệnh cây

2.2. Một số phương pháp xử lý ảnh

2.3. Thuật toán phân cụm K-means

2.4. Trích đặc trưng dùng PCA

3. CHƯƠNG 3: PHƯƠNG PHÁP PHÂN LOẠI BỆNH LÁ BẰNG MẠNG NƠ-RON TÍCH CHẬP

3.1. Thu thập dữ liệu

3.2. Tiền xử lý dữ liệu ảnh

3.3. Mạng CNN VGG16

3.4. Cấu trúc mạng

3.5. Lớp tích chập

3.6. Lớp hiệu chỉnh tuyến tính (ReLU)

3.7. Lớp kết nối đầy đủ (Fully connected layer)

3.8. Lớp ngõ ra

3.9. Thuật toán tối ưu dùng trong huấn luyện

3.10. Thuật toán lan truyền bình phương trung bình căn bậc hai

3.11. Ước lượng mô men thích ứng

4. CHƯƠNG 4: KẾT QUẢ VÀ ĐÁNH GIÁ

4.1. Tập dữ liệu dùng để trainning và testing

4.2. Kết quả huấn luyện

4.3. Kết quả phân loại

4.4. Đánh giá mô hình CNN VGG16

5. CHƯƠNG 5: KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN

TÀI LIỆU THAM KHẢO

Tóm tắt

I. Giới thiệu về mạng học sâu trong nhận diện bệnh cây

Mạng học sâu, đặc biệt là mạng nơ-ron tích chập (CNN), đã trở thành công cụ quan trọng trong việc nhận diện bệnh cây thông qua phân loại ảnh lá. Việc áp dụng công nghệ AI trong nông nghiệp giúp cải thiện độ chính xác và tốc độ trong việc phát hiện bệnh. Các nghiên cứu gần đây cho thấy rằng mạng học sâu có khả năng tự động trích xuất đặc trưng từ hình ảnh mà không cần sự can thiệp của con người, điều này giúp giảm thiểu thời gian và công sức trong quá trình phân loại. Theo một nghiên cứu, việc sử dụng mạng CNN VGG-16 cho phép phân loại chính xác các loại bệnh trên cây cà chua với hiệu suất cao. Điều này chứng tỏ rằng công nghệ nhận diện có thể hỗ trợ nông dân trong việc phát hiện sớm và xử lý kịp thời các bệnh cây, từ đó nâng cao năng suất và chất lượng sản phẩm nông nghiệp.

II. Phân loại ảnh lá và các phương pháp xử lý

Phân loại ảnh lá là một bước quan trọng trong việc nhận diện bệnh cây. Các phương pháp xử lý ảnh như phân cụm K-means và phân tích thành phần chính (PCA) được sử dụng để cải thiện chất lượng hình ảnh trước khi đưa vào mạng học sâu. Phân cụm K-means giúp nhóm các đặc trưng của ảnh lại với nhau, trong khi PCA giúp giảm chiều dữ liệu mà vẫn giữ lại các thông tin quan trọng. Việc chuẩn hóa ảnh đầu vào cũng rất cần thiết để phù hợp với cấu trúc của mạng CNN. Các bước này không chỉ giúp tăng cường độ chính xác của mô hình mà còn giảm thiểu thời gian huấn luyện. Một nghiên cứu cho thấy rằng việc áp dụng các phương pháp này có thể cải thiện đáng kể hiệu suất phân loại, từ đó giúp nông dân phát hiện bệnh sớm hơn.

III. Kết quả và đánh giá hiệu suất mô hình

Kết quả từ việc huấn luyện mạng CNN VGG-16 cho thấy mô hình có khả năng phân loại chính xác các loại lá bệnh với độ chính xác cao. Sử dụng ma trận nhầm lẫn để đánh giá hiệu suất, mô hình đã đạt được kết quả khả quan trong việc phân loại 8 loại lá bệnh khác nhau. Việc so sánh với các mô hình khác như Support Vector Machine (SVM) cho thấy mạng học sâu vượt trội hơn về độ chính xác và tốc độ. Điều này chứng tỏ rằng công nghệ nhận diện không chỉ có giá trị lý thuyết mà còn có ứng dụng thực tiễn cao trong nông nghiệp. Nông dân có thể sử dụng các ứng dụng này để theo dõi sức khỏe cây trồng và đưa ra các biện pháp can thiệp kịp thời, từ đó giảm thiểu thiệt hại do bệnh cây gây ra.

IV. Hướng phát triển trong tương lai

Hướng phát triển trong tương lai của việc ứng dụng mạng học sâu trong nhận diện bệnh cây có thể bao gồm việc mở rộng tập dữ liệu để bao quát nhiều loại cây trồng và bệnh hơn. Việc tích hợp các công nghệ mới như trí tuệ nhân tạo và học máy sẽ giúp cải thiện độ chính xác và khả năng nhận diện. Ngoài ra, việc phát triển các ứng dụng di động cho phép nông dân dễ dàng chụp ảnh và nhận diện bệnh cây ngay tại ruộng sẽ là một bước tiến lớn. Các nghiên cứu tiếp theo cũng nên tập trung vào việc tối ưu hóa các thuật toán để giảm thiểu thời gian huấn luyện và tăng cường khả năng phân loại. Điều này không chỉ giúp nâng cao hiệu quả sản xuất nông nghiệp mà còn góp phần vào việc phát triển nông nghiệp bền vững.

25/01/2025

Bạn đang xem trước tài liệu:

Luận văn thạc sĩ hcmute ứng dụng mạng học sâu cho nhận biết bệnh cây bằng việc phân loại ảnh lá

Tải đầy đủ

Nội dung chính

Tổng quan nghiên cứu

Trong bối cảnh nông nghiệp hiện đại, sâu bệnh cây trồng là một trong những nguyên nhân chính gây giảm năng suất và chất lượng sản phẩm. Việc nhận biết sớm và chính xác các loại bệnh trên cây trồng đóng vai trò quan trọng trong việc phòng ngừa và xử lý kịp thời, từ đó nâng cao hiệu quả sản xuất nông nghiệp. Theo ước tính, việc nhận dạng bệnh cây thủ công bằng mắt thường không chỉ tốn nhiều thời gian mà còn thiếu chính xác, dẫn đến nguy cơ mất mùa và thiệt hại kinh tế lớn.

Trong những năm gần đây, sự phát triển mạnh mẽ của công nghệ trí tuệ nhân tạo, đặc biệt là mạng học sâu (Deep Learning), đã mở ra nhiều cơ hội ứng dụng trong lĩnh vực nông nghiệp. Mạng nơ-ron tích chập (Convolutional Neural Network - CNN) được xem là một trong những mô hình hiệu quả nhất trong việc phân loại hình ảnh, bao gồm cả nhận biết bệnh cây qua ảnh lá. Luận văn tập trung nghiên cứu ứng dụng mạng CNN VGG-16 để phân loại 8 loại lá bệnh và lá khỏe trên cây cà chua, sử dụng tập dữ liệu PlantVillage với tổng cộng 8.000 ảnh (mỗi loại 1.000 ảnh). Tỷ lệ chia tập huấn luyện và kiểm tra lần lượt là 80% và 20%.

Mục tiêu chính của nghiên cứu là xây dựng hệ thống nhận biết bệnh cây nhanh chóng, chính xác thông qua phân loại ảnh lá, giúp người nông dân chủ động trong việc phòng trừ sâu bệnh, từ đó góp phần nâng cao năng suất và chất lượng cây trồng. Nghiên cứu có phạm vi áp dụng trong lĩnh vực kỹ thuật điện tử, tập trung vào cây cà chua với dữ liệu thu thập từ tập dữ liệu quốc tế PlantVillage, thời gian thực hiện nghiên cứu là năm 2021. Kết quả nghiên cứu có ý nghĩa quan trọng trong việc phát triển các giải pháp công nghệ hỗ trợ nông nghiệp thông minh, góp phần thúc đẩy chuyển đổi số trong nông nghiệp Việt Nam.

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Luận văn dựa trên các lý thuyết và mô hình sau:

Mạng nơ-ron tích chập (CNN - Convolutional Neural Network): Là mô hình học sâu chuyên dụng cho xử lý và phân loại hình ảnh. CNN gồm các lớp tích chập (Convolutional layers), lớp hiệu chỉnh tuyến tính (ReLU), lớp lấy mẫu lớn nhất (Max Pooling), và lớp kết nối đầy đủ (Fully Connected Layer). Mạng CNN có khả năng tự động trích xuất đặc trưng từ ảnh đầu vào mà không cần trích xuất thủ công, giúp tăng hiệu quả phân loại.
Mô hình VGG-16: Là kiến trúc CNN gồm 16 lớp có thể huấn luyện, sử dụng bộ lọc kích thước 3x3, stride 1 và padding 1, được thiết kế để nhận dạng hình ảnh với độ chính xác cao. VGG-16 có 13 lớp tích chập và 3 lớp kết nối đầy đủ, được sử dụng làm mô hình chính trong nghiên cứu.
Phân tích thành phần chính (PCA - Principal Component Analysis): Phương pháp giảm chiều dữ liệu, giúp trích xuất các đặc trưng quan trọng nhất từ tập dữ liệu đa chiều, hỗ trợ trong việc xử lý và phân loại ảnh.
Thuật toán tối ưu hóa: Bao gồm giảm độ dốc ngẫu nhiên (SGD) và độ dốc thích ứng (Adagrad) được sử dụng để huấn luyện mạng CNN, giúp tối ưu hóa trọng số mạng nhằm đạt hiệu suất phân loại tốt nhất.

Các khái niệm chính trong nghiên cứu gồm: lớp tích chập, hàm kích hoạt ReLU, lớp pooling, lớp kết nối đầy đủ, ma trận nhầm lẫn (Confusion Matrix) để đánh giá hiệu suất phân loại.

Phương pháp nghiên cứu

Nguồn dữ liệu: Sử dụng tập dữ liệu PlantVillage, gồm 54.306 ảnh lá cây thuộc 38 lớp bệnh khác nhau. Luận văn chọn 8 loại lá bệnh và lá khỏe trên cây cà chua, mỗi loại gồm 1.000 ảnh, tổng cộng 8.000 ảnh. Ảnh có kích thước gốc 256x256x3, được chuẩn hóa về kích thước 224x224x3 phù hợp với đầu vào của mạng VGG-16.
Tiền xử lý dữ liệu: Bao gồm định lại kích thước ảnh, tăng cường dữ liệu (data augmentation) bằng các kỹ thuật xoay ảnh, lật ảnh, phóng to ảnh nhằm tạo thêm dữ liệu huấn luyện đa dạng, giúp mô hình tổng quát hóa tốt hơn.
Phương pháp phân tích: Mạng CNN VGG-16 được huấn luyện trên tập huấn luyện chiếm 80% dữ liệu, kiểm tra trên 20% còn lại. Quá trình huấn luyện sử dụng thuật toán giảm độ dốc ngẫu nhiên (SGD) và độ dốc thích ứng (Adagrad) để tối ưu trọng số mạng. Hiệu suất phân loại được đánh giá qua ma trận nhầm lẫn, độ chính xác, và so sánh với các mô hình khác.
Timeline nghiên cứu: Thu thập và tiền xử lý dữ liệu, xây dựng mô hình và huấn luyện trong khoảng thời gian đầu năm 2021, đánh giá kết quả và hoàn thiện luận văn trong quý đầu năm 2021.

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

Hiệu suất phân loại cao với mạng VGG-16: Mô hình đạt độ chính xác phân loại lên đến khoảng 92% khi phân loại 8 loại lá bệnh và lá khỏe trên cây cà chua. Độ chính xác này vượt trội so với các mô hình truyền thống như SVM hay MLP, vốn chỉ đạt khoảng 80-85%.
Ảnh hưởng của số lượng loại bệnh trong phân loại: Khi phân loại 3 loại bệnh, mô hình đạt độ chính xác khoảng 95%, giảm xuống còn khoảng 90% khi phân loại 5 loại bệnh và khoảng 88-92% khi phân loại 8 loại bệnh. Điều này cho thấy độ phức tạp của bài toán tăng theo số lượng lớp phân loại.
Tác động của tăng cường dữ liệu: Việc áp dụng các kỹ thuật tăng cường dữ liệu như xoay, lật, phóng to ảnh giúp cải thiện độ chính xác phân loại từ khoảng 85% lên trên 90%, đồng thời giảm thiểu hiện tượng quá khớp (overfitting).
So sánh với các mô hình khác: Mạng VGG-16 cho kết quả tốt hơn so với các mô hình CNN khác như LeNet, AlexNet, GoogleNet trong cùng điều kiện thử nghiệm, với thời gian huấn luyện hợp lý và độ chính xác cao hơn từ 3-5%.

Thảo luận kết quả

Nguyên nhân chính giúp mạng VGG-16 đạt hiệu suất cao là do kiến trúc sâu với nhiều lớp tích chập nhỏ (3x3) giúp trích xuất đặc trưng chi tiết và đa dạng từ ảnh lá bệnh. Việc chuẩn hóa ảnh đầu vào và tăng cường dữ liệu cũng góp phần quan trọng trong việc nâng cao khả năng tổng quát của mô hình. So với các nghiên cứu trước đây sử dụng SVM hay MLP, mạng CNN tự động học đặc trưng mà không cần trích xuất thủ công, giúp giảm thời gian xử lý và tăng độ chính xác.

Kết quả có thể được trình bày qua biểu đồ so sánh độ chính xác phân loại giữa các mô hình và số lượng loại bệnh, cũng như ma trận nhầm lẫn thể hiện chi tiết tỷ lệ phân loại đúng/sai từng loại bệnh. Bảng so sánh thời gian huấn luyện cũng minh họa ưu điểm về hiệu suất tính toán của VGG-16.

Những kết quả này khẳng định tiềm năng ứng dụng mạng học sâu trong nhận biết bệnh cây qua ảnh lá, góp phần phát triển các hệ thống hỗ trợ nông nghiệp thông minh, giảm thiểu tổn thất do sâu bệnh gây ra.

Đề xuất và khuyến nghị

Mở rộng tập dữ liệu thực tế: Thu thập thêm ảnh lá bệnh từ các vùng trồng cà chua thực tế nhằm tăng tính đa dạng và độ chính xác của mô hình, dự kiến thực hiện trong 12 tháng tới, do các viện nghiên cứu nông nghiệp phối hợp với các trường đại học.
Phát triển ứng dụng di động: Xây dựng ứng dụng nhận diện bệnh cây dựa trên mô hình CNN để hỗ trợ nông dân trực tiếp trên điện thoại thông minh, giúp nhận biết nhanh và chính xác tại hiện trường, mục tiêu hoàn thành trong 18 tháng.
Tối ưu hóa mô hình: Nghiên cứu áp dụng các kiến trúc mạng học sâu mới như ResNet, EfficientNet để cải thiện độ chính xác và giảm thời gian huấn luyện, đồng thời tích hợp kỹ thuật giảm tham số (pruning) để triển khai trên thiết bị di động.
Đào tạo và chuyển giao công nghệ: Tổ chức các khóa đào tạo cho cán bộ kỹ thuật và nông dân về sử dụng công nghệ nhận diện bệnh cây bằng ảnh lá, nhằm nâng cao nhận thức và khả năng ứng dụng công nghệ trong sản xuất nông nghiệp.

Đối tượng nên tham khảo luận văn

Nhà nghiên cứu và sinh viên ngành kỹ thuật điện tử, trí tuệ nhân tạo: Luận văn cung cấp kiến thức chuyên sâu về ứng dụng mạng CNN trong xử lý ảnh và phân loại, hỗ trợ phát triển các đề tài nghiên cứu liên quan.
Chuyên gia và kỹ sư nông nghiệp công nghệ cao: Tài liệu giúp hiểu rõ phương pháp ứng dụng công nghệ học sâu trong nhận biết bệnh cây, từ đó áp dụng vào thực tiễn sản xuất và quản lý sâu bệnh.
Doanh nghiệp phát triển phần mềm nông nghiệp: Cung cấp cơ sở để phát triển các sản phẩm công nghệ hỗ trợ nông dân, như ứng dụng di động nhận diện bệnh cây, hệ thống giám sát tự động.
Cơ quan quản lý và hoạch định chính sách nông nghiệp: Tham khảo để xây dựng các chương trình chuyển đổi số trong nông nghiệp, thúc đẩy ứng dụng công nghệ mới nhằm nâng cao năng suất và chất lượng sản phẩm.

Câu hỏi thường gặp

Mạng CNN VGG-16 có ưu điểm gì so với các mô hình khác trong nhận biết bệnh cây?
VGG-16 có kiến trúc sâu với nhiều lớp tích chập nhỏ giúp trích xuất đặc trưng chi tiết, đạt độ chính xác cao (khoảng 92%) và khả năng tổng quát tốt hơn so với các mô hình như SVM hay LeNet.
Tại sao cần tăng cường dữ liệu trong huấn luyện mạng CNN?
Tăng cường dữ liệu giúp tạo ra nhiều biến thể ảnh từ dữ liệu gốc, giúp mô hình học được đa dạng đặc trưng, giảm hiện tượng quá khớp và nâng cao độ chính xác phân loại.
Phương pháp đánh giá hiệu suất phân loại được sử dụng là gì?
Luận văn sử dụng ma trận nhầm lẫn để đánh giá chi tiết tỷ lệ phân loại đúng/sai từng loại bệnh, cùng với các chỉ số như độ chính xác tổng thể, giúp đánh giá toàn diện hiệu quả mô hình.
Có thể áp dụng mô hình này cho các loại cây khác không?
Có thể, tuy nhiên cần thu thập và huấn luyện lại với tập dữ liệu ảnh lá bệnh của cây đó để đảm bảo độ chính xác, do đặc điểm bệnh và hình ảnh lá khác nhau giữa các loại cây.
Thời gian huấn luyện mô hình trên tập dữ liệu 8.000 ảnh là bao lâu?
Thời gian huấn luyện trên phần mềm Matlab 2019a với cấu hình máy tính tiêu chuẩn mất khoảng vài giờ cho 10 epoch, tùy thuộc vào cấu hình phần cứng và các tham số huấn luyện.

Kết luận

Luận văn đã xây dựng thành công hệ thống nhận biết bệnh cây cà chua qua phân loại ảnh lá sử dụng mạng CNN VGG-16 với độ chính xác khoảng 92%.
Phương pháp tăng cường dữ liệu và chuẩn hóa ảnh đầu vào góp phần nâng cao hiệu suất phân loại và giảm hiện tượng quá khớp.
Mô hình VGG-16 vượt trội hơn các mô hình truyền thống và một số kiến trúc CNN khác về độ chính xác và thời gian huấn luyện.
Kết quả nghiên cứu mở ra hướng phát triển ứng dụng công nghệ học sâu trong nông nghiệp thông minh, hỗ trợ người nông dân phòng trừ sâu bệnh hiệu quả.
Đề xuất mở rộng dữ liệu thực tế, phát triển ứng dụng di động và tối ưu mô hình là các bước tiếp theo nhằm nâng cao hiệu quả và khả năng ứng dụng thực tiễn.

Hãy bắt đầu áp dụng công nghệ học sâu để nâng cao năng suất và chất lượng cây trồng ngay hôm nay!

Bài viết "Luận văn thạc sĩ HCMUTE: Ứng dụng mạng học sâu để nhận diện bệnh cây từ ảnh lá" của tác giả Nguyễn Minh Tuấn, dưới sự hướng dẫn của PGS.TS Nguyễn Thanh Hải, trình bày về việc áp dụng công nghệ mạng học sâu trong việc nhận diện bệnh cây thông qua phân loại ảnh lá. Nghiên cứu này không chỉ giúp nâng cao khả năng phát hiện sớm các bệnh cây mà còn góp phần vào việc bảo vệ mùa màng, từ đó tăng năng suất nông nghiệp. Việc ứng dụng công nghệ hiện đại trong nông nghiệp như vậy mang lại nhiều lợi ích cho người nông dân, giúp họ quản lý cây trồng hiệu quả hơn.

Nếu bạn quan tâm đến các nghiên cứu liên quan đến nông nghiệp và công nghệ, hãy tham khảo thêm bài viết Giải pháp phát triển chăn nuôi bò thịt tại huyện Tân Lạc, tỉnh Hòa Bình, nơi đề cập đến các giải pháp phát triển chăn nuôi bền vững. Ngoài ra, bài viết Nghiên cứu thành phần bệnh hại cây con ở giai đoạn vườn ươm và biện pháp phòng chống tại Thái Nguyên cũng sẽ cung cấp thêm thông tin về các bệnh hại cây trồng và biện pháp phòng ngừa. Cuối cùng, bạn có thể tìm hiểu thêm về Nghiên cứu bệnh thán thư trên thanh long và các biện pháp quản lý tổng hợp, một nghiên cứu khác liên quan đến bệnh cây và quản lý nông nghiệp. Những tài liệu này sẽ giúp bạn mở rộng kiến thức về ứng dụng công nghệ trong nông nghiệp và quản lý cây trồng.

#trí tuệ nhân tạo

#phân tích hình ảnh

#nông nghiệp thông minh

#công nghệ nhận diện hình ảnh

#mạng học sâu

#nhận diện bệnh cây

Chủ đề

Ứng dụng trí tuệ nhân tạo

Phát triển bền vững trong nông nghiệp

Công nghệ trong nông nghiệp

Học sâu và học máy