Luận văn thạc sĩ: Nghiên cứu phát triển hệ thống tra cứu các loài thực vật quý hiếm tại khu bảo ...

Luận văn thạc sĩ nghiên cứu phát triển hệ thống tra cứu các loài thực vật quý hiếm tại khu bảo tồn thiên nhiên Na Hang, Tuyên Quang.

2019

75
2
0

Phí lưu trữ

30 Point

Mục lục chi tiết

LỜI CAM ĐOAN

1. CHƯƠNG 1: MỘT SỐ NGHIÊN CỨU LIÊN QUAN

1.1. Tổng quan về tra cứu ảnh

1.2. Tổng quan về nhận dạng, tra cứu thực vật

1.3. Một số nghiên cứu liên quan

2. CHƯƠNG 2: PHƯƠNG PHÁP TRA CỨU LÁ CÂY SỬ DỤNG KDES

2.1. Phương pháp KDES

2.2. Gradient, màu sắc, và hình dạng kernels tương ứng

2.3. Học tính năng nhỏ gọn

2.4. Phương pháp tra cứu lá cây sử dụng KDES cải tiến

2.5. Biểu diễn ảnh lá cây

2.5.1. Tính toán đặc trưng mức Pixel

2.5.2. Tính toán đặc trưng mức patch

2.5.2.1. Sinh tập patch với kích thước patch thích nghi
2.5.2.2. Tính toán véctơ đặc trưng mức patch

2.5.3. Tính toán đặc trưng mức ảnh

2.6. Phân lớp ảnh lá cây

2.6.1. Máy véctơ hỗ trợ - SVM

2.6.2. Máy véctơ hỗ trợ nhiều lớp – MSVM

2.6.2.1. Từ Binary classification tới multi-class classification
2.6.2.2. Xử lý dữ liệu ảnh

3. CHƯƠNG 3: THỰC NGHIỆM

3.1. Thu thập dữ liệu

3.1.1. Cơ sở dữ liệu hình ảnh

3.1.2. Phương pháp lấy mẫu hình ảnh lá cây

3.2. Tiền xử lý ảnh trong bộ cơ sở dữ liệu

3.3. Phương pháp đánh giá

3.4. Thử nghiệm và kết quả

KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN

TÀI LIỆU THAM KHẢO

Trích đoạn nội dung tài liệu

ĐẠI HỌC THÁI NGUYÊN TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG VŨ THANH BÌNH NGHIÊN CỨU PHÁT TRIỂN HỆ THỐNG TRA CỨU CÁC LOÀI THỰC VẬT QUÝ HIẾM TẠI KHU BẢO TỒN THIÊN NHIÊN NA HANG TỈNH TUYÊN QUANG LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH THÁI NGUYÊN - 2019 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com ĐẠI HỌC THÁI NGUYÊN TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG VŨ THANH BÌNH NGHIÊN CỨU PHÁT TRIỂN HỆ THỐNG TRA CỨU CÁC LOÀI THỰC VẬT QUÝ HIẾM TẠI KHU BẢO TỒN THIÊN NHIÊN NA HANG TỈNH TUYÊN QUANG Chuyên ngành: Khoa học máy tính Mã số: 8.0101 LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH Ngƣời hƣớng dẫn khoa học: TS. Nguyễn Văn Tảo THÁI NGUYÊN - 2019 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com i LỜI CAM ĐOAN Sau quá trình học tập tại Trƣờng Đại học Công nghệ thông tin & Truyền thông, với những kiến thức lý thuyết và thực hành đã tích lũy đƣợc, với việc vận dụng các kiến thức vào thực tế, em đã tự nghiên cứu các tài liệu, các công trình nghiên cứu, tự tìm kiếm dữ liệu hình ảnh trên thực tế, đồng thời phân tích, tổng hợp, đúc kết và phát triển để hoàn thành luận văn thạc sĩ của mình. Em xin cam đoan luận văn này là công trình do bản thân em tự tìm hiểu, nghiên cứu và hoàn thành dƣới sự hƣớng dẫn của thầy giáo, TS. Thái Nguyên, tháng năm 2019 Học viên Vũ Thanh Bình LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com ii LỜI CẢM ƠN Trong thời gian 2 năm của chƣơng trình đào tạo thạc sĩ, trong đó gần một nửa thời gian dành cho các môn học, thời gian còn lại dành cho việc lựa chọn luận văn, giáo viên hƣớng dẫn, tập trung vào nghiên cứu, viết, chỉnh sửa và hoàn thiện luận văn. Với quỹ thời gian nhƣ vậy và với vị trí công việc đang phải đảm nhận, không riêng bản thân em mà hầu hết các sinh viên cao học muốn hoàn thành tốt luận văn của mình mình trƣớc hết đều phải có sự sắp xếp thời gian hợp lý, có sự tập trung học tập và nghiên cứu với tinh thần nghiêm túc nỗ lực hết mình; tiếp đến là có sự ủng hộ về tinh thần, sự giúp đỡ về chuyên môn - một trong những điều kiện không thể thiếu quyết định đến việc thành công của luận văn. Để hoàn thành đƣợc luận văn này trƣớc tiên em xin gửi lời cảm ơn sâu sắc đến thầy giáo hƣớng dẫn TS. Nguyễn Văn Tảo, là ngƣời đã định hƣớng nội dung, hƣớng phát triển của luận văn và có nhiều ý kiến đóng góp quan trọng ảnh về những vấn đề chuyên môn của luận văn, giúp em tháo gỡ kịp thời những vƣớng mắc trong quá trình làm luận văn. Em cũng xin chân thành cảm ơn các thầy cô giáo Trƣờng Đại học Công nghệ thông tin và Truyền thông và bạn bè cùng lớp đã có những ý kiến bổ ích để luận văn đƣợc hoàn thiện hơn. Xin cảm ơn gia đình, ngƣời thân, đồng nghiệp luôn quan tâm ủng hộ về tinh thần trong suốt thời gian học tập và hoàn thành luận văn. Em xin hứa sẽ cố gắng tự nghiên cứu, nâng cao năng lực chuyên môn của mình để sau khi hoàn thành luận văn này sẽ có hƣớng tập trung nghiên LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com iii cứu sâu hơn, tiếp tục hoàn thiện luận văn này để có những ứng dụng thiết thực trong thực tế. Thái Nguyên, tháng năm 2019 Học viên Vũ Thanh Bình LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com iv MỤC LỤC LỜI CAM ĐOAN . ii MỤC LỤC . iv DANH SÁCH HÌNH VẼ . vi DANH MỤC CÁC BẢNG. viii MỞ ĐẦU . Bài toán tra cứu/ nhận dạng thực vật . Cấu trúc luận văn . 4 CHƢƠNG 1: MỘT SỐ NGHIÊN CỨU LIÊN QUAN .1 Tổng quan về tra cứu ảnh .2 Tổng quan về nhận dạng, tra cứu thực vật .3 Một số nghiên cứu liên quan . 11 CHƢƠNG 2: PHƢƠNG PHÁP TRA CỨU LÁ CÂY SỬ DỤNG KDES .2 Phƣơng pháp KDES .1 Gradient, màu sắc, và hình dạng kernels tƣơng ứng.2 Học tính năng nhỏ gọn .3 Phƣơng pháp tra cứu lá cây sử dụng KDES cải tiến .4 Biểu diễn ảnh lá cây .1 Tính toán đặc trƣng mức Pixel.2 Tính toán đặc trƣng mức patch .1 Sinh tập patch với kích thƣớc patch thích nghi .2 Tính toán véctơ đặc trƣng mức patch .3 Tính toán đặc trƣng mức ảnh .5 Phân lớp ảnh lá cây .1 Máy véctơ hỗ trợ - SVM . 37 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.2 Máy véctơ hỗ trợ nhiều lớp – MSVM .1 Từ Binary classification tới multi-class classification.2 Xử lý dữ liệu ảnh . 42 CHƢƠNG 3: THỰC NGHIỆM .1 Thu thập dữ liệu .1 Cơ sở dữ liệu hình ảnh .2 Phƣơng pháp lấy mẫu hình ảnh lá cây: .2 Tiền xử lý ảnh trong bộ cơ sở dữ liệu .3 Phƣơng pháp đánh giá .4 Thử nghiệm và kết quả. 54 KẾT LUẬN VÀ HƢỚNG PHÁT TRIỂN. 60 TÀI LIỆU THAM KHẢO . 60 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com vi DANH SÁCH HÌNH VẼ Hình 2.1 : Xấp xỉ hữu hạn chiều .2: Sơ đồ hệ thống nhận dạng cây thuốc sử dụng KDES .3: Patch thích nghi với = = 8, do đó = =9 .4: Một số ví dụ minh họa patch cố định và patch thích nghi .5: Ý tưởng cơ bản của việc biểu diễn dựa trên kernel method .6: Cấu trúc pyramid .7: Nhược điểm của cách gán cứng .8: Mô hình Softmax Regression dưới dạng Neural network.1: Hình ảnh 38 mẫu lá cây đã thu thập được trong đề tài. Phân đoạn ảnh tự động . giải thuật sử dụng Salient region segmentation . Sự chuyển đổi hai không gian màu RGB và Lab . Co ảnh nhị phân . Giãn ảnh nhị phân. Chuẩn hóa hướng của lá cây . Sơ đồ các khối chức năng của giai đoạn huấn luyện . Sơ đồ các khối chức năng của giai đoạn kiểm thử .10: Một phần mã code chương trình.11: quá trình Huấn luyện của chương trình .12: Kết thúc quá trình huấn luyện .13: Tính toán số vòng lặp so sánh . 58 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com vii Hình 3.14: Hình ảnh ma trận nhầm lẫn của phương pháp KDES cải tiến .7: Hình ảnh nhầm lân ma trận của phương pháp KDES gốc.8: Hình ảnh nhầm lẫn ma trân của phương pháp KDES cải tiến . 60 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com viii DANH MỤC CÁC BẢNG Bảng 3.1: Danh sách mẫu thực vật trong cơ sở dữ liệu .2: So sánh kết quả giữa KDES gốc và phương pháp lựa chọn (KDES cải tiến). 59 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com 1 MỞ ĐẦU 1. Đặt vấn đề Khu Bảo tồn thiên nhiên Na Hang là một trong những nơi có nguồn tài nguyên cây thuốc đa dạng và phong phú [1]. Hiện biết có 275 loài cây thuốc, thuộc 4 ngành, 96 họ, 204 chi của thực vật có mạch, đã đƣợc ghi lại trong các cuộc điều tra thực địa. Trong số đó, có 204 loài, thuộc 3 ngành, 85 họ, 168 chi của thực vật có mạch đƣợc sử dụng bởi Cao Lan dân tộc; đã 05 loài đƣợc liệt kê trong Sách Đỏ Việt Nam và Danh lục Đỏ cây thuốc Việt Nam. Trong số 85 họ, có 11 họ có số loài nhiều nhất là họ Rubiaceae, Euphorbiaceae, Zingberaceae, Araceae, Vitaceae, Acanthaceae, Verbenaceae, Myrsinaceae, Moraceae, Menispermaceae và Convallariaceae. Bốn loại phổ biến của cây thuốc là cây thân thảo (41,63%), cây bụi (22.01%), cây thân gỗ (16,75%) và leo núi (17. Các bộ phận đƣợc sử dụng nhiều nhất thân, lá, rễ và toàn cây. Các nguồn tài nguyên cây thuốc ở khu bảo tồn thiên nhiên Na Hang có giá trị kinh tế quan trọng và một tiềm năng để phát triển dƣợc phẩm mới và các sản phẩm tự nhiên khác. Rừng đặc dụng Na Hang (trƣớc đây là Khu bảo tồn thiên nhiên Tát kẻ - Bản Bung huyện Na Hang) đƣợc thành lập theo Quyết định 274/UB-QĐ ngày 9 tháng 5 năm 1994 của Uỷ ban nhân dân tỉnh Tuyên Quang. Nằm trên địa bàn các xã Khâu Tinh, Côn Lôn, Sơn Phú, Thanh Tƣơng của huyện Na Hang, tỉnh Tuyên Quang. Rừng đặc dụng Na Hang có diện tích tự nhiên khoảng 22.401,5 ha, trong đó diện tích khu vực có địa hình dƣới 300 m chiếm khoảng 30%, 300-800 m chiếm 60%, trên 900m chiếm 10%. Mùa đông nhiệt độ trung bình 15 - 20oC, mùa hè nhiệt độ lên đến 30oC hoặc có thể hơn. Hệ LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com 2 thống sông ngòi chỉ ở mức trung bình, có hai con sông lớn chảy qua là sông Gâm (phía Tây Tát Kẻ) và sông Năng (phía đông Na Hang). Hiện nay, nguồn nƣớc từ rừng đặc dụng Na Hang đƣợc phân phối, điều hòa bởi hệ thống lòng hồ và đập thủy điện Na Hang. Hệ thực vật tại Khu bảo tồn thiên nhiên (BTTN) Na Hang có 1.162 loài thực vật, thuộc 604 chi, 159 họ của 4 ngành thực vật bậc cao có mạch. Trong đó ngành Hạt kín (Angiospermae) có 1.083 loài, 570 chi, 135 họ; ngành Hạt trần (Gymnospermae) có 11 loài, 8 chi, 5 họ; ngành Dƣơng xỉ (Polypodiophyta) có 63 loài, 34 chi, 17 họ; nhành Thông đất (Lycopodiophyta) có 5 loài, 2 chi, 2 họ. Trong số 1162 loài thực vật đƣợc ghi nhận tại Khu BTTN Na Hang, có 558 loài thực vật đƣợc ghi nhận có giá trị làm thuốc. Việc nghiên cứu hiện trạng và bảo tồn nguồn tài nguyên cây cối có vị trí rất quan trọng trong việc phát triển nguồn tài nguyên sinh vật ở rừng đặc dụng Na Hang. Để hỗ trợ cho công tác này, việc phát triển các công cụ, dịch vụ công nghệ thông tin hỗ trợ là cần thiết nhằm giúp cho việc xây dựng chiến lƣợc quản lý, bảo tồn và phát triển bền vững tính đa dạng sinh học của Na Hang, tỉnh Tuyên Quang trong tƣơng lai đƣợc thuận lợi hơn. Bƣớc đầu tiên của việc bảo vệ thực vật là tự động nhận ra hoặc phân loại chúng. Có nghĩa là hiểu chúng là gì và chúng đến từ đâu. Nhƣng rất khó để ngƣời ta nhận ra một loại cây một cách chính xác và ngay lập tức bởi vì số lƣợng loài rất lớn. Một hệ thống tự động nhận dạng, tra cứu sẽ rất hữu ích trong quản lý, bảo tồn hệ thống các loài cây quý hiếm, nhận dạng ra các loại cây với thông tin của nó v. Tuy nhiên, hiện nay chƣa có một cơ sở dữ liệu với đầy đủ thông tin cần thiết về các loài thực vật quý hiếm tại Khu bảo tồn Thiên nhiên Na Hang LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com 3 cùng với công cụ tra cứu, tiếp cận thông tin một cách thuận tiện.

Nội dung được bảo vệ bản quyền — Tải xuống đầy đủ