I. Khái niệm và ứng dụng của trí tuệ nhân tạo trong nhận diện dược liệu
Trí tuệ nhân tạo (AI) và học sâu (Deep Learning) đã trở thành công cụ hữu ích trong lĩnh vực nhận diện dược liệu bằng hình ảnh. Khóa luận này tập trung vào ứng dụng thị giác máy tính (Computer Vision) để phân loại và xác định các loại dược liệu từ ảnh số. Qua đó, người dùng có thể nhanh chóng nhận diện các loại cây thuốc thông qua ứng dụng kỹ thuật số. Công nghệ này giúp cải thiện độ chính xác, tiết kiệm thời gian và giảm sai sót trong quá trình nhận diện dược liệu. Đặc biệt, mạng nơ ron tích chập (CNN) và Vision Transformer (ViT) là những mô hình tiên tiến được sử dụng để xây dựng hệ thống này. Ứng dụng AI trong dược liệu có ý nghĩa lớn trong đào tạo, kiểm tra chất lượng và sản xuất dược phẩm.
1.1. Khái niệm về thị giác máy tính và học sâu
Thị giác máy tính (CV) là lĩnh vực nghiên cứu cho phép máy tính hiểu, phân tích và xử lý hình ảnh. Học sâu (DL) là một nhánh của học máy (ML) sử dụng các mạng nơ ron nhân tạo có nhiều lớp để nhận dạng các mẫu phức tạp. Từ hình ảnh dược liệu, các mô hình Deep Learning có khả năng tự động trích xuất các đặc trưng và thực hiện phân loại với độ chính xác cao.
1.2. Các mô hình học sâu phổ biến trong nhận diện hình ảnh
Các mô hình như CNN, ResNet, EfficientNet và Vision Transformer được sử dụng rộng rãi trong phân loại hình ảnh dược liệu. Mỗi mô hình có những ưu điểm riêng: CNN nhanh và hiệu quả, Vision Transformer xử lý các đặc trưng toàn cục tốt. Việc lựa chọn mô hình phù hợp ảnh hưởng trực tiếp đến độ chính xác của hệ thống nhận diện.
II. Phương pháp nghiên cứu và xây dựng mô hình nhận diện
Khóa luận sử dụng phương pháp tiếp cận dữ liệu (data-driven approach) để xây dựng hệ thống nhận diện dược liệu tự động. Quá trình bao gồm các bước: thu thập ảnh dược liệu, tiền xử lý dữ liệu, huấn luyện mô hình, đánh giá hiệu suất và triển khai trên nền tảng web. Tập dữ liệu được thu thập từ các loại dược liệu phổ biến, sau đó được tăng cường dữ liệu (data augmentation) để cải thiện khả năng tổng quát của mô hình. Các chỉ số đánh giá như Accuracy, Precision, Recall, F1-score được sử dụng để đo lường hiệu suất. Cuối cùng, mô hình được triển khai thành một ứng dụng web cho phép người dùng tải ảnh và nhận kết quả nhận diện ngay lập tức.
2.1. Thu thập và tiền xử lý dữ liệu
Dữ liệu là nền tảng của mô hình học sâu. Khóa luận thu thập ảnh từ các loại dược liệu thực tế, sắp xếp theo từng lớp. Giai đoạn tiền xử lý bao gồm chuẩn hóa kích thước ảnh, cân bằng dữ liệu giữa các lớp và tăng cường dữ liệu bằng các kỹ thuật xoay, lật, thay đổi độ sáng. Điều này giúp mô hình học tốt hơn từ dữ liệu hạn chế.
2.2. Huấn luyện và đánh giá mô hình
Mô hình được huấn luyện (training) trên tập dữ liệu với các siêu tham số được tối ưu hóa. Quá trình sử dụng validation set để kiểm tra hiệu suất và test set để đánh giá cuối cùng. Các chỉ số TP, TN, FP, FN được tính toán để xác định độ chính xác (Accuracy), độ chuẩn xác (Precision) và độ nhạy (Recall) của mô hình trên các loại dược liệu khác nhau.
III. Kết quả thực nghiệm và khả năng ứng dụng
Mô hình nhận diện dược liệu đã được xây dựng và kiểm thử với kết quả khả quan. Mô hình đạt độ chính xác cao trong việc phân loại các loại dược liệu khác nhau, đặc biệt là các loại phổ biến trong dân gian và y học cổ truyền. Kết quả cho thấy Vision Transformer đạt hiệu suất tốt hơn so với các mô hình CNN truyền thống. Hệ thống được triển khai dưới dạng ứng dụng web cho phép người dùng tải ảnh dược liệu và nhận được kết quả nhận diện tức thời. Ứng dụng này có tiềm năng lớn trong đào tạo dược sĩ, kiểm tra chất lượng dược liệu tại các cơ sở sản xuất và hỗ trợ bán lẻ tại các nhà thuốc.
3.1. Kết quả hiệu suất mô hình
Các chỉ số đánh giá cho thấy mô hình ViT đạt Accuracy cao nhất so với các mô hình khác. Mô hình có khả năng phân biệt tốt giữa các loại dược liệu có hình dáng tương tự. Tuy nhiên, kết quả cũng chỉ ra những lớp dược liệu mà mô hình khó phân biệt, đó là cơ sở để cải tiến trong tương lai bằng cách thu thập thêm dữ liệu hoặc điều chỉnh kiến trúc mô hình.
3.2. Ứng dụng thực tế trong lĩnh vực dược học
Hệ thống nhận diện này có thể được ứng dụng trong nhiều bối cảnh: hỗ trợ sinh viên Dược sĩ học tập, kiểm tra chất lượng nguyên liệu dược liệu, hỗ trợ bán lẻ tại các quầy thuốc. Ngoài ra, ứng dụng web-based giúp người dùng dễ dàng truy cập mà không cần cài đặt phần mềm phức tạp. Các cải tiến tương lai có thể bao gồm mở rộng tập dụng liệu, thêm tính năng phát hiện bệnh lý, hoặc tích hợp với cơ sở dữ liệu dược liệu toàn diện.
IV. Những thách thức hạn chế và hướng phát triển tương lai
Mặc dù mô hình nhận diện dược liệu bằng AI cho thấy kết quả tích cực, nhưng vẫn còn một số thách thức cần vượt qua. Thứ nhất, dữ liệu huấn luyện hiện tại vẫn hạn chế về số lượng và đa dạng hình ảnh trong các điều kiện chiếu sáng, góc độ chụp khác nhau. Thứ hai, một số loại dược liệu có hình dáng rất giống nhau, làm khó khăn cho quá trình phân loại. Thứ ba, mô hình có thể gặp khó khăn khi xử lý ảnh bị lẫn, che phủ hoặc có chất lạ. Để cải tiến hiệu suất, các hướng phát triển tương lai bao gồm: mở rộng tập dữ liệu, ứng dụng few-shot learning để nhận diện dược liệu mới, tích hợp các mô hình hybrid kết hợp nhiều kiến trúc khác nhau, và phát triển ứng dụng di động để tăng tính tiện dụng.
4.1. Những hạn chế của mô hình hiện tại
Mô hình nhận diện hiện tại vẫn còn một số hạn chế: khó phân biệt dược liệu có đặc trưng hình ảnh tương tự, độ chính xác giảm khi ảnh có chất lượng thấp hoặc chụp từ góc độ lạ. Ngoài ra, mô hình cần dữ liệu huấn luyện lớn để đạt hiệu suất tốt, điều này đôi khi khó thực hiện trong thực tế. Thời gian suy luận (inference time) cũng là một yếu tố cần được tối ưu hóa để phù hợp với ứng dụng thực tế.
4.2. Hướng phát triển và cải tiến mô hình tương lai
Các hướng cải tiến tương lai bao gồm: (1) mở rộng tập dữ liệu với các loại dược liệu mới và điều kiện chụp đa dạng, (2) ứng dụng transfer learning từ các mô hình được huấn luyện trên tập dữ liệu lớn, (3) phát triển ensemble learning kết hợp nhiều mô hình, (4) tích hợp semi-supervised learning để tận dụng dữ liệu chưa gán nhãn, (5) xây dựng ứng dụng di động cho phép người dùng sử dụng bất kỳ lúc nào, ở đâu.