Tổng quan nghiên cứu

Trong bối cảnh cuộc cách mạng công nghiệp 4.0, việc ứng dụng công nghệ học sâu trong kiểm tra chất lượng sản phẩm ngày càng trở nên thiết yếu. Đặc biệt, trong ngành sản xuất linh kiện nhựa cấu thành máy in, việc phát hiện lỗi ngoại quan như khuyết tật bề mặt, xước hay sứt mẻ đóng vai trò quan trọng trong việc nâng cao độ tin cậy và tuổi thọ sản phẩm. Theo ước tính, các lỗi khuyết tật bề mặt có thể làm giảm độ tin cậy của máy in đến hơn 10%, ảnh hưởng trực tiếp đến uy tín của nhà sản xuất trên thị trường. Mục tiêu nghiên cứu của luận văn là phát triển một hệ thống kiểm tra ngoại quan tự động ứng dụng công nghệ học sâu nhằm phát hiện và loại bỏ các sản phẩm lỗi trong quá trình đúc linh kiện nhựa máy in. Nghiên cứu tập trung vào ba mô hình học sâu chính: PaDiM, Reg-AD và DFR, được thử nghiệm trên bộ dữ liệu linh kiện nhựa với hơn 1.000 ảnh thử nghiệm, thực hiện tại Trường Cơ Khí – Đại học Bách Khoa Hà Nội trong năm 2022-2023. Ý nghĩa của nghiên cứu thể hiện qua việc cải thiện hiệu suất phát hiện lỗi lên đến 97,1%, giảm thiểu sai sót do kiểm tra thủ công, đồng thời tăng năng suất và chất lượng sản phẩm trong dây chuyền sản xuất tự động.

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Luận văn dựa trên các lý thuyết và mô hình học máy, học sâu trong lĩnh vực thị giác máy tính và phát hiện dị thường (anomaly detection). Hai lý thuyết chính được áp dụng gồm:

  1. Học sâu (Deep Learning): Sử dụng mạng nơ-ron tích chập (CNN) để trích xuất đặc trưng hình ảnh, cho phép mô hình học được các biểu diễn phức tạp từ dữ liệu ảnh linh kiện nhựa. Các mô hình CNN được huấn luyện trước như ResNet, Wide-ResNet được tận dụng để tăng hiệu quả trích xuất đặc trưng.

  2. Phát hiện dị thường không giám sát (Unsupervised Anomaly Detection): Do các lỗi khuyết tật thường xảy ra ngẫu nhiên và khó có đủ dữ liệu lỗi để huấn luyện, phương pháp học không giám sát chỉ sử dụng ảnh sản phẩm bình thường để xây dựng mô hình, từ đó phát hiện các điểm bất thường dựa trên sự khác biệt so với mẫu chuẩn.

Ba mô hình chính được nghiên cứu gồm:

  • PaDiM (Patch Distribution Modeling): Mô hình sử dụng phân phối Gaussian đa biến để mô hình hóa đặc trưng các miếng ảnh, phát hiện điểm bất thường dựa trên khoảng cách Mahalanobis.

  • Reg-AD (Registration based Few-Shot Anomaly Detection): Mô hình học sâu kết hợp kỹ thuật đăng ký ảnh (registration) và học ít lần (few-shot learning) để phát hiện dị thường với số lượng ảnh huấn luyện hạn chế.

  • DFR (Deep Feature Reconstruction): Mô hình sử dụng bộ mã hóa tự động tích chập (CAE) để tái tạo đặc trưng đa tỷ lệ, phát hiện dị thường dựa trên sai khác giữa đặc trưng gốc và đặc trưng tái tạo.

Các khái niệm chuyên ngành như khoảng cách Mahalanobis, mạng Siamese, bộ mã hóa tự động (Autoencoder), và các chỉ số đánh giá mô hình như AUC-ROC được sử dụng để đánh giá hiệu quả mô hình.

Phương pháp nghiên cứu

Nguồn dữ liệu chính là bộ ảnh linh kiện nhựa máy in, gồm khoảng 1.200 ảnh sản phẩm bình thường và bất thường được thu thập tại một số nhà máy sản xuất linh kiện nhựa. Cỡ mẫu thử nghiệm gồm 1.000 ảnh được chia thành tập huấn luyện (chỉ ảnh bình thường) và tập kiểm tra (ảnh bình thường và bất thường).

Phương pháp phân tích bao gồm:

  • Tiền xử lý ảnh: chuyển đổi ảnh màu sang ảnh xám, lọc nhiễu bằng bộ lọc Gaussian, nhị phân hóa và phát hiện contour.

  • Trích xuất đặc trưng bằng mạng CNN được huấn luyện trước.

  • Huấn luyện và thử nghiệm ba mô hình PaDiM, Reg-AD và DFR trên nền tảng Google Colab với GPU, sử dụng thư viện Pytorch và OpenCV.

  • Đánh giá mô hình dựa trên các chỉ số như độ chính xác phát hiện, tốc độ huấn luyện, khả năng nhận diện đa sản phẩm và bản đồ dị thường.

Timeline nghiên cứu kéo dài từ tháng 6/2022 đến tháng 4/2023, bao gồm các giai đoạn thu thập dữ liệu, phát triển mô hình, thử nghiệm và đánh giá kết quả.

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

  1. Hiệu suất phát hiện lỗi của mô hình PaDiM đạt 97,1% trên tập kiểm tra, với tốc độ huấn luyện nhanh, tuy nhiên chỉ áp dụng hiệu quả cho từng loại sản phẩm riêng biệt.

  2. Mô hình Reg-AD đạt hiệu suất 96%, có khả năng nhận diện đa dạng các loại linh kiện nhựa trong máy in nhờ kỹ thuật học ít lần và đăng ký ảnh, phù hợp với môi trường sản xuất đa dạng sản phẩm.

  3. Mô hình DFR đạt hiệu suất 96,1%, có thời gian huấn luyện lâu nhất nhưng cho kết quả thực nghiệm chính xác nhất trong việc phát hiện các khuyết tật nhỏ và phức tạp trên bề mặt linh kiện.

  4. So sánh ưu nhược điểm: PaDiM có ưu thế về tốc độ huấn luyện và đơn giản, Reg-AD linh hoạt với đa sản phẩm, DFR chính xác cao nhưng tốn thời gian huấn luyện. Các mô hình đều sử dụng học không giám sát, chỉ cần ảnh sản phẩm đạt chuẩn để huấn luyện.

Thảo luận kết quả

Nguyên nhân hiệu quả cao của PaDiM là do mô hình tận dụng phân phối Gaussian đa biến và khoảng cách Mahalanobis để phát hiện dị thường, phù hợp với các sản phẩm có đặc điểm ổn định. Reg-AD tận dụng kỹ thuật đăng ký ảnh và học ít lần giúp mô hình khái quát hóa tốt trên nhiều loại sản phẩm khác nhau, giảm chi phí thu thập dữ liệu lỗi. DFR sử dụng bộ mã hóa tự động tích chập đa tỷ lệ giúp phát hiện các lỗi nhỏ và phức tạp, tuy nhiên đòi hỏi tài nguyên tính toán lớn và thời gian huấn luyện dài.

Kết quả nghiên cứu phù hợp với các báo cáo ngành và các nghiên cứu trước đây về ứng dụng học sâu trong kiểm tra ngoại quan sản phẩm nhựa. Việc trình bày dữ liệu qua biểu đồ ROC và bảng so sánh hiệu suất giúp minh họa rõ ràng ưu nhược điểm từng mô hình. Nghiên cứu góp phần nâng cao hiệu quả kiểm tra tự động, giảm thiểu sai sót do con người và tăng năng suất sản xuất.

Đề xuất và khuyến nghị

  1. Tích hợp ưu điểm các mô hình: Phát triển hệ thống kết hợp PaDiM, Reg-AD và DFR để tận dụng tốc độ, khả năng đa sản phẩm và độ chính xác, nhằm tối ưu hóa hiệu suất phát hiện lỗi. Thời gian thực hiện dự kiến 6-12 tháng, do nhóm nghiên cứu và kỹ sư phát triển phần mềm thực hiện.

  2. Mở rộng bộ dữ liệu huấn luyện: Thu thập thêm dữ liệu ảnh các loại linh kiện nhựa khác trong máy in để nâng cao khả năng khái quát của mô hình, giảm tỷ lệ báo động sai. Thời gian thực hiện 3-6 tháng, phối hợp với nhà máy sản xuất.

  3. Nâng cấp phần cứng hệ thống: Đầu tư camera độ phân giải cao, hệ thống chiếu sáng đồng bộ và máy tính xử lý mạnh mẽ để cải thiện chất lượng ảnh đầu vào và tốc độ xử lý. Chủ thể thực hiện là bộ phận kỹ thuật nhà máy, thời gian 3 tháng.

  4. Triển khai hệ thống tự động trên dây chuyền sản xuất: Kết hợp robot công nghiệp và hệ thống băng tải tự động để tự động loại bỏ sản phẩm lỗi ngay tại dây chuyền, giảm thiểu sai sót và tăng năng suất. Thời gian triển khai 6 tháng, phối hợp giữa nhóm nghiên cứu và nhà máy.

Đối tượng nên tham khảo luận văn

  1. Các nhà quản lý sản xuất trong ngành cơ điện tử và nhựa: Nắm bắt công nghệ kiểm tra tự động, nâng cao hiệu quả quản lý chất lượng sản phẩm.

  2. Kỹ sư phát triển hệ thống tự động hóa và robot công nghiệp: Áp dụng mô hình học sâu vào thiết kế hệ thống kiểm tra và phân loại sản phẩm.

  3. Nhà nghiên cứu và sinh viên ngành kỹ thuật cơ điện tử, công nghệ thông tin: Tham khảo phương pháp ứng dụng học sâu trong thị giác máy tính và phát hiện dị thường.

  4. Doanh nghiệp sản xuất linh kiện nhựa và máy in: Tìm hiểu giải pháp nâng cao chất lượng sản phẩm, giảm chi phí kiểm tra thủ công và tăng năng suất.

Câu hỏi thường gặp

  1. Tại sao chỉ sử dụng ảnh sản phẩm bình thường để huấn luyện mô hình?
    Do các lỗi khuyết tật xảy ra ngẫu nhiên và khó dự đoán, việc thu thập đủ ảnh lỗi rất khó khăn. Học không giám sát cho phép mô hình học đặc trưng sản phẩm chuẩn và phát hiện bất thường dựa trên sự khác biệt.

  2. Mô hình nào phù hợp nhất cho sản xuất đa dạng sản phẩm?
    Mô hình Reg-AD có khả năng nhận diện nhiều loại sản phẩm nhờ kỹ thuật học ít lần và đăng ký ảnh, phù hợp với môi trường sản xuất đa dạng linh kiện.

  3. Thời gian huấn luyện mô hình có ảnh hưởng đến ứng dụng thực tế không?
    Có, mô hình PaDiM có thời gian huấn luyện nhanh phù hợp với sản xuất thay đổi sản phẩm thường xuyên, trong khi DFR chính xác hơn nhưng tốn thời gian hơn, phù hợp với sản xuất ổn định.

  4. Hệ thống kiểm tra tự động có thể thay thế hoàn toàn kiểm tra thủ công không?
    Hệ thống tự động giúp giảm thiểu sai sót và tăng năng suất, nhưng vẫn cần kiểm tra thủ công bổ sung trong các trường hợp đặc biệt hoặc lỗi phức tạp.

  5. Làm thế nào để mở rộng hệ thống cho các loại linh kiện khác?
    Cần thu thập thêm dữ liệu ảnh các loại linh kiện mới, huấn luyện lại hoặc tinh chỉnh mô hình, đồng thời nâng cấp phần cứng và phần mềm để đáp ứng yêu cầu mới.

Kết luận

  • Luận văn đã phát triển thành công hệ thống kiểm tra ngoại quan linh kiện nhựa máy in ứng dụng học sâu với hiệu suất phát hiện lỗi lên đến 97,1%.
  • Ba mô hình PaDiM, Reg-AD và DFR được so sánh và đánh giá chi tiết về ưu nhược điểm, phù hợp với các điều kiện sản xuất khác nhau.
  • Nghiên cứu góp phần nâng cao độ chính xác, giảm sai sót kiểm tra thủ công và tăng năng suất sản xuất trong ngành cơ điện tử.
  • Đề xuất tích hợp mô hình, mở rộng bộ dữ liệu và nâng cấp phần cứng để tối ưu hệ thống trong tương lai.
  • Khuyến khích các nhà quản lý, kỹ sư và nhà nghiên cứu ứng dụng kết quả nghiên cứu để phát triển hệ thống kiểm tra tự động hiệu quả hơn.

Hành động tiếp theo là triển khai thử nghiệm hệ thống tích hợp tại nhà máy sản xuất, đồng thời mở rộng nghiên cứu sang các loại linh kiện khác nhằm nâng cao tính ứng dụng thực tiễn.