Tổng quan nghiên cứu

Ngành công nghiệp bán dẫn toàn cầu ghi nhận giá trị thị trường đạt khoảng 452,25 tỷ đô la Mỹ vào năm 2021 và dự báo tăng lên 483 tỷ đô la Mỹ trong năm 2022, với xu hướng tiếp tục tăng trưởng mạnh trong những năm tiếp theo. Trong bối cảnh cạnh tranh gay gắt và nhu cầu ngày càng cao về chip bán dẫn, việc kiểm soát chất lượng sản phẩm trở thành yếu tố sống còn để duy trì uy tín và hình ảnh doanh nghiệp. Một trong những thách thức lớn là phát hiện kịp thời các lỗi ngoại quan trong quá trình sản xuất chip System on Chip (SoC), nhằm loại bỏ sản phẩm lỗi trước khi chuyển sang các công đoạn tiếp theo.

Luận văn tập trung vào việc ứng dụng học sâu (Deep Learning) và kỹ thuật xử lý ảnh để phát hiện lỗi trong sản xuất chip SoC, đặc biệt là những lỗi mà hệ thống kiểm tra ngoại quan hiện tại chưa thể phát hiện do giới hạn vùng quan tâm (ROI) hoặc khả năng xử lý. Mục tiêu cụ thể là xây dựng một ứng dụng bổ sung cho hệ thống kiểm tra sẵn có, sử dụng các phương pháp Patch Distribution Modeling (PaDiM), Template Matching kết hợp với các kỹ thuật xử lý ảnh nhằm nâng cao độ chính xác phát hiện lỗi. Nghiên cứu được thực hiện trong phạm vi dây chuyền sản xuất chip SoC tại một nhà máy sản xuất chip bán dẫn, với dữ liệu thu thập từ các lô sản phẩm thực tế trong năm 2022.

Ý nghĩa của nghiên cứu thể hiện qua việc giảm thiểu tỷ lệ sản phẩm lỗi bị bỏ sót, từ đó giảm thiểu chi phí sản xuất và tăng độ tin cậy sản phẩm đầu ra. Các chỉ số đánh giá như độ chính xác (accuracy), độ chính xác dự báo lỗi (precision) và tỷ lệ phát hiện lỗi (recall) được sử dụng làm metrics để đo lường hiệu quả của hệ thống phát hiện lỗi mới.

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Nghiên cứu dựa trên hai lý thuyết và mô hình chính:

  1. Patch Distribution Modeling (PaDiM): Đây là phương pháp học không giám sát sử dụng phân phối Gaussian đa chiều để mô hình hóa đặc trưng ảnh tại từng điểm ảnh. PaDiM kết hợp các feature map trích xuất từ ba lớp đầu của mạng Residual Neural Network (ResNet18) để tính toán trung bình và ma trận hiệp phương sai đặc trưng. Khoảng cách Mahalanobis được sử dụng để đánh giá sự khác biệt giữa ảnh kiểm tra và dữ liệu huấn luyện, giúp phát hiện các điểm bất thường trên ảnh.

  2. Template Matching: Phương pháp xử lý ảnh truyền thống dùng để xác định vùng quan tâm (ROI) trên ảnh bằng cách so sánh ảnh mẫu với ảnh đầu vào. Template Matching giúp căn chỉnh vị trí sản phẩm và tách vùng cần phân tích, đặc biệt hữu ích trong phát hiện lỗi lệch hoặc mất linh kiện.

Các khái niệm chính bao gồm:

  • Residual Neural Network (ResNet18): Mạng học sâu với kiến trúc có kết nối tắt giúp tránh hiện tượng biến mất gradient, phù hợp cho việc trích xuất đặc trưng ảnh.
  • Khoảng cách Mahalanobis: Đo lường sự khác biệt có tính đến mối tương quan giữa các biến trong dữ liệu đa chiều.
  • Tiền xử lý ảnh: Các kỹ thuật như Gamma Correction, Enhance Image, và Sharpeness được áp dụng để cải thiện chất lượng ảnh đầu vào trước khi huấn luyện mô hình CNN.

Phương pháp nghiên cứu

Nguồn dữ liệu được thu thập từ các lô sản phẩm chip SoC thực tế tại nhà máy trong năm 2022, bao gồm:

  • Dữ liệu huấn luyện: Khoảng dưới 700 hình ảnh sản phẩm không lỗi cho mỗi loại chip, được lấy từ công đoạn cuối cùng của dây chuyền.
  • Dữ liệu kiểm định: 2 lô sản phẩm với hình ảnh trộn lẫn giữa sản phẩm lỗi và không lỗi, có nhãn rõ ràng.
  • Dữ liệu kiểm tra: 8 lô sản phẩm bất kỳ được xử lý qua công đoạn hiện tại.

Phương pháp phân tích bao gồm:

  • Tiền xử lý ảnh bằng các kỹ thuật tăng sáng, lọc nhiễu và điều chỉnh tương phản.
  • Sử dụng Template Matching để xác định ROI và căn chỉnh ảnh.
  • Áp dụng ResNet18 để trích xuất đặc trưng ảnh, kết hợp PaDiM để phát hiện điểm bất thường dựa trên khoảng cách Mahalanobis.
  • Phát hiện lỗi lệch hoặc mất linh kiện bằng kỹ thuật xử lý ảnh truyền thống với OpenCV, sử dụng các hàm tìm đường bao (contours) và bounding box để đo kích thước linh kiện.
  • Đánh giá mô hình qua các chỉ số accuracy, precision và recall trên tập dữ liệu kiểm định và kiểm tra.

Timeline nghiên cứu kéo dài từ tháng 9 đến tháng 12 năm 2022, với các bước thu thập dữ liệu, xây dựng mô hình, huấn luyện, thử nghiệm và đánh giá kết quả.

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

  1. Ảnh hưởng của số lượng dữ liệu huấn luyện đến độ chính xác mô hình CNN:
    Khi tăng số lượng hình ảnh huấn luyện từ 100 lên 700, độ chính xác (accuracy) của mô hình trên sản phẩm mẫu tăng từ khoảng 85% lên trên 95%. Điều này cho thấy việc mở rộng dữ liệu huấn luyện giúp cải thiện khả năng nhận dạng lỗi.

  2. Hiệu quả của các phương pháp tiền xử lý ảnh:
    Sử dụng Gamma Correction và Enhance Image giúp tăng precision và recall lên lần lượt khoảng 5-7% so với ảnh gốc chưa xử lý. Phương pháp Sharpeness cũng cải thiện độ sắc nét ảnh, hỗ trợ mô hình CNN phát hiện các vết bẩn nhỏ và mờ hiệu quả hơn.

  3. Kích thước vector đặc trưng ảnh hưởng đến kết quả nhận dạng:
    Khi thay đổi kích thước vector đặc trưng từ 256 lên 448, accuracy và precision tăng lên đáng kể, đạt mức trên 94% và 92% tương ứng. Điều này chứng tỏ việc lựa chọn kích thước vector phù hợp giúp mô hình trích xuất đặc trưng hiệu quả hơn.

  4. Phát hiện lỗi lệch và mất linh kiện bằng phương pháp xử lý ảnh truyền thống:
    Kích thước bounding box của linh kiện bị lệch tăng trung bình 15-20% so với linh kiện đúng vị trí, trong khi linh kiện mất có kích thước bounding box giảm khoảng 30%. Phương pháp này đạt độ chính xác phát hiện lỗi trên 90% trong các thử nghiệm thực tế.

Thảo luận kết quả

Kết quả cho thấy sự kết hợp giữa học sâu và xử lý ảnh truyền thống là giải pháp hiệu quả cho bài toán phát hiện lỗi ngoại quan trong sản xuất chip SoC. Việc sử dụng PaDiM giúp phát hiện các lỗi nhỏ, khó nhận biết bằng mắt thường hoặc hệ thống kiểm tra hiện tại, đặc biệt là các vết bẩn và trầy xước. Trong khi đó, Template Matching và kỹ thuật xử lý ảnh với OpenCV hỗ trợ phát hiện chính xác các lỗi lệch và mất linh kiện nhờ vào việc phân tích kích thước và vị trí linh kiện.

So với các nghiên cứu trước đây sử dụng mạng CNN thuần túy hoặc Auto Encoder, phương pháp PaDiM cho thấy ưu thế trong việc phát hiện lỗi nhỏ và không cần dữ liệu lỗi đa dạng để huấn luyện. Các biểu đồ so sánh accuracy, precision và recall theo số lượng dữ liệu huấn luyện và phương pháp tiền xử lý ảnh minh họa rõ ràng sự cải thiện hiệu quả của mô hình.

Ý nghĩa thực tiễn của nghiên cứu là giúp nhà máy sản xuất chip giảm thiểu tỷ lệ sản phẩm lỗi bị bỏ sót, từ đó tiết kiệm chi phí và nâng cao chất lượng sản phẩm. Hệ thống cảnh báo tự động giúp người vận hành kịp thời xử lý các lỗi phát sinh, tránh ảnh hưởng đến các công đoạn tiếp theo.

Đề xuất và khuyến nghị

  1. Triển khai hệ thống phát hiện lỗi bổ sung trên toàn bộ dây chuyền sản xuất:
    Áp dụng ứng dụng xử lý ảnh và học sâu đã phát triển để giám sát liên tục các công đoạn sản xuất chip SoC, nhằm giảm tỷ lệ sản phẩm lỗi bị bỏ sót xuống dưới 1% trong vòng 6 tháng tới. Chủ thể thực hiện là bộ phận kiểm soát chất lượng và kỹ thuật nhà máy.

  2. Tăng cường thu thập và mở rộng dữ liệu huấn luyện:
    Thu thập thêm dữ liệu hình ảnh sản phẩm không lỗi và lỗi đa dạng để cải thiện độ chính xác mô hình CNN, đặc biệt là các lỗi mới phát sinh. Mục tiêu tăng số lượng dữ liệu huấn luyện lên ít nhất 1000 hình ảnh mỗi loại trong 3 tháng tiếp theo.

  3. Cải tiến giao diện người dùng và hệ thống cảnh báo:
    Phát triển giao diện trực quan hơn cho người vận hành, tích hợp cảnh báo tự động qua email hoặc tin nhắn khi phát hiện lỗi nghiêm trọng. Thời gian hoàn thành dự kiến 2 tháng, do bộ phận phát triển phần mềm đảm nhiệm.

  4. Nghiên cứu mở rộng ứng dụng cho các loại chip và linh kiện khác:
    Áp dụng phương pháp PaDiM và xử lý ảnh cho các sản phẩm chip khác trong nhà máy, đồng thời thử nghiệm với các loại linh kiện có đặc điểm khác biệt. Kế hoạch thực hiện trong vòng 6 tháng, phối hợp giữa phòng R&D và sản xuất.

Đối tượng nên tham khảo luận văn

  1. Kỹ sư kiểm soát chất lượng trong ngành sản xuất bán dẫn:
    Học hỏi các phương pháp phát hiện lỗi ngoại quan tiên tiến, áp dụng vào quy trình kiểm tra sản phẩm nhằm nâng cao độ chính xác và giảm thiểu lỗi bỏ sót.

  2. Nhà nghiên cứu và phát triển công nghệ học sâu và xử lý ảnh:
    Tham khảo mô hình PaDiM kết hợp ResNet18 và kỹ thuật xử lý ảnh truyền thống để phát triển các ứng dụng tương tự trong công nghiệp.

  3. Quản lý sản xuất và vận hành nhà máy:
    Hiểu rõ về tầm quan trọng của hệ thống kiểm tra chất lượng tự động, từ đó đưa ra các quyết định đầu tư và cải tiến quy trình sản xuất hiệu quả.

  4. Sinh viên và học viên ngành Điều khiển và Tự động hóa, Khoa học máy tính:
    Nắm bắt kiến thức thực tiễn về ứng dụng học sâu trong công nghiệp, từ đó phát triển kỹ năng nghiên cứu và ứng dụng công nghệ mới.

Câu hỏi thường gặp

  1. Phương pháp PaDiM có ưu điểm gì so với các mô hình học sâu khác?
    PaDiM sử dụng học không giám sát, chỉ cần dữ liệu sản phẩm bình thường để huấn luyện, giúp phát hiện lỗi nhỏ và đa dạng mà không cần dữ liệu lỗi phong phú. Ví dụ, nó phát hiện được các vết bẩn mờ mà Auto Encoder thường bỏ sót.

  2. Template Matching được sử dụng như thế nào trong nghiên cứu này?
    Template Matching giúp xác định vùng quan tâm (ROI) trên ảnh, căn chỉnh vị trí sản phẩm để mô hình CNN xử lý chính xác hơn. Ví dụ, nó giúp cắt đúng vùng linh kiện để phát hiện lệch hoặc mất linh kiện.

  3. Làm thế nào để đánh giá hiệu quả mô hình phát hiện lỗi?
    Sử dụng các chỉ số accuracy, precision và recall trên tập dữ liệu kiểm định và kiểm tra. Ví dụ, precision cao cho thấy mô hình ít báo lỗi sai, recall cao giúp giảm bỏ sót sản phẩm lỗi.

  4. Tiền xử lý ảnh ảnh hưởng thế nào đến kết quả nhận dạng?
    Tiền xử lý như Gamma Correction và Enhance Image giúp tăng độ tương phản và sắc nét, làm nổi bật các lỗi nhỏ trên bề mặt sản phẩm, từ đó cải thiện độ chính xác mô hình CNN.

  5. Hệ thống phát hiện lỗi này có thể áp dụng cho các loại chip khác không?
    Có thể, với việc điều chỉnh template và huấn luyện lại mô hình trên dữ liệu tương ứng. Ví dụ, nghiên cứu đề xuất mở rộng ứng dụng cho các loại chip và linh kiện khác trong nhà máy.

Kết luận

  • Nghiên cứu đã phát triển thành công ứng dụng kết hợp học sâu và xử lý ảnh để phát hiện lỗi ngoại quan trong sản xuất chip SoC, nâng cao độ chính xác phát hiện lỗi so với hệ thống hiện tại.
  • Phương pháp Patch Distribution Modeling (PaDiM) kết hợp ResNet18 và Template Matching cho phép phát hiện hiệu quả các lỗi vết bẩn, trầy xước, lệch và mất linh kiện.
  • Kết quả thử nghiệm trên dữ liệu thực tế cho thấy accuracy đạt trên 95%, precision và recall đều vượt mức 90%, đáp ứng yêu cầu sản xuất công nghiệp.
  • Hệ thống cảnh báo tự động giúp người vận hành kịp thời xử lý lỗi, giảm thiểu thiệt hại và nâng cao chất lượng sản phẩm.
  • Các bước tiếp theo bao gồm mở rộng dữ liệu huấn luyện, cải tiến giao diện người dùng và triển khai ứng dụng trên toàn dây chuyền sản xuất nhằm tối ưu hóa hiệu quả kiểm tra chất lượng.

Để nâng cao chất lượng sản phẩm và giảm thiểu lỗi trong sản xuất chip SoC, các nhà quản lý và kỹ sư kiểm soát chất lượng nên xem xét áp dụng các giải pháp học sâu và xử lý ảnh tiên tiến như nghiên cứu này. Việc đầu tư vào công nghệ kiểm tra tự động sẽ góp phần nâng cao năng lực cạnh tranh và uy tín của doanh nghiệp trên thị trường quốc tế.