Nghiên cứu ứng dụng học sâu (Deep Learning) phát hiện lỗi sản phẩm dệt may

Phát hiện lỗi dệt may tự động với học sâu. Tìm hiểu cách công nghệ này cải thiện quy trình kiểm tra chất lượng, giảm thiểu sai sót & nâng cao hiệu quả sản xuất.

Trường đại học

Trường Đại Học Quy Nhơn

Người đăng

Ẩn danh

Thể loại

Luận Văn Thạc Sĩ

2023

44
2
0

Phí lưu trữ

30 Point

Tóm tắt

I. TỔNG QUAN Học Sâu Phát Hiện Lỗi Dệt May Tự Động

Ngành dệt may đang chứng kiến sự trỗi dậy mạnh mẽ của Học Sâu (Deep Learning). Ứng dụng Học Sâu trong ngành dệt may mang lại tiềm năng to lớn trong việc tự động hóa các quy trình kiểm tra chất lượng, đặc biệt là Phát hiện khuyết tật vải tự động. Bài viết này cung cấp cái nhìn tổng quan về cách Học Sâu đang cách mạng hóa quy trình Kiểm tra chất lượng vải bằng AI, từ việc Phân tích hình ảnh dệt may đến xây dựng các Mô hình học sâu cho phát hiện lỗi. Các Hệ thống kiểm tra chất lượng dệt may tự động giúp doanh nghiệp giảm chi phí nhân công, tăng năng suất và đảm bảo chất lượng sản phẩm. Sự phát triển của các thuật toán Xử lý ảnh trong phát hiện lỗi dệt và phần cứng mạnh mẽ đã mở ra những khả năng mới, cho phép phát hiện các lỗi nhỏ nhất mà mắt thường khó nhận ra. Các nghiên cứu gần đây tập trung vào việc xây dựng các Mạng nơ-ron tích chập (CNN) cho dệt may, tận dụng khả năng trích xuất đặc trưng mạnh mẽ của chúng. Tuy nhiên, việc triển khai Học Sâu trong thực tế vẫn còn nhiều thách thức, bao gồm việc thu thập và gán nhãn Dữ liệu huấn luyện cho phát hiện lỗi dệt may, cũng như việc Tối ưu hóa mô hình deep learning cho dệt may để đảm bảo độ chính xác cao và tốc độ xử lý nhanh.

1.1. Giới thiệu về Ứng dụng AI trong Kiểm tra Dệt May

Trí tuệ nhân tạo (AI), đặc biệt là học sâu (DL), đang dần trở thành công cụ không thể thiếu trong ngành dệt may. Ứng dụng AI trong kiểm tra dệt may không chỉ giúp tăng cường hiệu quả và độ chính xác mà còn giảm thiểu sự phụ thuộc vào lao động thủ công, đồng thời cho phép phát hiện lỗi nhanh chóng và chính xác hơn. Hệ thống AI có khả năng phân tích hình ảnh, video, và các dữ liệu khác để xác định các khuyết tật trên vải, từ đó giảm thiểu lãng phí và cải thiện chất lượng sản phẩm. Các giải pháp AI tiên tiến còn tích hợp các thuật toán học máy để liên tục cải thiện khả năng phát hiện lỗi và thích ứng với các loại vải và khuyết tật mới.

1.2. Lợi ích của Hệ thống Kiểm Tra Chất Lượng Dệt May Tự Động

Việc triển khai các hệ thống kiểm tra chất lượng dệt may tự động mang lại nhiều lợi ích đáng kể. Đầu tiên, nó giúp giảm chi phí lao động bằng cách thay thế các công việc kiểm tra thủ công tốn thời gian và công sức. Thứ hai, hệ thống tự động có khả năng kiểm tra liên tục và nhanh chóng, giúp tăng năng suất và giảm thời gian sản xuất. Thứ ba, nhờ vào khả năng phân tích dữ liệu chi tiết, các hệ thống này giúp cải thiện chất lượng sản phẩm bằng cách phát hiện và loại bỏ các sản phẩm lỗi ngay từ giai đoạn đầu của quy trình sản xuất. Cuối cùng, hệ thống tự động cung cấp dữ liệu và báo cáo chi tiết, giúp doanh nghiệp theo dõi và cải thiện quy trình sản xuất một cách hiệu quả hơn.

II. THÁCH THỨC Phát Hiện Lỗi Vải Bằng Phương Pháp Truyền Thống

Kiểm tra chất lượng vải là một công đoạn quan trọng trong sản xuất dệt may. Tuy nhiên, việc kiểm tra bằng phương pháp thủ công thường tốn kém thời gian, công sức và dễ bị sai sót do yếu tố chủ quan. Phát hiện khuyết tật vải tự động bằng mắt thường đòi hỏi người kiểm tra phải có kinh nghiệm, sự tập trung cao và dễ bị mỏi mắt khi kiểm tra liên tục. Các phương pháp truyền thống cũng gặp khó khăn trong việc phát hiện các lỗi nhỏ, phức tạp hoặc các lỗi có hình dạng, kích thước không đồng nhất. Ngoài ra, việc lưu trữ và phân tích dữ liệu về các lỗi phát hiện được cũng gặp nhiều khó khăn, hạn chế khả năng cải thiện quy trình sản xuất. Vì vậy, việc tìm kiếm các giải pháp thay thế hiệu quả hơn là vô cùng cần thiết. Việc thiếu các hệ thống Machine vision trong kiểm tra dệt may tự động hiệu quả dẫn đến tăng chi phí sản xuất, giảm chất lượng sản phẩm và giảm khả năng cạnh tranh của doanh nghiệp.

2.1. Hạn chế của Kiểm Tra Chất Lượng Vải Thủ Công

Kiểm tra chất lượng vải thủ công, dù phổ biến, vẫn tồn tại nhiều hạn chế. Sự phụ thuộc vào thị giác con người dễ dẫn đến sai sót do mệt mỏi, chủ quan, hoặc thiếu kinh nghiệm. Quá trình kiểm tra chậm chạp, không đáp ứng được yêu cầu sản xuất hàng loạt. Việc đánh giá và ghi nhận các lỗi một cách hệ thống gặp nhiều khó khăn, gây cản trở cho việc phân tích và cải thiện quy trình. Các lỗi nhỏ hoặc khó nhận biết bằng mắt thường thường bị bỏ qua, ảnh hưởng đến chất lượng sản phẩm cuối cùng.

2.2. Các Loại Lỗi Dệt May Phổ Biến và Khó Phát Hiện

Ngành dệt may đối mặt với nhiều loại lỗi khác nhau, từ các lỗi đơn giản như vết bẩn, lỗ thủng nhỏ đến các lỗi phức tạp hơn như sai lệch hoa văn, lỗi dệt kim, hoặc sự không đồng đều về màu sắc. Các lỗi này có thể xuất hiện ngẫu nhiên và có hình dạng, kích thước khác nhau, gây khó khăn cho việc phát hiện bằng phương pháp thủ công. Đặc biệt, các lỗi nhỏ hoặc nằm ở vị trí khuất thường bị bỏ qua, ảnh hưởng đến chất lượng tổng thể của sản phẩm.

III. GIẢI PHÁP Mô Hình Học Sâu Phát Hiện Lỗi Vải Tối Ưu

Để giải quyết những thách thức trên, Học Sâu nổi lên như một giải pháp đầy tiềm năng. Các Thuật toán phát hiện lỗi vải dựa trên Học Sâu có khả năng tự động học các đặc trưng của vải và các loại lỗi khác nhau từ dữ liệu huấn luyện. Các mô hình như Mạng nơ-ron tích chập (CNN) được sử dụng rộng rãi để Phân tích hình ảnh dệt may và xác định các vùng có khả năng chứa lỗi. Quá trình huấn luyện mô hình đòi hỏi một lượng lớn Dữ liệu huấn luyện cho phát hiện lỗi dệt may, bao gồm cả hình ảnh vải bình thường và hình ảnh vải có lỗi. Việc Phân loại lỗi vải bằng deep learning cho phép phân loại các lỗi theo loại, kích thước và mức độ nghiêm trọng, giúp doanh nghiệp đưa ra các quyết định xử lý phù hợp. Các nghiên cứu gần đây tập trung vào việc Tối ưu hóa mô hình deep learning cho dệt may để đạt được độ chính xác cao và tốc độ xử lý nhanh.

3.1. Ứng dụng Mạng Nơ ron Tích Chập CNN cho Phát Hiện Lỗi

Mạng Nơ-ron Tích Chập (CNN) đã chứng minh được hiệu quả vượt trội trong lĩnh vực xử lý ảnh và phát hiện lỗi. CNN có khả năng tự động học các đặc trưng quan trọng từ hình ảnh, giúp phát hiện các khuyết tật một cách chính xác và nhanh chóng. Quá trình huấn luyện CNN đòi hỏi một lượng lớn dữ liệu hình ảnh có gắn nhãn, cho phép mạng học cách phân biệt giữa các loại vải bình thường và các loại vải có lỗi.

3.2. Phát Hiện Khuyết Tật Vải Tự Động bằng Autoencoder và VAE

Autoencoder (AE) và Variational Autoencoder (VAE) là các mô hình học sâu không giám sát, có khả năng tái tạo lại dữ liệu đầu vào. Trong bài toán phát hiện lỗi, AE và VAE được huấn luyện trên dữ liệu vải bình thường. Khi gặp một mẫu vải có lỗi, mô hình sẽ gặp khó khăn trong việc tái tạo lại hình ảnh, từ đó giúp phát hiện ra các vùng bất thường. Kỹ thuật này đặc biệt hữu ích khi không có đủ dữ liệu về các loại lỗi khác nhau.

3.3. Sử dụng GAN Generative Adversarial Networks để tăng độ chính xác

Mạng đối kháng GAN bao gồm hai mạng thành phần: Mạng sinh (Generator) và Mạng phân biệt (Discriminator). Mạng sinh tạo ra các mẫu dữ liệu giả, trong khi mạng phân biệt cố gắng phân biệt giữa dữ liệu thật và dữ liệu giả. Quá trình huấn luyện GAN giúp mạng sinh tạo ra các mẫu dữ liệu giả ngày càng giống với dữ liệu thật, từ đó tăng cường khả năng phát hiện các mẫu dữ liệu bất thường. Trong bối cảnh phát hiện lỗi vải, GAN có thể được sử dụng để tạo ra các mẫu lỗi giả, giúp mạng phát hiện lỗi học cách nhận biết các loại lỗi khác nhau một cách hiệu quả hơn.

IV. THỰC NGHIỆM Đánh Giá Độ Chính Xác của Phát Hiện Lỗi Bằng DL

Để đánh giá hiệu quả của các mô hình Học Sâu, các nhà nghiên cứu thường sử dụng các bộ dữ liệu chuẩn như MVTec AD. Độ chính xác của phát hiện lỗi bằng học sâu được đánh giá bằng các chỉ số như AuC (Area under RoC Curve). Kết quả nghiên cứu cho thấy rằng các mô hình Học Sâu có thể đạt được độ chính xác cao trong việc Phát hiện khuyết tật vải tự động, vượt trội so với các phương pháp truyền thống. Tuy nhiên, việc lựa chọn kiến trúc mô hình phù hợp, tối ưu hóa các tham số huấn luyện và chuẩn bị dữ liệu một cách cẩn thận là rất quan trọng để đạt được kết quả tốt nhất. Các thử nghiệm cũng cho thấy sự quan trọng của việc cân bằng dữ liệu giữa các lớp (vải bình thường và vải có lỗi) để tránh hiện tượng thiên vị mô hình.

4.1. Sử dụng MVTec AD để kiểm tra chất lượng mô hình

Bộ dữ liệu MVTec AD là một bộ dữ liệu tiêu chuẩn được sử dụng rộng rãi trong lĩnh vực phát hiện bất thường. Nó bao gồm nhiều loại đối tượng và kết cấu khác nhau, trong đó có cả vải. Việc sử dụng MVTec AD cho phép so sánh hiệu suất của các mô hình phát hiện lỗi khác nhau một cách khách quan và đáng tin cậy.

4.2. Đánh giá bằng chỉ số AuC Area Under Curve

Chỉ số AuC (Area Under Curve) là một thước đo hiệu suất quan trọng trong các bài toán phân loại nhị phân, bao gồm cả phát hiện lỗi. AuC thể hiện khả năng của mô hình trong việc phân biệt giữa các mẫu dương tính (vải có lỗi) và các mẫu âm tính (vải bình thường). AuC càng gần 1, hiệu suất của mô hình càng tốt.

4.3. Các yếu tố ảnh hưởng đến độ chính xác của mô hình

Độ chính xác của mô hình phát hiện lỗi phụ thuộc vào nhiều yếu tố, bao gồm kiến trúc mô hình, lượng dữ liệu huấn luyện, chất lượng dữ liệu, và các tham số huấn luyện. Việc lựa chọn kiến trúc mô hình phù hợp với đặc điểm của dữ liệu, thu thập và gán nhãn dữ liệu một cách cẩn thận, và tối ưu hóa các tham số huấn luyện là rất quan trọng để đạt được kết quả tốt nhất.

V. KẾT LUẬN Tiềm Năng và Hướng Phát Triển của Học Sâu

Học Sâu đã chứng minh được tiềm năng to lớn trong việc tự động hóa quy trình kiểm tra chất lượng vải. Các Hệ thống kiểm tra chất lượng dệt may tự động dựa trên Học Sâu giúp doanh nghiệp giảm chi phí nhân công, tăng năng suất và đảm bảo chất lượng sản phẩm. Trong tương lai, các nghiên cứu sẽ tập trung vào việc phát triển các mô hình Học Sâu hiệu quả hơn, ít tốn kém dữ liệu huấn luyện hơn và có khả năng xử lý các loại vải và lỗi khác nhau. Việc tích hợp Học Sâu với các công nghệ khác như Machine vision trong kiểm tra dệt may, cảm biến và robot cũng sẽ mở ra những khả năng mới trong việc tự động hóa quy trình sản xuất dệt may.

5.1. Ứng Dụng Học Sâu vào Các Ngành Công Nghiệp Khác

Thành công của Học Sâu trong ngành dệt may mở ra tiềm năng ứng dụng rộng rãi trong các ngành công nghiệp khác. Ví dụ, trong sản xuất ô tô, Học Sâu có thể được sử dụng để phát hiện các lỗi trong quá trình lắp ráp hoặc kiểm tra chất lượng bề mặt sơn. Trong ngành thực phẩm, Học Sâu có thể giúp phân loại và kiểm tra chất lượng sản phẩm một cách tự động.

5.2. Hướng Nghiên Cứu và Phát Triển trong Tương Lai

Các hướng nghiên cứu và phát triển trong tương lai tập trung vào việc phát triển các mô hình Học Sâu hiệu quả hơn, ít tốn kém dữ liệu huấn luyện hơn và có khả năng xử lý các loại dữ liệu khác nhau. Việc tích hợp Học Sâu với các công nghệ khác như Internet of Things (IoT) và robot cũng sẽ mở ra những khả năng mới trong việc tự động hóa và tối ưu hóa các quy trình sản xuất.

20/09/2025

Trích đoạn nội dung tài liệu

Chương 1: TỔNG QUAN VỀ HỌC MÁY VÀ HỌC SÂU. Chúng tôi trình bày tổng quan về ML và DL gồm có: sơ lược về ML, phương pháp ML, giới thiệu một số bài toán trong ML, giới thiệu một số thuật toán trong ML, sơ lược về DL và giới thiệu một số mô hình trong DL. + Chương 2: BÀI TOÁN PHÁT HIỆN LỖI TRÊN SẢN PHẨM DỆT MAY. Chúng tôi sẽ trình bày giải pháp giải quyết bài toán tìm lỗi trên sản có độ chính xác cao cho bài toán phát hiện lỗi trên sản phẩm dệt may.

+ Chương 3: XÂY DỰNG MÔ HÌNH VÀ THỰC NGHIỆM. Chúng tôi cài đặt thử nghiệm giải pháp đã đề xuất cho bài toán phát hiện lỗi trên sản phẩm dệt may, một số đánh giá về mô hình thu được và đề xuất giải pháp triển khai. TỔNG QUAN VỀ HỌC MÁY VÀ HỌC SÂU Chúng tôi trình bày tổng quan về học máy và học sâu gồm có: sơ lược về học máy, phương pháp học máy, giới thiệu một số bài toán trong học máy, giới thiệu một số thuật toán trong học máy, sơ lược về học sâu và giới thiệu một số mô hình học sâu.1 Sơ lược về học máy Học máy hay máy học (ML) là một thuật ngữ mà con người sử dụng để khi nhắc đến các chương trình máy tính có khả năng học hỏi về cách hoàn thành các nhiệm vụ và cách cải thiện hiệu suất theo thời gian. Nó là một công nghệ được phát triển từ lĩnh vực trí tuệ nhân tạo (AI).

Quá trình phát triển và hình thành của học máy ML vẫn cần sự đánh giá của con người trong việc tìm hiểu dữ liệu cơ sở và lựa chọn các kĩ thuật phù hợp để phân tích dữ liệu. Ngoài ra, trước khi sử dụng thì dữ liệu cần được tiền xử lý dữ liệu để dữ liệu được sạch, không có sai lệch và không có dữ liệu giả. Mô hình được tạo ra từ ML cần lượng dữ liệu đủ lớn để huấn luyện và đánh giá mô hình. Trước đây, quyền truy cập vào các nguồn dữ liệu cần thiết để mô hình hóa các mối quan hệ giữa các dữ liệu còn hạn chế.

Ngày nay, sự 4 tăng trưởng trong dữ liệu lớn (Big Data) đã cung cấp nguồn dữ liệu để cải thiện độ chính xác của mô hình và dự đoán của các mô hình ML.2 Phương pháp học máy ML có 2 lớp chính bao gồm học có giám sát (Supervised Learning) và học không giám sát (Unsupervised Learning). Ngoài ra, còn có 2 lớp khác là học bán giám sát (Semi-Supervised Learning) và học tăng cường (Reinforcement Learning).1 Supervised Learning Máy tính sẽ cố gắng học cách mô hình hóa các mối quan hệ dựa trên dữ liệu được gán nhãn (labeled data). Sau khi tìm hiểu cách tốt nhất để mô hình hóa các mối quan hệ cho dữ liệu được gắn nhãn, các thuật toán được huấn luyện được sử dụng cho các bộ dữ liệu mới. Supervised Learning có thể được nhóm lại thành 2 bài toán chính là phân lớp (Classification) và hồi quy (Regression), một số thuật toán tiêu biểu như: Decision Trees, Linear Regression, Logistic Regression, Support Vector Machine.2 Unsupervised Learning Máy tính không được cung cấp dữ liệu được dán nhãn mà thay vào đó chỉ được cung cấp dữ liệu và thuật toán tìm cách mô tả dữ liệu và cấu trúc của chúng.

Unsupervised Learning có một số thuật toán tiêu biểu như: Principal Component Analysis, Singular Value Decomposition.3 Reinforcement Learning Học tăng cường (RL) là một kỹ thuật học máy cho phép tác nhân học bằng cách thử và sai trong môi trường tương tác sử dụng đầu vào từ các hành động (Actions) và kinh nghiệm của nó. Không giống như học có giám sát, dựa trên dữ liệu mẫu hoặc ví dụ đã cho, phương pháp RL dựa trên tương tác với môi trường. Vấn đề cần giải quyết trong học tăng cường (RL) được định nghĩa là Markov Decision Process (MDP) [1] tức là tất cả về việc đưa ra các quyết định một cách tuần tự. Một vấn đề RL thường bao gồm bốn yếu tố như tác nhân (Agent), môi trường (Environment), phần thưởng (Rewards) và chính sách (Policy).

Reinforcement Learning 6 RL có thể được chia thành các kỹ thuật dựa trên mô hình (Model-based) và không có mô hình (Model-free). + Dựa trên mô hình: Quá trình suy ra hành vi tối ưu từ một mô hình của môi trường bằng cách thực hiện các hành động và quan sát kết quả, bao gồm trạng thái tiếp theo và phần thưởng ngay lập tức. AlphaZero, AlphaGo là những ví dụ về cách tiếp cận dựa trên mô hình [2]. + Không có mô hình: Cách tiếp cận không có mô hình không sử dụng phân phối xác suất chuyển đổi và hàm phần thưởng được liên kết với MDP.

Q-learning, Deep Q Network, Monte Carlo Control, SARSA (State – Action – Reward – State – Action),. là một số ví dụ về thuật toán không có mô hình [1]. Khác với RL dựa trên mô hình thì trên RL không có mô hình không yêu cầu chính sách (Policy), đây là điểm khác biệt chính giữa học tập dựa trên mô hình và không mô hình.3 Một số bài toán trong học máy 1.1 Bài toán phân loại Bài toán phân loại là quá trình phân một đối tượng dữ liệu vào một hay nhiều lớp đã cho trước nhờ vào một mô hình phân lớp. Về mặt toán học, nó là ánh xạ một hàm (f) từ các biến đầu vào (X) đến các biến đầu ra (Y) và được biểu diễn như sau 𝑓(𝑋) = 𝑌 [1].

Khi dự đoán lớp của các điểm dữ liệu đã cho, chúng ta có thể được thực hiện trên dữ liệu có cấu trúc hoặc phi cấu trúc. Sau đây, chúng tôi tóm tắt các vấn đề phân loại phổ biến.1 Phân loại nhị nhân Thông thường, các nhiệm vụ phân loại nhị phân sẽ bao gồm một lớp là “trạng thái bình thường” và một lớp khác là “trạng thái bất thường”. Ví dụ “not spam” là trạng thái bình thường và “spam” là trạng thái bất thường. Một ví dụ khác là "ung thư không được phát hiện" là trạng thái bình thường và "ung thư được phát hiện" là trạng thái bất thường.

Giả sử, lớp cho trạng thái bình thường được gán nhãn lớp 0 và lớp có trạng thái bất thường được gán nhãn lớp 1. Người ta thường lập mô hình nhiệm vụ phân loại nhị phân với một mô hình dự đoán phân phối xác suất Bernoulli cho mỗi ví dụ. Phân phối Bernoulli là một phân phối xác suất rời rạc bao gồm trường hợp một sự kiện sẽ có kết quả nhị phân là 0 hoặc 1. Đối với phân loại, điều này có nghĩa là mô hình dự đoán xác suất của một ví dụ thuộc lớp trạng thái bình thường hoặc lớp trang thái bất thường.

[1] Một số phương pháp thường được sử dụng để phân lớp nhị phân là: Decision Trees, Random Forests, Bayesian Networks, Support Vector Machines, Neural Networks, Logistic Regression.2 Phân loại nhiều lớp Khác với bài toán phân lớp nhị phân, phân loại nhiều lớp không sử dụng khái niệm “trạng thái bình thường” và “trạng thái bất thường” mà dữ liệu sẽ được phân lớp dựa vào danh sách nhãn đã biết. Số lượng nhãn có thể rất lớn tùy vào vấn đề, ví dụ trong hệ thống nhận diện khuôn mặt thì kết quả dự đoán một bức ảnh có thể thuộc về một trong số hàng nghìn hoặc chục nghìn khuôn mặt đã có trong hệ thống. Hay mô hình dịch văn bản cũng có thể được coi là một kiểu phân loại nhiều lớp đặc biệt. Mỗi từ trong chuỗi được dự đoán liên quan đến một phân loại nhiều lớp trong đó kích thước của từ vựng xác định số lượng các lớp có thể được dự đoán và có thể có kích thước hàng chục hoặc hàng trăm nghìn từ.

[1] Người ta thường lập mô hình nhiệm vụ phân loại nhiều lớp với một mô hình dự đoán phân phối xác suất Multinoulli cho mỗi ví dụ. Phân phối 8 Multinoulli là một phân phối xác suất rời rạc bao gồm trường hợp một sự kiện sẽ có kết quả phân loại, ví dụ: K trong {1, 2, 3,…, K}. Đối với phân loại, điều này có nghĩa là mô hình dự đoán xác suất của một ví dụ thuộc về mỗi nhãn lớp. Một số thuật toán phổ biến có thể được sử dụng để phân loại nhiều lớp là: k-Nearest Neighbors, Decision Trees, Random Forests.

Ngoài ra, một số thuật toán được sử dụng để phân loại nhị phân có thể được sử dụng để phân loại nhiều lớp.2 Bài toán hồi quy Bài toán hồi quy là quá trình dự đoán một biến kết quả (y) liên tục dựa trên giá trị của một hoặc nhiều biến dự báo (x) [1]. Sự khác biệt đáng kể nhất giữa phân loại và hồi quy là phân loại dự đoán các nhãn lớp riêng biệt, trong khi hồi quy tạo điều kiện cho việc dự đoán một đại lượng liên tục. Hình 6 cho thấy một ví dụ về cách phân loại khác với các mô hình hồi quy. Một số chồng chéo thường được tìm thấy giữa hai loại thuật toán học máy.

Các mô hình hồi quy hiện được sử dụng rộng rãi trong nhiều lĩnh vực, bao gồm dự báo hoặc dự đoán tài chính, ước tính chi phí, phân tích xu hướng, tiếp thị, ước tính chuỗi thời gian, mô hình phản ứng thuốc, và nhiều hơn nữa. Một số loại thuật toán hồi quy quen thuộc là hồi quy tuyến tính, hồi quy đa thức, … được giải thích ngắn gọn trong phần sau.1 Hồi quy tuyến tính đơn giản và đa tuyến tính Phương pháp này khá phổ biến trong những mô hình ML, đồng thời là phương pháp nổi tiếng trong các phương pháp hồi quy. Trong phương pháp này, biến phụ thuộc là liên tục, các biến độc lập có thể liên tục hoặc rời rạc và dạng của đường hồi quy là tuyến tính. Hồi quy tuyến tính tạo ra mối quan hệ giữa biến phụ thuộc (y) và một hoặc nhiều biến độc lập (x) (còn được gọi là đường hồi quy) bằng cách sử dụng đường thẳng phù hợp nhất [1].

Hồi quy đa tuyến tính là một phần mở rộng của hồi quy tuyến tính đơn giản cho phép hai hoặc nhiều biến dự báo mô hình hóa một biến đáp ứng, y như một hàm tuyến tính được định nghĩa bởi phương trình (2).Trong khi hồi quy tuyến tính đơn giản chỉ có 1 biến độc lập, được xác định trong phương trình (1).2 Hồi quy đa thức Hồi quy đa thức là một dạng phân tích hồi quy trong đó mối quan hệ giữa biến độc lập (x) và biến phụ thuộc (y) không phải là tuyến tính, mà là đa thức bậc n trong (x). Phương trình hồi quy đa thức cũng được suy ra từ phương trình hồi quy tuyến tính, được định nghĩa bởi công thức sau: 𝑦 = 𝑎 + 𝑏1 𝑥 1 + 𝑏2 𝑥 2 + .4 Một số thuật toán trong học máy 1.1 Khái niệm Cuối những năm 70 đầu những năm 80, J.

Nội dung được bảo vệ bản quyền — Tải xuống đầy đủ