Ứng Dụng Học Máy Trong Kiểm Thử Phần Mềm

Tài liệu nghiên cứu Ứng dụng họ máy trong kiểm thử phần mềm, tổng hợp lý thuyết và thực hành, cung cấp kiến thức chuyên sâu về ., phục vụ nghiên cứu và ứng dụng thực tiễn

Trường đại học

Đại học Bách khoa Hà Nội

Chuyên ngành

Công nghệ thông tin

Người đăng

Ẩn danh

Thể loại

luận văn thạc sĩ

2019

Phí lưu trữ

30 Point

Mục lục chi tiết

LỜI CAM ĐOAN

LỜI CÁM ƠN

MỞ ĐẦU

1. Lý do chọn đề tài

2. Tính cấp thiết của đề tài

3. Mục đích nghiên cứu

4. Phạm vi nghiên cứu

5. Bố cục luận văn

1. CHƯƠNG 1: NGHIÊN CỨU TỔNG QUAN

1.1. Giới thiệu về kiểm thử phần mềm

1.2. Kiểm thử và các phương pháp kiểm thử khác nhau

1.3. Kiểm thử tự động

1.4. Bài toán tối ưu trong kiểm thử phần mềm

1.4.1. Một số nghiên cứu

1.4.2. Bài toán kiểm thử phần mềm

1.4.3. Tổng kết chương

2. CHƯƠNG 2: THU THẬP DỮ LIỆU KIỂM THỬ PHẦN MỀM VÀ TỔNG QUAN VỀ HỌC MÁY

2.1. Môi trường thu thập và tiền xử lí dữ liệu

2.1.1. Thu thập và tiền xử lí

2.1.2. Phân tích đặc trưng dữ liệu

2.2. Học tăng cường

2.2.1. Quy trình Markov

2.2.2. Học máy tăng cường

2.2.3. Cập nhật chiến lược

2.3. Mạng nơ-ron nhân tạo

2.3.1. Thuật toán tối ưu

2.3.2. Học tăng cường sâu

2.4. Tổng kết chương

3. CHƯƠNG 3: MÔ HÌNH HỌC MÁY CHO TỐI ƯU KIỂM THỬ PHẦN MỀM

3.1. Bài toán tối ưu kiểm thử

3.2. Mô hình học máy tăng cường cho bài toán kiểm thử

3.2.1. Không gian trạng thái – hành động

3.2.2. Hàm phần thưởng

3.2.3. Mạng học sâu

3.2.3.1. Xây dựng bộ dữ liệu học cho mạng nơ-ron

3.2.3.2. Cấu trúc mạng nơ-ron

3.3. Lập lịch kiểm thử và đưa vào CI

3.4. Tổng kết chương

4. CHƯƠNG 4: CÀI ĐẶT VÀ THỰC NGHIỆM

4.1. Cài đặt chương trình

4.1.1. Môi trường phát triển và thử nghiệm

4.1.2. Phương pháp đo độ chính xác

4.2. Dữ liệu thử nghiệm

4.3. Kết quả thử nghiệm

4.4. So sánh với nghiên cứu liên quan

5. CHƯƠNG 5: KẾT LUẬN

5.1. Kết quả đạt được

5.2. Định hướng phát triển

DANH MỤC HÌNH VẼ VÀ SƠ ĐỒ

DANH MỤC BẢNG

Tóm tắt

I. Tổng Quan Về Ứng Dụng Học Máy Trong Kiểm Thử Phần Mềm

Kiểm thử phần mềm đóng vai trò then chốt trong việc xác minh và đảm bảo chất lượng của một hệ thống. Chi phí, thời gian và nguồn lực dành cho giai đoạn kiểm thử thường chiếm tỷ lệ đáng kể trong quy trình phát triển phần mềm. Sự phát triển nhanh chóng và độ phức tạp ngày càng tăng của phần mềm đặt ra những thách thức lớn cho việc kiểm thử. Nhiều ý kiến cho rằng kiểm thử đã trở thành khâu tốn kém thời gian và công sức nhất. Các kỹ thuật truyền thống trong kiểm thử thường giải quyết các bài toán trong những lĩnh vực hẹp và ít có khả năng tự động hóa hoàn toàn. Do đó, việc ứng dụng các kỹ thuật trí tuệ nhân tạo và học máy thông minh vào kiểm thử phần mềm, đặc biệt là Machine Learning in Software Testing, hứa hẹn sẽ mang lại những cải tiến đáng kể về hiệu quả và độ tin cậy. Luận văn này sẽ đi sâu vào việc ứng dụng học máy để giải quyết bài toán tối ưu trong kiểm thử, từ đó đề xuất một mô hình phù hợp để tích hợp vào quy trình phát triển phần mềm thực tế.

1.1. Giới thiệu về kiểm thử phần mềm và tầm quan trọng

Kiểm thử phần mềm là một quá trình quan trọng trong việc đảm bảo chất lượng của sản phẩm phần mềm. Nó bao gồm việc đánh giá các thuộc tính và chức năng của hệ thống để xác định xem chúng có đáp ứng các yêu cầu đặt ra hay không. Một định nghĩa tiêu chuẩn về trường hợp kiểm thử theo IEEE 610 (1990) bao gồm một bộ đầu vào, điều kiện thực thi và kết quả mong đợi, được thiết kế để kiểm tra một đường dẫn phần mềm hoặc xác minh việc tuân thủ các yêu cầu cụ thể. Do chi phí và thời gian dành cho kiểm thử là có hạn, việc lựa chọn các kỹ thuật kiểm thử phù hợp là rất quan trọng. Vì vậy, cần có sự phối hợp giữa kiểm thử viên và phần mềm để tối ưu quy trình kiểm thử.

1.2. Các phương pháp kiểm thử truyền thống Ưu và nhược điểm

Có nhiều phương pháp kiểm thử khác nhau, mỗi phương pháp có những ưu điểm và nhược điểm riêng. Các phương pháp kiểm thử có thể được phân loại theo nhiều tiêu chí khác nhau, chẳng hạn như theo cách nhìn của người thực hiện kiểm thử (kiểm thử hộp trắng, hộp đen, hộp xám), theo mức độ (kiểm thử đơn vị, kiểm thử tích hợp, kiểm thử hệ thống, kiểm thử chấp nhận) hoặc theo công cụ hỗ trợ (kiểm thử thủ công, kiểm thử tự động). Việc lựa chọn phương pháp kiểm thử phù hợp phụ thuộc vào nhiều yếu tố, bao gồm mục tiêu kiểm thử, đặc điểm của phần mềm và nguồn lực sẵn có. Trong số đó, kiểm thử tự động ngày càng được ưa chuộng, giúp tăng năng suất, độ tin cậy và khả năng bao phủ.

II. Thách Thức Trong Kiểm Thử Phần Mềm Hiện Nay Giải Pháp ML

Trong bối cảnh phát triển phần mềm ngày càng phức tạp, các phương pháp kiểm thử truyền thống đang đối mặt với nhiều thách thức. Kiểm thử hồi quy, mặc dù quan trọng để đảm bảo tính ổn định của phần mềm, lại chiếm phần lớn ngân sách kiểm thử. Các kỹ thuật như Kiểm thử lại toàn bộ, Chọn kiểm thử hồi quy (RTS), Giảm thiểu bộ test (TSM) và Ưu tiên trường hợp kiểm thử (TCP) đều có những hạn chế nhất định. Việc theo dõi mối liên hệ giữa thay đổi mã nguồn và phương án kiểm thử không phải lúc nào cũng rõ ràng, đặc biệt trong các hệ thống quản lý kiểm thử độc lập. Do đó, cần có một phương pháp tối ưu hóa kiểm thử không phụ thuộc vào đặc tả phần mềm và vẫn đảm bảo hiệu năng phát hiện lỗi dưới ràng buộc thời gian. AI in Software Testing và ML for Test Automation có thể giúp giải quyết các vấn đề đó.

2.1. Giới hạn của phương pháp kiểm thử hồi quy truyền thống

Kiểm thử hồi quy là một phần quan trọng của quy trình phát triển phần mềm, nhưng nó cũng là một hoạt động tốn kém và tốn thời gian. Các phương pháp kiểm thử hồi quy truyền thống như kiểm thử lại toàn bộ, chọn kiểm thử hồi quy (RTS) và giảm thiểu bộ kiểm thử (TSM) đều có những hạn chế. Kiểm thử lại toàn bộ tốn kém khi bộ kiểm thử lớn. Kỹ thuật chọn kiểm thử hồi quy (Regression Test Selection) không an toàn, và kỹ thuật giảm thiểu bộ kiểm thử (Test Suite Minimization) giảm thiểu lỗi không đáng kể. Do đó, cần có một phương pháp kiểm thử hồi quy hiệu quả hơn.

2.2. Ưu tiên trường hợp kiểm thử TCP và các vấn đề tồn tại

Ưu tiên trường hợp kiểm thử (TCP) là một kỹ thuật kiểm thử hồi quy nhằm sắp xếp thứ tự các trường hợp kiểm thử dựa trên mức độ quan trọng của chúng. Các trường hợp kiểm thử có mức độ ưu tiên cao hơn sẽ được thực hiện sớm hơn trong quá trình kiểm thử. TCP có thể giúp tiết kiệm thời gian và chi phí, đồng thời tăng tỷ lệ phát hiện lỗi. Tuy nhiên, việc xác định tiêu chí ưu tiên trường hợp kiểm thử phù hợp có thể gặp nhiều khó khăn. Các nghiên cứu về tối ưu hóa kiểm thử hiện nay cần phải được tiếp cận theo nhiều hướng khác nhau và số lượng lớn phụ thuộc vào đặc tả phần mềm và mã nguồn.

III. Học Máy Tăng Cường Phương Pháp Tối Ưu Kiểm Thử Tự Động

Luận văn này đề xuất một mô hình tối ưu hóa trong kiểm thử phần mềm dựa trên học máy tăng cường kết hợp mạng nơ-ron nhân tạo. Mô hình này sẽ được sử dụng để tích hợp vào quy trình phát triển phần mềm thực tế. Học tăng cường cho phép hệ thống học cách đưa ra quyết định tối ưu dựa trên kinh nghiệm. Bằng cách tương tác với môi trường kiểm thử, hệ thống có thể học cách ưu tiên các trường hợp kiểm thử có khả năng phát hiện lỗi cao nhất, từ đó tối ưu hóa hiệu quả của quá trình kiểm thử. Mô hình này được kỳ vọng sẽ giải quyết vấn đề tối ưu hóa kiểm thử một cách hiệu quả, không phụ thuộc vào đặc tả phần mềm và vẫn đảm bảo hiệu năng phát hiện lỗi dưới ràng buộc thời gian.

3.1. Tổng quan về học tăng cường và ứng dụng trong kiểm thử

Học tăng cường (Reinforcement Learning) là một nhánh của học máy cho phép một tác nhân (agent) học cách đưa ra quyết định trong một môi trường để tối đa hóa phần thưởng tích lũy. Trong bối cảnh kiểm thử phần mềm, tác nhân có thể là một hệ thống tự động hóa kiểm thử, môi trường là phần mềm đang được kiểm thử và phần thưởng là việc phát hiện lỗi. Bằng cách thử nghiệm và học hỏi từ những kết quả, tác nhân có thể dần dần cải thiện khả năng kiểm thử của mình.

3.2. Kết hợp mạng nơ ron nhân tạo với học tăng cường Deep RL

Mạng nơ-ron nhân tạo (Artificial Neural Networks) là một công cụ mạnh mẽ để xấp xỉ các hàm phức tạp. Khi kết hợp với học tăng cường, chúng tạo thành học tăng cường sâu (Deep Reinforcement Learning), cho phép tác nhân học cách đưa ra quyết định trong các môi trường phức tạp với không gian trạng thái lớn. Trong kiểm thử phần mềm, Deep RL có thể được sử dụng để học cách ưu tiên các trường hợp kiểm thử, dự đoán khả năng phát hiện lỗi của một trường hợp kiểm thử và thậm chí tạo ra các trường hợp kiểm thử mới.

3.3. AI driven testing Mạng học sâu cho bài toán kiểm thử

Việc sử dụng mạng nơ-ron trong kiến trúc mô hình giúp cho việc ra quyết định trở nên chính xác hơn dựa trên các dữ liệu lịch sử có sẵn. Các tham số của mô hình sẽ được điều chỉnh để tối đa hóa việc phát hiện lỗi. Mô hình bao gồm các bước thực hiện để tìm, tổng hợp và tiền xử lý dữ liệu. Bài toán kiểm thử là một bài toán phụ thuộc rất lớn vào yêu cầu đặc tả của phần mềm do đó hai bộ dữ liệu được chọn phải đại diện được các đặc trưng về báo cáo kiểm thử thường gặp.

IV. Xây Dựng Mô Hình ML Cho Tối Ưu Hóa Quy Trình Kiểm Thử

Mô hình đề xuất sẽ tập trung vào việc xây dựng một hệ thống kiểm thử thông minh có khả năng tự động học và cải thiện hiệu quả kiểm thử theo thời gian. Hệ thống này sẽ bao gồm các thành phần chính sau: (1) Thu thập và tiền xử lý dữ liệu kiểm thử, (2) Xây dựng mô hình học máy tăng cường kết hợp mạng nơ-ron nhân tạo, (3) Đánh giá hiệu quả của mô hình trên các bộ dữ liệu kiểm thử thực tế, (4) Tích hợp mô hình vào quy trình phát triển phần mềm để cải thiện hiệu quả kiểm thử. Predictive Testing using Machine Learning là một phần quan trọng trong mô hình.

4.1. Thu thập và xử lý dữ liệu kiểm thử đầu vào

Dữ liệu kiểm thử là yếu tố quan trọng để xây dựng một mô hình học máy hiệu quả. Dữ liệu này có thể bao gồm thông tin về các trường hợp kiểm thử đã thực hiện, kết quả kiểm thử, thông tin về mã nguồn, thông tin về các lỗi đã được phát hiện và các thông tin liên quan khác. Dữ liệu cần được thu thập, làm sạch và tiền xử lý trước khi được sử dụng để huấn luyện mô hình học máy. Mô tả chi tiết các bước thực hiện để tìm, tổng hợp, tiền xử lí dữ liệu.

4.2. Thiết kế kiến trúc mô hình học máy tăng cường

Mô hình học máy tăng cường sẽ được thiết kế để học cách ưu tiên các trường hợp kiểm thử có khả năng phát hiện lỗi cao nhất. Mô hình sẽ nhận đầu vào là thông tin về trạng thái của hệ thống, các trường hợp kiểm thử có sẵn và đưa ra quyết định về trường hợp kiểm thử nào nên được thực hiện tiếp theo. Mô hình sẽ được huấn luyện bằng cách sử dụng dữ liệu kiểm thử đã thu thập được và phần thưởng sẽ được gán cho việc phát hiện lỗi.

4.3. Đánh giá hiệu quả của mô hình Test Case Generation using Machine Learning

Hiệu quả của mô hình học máy sẽ được đánh giá trên các bộ dữ liệu kiểm thử thực tế. Các chỉ số đánh giá có thể bao gồm tỷ lệ phát hiện lỗi, thời gian kiểm thử và chi phí kiểm thử. Kết quả đánh giá sẽ được sử dụng để tinh chỉnh mô hình và cải thiện hiệu quả kiểm thử.

V. Thực Nghiệm và Đánh Giá AI Cải Thiện Kiểm Thử Ra Sao

Chương này sẽ trình bày kết quả thực nghiệm và đánh giá mô hình đã được xây dựng. Chương trình được xây dựng trên các thư viện hỗ trợ học máy của Python. Hai bộ dữ liệu từ ABB Robotics Paint Control và Rails Travis CI được sử dụng làm dữ liệu thử nghiệm. Các kết quả sẽ được so sánh với các phương pháp kiểm thử truyền thống và các nghiên cứu liên quan để đánh giá hiệu quả của mô hình ứng dụng học máy trong kiểm thử phần mềm. Mục tiêu là chứng minh rằng ML driven testing có thể giúp cải thiện đáng kể hiệu quả và độ tin cậy của quá trình kiểm thử.

5.1. Môi trường phát triển và dữ liệu thử nghiệm

Việc lựa chọn môi trường phát triển và dữ liệu thử nghiệm phù hợp là rất quan trọng để đảm bảo tính khách quan và khả năng tái lập của kết quả nghiên cứu. Chương trình cần được xây dựng trên các thư viện hỗ trợ học máy phổ biến và dễ sử dụng, chẳng hạn như TensorFlow hoặc PyTorch. Dữ liệu thử nghiệm cần đại diện cho các loại phần mềm khác nhau và có đủ độ lớn để đảm bảo tính thống kê của kết quả.

5.2. Kết quả thực nghiệm và so sánh với phương pháp truyền thống

Kết quả thực nghiệm sẽ được trình bày một cách chi tiết và dễ hiểu. Các chỉ số đánh giá sẽ được tính toán và so sánh với các phương pháp kiểm thử truyền thống, chẳng hạn như kiểm thử ngẫu nhiên hoặc kiểm thử dựa trên độ bao phủ. So sánh với phương pháp ngẫu nhiên và phương pháp có sắp xếp.

5.3. Phân tích ưu điểm và hạn chế của mô hình

Bên cạnh việc trình bày kết quả thực nghiệm, chương này cũng sẽ phân tích những ưu điểm và hạn chế của mô hình đã được xây dựng. Phân tích này sẽ giúp xác định những lĩnh vực mà mô hình có thể được cải thiện trong tương lai.

VI. Kết Luận Tương Lai Học Máy Thay Đổi Kiểm Thử Ra Sao

Luận văn này đã trình bày một mô hình ứng dụng học máy vào tối ưu hóa kiểm thử phần mềm tự động, dựa trên khai thác các đặc trưng từ dữ liệu lịch sử. Kết quả nghiên cứu cho thấy rằng mô hình đề xuất có tiềm năng cải thiện đáng kể hiệu quả và độ tin cậy của quá trình kiểm thử. Trong tương lai, hướng nghiên cứu có thể tập trung vào việc mở rộng mô hình để xử lý các loại phần mềm phức tạp hơn, tích hợp mô hình vào các công cụ kiểm thử hiện có và nghiên cứu các phương pháp học máy mới để cải thiện hiệu quả của quá trình kiểm thử. Software Quality Assurance with Machine Learning sẽ ngày càng trở nên quan trọng.

6.1. Tóm tắt kết quả đạt được và đóng góp chính của nghiên cứu

Kết luận cần tóm tắt những kết quả chính đã đạt được trong luận văn, cũng như nêu rõ những đóng góp mới của nghiên cứu so với các công trình trước đó. Cần trình bày kết luận về công trình nghiên cứu, các đóng góp chính và ý tưởng phát triển thêm trong tương lai.

6.2. Định hướng phát triển và ứng dụng trong tương lai

Phần này sẽ thảo luận về những hướng phát triển tiềm năng của mô hình trong tương lai. Ví dụ: Mở rộng mô hình để xử lý các loại phần mềm phức tạp hơn, tích hợp mô hình vào các công cụ kiểm thử hiện có hoặc nghiên cứu các phương pháp học máy mới để cải thiện hiệu quả của quá trình kiểm thử. Cần trình bày ý tưởng phát triển thêm trong tương lai.

23/05/2025

Bạn đang xem trước tài liệu:

Ứng dụng họ máy trong kiểm thử phần mềm

Tải đầy đủ

Nội dung chính

Tổng quan nghiên cứu

Kiểm thử phần mềm là một giai đoạn quan trọng trong vòng đời phát triển phần mềm, chiếm tới khoảng 80% ngân sách kiểm thử hồi quy và ảnh hưởng trực tiếp đến chất lượng sản phẩm. Với sự phát triển nhanh chóng và độ phức tạp ngày càng tăng của phần mềm, việc kiểm thử truyền thống thủ công trở nên tốn kém về thời gian và chi phí, đồng thời khó đảm bảo hiệu quả. Tại Việt Nam, quy trình kiểm thử phần mềm vẫn chủ yếu dựa vào thủ công, gây ra nhiều hạn chế về năng suất và độ tin cậy. Trong bối cảnh đó, việc ứng dụng các kỹ thuật học máy, đặc biệt là học tăng cường sâu (Deep Reinforcement Learning), vào kiểm thử phần mềm tự động nhằm tối ưu hóa quá trình kiểm thử trở nên cấp thiết.

Mục tiêu nghiên cứu của luận văn là xây dựng mô hình ứng dụng học máy tăng cường kết hợp mạng nơ-ron nhân tạo để tối ưu hóa việc ưu tiên và lựa chọn trường hợp kiểm thử trong quy trình kiểm thử tự động, đặc biệt trong môi trường tích hợp liên tục (Continuous Integration - CI). Phạm vi nghiên cứu tập trung vào kiểm thử tự động, khai thác dữ liệu lịch sử kiểm thử từ hai bộ dữ liệu thực nghiệm là ABB Robotics Paint Control và Rails Travis CI, với tổng số vòng CI lần lượt là 312 và 2000. Nghiên cứu nhằm nâng cao hiệu quả phát hiện lỗi, giảm thiểu thời gian và chi phí kiểm thử dưới các ràng buộc về thời gian thực thi.

Việc áp dụng học máy trong kiểm thử phần mềm không chỉ giúp tăng độ bao phủ và độ tin cậy mà còn hỗ trợ lập lịch kiểm thử hiệu quả, góp phần rút ngắn vòng đời phát triển phần mềm và nâng cao chất lượng sản phẩm phần mềm trong thực tế.

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Luận văn dựa trên hai lý thuyết chính: Quy trình quyết định Markov (Markov Decision Process - MDP) và học máy tăng cường sâu (Deep Reinforcement Learning - DRL). MDP cung cấp mô hình toán học để tối ưu hóa việc ra quyết định trong môi trường không chắc chắn, với các thành phần gồm bộ trạng thái, bộ hành động, hàm chuyển trạng thái, hàm phần thưởng và hệ số giảm trừ. Học tăng cường cho phép máy học từ tương tác với môi trường thông qua việc nhận phần thưởng, kết hợp giữa khám phá và khai thác để tìm chiến lược tối ưu.

Mạng nơ-ron nhân tạo (Artificial Neural Network - ANN) được sử dụng làm hàm ước lượng trong học tăng cường, giúp xử lý không gian trạng thái và hành động lớn, liên tục. Mạng nơ-ron đa lớp (Multilayer Perceptron - MLP) với các lớp ẩn và hàm kích hoạt ReLU được huấn luyện bằng thuật toán truyền ngược sai số (backpropagation) và tối ưu bằng Adam. Thuật toán Q-learning được mở rộng thành Deep Q-learning (DQN) sử dụng mạng nơ-ron để ước lượng hàm giá trị Q, giúp máy học chiến lược ưu tiên và lựa chọn trường hợp kiểm thử hiệu quả.

Ba khái niệm chính trong nghiên cứu gồm:

Ưu tiên trường hợp kiểm thử (Test Case Prioritization - TCP) với mục tiêu sắp xếp thứ tự thực thi để phát hiện lỗi sớm nhất.
Lựa chọn trường hợp kiểm thử thích nghi (Adaptive Test Case Selection - ATCS) nhằm chọn bộ kiểm thử tối ưu dưới ràng buộc thời gian.
Hàm phần thưởng trong học tăng cường phản ánh hiệu năng phát hiện lỗi và thời gian thực thi.

Phương pháp nghiên cứu

Nguồn dữ liệu chính gồm hai bộ dữ liệu lịch sử kiểm thử: ABB Robotics Paint Control với 114 trường hợp kiểm thử qua 312 vòng CI và Rails Travis CI với 2000 vòng CI. Dữ liệu được thu thập, tiền xử lý và chiết xuất đặc trưng, bao gồm kết quả thành công/thất bại và thời gian thực thi từng trường hợp kiểm thử.

Phương pháp phân tích sử dụng thuật toán học tăng cường sâu DQN với mạng nơ-ron đa lớp gồm 3 lớp ẩn (200, 100, 50 nút), hàm kích hoạt ReLU, tối ưu Adam, tốc độ học 0.001 và bộ nhớ replay kích thước 10,000. Tỉ lệ khám phá (epsilon) bắt đầu từ 0.2 và giảm dần theo thời gian. Mô hình được huấn luyện trên dữ liệu lịch sử để học cách ưu tiên và lựa chọn trường hợp kiểm thử nhằm tối đa hóa hàm phần thưởng.

Timeline nghiên cứu kéo dài từ năm 2016 đến 2019, bao gồm các bước thu thập dữ liệu, xây dựng mô hình, huấn luyện và đánh giá trên hai bộ dữ liệu thực nghiệm. Phương pháp đánh giá hiệu quả mô hình dựa trên chỉ số NAPFD (Normalized Average Percentage of Faults Detected), đo lường tốc độ phát hiện lỗi trong bộ kiểm thử được ưu tiên.

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

Hiệu quả mô hình học tăng cường sâu: Mô hình sử dụng mạng nơ-ron hỗ trợ Q-learning đạt hiệu năng cao hơn đáng kể so với Q-learning truyền thống dùng bảng, với NAPFD tăng trung bình khoảng 15-20% trên cả hai bộ dữ liệu.
Ảnh hưởng của hàm phần thưởng: Hàm phần thưởng dựa trên số lần thất bại (tcfail) cho kết quả tốt nhất, với NAPFD đạt khoảng 0.85 trên bộ dữ liệu Paint Control và 0.78 trên bộ dữ liệu Rails, vượt trội so với các hàm phần thưởng khác như đếm số lần thất bại đơn thuần hoặc xếp hạng thời gian.
Tác động của độ dài lịch sử kiểm thử: Hiệu năng mô hình cải thiện rõ rệt khi sử dụng lịch sử kiểm thử dài hơn, thể hiện qua việc bộ dữ liệu Paint Control với 300 vòng CI cho kết quả tốt hơn so với bộ dữ liệu Rails với 2000 vòng CI nhưng ít trường hợp thất bại hơn.
Tính thích nghi của mô hình: Mô hình có khả năng thích nghi với sự thay đổi trong dữ liệu kiểm thử theo thời gian, giúp ưu tiên các trường hợp kiểm thử có khả năng phát hiện lỗi cao trong từng giai đoạn CI.

Thảo luận kết quả

Nguyên nhân chính của hiệu quả mô hình là khả năng học và cập nhật chiến lược ưu tiên dựa trên dữ liệu lịch sử kiểm thử, không phụ thuộc vào đặc tả phần mềm hay mã nguồn, phù hợp với môi trường kiểm thử độc lập và tích hợp liên tục. Việc sử dụng mạng nơ-ron giúp mô hình tổng quát hóa tốt hơn trong không gian trạng thái lớn, khắc phục hạn chế của Q-learning truyền thống.

So sánh với các nghiên cứu trước đây chủ yếu sử dụng các kỹ thuật truyền thống hoặc dựa trên mã nguồn, mô hình đề xuất có ưu thế trong việc xử lý dữ liệu hộp đen và thích nghi với ràng buộc thời gian thực thi. Kết quả cũng cho thấy việc lựa chọn hàm phần thưởng phù hợp là yếu tố quan trọng ảnh hưởng đến hiệu năng mô hình.

Dữ liệu có thể được trình bày qua biểu đồ NAPFD theo thời gian vòng CI, minh họa sự tăng trưởng hiệu năng của mô hình học tăng cường sâu so với các phương pháp khác, cũng như bảng so sánh chi tiết các chỉ số hiệu quả trên từng bộ dữ liệu.

Đề xuất và khuyến nghị

Triển khai mô hình học tăng cường sâu trong quy trình CI: Áp dụng mô hình ưu tiên và lựa chọn trường hợp kiểm thử tự động để nâng cao hiệu quả phát hiện lỗi, giảm thời gian kiểm thử. Thời gian thực hiện: 6-12 tháng; chủ thể: các đội phát triển phần mềm và kiểm thử.
Tích hợp hệ thống thu thập và tiền xử lý dữ liệu kiểm thử: Xây dựng hệ thống tự động thu thập, lưu trữ và xử lý dữ liệu lịch sử kiểm thử để cung cấp đầu vào chính xác cho mô hình học máy. Thời gian: 3-6 tháng; chủ thể: bộ phận quản lý kiểm thử và CNTT.
Đào tạo và nâng cao năng lực cho đội ngũ kiểm thử viên: Tổ chức các khóa đào tạo về học máy và kiểm thử tự động để nâng cao kỹ năng vận hành và giám sát mô hình. Thời gian: liên tục; chủ thể: phòng nhân sự và đào tạo.
Nghiên cứu mở rộng và tối ưu mô hình: Tiếp tục phát triển mô hình với các thuật toán học sâu mới, mở rộng phạm vi áp dụng cho các loại phần mềm khác nhau và tích hợp thêm các yếu tố như đặc tả phần mềm, mã nguồn. Thời gian: 12-24 tháng; chủ thể: nhóm nghiên cứu và phát triển sản phẩm.

Các giải pháp trên nhằm mục tiêu tăng chỉ số NAPFD lên ít nhất 10% trong vòng 1 năm, đồng thời giảm chi phí và thời gian kiểm thử từ 15-20% so với phương pháp truyền thống.

Đối tượng nên tham khảo luận văn

Các kỹ sư kiểm thử phần mềm: Nắm bắt phương pháp tối ưu hóa kiểm thử tự động, áp dụng mô hình học máy để nâng cao hiệu quả công việc, giảm thiểu thao tác thủ công.
Nhà quản lý dự án phần mềm: Hiểu rõ lợi ích của việc tích hợp học máy trong quy trình kiểm thử, từ đó hoạch định chiến lược phát triển và phân bổ nguồn lực hợp lý.
Nhà nghiên cứu và phát triển công nghệ học máy: Tham khảo mô hình ứng dụng học tăng cường sâu trong lĩnh vực kiểm thử phần mềm, mở rộng nghiên cứu về các thuật toán và ứng dụng thực tiễn.
Các tổ chức phát triển phần mềm quy mô lớn: Áp dụng mô hình để cải thiện quy trình kiểm thử trong môi trường tích hợp liên tục, nâng cao chất lượng sản phẩm và rút ngắn thời gian phát hành.

Mỗi nhóm đối tượng có thể sử dụng luận văn như tài liệu tham khảo để triển khai hoặc nghiên cứu sâu hơn về ứng dụng học máy trong kiểm thử phần mềm, từ đó nâng cao năng lực và hiệu quả công việc.

Câu hỏi thường gặp

Học tăng cường sâu khác gì so với học máy truyền thống trong kiểm thử phần mềm?
Học tăng cường sâu kết hợp mạng nơ-ron để xử lý không gian trạng thái lớn và liên tục, cho phép mô hình tự học từ tương tác với môi trường mà không cần dữ liệu giám sát đầy đủ, phù hợp với kiểm thử tự động trong môi trường thay đổi liên tục.
Mô hình có thể áp dụng cho các loại phần mềm khác ngoài hai bộ dữ liệu thử nghiệm không?
Có thể, tuy nhiên cần điều chỉnh tham số và huấn luyện lại mô hình với dữ liệu lịch sử kiểm thử tương ứng để đảm bảo hiệu quả tối ưu trong từng môi trường phần mềm cụ thể.
Làm thế nào để đánh giá hiệu quả mô hình trong thực tế?
Sử dụng chỉ số NAPFD để đo lường tốc độ phát hiện lỗi trong bộ kiểm thử được ưu tiên, so sánh với các phương pháp kiểm thử hiện tại để đánh giá mức độ cải thiện.
Mô hình có thể hoạt động hiệu quả khi dữ liệu lịch sử kiểm thử còn hạn chế?
Học tăng cường có khả năng bắt đầu với ít dữ liệu và tự khám phá chiến lược tối ưu qua quá trình tương tác liên tục, do đó phù hợp với tình huống dữ liệu hạn chế ban đầu.
Có thể tích hợp mô hình vào quy trình kiểm thử hiện tại dễ dàng không?
Mô hình được thiết kế để tích hợp vào quy trình CI, tuy nhiên cần xây dựng hệ thống thu thập và xử lý dữ liệu phù hợp, đồng thời đào tạo nhân sự để vận hành và giám sát mô hình hiệu quả.

Kết luận

Luận văn đã xây dựng thành công mô hình học máy tăng cường sâu kết hợp mạng nơ-ron nhân tạo để tối ưu hóa ưu tiên và lựa chọn trường hợp kiểm thử phần mềm.
Mô hình được đánh giá trên hai bộ dữ liệu thực nghiệm với kết quả NAPFD cải thiện đáng kể so với các phương pháp truyền thống.
Phương pháp không phụ thuộc vào đặc tả phần mềm hay mã nguồn, phù hợp với môi trường kiểm thử độc lập và tích hợp liên tục.
Các hàm phần thưởng được thiết kế phù hợp giúp mô hình thích nghi và nâng cao hiệu quả phát hiện lỗi theo thời gian.
Đề xuất các giải pháp triển khai và nghiên cứu mở rộng nhằm ứng dụng mô hình trong thực tế và phát triển công nghệ kiểm thử tự động.

Tiếp theo, cần triển khai thử nghiệm mô hình trong môi trường kiểm thử thực tế, đồng thời mở rộng nghiên cứu về các thuật toán học sâu mới để nâng cao hiệu quả và phạm vi ứng dụng. Độc giả và các tổ chức phát triển phần mềm được khuyến khích áp dụng và phát triển thêm dựa trên kết quả nghiên cứu này nhằm nâng cao chất lượng và hiệu quả kiểm thử phần mềm.

Trích đoạn nội dung tài liệu

CHƯƠNG 1 NGHIÊN CỨU TỔNG QUAN VỀ KIỂM THỬ PHẦN MỀM Chương này trình bày một cách tóm tắt kiến thức cơ bản về kiểm thử phần mềm, kiểm thử tự động. Từ đó cách tiếp cận bài toán tối ưu trong kiểm thử được đề xuất và mô hình ưu tiên hóa và lựa chọn trường hợp kiểm thử được trình bày. Đồng thời, cũng đưa ra một số nghiên cứu của các tác giả trong lĩnh vực liên quan tới một số kĩ thuật tối ưu hóa trong kiểm thử phần mềm.1 Giới thiệu về kiểm thử phần mềm Phần này giới thiệu về kiểm thử phần mềm, các khái niệm xung quanh kiểm thử phần mềm và tự động hóa trong kiểm thử.1 Kiểm thử và các phương pháp kiểm thử khác nhau Định nghĩa 1.1 Tiêu chuẩn IEEE 610 (1990) định nghĩa trường hợp kiểm thử:  Một bộ đầu vào, điều kiện thực thi, và kết quả mong đợi được xây dựng cho một mục tiêu nhất định, như kiểm tra một đường dẫn phần mềm, hay xác minh việc tuân theo những yêu cầu cụ thể  Các tài liệu xác định đầu vào, kết quả mong đợi và một bộ điều kiện cho một đối tượng kiểm thử Kiểm thử phần mềm là phân tích được thực hiện để đánh giá chất lượng của hệ thống phần mềm dưới dạng một bài kiểm tra [13]. Có rất nhiều kỹ thuật kiểm thử để đảm bảo chắc chắn rằng một bộ phận hay một hệ thống được kiểm tra sẽ đáp ứng đúng yêu cầu đặc tả.

Rất nhiều các phương án khác nhau được sử dụng để chọn ra kỹ thuật kiểm thử hợp lí nhất. Điều này là do khối lượng kiểm thử là rất lớn trong khi thời gian và các chi phí khác là có hạn. Trong mô hình phát triển phần mềm, thời gian và tài nguyên cho kiểm thử là giới hạn. Mô hình phát triển phần mềm thác nước truyền thống [14] kiểm thử chỉ diễn ra khi hệ thống đã được thiết kế và triển 12 khai xong toàn bộ.

Tuy nhiên, trong mô hình phát triển nhanh agile ngày nay, kiểm thử diễn ra cùng giai đoạn với quá trình phát triển phần mềm. Chương này sẽ giới thiệu các phương pháp kiểm thử khác nhau cùng giải thích. Chúng có thể sẽ được nhóm lại dựa theo bộ tiêu chí nhất định và một phương pháp có thể thuộc về nhiều nhóm. Mỗi nhóm sẽ có những lợi thế và bất lợi nhất định mà người kiểm thử phải xem xét và đánh giá kĩ nhằm tận dụng chúng tốt nhất có thể.

Đầu tiên, phân loại theo cách nhìn của người thực thi kiểm thử, các phương pháp kiểm thử sẽ được chia làm hai loại chính là hộp trắng và hộp đen [15], ngoài ra còn có thêm hộp xám [16]. Thiết kết theo phương pháp hộp trắng cần có hiểu biết bên trong, cách hệ thống hoạt động. Ngược lại, thiết kế kiểm thử theo phương pháp nhóm hộp đen sẽ đánh giá tính năng của hệ thống mà không có hiểu biết gì về cách hoạt động bên trong hay mã triển khai. Hộp xám là phương pháp kết hợp khi hiểu biết về phần mềm được dùng để thiết kế các trường hợp kiểm thử còn việc thực hiện kiểm thử lại ở mức độ người dùng.

Tiếp tục, các phương pháp kiểm thử còn được phân chia theo mức độ. Thấp nhất là kiểm thử đơn vị [17] mà theo đó từng phần mã nguồn riêng rẽ cùng với dữ liệu đi kèm, thủ tục sử dụng và vận hành được kiểm thử để xác định là chúng hoạt động đúng. Những bài kiểm thử này chủ yếu viết bởi người lập trình viên sau khi hoặc thậm chí trước cả khi bắt đầu viết mã nguồn phần mềm [18] nhằm khuyến khích việc thiết kế kiến trúc phần mềm đơn giản hơn. Kiểm thử hộp trắng cũng liên quan trực tiếp tới mức độ kiểm thử này vì sự tương đồng về trong tính chất.

Mức độ thứ hai là kiểm thử kết hợp [19] là kiểm thử sự kết nối giữa các thành phần, tương tác tới các phần khác nhau trong một hệ thống đang vận hành. Tiếp theo là kiểm thử hệ thống đề cập tới hành vi của hệ thống được định nghĩa bởi phạm vi phát triển phần mềm [19]. Cuối cùng là kiểm thử chấp nhận, được thực hiện từ phía khách hàng cũng tại chính môi trường mà nó sẽ được vận hành. Trong đó, các trường hợp kiểm thử cũng sẽ chỉ gồm những điểm quan trọng từ điểm nhìn của khách hàng.

13 Các kĩ thuật kiểm thử còn có thể được chia theo công cụ, phần mềm hỗ trợ. Kiểm thử thủ công là các trường hợp việc kiểm thử được thực hiện mà không có sự hỗ trợ của phần mềm tự động nào. Người kiểm thử sẽ đi qua tất cả các bước trong kế hoạch kiểm thử để đảm bảo tất cả các chức năng của hệ thống có kết quả đúng theo yêu cầu. Các công đoạn này đều có thể được tự động hóa bằng phần mềm.

Tức là, một phần mềm tự động được điều khiển để thực hiện theo trường hợp kiểm thử và so sánh với kết quả đã định sẵn [20]. Các cách nhìn khác nhau về phân loại kiểm thử đều có thể được kết hợp lại và trong các công ty phần mềm ngày nay, nhiều phương án kiểm thử khác nhau đang được dùng để đảm bảo chất lượng. Và xu hướng hiện nay đó là đơn giản hóa việc kiểm thử tự động để làm đòn bẩy cho việc đầu tư vào kiểm thử thủ công.2 Kiểm thử tự động Kiểm thử phần mềm về bản chất là sự lặp đi lặp lại. Một danh sách các bước cần thực hiện, kiểm tra đầu ra, đưa hệ thống về trạng thái ban đầu và thực hiện lại các bước từ đầu.

Các nhân viên kiểm thử cùng triển khai trên một hệ thống, làm các bước giống hoặc gần giống nhau. Như vậy, kiểm thử là một hoạt động tương đối chậm và tốn kém. Sự thiếu khách quan của người kiểm thử có thể ảnh hưởng tới các bước quan trọng trong quy trình kiểm thử. Tuy nhiên, trong kiểm thử tự động, những điểm vừa liệt kê khó có thể xảy ra  Tăng năng suất: Lý tưởng mà nói, một bộ trường hợp kiểm thử tự động nên được chạy mà không có sự can thiệp của con người.

Như vậy sẽ tiết kiệm được rất nhiều tài nguyên khi để việc kiểm thử chạy tự động ban đêm không cần người giám sát [21]. Kiểm thử tự động có thể làm ngắn lại vòng đời phát hành sản phẩm. Những lỗi do thay đổi trong hệ thống sẽ sớm được phát hiện sớm trong quy trình phát triển phần mềm, tiết kiệm công sức và tiền bạc [22] Hơn nữa, kiểm thử tự động có thể xử lí lượng lớn dữ liệu so với kiểm thử thủ 14 công, ví dụ cần kiểm thử trên bộ dữ liệu gồm hàng ngàn bản ghi sẽ gặp khó khăn nếu làm thủ công trong khi khá là đơn giản nếu thực hiện tự động.  Tăng độ tin cậy: thể hiện ở việc kiểm thử tự động được chạy chính xác giống hệt nhau mỗi lần thực hiện.

Một hoạt động kiểm thử thủ công chắc chắc khó tránh khỏi các lỗi ở con người, nhất là ở các trường hợp lặp đi lặp lại, cần chuẩn bị nhiều, hoặc cần chú ý tới các bước phụ, nhỏ, chi tiết. Hơn nữa, việc để kiểm thử chạy tự động giải thoát người kĩ sư khỏi những việc lặp đi lặp lại mà tập trung hơn vào nghiên cứu hệ thống, thiết kế kế hoạch kiểm thử hiệu quả hơn [22].  Tăng độ bao phủ: Kiểm thử tự động chạy rất tương đối nhanh. Nhiều trường hợp kiểm thử được thực thi trong thời gian ngắn hơn sẽ dẫn đến việc có thể chạy nhiều trường hợp kiểm thử hơn, độ bao phủ phần mềm cao hơn.2 Bài toán tối ưu trong kiểm thử phần mềm Kiểm thử hồi quy chiếm 80% ngân sách kiểm thử [23].

Việc thực hiện yêu cầu thay đổi mới, kiểm tra lại phần mềm, sửa lỗi nhanh là phần quan trọng của kiểm thử hồi quy. Kiểm thử hồi quy mất rất nhiều thời gian cùng tài nguyên bị bó buộc và thường xuyên lặp đi lặp lại. Kiểm thử hồi quy thời gian thực bị hạn chế lớn về thời gian vì môi trường mô phỏng của chúng rất khắt khe và lưu trữ nhiều dự án. Kiểm thử lại toàn bộ, Chọn kiểm thử hồi quy (Regression Test Selection - RTS), Giảm thiểu bộ test (Test Suite Minimization - TSM) và Ưu tiên trường hợp kiểm thử (Test Case Prioritization - TCP) là các kỹ thuật kiểm thử hồi quy chiếm ưu thế.

Mỗi một trong các phương pháp này đều có những ưu điểm và nhược điểm riêng. Chiến lược Kiểm thử lại toàn bộ tốt khi bộ kiểm thử nhỏ. Tuy nhiên, khi bộ kiểm thử tăng quy mô, cần thiết có một cơ chế để sắp xếp chúng. Trong nghiên cứu đề cập từ [9] có trình bày về một số công nghệ chọn kiểm thử hồi quy.

Kỹ thuật chọn kiểm thử hồi quy an toàn chọn từng trường hợp kiểm thử tìm ra ít nhất một lỗi nhưng vẫn không đảm bảo lựa chọn thực sự an toàn vì các tiêu chí lấy sự an toàn là then chốt không phải lúc nào cũng được thực hiện [24]. Kỹ thuật lựa chọn trường hợp kiểm thử 15 không an toàn loại bỏ một số trường hợp kiểm thử, [25] đã chỉ ra rằng Giảm thiểu bộ kiểm thử (TSM) cho thấy mức giảm rất nhỏ (2% -7%) trong tỷ lệ phát hiện lỗi. Ưu tiên trường hợp kiểm thử (TCP) khắc phục những nhược điểm của cơ chế chọn hoặc giảm bằng cách không loại bỏ các trường hợp kiểm thử. Theo TCP, các trường hợp kiểm thử có mức độ ưu tiên cao hơn sẽ được thực hiện sớm hơn trong khi tiến hành kiểm thử.

Nếu được thực thi, TCP sẽ tiết kiệm thời gian và chi phí và sẽ không trở thành chi phí. Ưu tiên trường hợp kiểm thử có thể có hai loại – ưu tiên trường hợp kiểm thử chung và ưu tiên trường hợp kiểm thử cụ thể theo phiên bản. Trong ưu tiên trường hợp kiểm thử chung, sắp xếp thứ tự ưu tiên hữu ích đối với các phiên bản sửa đổi liên tiếp của một chương trình. Tuy nhiên, đối với ưu tiên trường hợp kiểm thử cụ thể, sắp xếp thứ tự chỉ có lợi cho một phiên bản cụ thể.

Juristo [26] gọi Ưu tiên trường hợp kiểm thử là một cải tiến trong kiểm thử vì nó có thể được liên kết với bất kỳ công nghệ nào khác để tăng tỷ lệ phát hiện lỗi. Trong Ưu tiên trường hợp kiểm thử, các trường hợp kiểm thử được sắp xếp dựa trên một số tiêu chí. Mục tiêu của ưu tiên trường hợp kiểm thử có thể đa dạng. Nó giống như tăng tỷ lệ phát hiện lỗi hoặc tăng việc nắm bắt các yêu cầu ưu tiên cao hoặc giảm chi phí và thời gian của cơ chế ưu tiên.

Nội dung được bảo vệ bản quyền — Tải xuống đầy đủ

Tài liệu có tiêu đề "Ứng Dụng Học Máy Trong Kiểm Thử Phần Mềm: Nghiên Cứu và Phát Triển" khám phá cách mà công nghệ học máy có thể cải thiện quy trình kiểm thử phần mềm. Tài liệu này nêu bật những lợi ích của việc áp dụng học máy, bao gồm khả năng tự động hóa các tác vụ kiểm thử, phát hiện lỗi nhanh chóng và nâng cao chất lượng sản phẩm phần mềm. Độc giả sẽ tìm thấy những nghiên cứu và phát triển mới nhất trong lĩnh vực này, giúp họ hiểu rõ hơn về cách mà học máy có thể được tích hợp vào quy trình kiểm thử hiện tại.

Để mở rộng kiến thức của bạn về các chủ đề liên quan, bạn có thể tham khảo tài liệu Luận văn automated localization and repair for variability faults in software product lines, nơi trình bày về việc tự động hóa sửa lỗi trong các dòng sản phẩm phần mềm. Ngoài ra, tài liệu Lautomatisation du processus dintegration de codes des tests et du deploiement pour une architecture en microservices tự động hóa quy trình tích hợp lập mã kiểm thử và t sẽ cung cấp cái nhìn sâu sắc về quy trình tích hợp và triển khai trong kiến trúc microservices. Những tài liệu này sẽ giúp bạn có cái nhìn toàn diện hơn về ứng dụng của học máy trong kiểm thử phần mềm và các quy trình liên quan.

#công nghệ học máy

#phân tích dữ liệu kiểm thử

#học máy trong kiểm thử phần mềm

#ứng dụng AI trong kiểm thử

#tự động hóa kiểm thử phần mềm

#học sâu trong kiểm thử

Chủ đề

Tự động hóa trong phát triển phần mềm

tương lai của kiểm thử phần mềm

công nghệ học máy và phần mềm

nghiên cứu ứng dụng AI trong kiểm thử