Phương Pháp Phân Hoạch Dữ Liệu Kiểm Thử Dựa Trên Tính Hợp Lệ Trong Nghiên Cứu Thạc Sĩ

Trường đại học

Đại học Quy Nhơn

Chuyên ngành

Khoa học máy tính

Người đăng

Ẩn danh

Thể loại

luận văn thạc sĩ

2020

Phí lưu trữ

30 Point

Mục lục chi tiết

LỜI CẢM ƠN

LỜI CAM ĐOAN

MỤC LỤC

PHẦN MỞ ĐẦU

1. CHƯƠNG 1: TỔNG QUAN

1.1. GIỚI THIỆU CHUNG VỀ KIỂM THỬ ROBUSTNESS

1.2. Khái niệm kiểm thử phần mềm

1.3. Kiểm thử robustness

1.4. Dữ liệu thử trong kiểm thử robustness

1.5. Một số nghiên cứu liên quan

1.6. Các phƣơng pháp kiểm thử

1.6.1. Kiểm thử tĩnh

1.6.2. Kiểm thử động

1.7. Các chiến lƣợc kiểm thử

1.7.1. Kiểm thử hộp đen

1.7.2. Kiểm thử hộp trắng

1.7.3. Kiểm thử hộp xám

1.8. Các cấp độ kiểm thử phần mềm

1.8.1. Kiểm thử đơn vị

1.8.2. Kiểm thử tích hợp

1.9. Kết luận chương 1

2. CHƯƠNG 2: TÌM BIÊN PHÂN HOẠCH DỮ LIỆU KIỂM THỬ

2.1. Biên phân hoạch dữ liệu thử theo tính hợp lệ

2.2. Kiểm thử đột biến

2.3. Xác định độ đo khoảng cách và cách ứng dụng

2.4. Phƣơng pháp tìm biên phân hoạch

2.4.1. Xác định tập dữ liệu hợp lệ gần biên phân hoạch

2.4.2. Xác định tập dữ liệu hợp lệ và không hợp lệ

2.5. Kết luận chương 2

2.6. Cài đặt thực nghiệm

2.7. Kết quả thực nghiệm

TÀI LIỆU THAM KHẢO

Tóm tắt

I. Phân Hoạch Dữ Liệu Kiểm Thử

Phân hoach dữ liệu kiểm thử là một phương pháp quan trọng trong kiểm thử phần mềm, nhằm xác định các vùng dữ liệu hợp lệ và không hợp lệ. Phương pháp này giúp tối ưu hóa quá trình kiểm thử bằng cách tập trung vào các trường hợp có khả năng phát sinh lỗi cao. Theo Ammann và Offutt, vùng biên thường là nơi xảy ra lỗi, do đó việc xác định biên phân hoạch giữa dữ liệu hợp lệ và không hợp lệ là rất cần thiết. Việc áp dụng phương pháp này không chỉ giúp phát hiện lỗi mà còn nâng cao chất lượng phần mềm. Đặc biệt, trong bối cảnh hiện nay, khi mà các hệ thống phần mềm ngày càng phức tạp, việc phân tích và đánh giá tính hợp lệ của dữ liệu thử nghiệm trở nên cấp thiết hơn bao giờ hết.

1.1. Đánh Giá Tính Hợp Lệ

Đánh giá tính hợp lệ của dữ liệu kiểm thử là một bước quan trọng trong quy trình kiểm thử phần mềm. Việc xác định các giá trị hợp lệ và không hợp lệ giúp kiểm thử viên có cái nhìn rõ ràng hơn về các trường hợp có thể xảy ra trong thực tế. Các phương pháp như kiểm thử biên và phân lớp tương đương thường được sử dụng để xác định các giá trị này. Theo nghiên cứu, việc sử dụng các phương pháp này không chỉ giúp phát hiện lỗi mà còn giảm thiểu thời gian và chi phí trong quá trình kiểm thử. Điều này cho thấy tầm quan trọng của việc đánh giá tính hợp lệ trong việc nâng cao chất lượng phần mềm.

II. Quy Trình Phân Hoạch Dữ Liệu

Quy trình phân hoach dữ liệu kiểm thử bao gồm nhiều bước, từ việc xác định các vùng dữ liệu đến việc thực hiện kiểm thử. Đầu tiên, cần xác định các tập dữ liệu hợp lệ và không hợp lệ. Sau đó, kiểm thử viên sẽ tiến hành kiểm thử với các dữ liệu này để đánh giá khả năng hoạt động của hệ thống. Việc sử dụng các công cụ hỗ trợ như Fuzz testing có thể giúp tự động hóa quá trình này, từ đó nâng cao hiệu quả kiểm thử. Ngoài ra, việc phân tích kết quả kiểm thử cũng rất quan trọng, giúp xác định các lỗi và cải thiện quy trình phát triển phần mềm.

2.1. Phương Pháp Kiểm Thử

Các phương pháp kiểm thử như kiểm thử tĩnh và kiểm thử động đều có vai trò quan trọng trong quy trình phân hoach dữ liệu. Kiểm thử tĩnh giúp phát hiện lỗi trong mã nguồn mà không cần chạy chương trình, trong khi kiểm thử động cho phép kiểm tra hành vi của phần mềm trong thời gian thực. Việc kết hợp cả hai phương pháp này sẽ giúp tối ưu hóa quy trình kiểm thử, từ đó nâng cao chất lượng sản phẩm. Đặc biệt, kiểm thử hộp đen và hộp trắng cũng là những phương pháp quan trọng, giúp kiểm tra tính hợp lệ của dữ liệu đầu vào và đầu ra.

III. Ứng Dụng Thực Tiễn

Phương pháp phân hoach dữ liệu kiểm thử theo tính hợp lệ có nhiều ứng dụng thực tiễn trong ngành công nghiệp phần mềm. Việc áp dụng phương pháp này không chỉ giúp phát hiện lỗi mà còn cải thiện quy trình phát triển phần mềm. Các công ty phần mềm có thể sử dụng phương pháp này để tối ưu hóa quy trình kiểm thử, từ đó giảm thiểu thời gian và chi phí. Hơn nữa, việc nâng cao chất lượng phần mềm sẽ giúp tăng cường sự hài lòng của khách hàng và nâng cao uy tín của công ty trên thị trường.

3.1. Tác Động Đến Chất Lượng Phần Mềm

Việc áp dụng phương pháp phân hoach dữ liệu kiểm thử theo tính hợp lệ có tác động tích cực đến chất lượng phần mềm. Các nghiên cứu cho thấy rằng, khi sử dụng phương pháp này, tỷ lệ phát hiện lỗi tăng lên đáng kể, từ đó giúp cải thiện độ tin cậy của phần mềm. Điều này không chỉ giúp giảm thiểu rủi ro trong quá trình phát triển mà còn nâng cao sự hài lòng của người dùng. Hơn nữa, việc cải thiện chất lượng phần mềm cũng đồng nghĩa với việc giảm thiểu chi phí bảo trì và nâng cấp trong tương lai.

23/02/2025

Bạn đang xem trước tài liệu:

Luận văn thạc sĩ phương pháp phân hoạch dữ liệu kiểm thử theo tính hợp lệ

Tải đầy đủ

Nội dung chính

Tổng quan nghiên cứu

Kiểm thử phần mềm đóng vai trò then chốt trong việc đảm bảo chất lượng và độ tin cậy của các hệ thống công nghệ thông tin hiện đại. Trong đó, kiểm thử robustness là một lĩnh vực quan trọng nhằm đánh giá khả năng phần mềm hoạt động ổn định khi gặp các dữ liệu đầu vào không hợp lệ hoặc điều kiện bất thường. Theo báo cáo của ngành, khoảng 40-45% các chương trình trên các hệ điều hành phổ biến như Unix và Windows NT gặp lỗi hoặc treo khi xử lý dữ liệu đầu vào ngẫu nhiên không hợp lệ. Điều này cho thấy nhu cầu cấp thiết trong việc phát triển các phương pháp kiểm thử hiệu quả, đặc biệt là xác định biên phân hoạch dữ liệu kiểm thử đầu vào hợp lệ và không hợp lệ.

Luận văn tập trung nghiên cứu đề tài “Phương pháp phân hoạch dữ liệu kiểm thử theo tính hợp lệ” nhằm xây dựng và minh chứng một phương pháp xác định biên phân hoạch giữa dữ liệu hợp lệ và không hợp lệ trong không gian dữ liệu đầu vào. Phạm vi nghiên cứu được giới hạn trong khoảng thời gian thực hiện luận văn và áp dụng trên dữ liệu đầu vào là bộ ba số nguyên dương đại diện cho độ dài ba cạnh của một tam giác, với giá trị nằm trong đoạn [1, 20]. Mục tiêu cụ thể là phát triển phương pháp sinh dữ liệu thử nghiệm hợp lệ gần biên phân hoạch, áp dụng kỹ thuật đột biến để tạo dữ liệu không hợp lệ, từ đó xác định rõ ràng vùng biên phân hoạch.

Nghiên cứu có ý nghĩa quan trọng trong việc nâng cao hiệu quả kiểm thử robustness, giúp tiết kiệm thời gian và chi phí thiết kế bài kiểm thử, đồng thời tăng khả năng phát hiện lỗi phần mềm ở vùng biên – nơi thường xảy ra lỗi nhất. Kết quả nghiên cứu cũng mở ra hướng phát triển các kỹ thuật kiểm thử dữ liệu đầu vào phức tạp hơn trong tương lai.

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Luận văn dựa trên các lý thuyết và mô hình kiểm thử phần mềm, đặc biệt tập trung vào kiểm thử robustness và phân hoạch dữ liệu kiểm thử theo tính hợp lệ. Hai lý thuyết chính được áp dụng gồm:

Lý thuyết kiểm thử robustness: Đánh giá khả năng phần mềm chịu đựng và phản ứng đúng đắn với dữ liệu đầu vào không hợp lệ hoặc điều kiện bất thường. Các lỗi robustness được phân loại theo tiêu chí CRASH gồm: Catastrophic, Restart, Abort, Silent, và Hindering.
Lý thuyết biên phân hoạch dữ liệu kiểm thử: Xác định vùng biên giữa miền dữ liệu hợp lệ và không hợp lệ trong không gian dữ liệu đầu vào. Phương pháp kiểm thử giá trị biên tập trung vào các giá trị biên như tối thiểu, tối đa, và các giá trị gần biên để thiết kế bài kiểm thử hiệu quả.

Các khái niệm chuyên ngành quan trọng bao gồm: kiểm thử hộp đen, kiểm thử hộp trắng, kiểm thử đột biến (mutation testing), metric khoảng cách (distance metric) trong không gian dữ liệu, và kỹ thuật sinh dữ liệu thử nghiệm tự động.

Phương pháp nghiên cứu

Nguồn dữ liệu nghiên cứu là các bộ dữ liệu kiểm thử đầu vào được sinh tự động trong không gian ba chiều, mỗi chiều là một số nguyên dương đại diện cho độ dài cạnh tam giác, giới hạn trong đoạn [1, 20]. Cỡ mẫu được xác định bằng cách duyệt toàn bộ tổ hợp các giá trị trong phạm vi này, tạo ra khoảng 8.000 bộ dữ liệu thử nghiệm.

Phương pháp phân tích gồm hai bước chính:

Xác định tập dữ liệu hợp lệ gần biên phân hoạch (Tset): Sử dụng hàm khoảng cách tổng các độ lệch bình phương để lựa chọn các mẫu dữ liệu hợp lệ trải rộng và gần biên phân hoạch nhất. Hàm này được cực đại hóa nhằm đảm bảo các mẫu được chọn có khoảng cách lớn nhất với các mẫu đã có, giúp bao phủ không gian dữ liệu hợp lệ hiệu quả.
Tạo dữ liệu không hợp lệ bằng kỹ thuật đột biến: Áp dụng bốn kỹ thuật đột biến (IncreaseInt, DecreaseInt, IncreaseInKeepingSize, DecreaseInKeepingSize) trên các mẫu trong Tset để tạo ra các dữ liệu không hợp lệ gần biên phân hoạch. Quá trình đột biến được lặp lại cho đến khi thuộc tính hợp lệ/không hợp lệ của dữ liệu thay đổi, từ đó xác định rõ ràng biên phân hoạch giữa hai miền.

Timeline nghiên cứu bao gồm giai đoạn tổng quan lý thuyết, thiết kế phương pháp, cài đặt chương trình thử nghiệm trên ngôn ngữ C++ với môi trường Visual Studio 2015, thực hiện thử nghiệm với tham số MIN=1, MAX=20, và phân tích kết quả.

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

Tập dữ liệu hợp lệ gần biên phân hoạch (Tset) được xác định hiệu quả: Qua việc sử dụng hàm khoảng cách tổng các độ lệch bình phương, tập Tset gồm các bộ ba số nguyên dương đại diện cho các tam giác hợp lệ được chọn trải rộng trên ranh giới không gian dữ liệu đầu vào. Ví dụ, trong khoảng giá trị [1, 20], tập Tset bao gồm hàng trăm mẫu dữ liệu hợp lệ gần biên phân hoạch, giúp bao phủ vùng ranh giới một cách toàn diện.
Kỹ thuật đột biến tạo ra dữ liệu không hợp lệ gần biên phân hoạch: Áp dụng bốn kỹ thuật đột biến trên tập Tset đã tạo ra các bộ dữ liệu không hợp lệ nằm sát vùng biên phân hoạch. Tỷ lệ thành công trong việc tạo dữ liệu không hợp lệ từ dữ liệu hợp lệ gần biên đạt khoảng 85%, cho thấy phương pháp đột biến phù hợp và hiệu quả.
Biên phân hoạch dữ liệu kiểm thử được xác định rõ ràng: Kết quả thử nghiệm cho thấy hai tập dữ liệu kiểm thử hợp lệ và không hợp lệ được phân tách rõ ràng trong không gian ba chiều, minh họa bằng các biểu đồ phân bố dữ liệu. Khoảng cách trung bình giữa các cặp dữ liệu hợp lệ và không hợp lệ gần biên phân hoạch là khoảng 1.2 đơn vị, cho thấy biên phân hoạch có tính chính xác cao.
Phương pháp tiết kiệm thời gian và chi phí kiểm thử: So với việc sinh dữ liệu thử nghiệm ngẫu nhiên, phương pháp phân hoạch và đột biến giúp giảm khoảng 30% số lượng dữ liệu cần kiểm thử mà vẫn đảm bảo bao phủ vùng biên – nơi dễ phát sinh lỗi nhất.

Thảo luận kết quả

Nguyên nhân thành công của phương pháp là do việc kết hợp sinh dữ liệu thử nghiệm tự động với hàm khoảng cách metric giúp lựa chọn các mẫu dữ liệu hợp lệ gần biên phân hoạch một cách tối ưu. Kỹ thuật đột biến dữ liệu cho phép tạo ra các trường hợp không hợp lệ có tính bao phủ cao, giúp phát hiện lỗi phần mềm hiệu quả hơn so với phương pháp sinh dữ liệu ngẫu nhiên truyền thống.

So sánh với các nghiên cứu trước đây, phương pháp này vượt trội ở khả năng xác định biên phân hoạch rõ ràng và có hệ thống, thay vì chỉ dựa vào sinh dữ liệu ngẫu nhiên hoặc đột biến đơn thuần. Kết quả cũng phù hợp với quan điểm của Ammann và Offutt về tầm quan trọng của vùng biên trong kiểm thử robustness.

Ý nghĩa của nghiên cứu là cung cấp một công cụ và phương pháp luận có thể áp dụng rộng rãi trong kiểm thử phần mềm, đặc biệt trong các hệ thống yêu cầu độ tin cậy cao như tài chính, y tế, và hệ thống nhúng. Dữ liệu và kết quả có thể được trình bày qua biểu đồ phân bố 3D của các bộ dữ liệu hợp lệ và không hợp lệ, bảng thống kê tỷ lệ thành công của các kỹ thuật đột biến, và đồ thị khoảng cách giữa các mẫu dữ liệu.

Đề xuất và khuyến nghị

Triển khai phương pháp phân hoạch dữ liệu kiểm thử trong quy trình kiểm thử phần mềm: Các tổ chức phát triển phần mềm nên áp dụng phương pháp xác định biên phân hoạch để thiết kế các bộ dữ liệu kiểm thử tập trung vào vùng biên, nhằm tăng hiệu quả phát hiện lỗi. Thời gian thực hiện có thể bắt đầu ngay trong giai đoạn kiểm thử đơn vị và tích hợp.
Phát triển công cụ tự động hóa sinh dữ liệu kiểm thử và đột biến: Đề xuất xây dựng phần mềm hỗ trợ tự động sinh dữ liệu hợp lệ gần biên phân hoạch và thực hiện đột biến để tạo dữ liệu không hợp lệ, giúp giảm thiểu công sức thủ công và tăng tính chính xác. Chủ thể thực hiện là các nhóm phát triển công cụ kiểm thử, với timeline 6-12 tháng.
Mở rộng nghiên cứu áp dụng cho các loại dữ liệu đầu vào phức tạp hơn: Nghiên cứu nên được tiếp tục với các dữ liệu đa chiều, dữ liệu phi số, hoặc dữ liệu có cấu trúc phức tạp nhằm nâng cao tính ứng dụng của phương pháp. Thời gian nghiên cứu dự kiến 1-2 năm, phù hợp với các đề tài thạc sĩ hoặc tiến sĩ.
Đào tạo và nâng cao nhận thức về kiểm thử robustness và phân hoạch dữ liệu: Các trường đại học và tổ chức đào tạo nên đưa nội dung này vào chương trình giảng dạy và khóa học chuyên sâu về kiểm thử phần mềm, giúp sinh viên và kỹ sư phần mềm nắm vững kiến thức và kỹ năng thực tiễn.

Đối tượng nên tham khảo luận văn

Kỹ sư kiểm thử phần mềm (Test Engineers): Giúp họ hiểu rõ hơn về phương pháp thiết kế dữ liệu kiểm thử tập trung vào vùng biên, nâng cao khả năng phát hiện lỗi robustness trong phần mềm.
Nhà phát triển phần mềm (Software Developers): Hỗ trợ trong việc xây dựng mã nguồn có khả năng xử lý tốt các trường hợp dữ liệu đầu vào không hợp lệ, từ đó giảm thiểu lỗi phát sinh trong quá trình phát triển.
Giảng viên và nghiên cứu sinh ngành Khoa học máy tính: Cung cấp tài liệu tham khảo về phương pháp kiểm thử mới, hỗ trợ nghiên cứu và giảng dạy chuyên sâu về kiểm thử phần mềm và kiểm thử robustness.
Quản lý dự án phần mềm (Project Managers): Giúp họ hiểu tầm quan trọng của kiểm thử robustness và phân hoạch dữ liệu kiểm thử, từ đó lập kế hoạch kiểm thử hiệu quả, tiết kiệm chi phí và thời gian.

Câu hỏi thường gặp

Phương pháp phân hoạch dữ liệu kiểm thử theo tính hợp lệ là gì?
Phương pháp này xác định vùng biên giữa dữ liệu đầu vào hợp lệ và không hợp lệ trong không gian dữ liệu kiểm thử, giúp tập trung kiểm thử vào các giá trị biên dễ phát sinh lỗi. Ví dụ, trong kiểm thử tam giác, biên phân hoạch là các bộ ba cạnh gần ranh giới thỏa mãn hoặc không thỏa mãn bất đẳng thức tam giác.
Tại sao cần sử dụng kỹ thuật đột biến trong kiểm thử robustness?
Kỹ thuật đột biến tạo ra các biến thể dữ liệu đầu vào từ dữ liệu hợp lệ nhằm kiểm tra khả năng phần mềm xử lý các trường hợp không hợp lệ hoặc bất thường. Điều này giúp phát hiện lỗi tiềm ẩn mà dữ liệu ngẫu nhiên có thể bỏ sót.
Khoảng cách metric được sử dụng như thế nào trong nghiên cứu?
Khoảng cách metric đo sự khác biệt giữa các mẫu dữ liệu trong không gian đa chiều, giúp lựa chọn các mẫu dữ liệu hợp lệ trải rộng và gần biên phân hoạch. Ví dụ, tổng các độ lệch bình phương được dùng để tính khoảng cách giữa hai bộ ba số nguyên đại diện cho tam giác.
Phương pháp này có thể áp dụng cho các loại dữ liệu khác không?
Có thể, tuy nhiên cần điều chỉnh kỹ thuật sinh dữ liệu và đột biến phù hợp với đặc điểm dữ liệu mới. Nghiên cứu mở rộng có thể áp dụng cho dữ liệu phi số, dữ liệu có cấu trúc phức tạp hoặc dữ liệu đa chiều.
Lợi ích thực tiễn của phương pháp này trong phát triển phần mềm là gì?
Phương pháp giúp tiết kiệm thời gian và chi phí kiểm thử bằng cách tập trung vào vùng biên dễ phát sinh lỗi, nâng cao chất lượng phần mềm, giảm thiểu lỗi khi phần mềm được triển khai thực tế, đặc biệt quan trọng trong các hệ thống yêu cầu độ tin cậy cao.

Kết luận

Luận văn đã hệ thống hóa và phát triển phương pháp xác định biên phân hoạch dữ liệu kiểm thử đầu vào hợp lệ và không hợp lệ, góp phần nâng cao hiệu quả kiểm thử robustness.
Phương pháp kết hợp sinh dữ liệu tự động, hàm khoảng cách metric và kỹ thuật đột biến để tạo ra các bộ dữ liệu kiểm thử có tính bao phủ cao vùng biên phân hoạch.
Thử nghiệm trên dữ liệu ba số nguyên dương đại diện cho độ dài ba cạnh tam giác với khoảng giá trị [1, 20] đã minh chứng tính khả thi và hiệu quả của phương pháp.
Kết quả nghiên cứu có ý nghĩa thực tiễn trong việc thiết kế bài kiểm thử phần mềm, giúp phát hiện lỗi phần mềm hiệu quả hơn và tiết kiệm chi phí kiểm thử.
Hướng nghiên cứu tiếp theo là mở rộng áp dụng cho các loại dữ liệu phức tạp hơn và phát triển công cụ tự động hóa hỗ trợ kiểm thử.

Để nâng cao chất lượng phần mềm và đảm bảo tính ổn định trong môi trường thực tế, các nhà phát triển và kiểm thử phần mềm nên áp dụng phương pháp phân hoạch dữ liệu kiểm thử theo tính hợp lệ. Hãy bắt đầu triển khai ngay hôm nay để tối ưu hóa quy trình kiểm thử và nâng cao độ tin cậy sản phẩm!

Phương Pháp Phân Hoạch Dữ Liệu Kiểm Thử Theo Tính Hợp Lệ Trong Luận Văn Thạc Sĩ là một tài liệu chuyên sâu tập trung vào việc phân chia dữ liệu kiểm thử dựa trên tính hợp lệ, giúp tối ưu hóa quá trình kiểm tra chất lượng phần mềm. Tài liệu này cung cấp các phương pháp khoa học và chiến lược hiệu quả để đảm bảo dữ liệu kiểm thử được tổ chức một cách hợp lý, từ đó nâng cao độ chính xác và hiệu suất của quy trình kiểm thử. Đây là nguồn tài nguyên quý giá cho các nhà nghiên cứu và chuyên gia trong lĩnh vực công nghệ thông tin, đặc biệt là những người đang thực hiện luận văn thạc sĩ liên quan đến kiểm thử phần mềm.

Để mở rộng kiến thức về các phương pháp nghiên cứu và ứng dụng thực tiễn, bạn có thể tham khảo thêm Luận văn thạc sĩ xây dựng thuật toán trích xuất số phách trên phiếu trả lời trắc nghiệm của trường đại học phan thiết, một nghiên cứu sâu về thuật toán và ứng dụng công nghệ. Ngoài ra, Luận văn đề xuất các giải pháp nhằm nâng cao hiệu quả áp dụng cung cấp những giải pháp thiết thực để cải thiện hiệu quả trong nghiên cứu. Cuối cùng, 2 tóm tắt luận án tiến sĩ tiếng việt ncs nguyễn khắc tấn là tài liệu tham khảo hữu ích cho những ai quan tâm đến các phương pháp nghiên cứu khoa học chuyên sâu.

#Luận văn Thạc sĩ

#nghiên cứu khoa học

#kiểm thử phần mềm

#phương pháp kiểm thử

#dữ liệu kiểm thử

#phân hoạch dữ liệu

Chủ đề

nghiên cứu khoa học

Kiểm thử phần mềm

Luận văn thạc sĩ