Phương Pháp Tự Động Sửa Lỗi Cho Các Chương Trình Java

Khám phá phương pháp tự động sửa lỗi cho chương trình Java trong luận văn thạc sĩ, nâng cao hiệu quả lập trình và giảm thiểu sai sót.

Chuyên ngành

Khoa học máy tính

Người đăng

Ẩn danh

Thể loại

Luận văn thạc sĩ

2020

78
3
0

Phí lưu trữ

30 Point

Mục lục chi tiết

LỜI CAM ĐOAN

TÓM TẮT

LỜI CẢM ƠN

1. CHƯƠNG 1: GIỚI THIỆU

1.1. Mở đầu

1.2. Đóng góp

1.3. Bố cục luận văn

2. CHƯƠNG 2: KIẾN THỨC NỀN TẢNG

2.1. Kiểm thử hồi quy và lỗi hồi quy

2.2. Sửa lỗi chương trình tự động

3. CHƯƠNG 3: PHƯƠNG PHÁP SỬA TỰ ĐỘNG LỖI HỒI QUY

4. CHƯƠNG 4: CÀI ĐẶT CÔNG CỤ VÀ THỰC NGHIỆM

5. CHƯƠNG 5: KẾT LUẬN

A DANH SÁCH CÁC MẪU SỬA LỖI

TÀI LIỆU THAM KHẢO

Trích đoạn nội dung tài liệu

ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ Bùi Quang Cường PHƯƠNG PHÁP TỰ ĐỘNG SỬA LỖI CHO CÁC CHƯƠNG TRÌNH JAVA LUẬN VĂN THẠC SĨ Ngành: Khoa học máy tính HÀ NỘI - 2020 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ Bùi Quang Cường PHƯƠNG PHÁP TỰ ĐỘNG SỬA LỖI CHO CÁC CHƯƠNG TRÌNH JAVA Ngành: Khoa học máy tính Chuyên ngành: Khoa học máy tính Mã số: 60 48 01 01 LUẬN VĂN THẠC SĨ NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS. Phạm Ngọc Hùng HÀ NỘI - 2020 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com VIETNAM NATIONAL UNIVERSITY, HA NOI UNIVERSITY OF ENGINEERING AND TECHNOLOGY Bui Quang Cuong A METHOD FOR AUTOMATED REPAIR OF ERRORS FOR JAVA PROGRAMS MASTER THESIS OF COMPUTER SCIENCE Major: Computer Science Supervisor: Assoc. Pham Ngoc Hung HANOI - 2020 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com i LỜI CAM ĐOAN Tôi xin cam đoan rằng những nghiên cứu về phương pháp tự động sửa lỗi cho các chương trình Java được trình bày trong luận văn này là của tôi và chưa từng được nộp như một báo cáo luận văn tại trường Đại học Công nghệ - ĐHQGHN hoặc bất kỳ trường đại học khác. Những gì tôi viết ra không sao chép từ các tài liệu, không sử dụng các kết quả của người khác mà không trích dẫn cụ thể. Tôi xin cam đoan công cụ tự động sửa lỗi cho các chương trình Java tôi trình bày trong luận văn là do tôi tự phát triển, không sao chép mã nguồn của người khác. Nếu sai tôi hoàn toàn chịu trách nhiệm theo quy định của trường Đại học Công nghệ - ĐHQGHN. Hà Nội, ngày 15 tháng 08 năm 2020 Học viên cao học Bùi Quang Cường LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com ii TÓM TẮT Các hệ thống phần mềm luôn không ngừng phát triển theo lẽ tự nhiên để đáp ứng nhu cầu thay đổi liên tục từ khách hàng và thị trường. Tuy nhiên, những thay đổi này có thể gây ra các lỗi khiến cho những chức năng đã có của chương trình không hoạt động đúng. Những lỗi như thế này được gọi là lỗi hồi quy. Sửa lỗi tự động (Automated Program Repair - APR) gần đây đã cho thấy được tiềm năng lớn trong việc tự động sửa các lỗi của phần mềm. Mặc dù với sự phát triển mạnh mẽ của APR, chỉ có một số kỹ thuật tập trung xử lý các lỗi hồi quy. Tuy nhiên, các kỹ thuật chưa thực sự khai thác đầy đủ thông tin có sẵn trong lịch sử phát triển của các phần mềm (ví dụ: bản cập nhật gây ra lỗi, v.) để sửa lỗi hồi quy. Hơn nữa, những kỹ thuật này không công bố công cụ cài đặt cho cộng đồng hoặc công cụ rất hạn chế và khó có thể sử dụng để sửa lỗi trong thực tế. Luận văn này nhằm mục đích đề xuất phương pháp sửa lỗi hồi quy cho các chương trình Java bằng cách khai thác và mở rộng những phát hiện gần đây về lỗi hồi quy, ví dụ: mối tương quan giữa các bản cập nhật tạo ra lỗi và sửa lỗi. Luận văn cài đặt lại và cải tiến phương pháp sửa lỗi hồi quy tự động cho các chương trình C (Relifix). Từ đó, xây dựng một hệ thống có tên là LyFix, cho phép người dùng sửa lỗi hồi quy Java tự động bằng cách tận dụng các nguyên liệu sửa lỗi và các mẫu sửa lỗi cụ thể học được từ lịch sử phát triển phần mềm. Tám mẫu sửa lỗi hồi quy, thuật toán sửa lỗi đã được cài đặt lại dựa vào ý tưởng của Relifix. Ngoài ra, luận văn cài đặt thêm ba mẫu sửa lỗi hồi quy mới cho Java. Luận văn cũng thực hiện thực nghiệm để so sánh khả năng sửa lỗi của LyFix đối với jRelifix (bản cài đặt Relifix cho Java) và các công cụ sửa lỗi tự động tốt nhất hiện nay (jGenProg, jMutRepair, TBar) trên tập dữ liệu 51 lỗi hồi quy thực tế của các hệ thống phần mềm Java mã nguồn mở. Kết quả cho thấy LyFix có thể sinh ra bản vá thành công cho 56.8% lỗi có trong tập dữ liệu và tỉ lệ số bản vá chính xác là 79.3% trong khi các công cụ khác sửa lỗi tốt nhất (TBar) với kết quả sinh được bản vá 33.3% lỗi và tỉ lệ bản vá đúng là 41. Từ khóa: tự động sửa lỗi chương trình, lỗi hồi quy, lịch sử phát triển phần mềm LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com iii LỜI CẢM ƠN Đầu tiên và quan trọng nhất, tôi xin gửi lời cảm ơn trân trọng và sâu sắc tới PGS. Phạm Ngọc Hùng - người Thầy giáo đã trực tiếp hướng dẫn tận tình và đóng góp những ý kiến quý báu trong quá trình tôi học tập, nghiên cứu và cả kinh nghiệm cuộc sống từ những năm tháng tôi còn là sinh viên tại trường Đại học Công nghệ cho đến nay. Thầy đã không ngần ngại cho phép và hỗ trợ tôi tự lựa chọn đề tài để thực hiện luận văn này. Tôi xin được gửi lời cảm ơn chân thành tới TS. Bách Lê, TS. Lê Quang Lộc, và PGS. Corina Pasareanu đã hướng dẫn và hỗ trợ tôi rất nhiệt tình trong quá trình thực hiện luận văn này. Các anh và cô luôn động viên tôi và đưa ra những câu trả lời và gợi ý ngay lập tức mỗi khi tôi gặp khó khăn. Các anh và cô cũng chia sẻ rất nhiều kinh nghiệm quý báu trong nghiên cứu và cuộc sống và tôi đã học được nhiều điều từ các anh. Xin được cảm ơn ban tổ chức chương trình Google Summer of Code 2020 và Java PathFinder Team đã cho phép tài trợ kinh phí để tôi thực hiện đề tài trong luận văn này. Công trình này cũng được tài trợ một phần từ đề tài KHCN cấp ĐHQGHN, Mã số đề tài: QG. Cuối cùng, tôi xin được cảm ơn những lời động viên từ gia đình, người thân, bạn bè để giúp tôi luôn vững bước trong con đường tương lai. LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com iv Mục lục 1 Giới thiệu 1 1.3 Bố cục luận văn . 3 2 Kiến thức nền tảng 4 2.1 Kiểm thử hồi quy và lỗi hồi quy .2 Sửa lỗi chương trình tự động .1 Xác định vị trí gây ra lỗi .2 Các phương pháp sửa lỗi tự động hiện nay . 12 3 Phương pháp sửa tự động lỗi hồi quy 16 3.1 Tổng quan phương pháp .2 Xác định bản cập nhật gây ra lỗi .3 Thu thập thông tin mã nguồn thay đổi và nguyên liệu sửa lỗi .4 Các mẫu sửa lỗi .5 Xác định vị trí gây lỗi . 33 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.6 Thuật toán sửa lỗi . 34 4 Cài đặt công cụ và thực nghiệm 40 4.1 Cài đặt công cụ .1 Phương pháp thực nghiệm .2 Kết quả thực nghiệm và thảo luận . 46 5 Kết luận 52 A Danh sách các mẫu sửa lỗi 54 Tài liệu tham khảo 60 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com vi Danh sách hình vẽ 2.1 Các chiến lược kiểm thử hồi quy .2 Các bước tiêu chuẩn trong các kỹ thuật APR hiện nay [27] .3 Số lượng công bố mỗi năm về APR từ 1996 - 2019 .4 Tổng quan về xác định vị trí gây lỗi dựa trên phổ chương trình .5 Tổng quan về các kỹ thuật sửa lỗi [14] .1 Tổng quan phương pháp sửa tự động lỗi hồi quy .2 Các bản cập nhật gây ra lỗi và sửa lỗi của Closure 31 [21] .3 Ví dụ minh họa tính độ đo giữa nguyên liệu sửa lỗi và câu lệnh nghi ngờ lỗi .1 Kiến trúc công cụ sửa lỗi tự động LyFix . 41 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com vii Danh sách bảng 3.1 Nguyên liệu sửa lỗi và mẫu sửa lỗi sử dụng .2 Các mẫu sửa lỗi đã cài đặt .1 Thống kê các chỉ số của bộ dữ liệu lỗi hồi quy .2 Thống kê số lượng các hành động sửa lỗi của bộ dữ liệu lỗi hồi quy .3 Kết quả sửa lỗi trên tập dữ liệu lỗi hồi quy . 47 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com viii Danh sách từ viết tắt và thuật ngữ APR Automated Program Repair - Sửa lỗi chương trình tự động AST Abstract Syntax Tree - Cây cú pháp trừu tượng FL Fault Localization - Xác định vị trí gây lỗi SUT System Under Test - Hệ thống được kiểm thử RTS Regression Test Selection - Lựa chọn ca kiểm thử hồi quy TSM Test Suite Minimization - Giảm thiểu bộ ca kiểm thử TCP Test Case Prioritization - Ưu tiên ca kiểm thử BWTC Bug-witnessing Test Case - Ca kiểm thử phát hiện lỗi BIC Bug-inducing Commit - Bản cập nhật gây lỗi BFC Bug-fixing Commit - Bản cập nhật sửa lỗi RT Repair Templates - Các mẫu sửa lỗi, mỗi mẫu thực hiện một tập các hành động thay đổi mã nguồn để sửa lỗi FI Fix Ingredients - Các nguyên liệu sửa lỗi, là những thành phần mã nguồn có thể sử dụng làm tham số cho các mẫu sửa lỗi LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com 1 Chương 1 Giới thiệu 1.1 Mở đầu Các hệ thống phần mềm phát triển và tiến hóa không ngừng như một lẽ tự nhiên để bắt kịp nhu cầu thay đổi liên tục từ phía khách hàng và thị trường. Quá trình phát triển phần mềm là một quá trình gia tăng, thường mang theo các tính năng mới được cài đặt để đáp ứng các yêu cầu thay đổi của người dùng. Tuy nhiên, những tính năng được thêm mới này có thể làm hỏng các chức năng hiện tại của hệ thống phần mềm và do đó gây ra lỗi mới. Những lỗi này thường được gọi là lỗi hồi quy. Lỗi hồi quy rất phổ biến trong các hệ thống phần mềm hiện nay và vẫn đang là một thách thức lớn trong ngành công nghiệp phát triển phần mềm [35, 11]. Xác định và sửa lỗi hồi quy là một hoạt động bắt buộc trong các vòng lặp bảo trì phần mềm [39]. Những nghiên cứu từ trước đến nay tập trung chủ yếu vào việc hỗ trợ phát hiện và xác định lỗi hồi quy [39, 52, 26, 22]. Trong khi đó, sửa lỗi hồi quy vẫn đang phụ thuộc lớn vào con người để gỡ và sửa lỗi một cách thủ công, khiến công việc này tiêu tốn thời gian và rủi ro. Ví dụ, người ta đã ước tính rằng các lập trình viên cần tới 8,5 năm để sửa một lỗi hồi quy [4]. Sửa lỗi tự động (Automated Program Repair - APR), bao gồm các pha xác định vị trí gây ra lỗi và sửa lỗi mới xuất hiện gần đây để giúp giải quyết vấn đề này. APR tập trung vào việc tự động quá trình gỡ lỗi phần mềm, từ đó giúp giảm bớt hoặc thậm chí loại bỏ sự can thiệp của con người vào quá trình sửa lỗi. Các nghiên cứu LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Chương 1.

Nội dung được bảo vệ bản quyền — Tải xuống đầy đủ