Nghiên cứu ứng dụng mô hình ngôn ngữ lớn trong gỡ lỗi phần mềm

Chuyên ngành

Computer Science

Người đăng

Ẩn danh

Thể loại

master’s thesis

2024

85
1
0

Phí lưu trữ

30.000 VNĐ

Tóm tắt

I. Giới thiệu tổng quan

Trong những năm gần đây, mô hình ngôn ngữ lớn (LLMs) đã thu hút sự chú ý đáng kể từ cộng đồng nghiên cứu AI và công chúng. Những mô hình này có khả năng giải quyết nhiều nhiệm vụ ngôn ngữ phức tạp nhờ vào sự gia tăng số lượng tham số, khối lượng dữ liệu đào tạo và cấu hình đào tạo tinh vi. Các LLM nổi bật như LaMDA và GPT-4 cho thấy khả năng vượt trội trong nhiều ứng dụng từ dịch thuật đến tạo mã. Việc áp dụng AI trong lập trình, đặc biệt là trong gỡ lỗi phần mềm, đã mở ra những khả năng mới cho việc tự động hóa quy trình phát triển phần mềm. Tuy nhiên, các LLM vẫn gặp phải một số vấn đề như độ chính xác và độ tin cậy, điều này dẫn đến việc cần có các công cụ hỗ trợ để cải thiện hiệu suất của chúng trong các tác vụ cụ thể.

II. Mô hình tự sửa lỗi LLMs trong phát triển phần mềm

Mô hình tự sửa lỗi LLMs có thể được sử dụng trong quy trình gỡ lỗi phần mềm thông qua một chu trình gồm ba bước: Tạo ra mã, Giải thích mã và Phản hồi. Bước đầu tiên là việc mô hình dự đoán các chương trình ứng viên dựa trên mô tả vấn đề. Tiếp theo, trong bước giải thích, mô hình cần trình bày các dự đoán một cách có nghĩa, có thể là bằng ngôn ngữ tự nhiên hoặc tạo ra một bản truy vết thực thi cho mã đã dự đoán. Cuối cùng, bước phản hồi sẽ đánh giá tính chính xác của mã dự đoán. Việc sử dụng phản hồi từ các bài kiểm tra đơn vị có thể cải thiện hiệu quả của quá trình gỡ lỗi, cho thấy rằng việc xem xét các lỗi thực thi và kết quả của các bài kiểm tra thất bại có thể giúp lập trình viên cải thiện khả năng gỡ lỗi của họ.

III. Phương pháp nghiên cứu và khung phát triển mã

Luận văn giới thiệu mô hình CoT-SelfEvolve, kết hợp giữa kỹ thuật gợi ý Chuỗi Tư Duy (CoT) và khung phát triển mã, nhằm đánh giá hiệu quả của các LLM tự sửa lỗi trong việc hỗ trợ các nhà khoa học dữ liệu giải quyết lỗi phần mềm. Mô hình này được kiểm tra so với nhiều tiêu chuẩn và phương pháp đã công bố khác, cho thấy hiệu suất vượt trội trong các tác vụ liên quan đến Python như Pytorch, Sklearn và Pandas. Tuy nhiên, một số lĩnh vực cần cải thiện cũng được xác định, như hiệu suất kém với các câu hỏi Scipy. Nghiên cứu này không chỉ cung cấp một cái nhìn sâu sắc về cách các mô hình LLM có thể được áp dụng trong thực tiễn mà còn mở ra hướng nghiên cứu cho các ứng dụng tương lai.

IV. Đánh giá và kết luận

Nghiên cứu kết luận rằng mô hình CoT-SelfEvolve là một bước tiến hứa hẹn trong việc gỡ lỗi tự động hiệu quả và hiệu suất hơn. Việc tích hợp các phương pháp mới trong gỡ lỗi phần mềm không chỉ giúp cải thiện độ chính xác mà còn giảm thiểu thời gian cần thiết để phát hiện và sửa chữa lỗi. Điều này có thể có ý nghĩa lớn trong việc tối ưu hóa quy trình phát triển phần mềm, đồng thời mở ra cơ hội cho việc phát triển các công cụ hỗ trợ lập trình thông minh hơn trong tương lai. Các kết quả từ nghiên cứu này có thể được áp dụng rộng rãi trong ngành công nghiệp công nghệ thông tin, giúp nâng cao năng suất và chất lượng sản phẩm phần mềm.

05/01/2025
Luận văn thạc sĩ khoa học máy tính application of large language models in software error debugging
Bạn đang xem trước tài liệu : Luận văn thạc sĩ khoa học máy tính application of large language models in software error debugging

để xem tài liệu hoàn chỉnh bạn click vào nút

Tải xuống

Bài luận văn thạc sĩ mang tiêu đề "Nghiên cứu ứng dụng mô hình ngôn ngữ lớn trong gỡ lỗi phần mềm" của tác giả Tăng Quốc Thái, dưới sự hướng dẫn của PGS. Huỳnh Tường Nguyên và PGS. Quản Thành Thơ, tại Trường Đại Học Bách Khoa TP. Hồ Chí Minh, năm 2024, khám phá cách mà các mô hình ngôn ngữ lớn có thể được ứng dụng hiệu quả trong quá trình gỡ lỗi phần mềm. Bài nghiên cứu này không chỉ chỉ ra những thách thức trong việc gỡ lỗi mà còn đề xuất các giải pháp cụ thể, giúp cải thiện độ chính xác và hiệu suất của các công cụ gỡ lỗi hiện tại. Độc giả sẽ tìm thấy nhiều thông tin hữu ích về cách mà công nghệ ngôn ngữ có thể hỗ trợ trong lĩnh vực phát triển phần mềm.

Nếu bạn quan tâm đến các ứng dụng khác của mô hình ngôn ngữ lớn trong khoa học máy tính, hãy tham khảo bài viết "Hệ thống hỏi đáp hỗ trợ học vụ sử dụng mô hình ngôn ngữ lớn", nơi mô hình ngôn ngữ cũng được áp dụng để cải thiện hệ thống giáo dục.

Ngoài ra, bài viết "Giải pháp phân tích danh tính thiết bị từ dữ liệu web" sẽ cung cấp thêm góc nhìn về việc sử dụng mô hình ngôn ngữ trong phân tích dữ liệu, một lĩnh vực liên quan mật thiết đến công nghệ thông tin.

Cuối cùng, bài viết "Nhận dạng giọng nói tiếng Việt qua học sâu và mô hình ngôn ngữ" cũng rất đáng để tìm hiểu, vì nó thể hiện sự phát triển của công nghệ ngôn ngữ trong việc nhận diện và xử lý ngôn ngữ tự nhiên, một khía cạnh quan trọng trong nghiên cứu và ứng dụng mô hình ngôn ngữ lớn.

Những tài liệu này sẽ giúp bạn mở rộng kiến thức và cái nhìn sâu sắc hơn về ứng dụng của mô hình ngôn ngữ lớn trong nhiều lĩnh vực khác nhau.

Tải xuống (85 Trang - 3.31 MB )