Trường đại học
Đại Học Quốc Gia Tp Hcm Trường Đại Học Công Nghệ Thông TinChuyên ngành
Công Nghệ Thông TinNgười đăng
Ẩn danhThể loại
Luận Văn Thạc Sĩ2023
Phí lưu trữ
30.000 VNĐMục lục chi tiết
Tóm tắt
Việc sử dụng thẻ tín dụng ngày càng phổ biến, mang lại sự tiện lợi cho các giao dịch tài chính. Tuy nhiên, điều này cũng làm gia tăng các hoạt động gian lận. Các doanh nghiệp cần xây dựng hệ thống nhận diện và cảnh báo gian lận, nhằm hạn chế thất thoát tài chính. Nghiên cứu này sử dụng tập dữ liệu giao dịch thẻ tín dụng từ tháng 9 năm 2013 tại Châu Âu, với 284,807 giao dịch, trong đó chỉ có 492 giao dịch là gian lận, thể hiện sự phân bố không cân bằng [5]. Các nghiên cứu trước đây [1-3] chưa đề cập đến việc xử lý mất cân bằng dữ liệu, trong khi nghiên cứu [4] có xử lý bằng SMOTE-ENN nhưng không đề cập đến vấn đề overfitting. Luận văn này tập trung giải quyết những hạn chế này, đồng thời đề xuất phương pháp tiếp cận mới bằng logic mờ.
Trong bối cảnh giao dịch trực tuyến phát triển mạnh mẽ, gian lận thẻ tín dụng gây ra những thiệt hại lớn cho cả người dùng và tổ chức tài chính. Việc xây dựng các hệ thống phát hiện gian lận hiệu quả là vô cùng quan trọng để bảo vệ tài sản và uy tín. Các phương pháp truyền thống thường gặp nhiều hạn chế trong việc đối phó với các hình thức gian lận ngày càng tinh vi. Vì vậy, việc ứng dụng các kỹ thuật hiện đại như học máy và logic mờ là hướng đi đầy tiềm năng.
Luận văn này tập trung vào việc ứng dụng các thuật toán học máy và logic mờ để phát hiện gian lận thẻ tín dụng. Mục tiêu chính là xây dựng một mô hình có khả năng nhận diện các giao dịch gian lận một cách chính xác và hiệu quả, đồng thời giải quyết các vấn đề còn tồn tại trong các nghiên cứu trước đây, đặc biệt là vấn đề mất cân bằng dữ liệu và overfitting. Kết quả nghiên cứu có thể ứng dụng thực tế vào các hệ thống phát hiện gian lận của các tổ chức tài chính.
Trong thời đại số, gian lận thẻ tín dụng ngày càng tinh vi và khó lường. Các phương pháp truyền thống dựa trên luật lệ và quy tắc thường không đủ khả năng để đối phó với các hình thức gian lận mới. Một trong những thách thức lớn nhất là sự mất cân bằng dữ liệu, khi số lượng giao dịch gian lận thường rất nhỏ so với số lượng giao dịch hợp lệ. Điều này dẫn đến việc các mô hình học máy dễ bị thiên vị và cho kết quả không chính xác. Ngoài ra, vấn đề overfitting cũng là một rào cản lớn, khi mô hình học quá tốt trên dữ liệu huấn luyện nhưng lại hoạt động kém hiệu quả trên dữ liệu thực tế.
Dữ liệu giao dịch thẻ tín dụng thường có sự mất cân bằng lớn giữa số lượng giao dịch hợp lệ và gian lận. Điều này gây khó khăn cho việc huấn luyện các mô hình học máy, vì chúng có xu hướng tập trung vào việc nhận diện các giao dịch hợp lệ (chiếm đa số) và bỏ qua các giao dịch gian lận (chiếm thiểu số). Cần có các kỹ thuật đặc biệt để xử lý tình trạng mất cân bằng này, chẳng hạn như SMOTE, SMOTE-ENN, hoặc Random Oversampling.
Khi huấn luyện các mô hình học máy trên dữ liệu gian lận thẻ tín dụng, cần đặc biệt chú ý đến nguy cơ overfitting. Mô hình có thể học quá tốt trên dữ liệu huấn luyện nhưng lại hoạt động kém hiệu quả trên dữ liệu mới. Để giảm thiểu overfitting, có thể sử dụng các kỹ thuật như điều chỉnh tham số, sử dụng dữ liệu validation, hoặc áp dụng các phương pháp regularization.
Luận văn này đề xuất sử dụng kết hợp học máy và logic mờ để giải quyết các thách thức trong phát hiện gian lận thẻ tín dụng. Học máy cung cấp các thuật toán mạnh mẽ để xây dựng mô hình dự đoán dựa trên dữ liệu lịch sử. Logic mờ cho phép xử lý các thông tin không chắc chắn và mơ hồ, giúp cải thiện khả năng nhận diện các giao dịch gian lận tinh vi. Việc kết hợp hai phương pháp này có thể tạo ra một hệ thống phát hiện gian lận hiệu quả và đáng tin cậy.
Một số thuật toán học máy phổ biến được sử dụng trong phát hiện gian lận thẻ tín dụng bao gồm: mạng nơ-ron, SVM, cây quyết định, và ensemble methods. Mỗi thuật toán có những ưu điểm và nhược điểm riêng, và việc lựa chọn thuật toán phù hợp phụ thuộc vào đặc điểm của dữ liệu và yêu cầu của bài toán. Nghiên cứu này sẽ so sánh hiệu quả của các thuật toán khác nhau và đề xuất phương pháp kết hợp tối ưu.
Logic mờ cho phép biểu diễn và xử lý các khái niệm không chắc chắn và mơ hồ, chẳng hạn như “giao dịch đáng ngờ” hoặc “khách hàng có rủi ro cao”. Bằng cách sử dụng logic mờ, có thể cải thiện khả năng nhận diện các giao dịch gian lận tinh vi mà các phương pháp truyền thống khó phát hiện. Nghiên cứu này sẽ trình bày cách áp dụng logic mờ để xây dựng một mô hình phát hiện gian lận hiệu quả.
Nghiên cứu này tiến hành thực nghiệm trên tập dữ liệu giao dịch thẻ tín dụng thực tế để đánh giá hiệu suất của mô hình phát hiện gian lận được đề xuất. Các chỉ số đánh giá như độ chính xác, độ recall, độ F1, và AUC được sử dụng để so sánh hiệu quả của mô hình với các phương pháp khác. Kết quả thực nghiệm cho thấy rằng mô hình kết hợp học máy và logic mờ đạt được hiệu suất cao và vượt trội so với các phương pháp truyền thống.
Để đánh giá độ chính xác của các thuật toán phát hiện gian lận, cần sử dụng các chỉ số phù hợp, chẳng hạn như độ chính xác (accuracy), độ recall (recall), độ F1 (F1-score), và diện tích dưới đường cong ROC (AUC). Mỗi chỉ số đo lường một khía cạnh khác nhau của hiệu suất mô hình, và việc sử dụng kết hợp các chỉ số này giúp đánh giá toàn diện khả năng của mô hình.
Phân tích kết quả thực nghiệm cho thấy rằng mô hình kết hợp học máy và logic mờ có khả năng phát hiện gian lận tốt hơn so với các phương pháp truyền thống. Mô hình đạt được độ chính xác cao và độ recall tốt, đồng thời có khả năng xử lý dữ liệu không cân bằng một cách hiệu quả. Kết quả này chứng minh tính khả thi và tiềm năng của việc ứng dụng học máy và logic mờ trong phát hiện gian lận thẻ tín dụng.
Một ứng dụng đơn giản được xây dựng sử dụng Streamlit, cho phép người dùng nhập thông tin giao dịch và nhận kết quả dự đoán về khả năng gian lận. Ứng dụng này minh họa cách mô hình phát hiện gian lận có thể được triển khai trong thực tế để hỗ trợ các chuyên gia trong việc kiểm tra và xác minh các giao dịch đáng ngờ.
Ứng dụng được thiết kế với giao diện người dùng trực quan và dễ sử dụng, cho phép người dùng dễ dàng nhập thông tin giao dịch và xem kết quả dự đoán. Ứng dụng cung cấp các thông tin bổ sung về mức độ tin cậy của dự đoán, giúp người dùng đưa ra quyết định chính xác hơn.
Ứng dụng được tích hợp với mô hình học máy đã được huấn luyện, cho phép thực hiện dự đoán gian lận thời gian thực. Mô hình được cập nhật liên tục với dữ liệu mới để đảm bảo độ chính xác và hiệu quả trong quá trình phát hiện gian lận.
Luận văn đã trình bày một phương pháp hiệu quả để phát hiện gian lận thẻ tín dụng bằng cách kết hợp học máy và logic mờ. Kết quả nghiên cứu cho thấy rằng phương pháp này có tiềm năng lớn trong việc cải thiện khả năng nhận diện các giao dịch gian lận và giảm thiểu thiệt hại tài chính. Các hướng phát triển trong tương lai bao gồm việc nghiên cứu các thuật toán học máy mới, áp dụng các kỹ thuật xử lý dữ liệu tiên tiến, và mở rộng phạm vi ứng dụng của mô hình.
Luận văn đã đạt được một số kết quả quan trọng, bao gồm việc xây dựng một mô hình phát hiện gian lận hiệu quả, giải quyết vấn đề mất cân bằng dữ liệu, và áp dụng logic mờ để cải thiện độ chính xác của mô hình. Kết quả thực nghiệm cho thấy rằng mô hình có khả năng phát hiện gian lận tốt hơn so với các phương pháp truyền thống.
Trong tương lai, có thể tiếp tục nghiên cứu và phát triển mô hình phát hiện gian lận bằng cách áp dụng các thuật toán học máy mới, sử dụng các nguồn dữ liệu bổ sung, và tích hợp các kỹ thuật phân tích hành vi người dùng. Ngoài ra, cần chú trọng đến vấn đề bảo mật và quyền riêng tư khi thu thập và xử lý dữ liệu thẻ tín dụng.
Bạn đang xem trước tài liệu:
Luận văn thạc sĩ công nghệ thông tin phát hiện gian lận trong thẻ tín dụng bằng cách sử dụng học máy và logic mờ
Luận văn "Phát hiện Gian Lận Thẻ Tín Dụng Bằng Học Máy và Logic Mờ" trình bày giải pháp ứng dụng các kỹ thuật học máy (Machine Learning) kết hợp với logic mờ (Fuzzy Logic) để phát hiện các giao dịch gian lận thẻ tín dụng. Điểm nổi bật của luận văn này là sự kết hợp hai phương pháp, tận dụng ưu điểm của học máy trong việc tự động học từ dữ liệu lịch sử và sức mạnh của logic mờ trong việc xử lý những thông tin không chắc chắn, mơ hồ thường gặp trong các giao dịch gian lận. Đọc luận văn này giúp bạn hiểu rõ hơn về cách xây dựng mô hình phát hiện gian lận hiệu quả, giảm thiểu rủi ro tài chính cho các tổ chức tín dụng và người dùng.
Nếu bạn quan tâm đến ứng dụng học máy trong lĩnh vực tài chính, hãy xem thêm các tài liệu liên quan:
Để hiểu sâu hơn về ứng dụng học máy trong việc dự báo và phân tích rủi ro, bạn có thể tìm đọc Luận văn thạc sĩ phân tích và dự báo nợ xấu bằng mô hình cây quyết định hồi quy và mô hình logit probi để có cái nhìn toàn diện hơn về các phương pháp dự báo nợ xấu. Hoặc khám phá cách học máy có thể được sử dụng để Dự đoán giá cổ phiếu với học máy, một ứng dụng phổ biến khác trong tài chính. Cuối cùng, tìm hiểu về Détection danomalies sur les marchés boursiers grâce à lapprentissage automatique phát hiện bất thường trên thị trường chứng khoán với học máy để biết cách phát hiện các hoạt động bất thường trên thị trường chứng khoán.