I. Giới thiệu đề tài
Trong bối cảnh hiện nay, ngành tài chính công nghệ (Fintech) đang phát triển mạnh mẽ, đặc biệt là trong lĩnh vực cho vay trực tuyến. Nhu cầu vay vốn của người dân, đặc biệt là nhóm khách hàng yếu thế, ngày càng tăng cao, đặc biệt sau đại dịch COVID-19. Theo thống kê, khoảng 70% người trưởng thành tại Việt Nam có tài khoản ngân hàng, nhưng gần một nửa trong số đó không thể tiếp cận tín dụng. Điều này dẫn đến việc nhiều người phải tìm đến các hình thức vay không chính thống, gây ra nhiều rủi ro tài chính. Danh sách đen trở thành một công cụ quan trọng trong việc thẩm định tín dụng, giúp các công ty tài chính xác định khách hàng có khả năng trả nợ hay không. Tuy nhiên, việc chia sẻ thông tin giữa các công ty tài chính hiện nay vẫn còn nhiều bất cập, thiếu một cơ chế chung để đảm bảo an toàn thông tin khách hàng. Luận văn này nhằm nghiên cứu và phát triển một hệ thống chia sẻ danh sách đen giữa các công ty tài chính, đảm bảo tính bảo mật và hiệu quả.
II. Mô tả bài toán
Bài toán chia sẻ danh sách đen trong lĩnh vực cho vay trực tuyến được đặt ra nhằm xây dựng một cơ chế chia sẻ dữ liệu giữa các công ty tài chính mà không làm lộ thông tin khách hàng. Hệ thống này sẽ sử dụng cấu trúc dữ liệu Bloom Filter để mã hóa thông tin khách hàng. Mỗi công ty sẽ gửi dữ liệu danh sách đen đã được mã hóa cùng với nhãn thời gian đến các đối tác. Điều này không chỉ giúp tăng cường bảo mật mà còn giảm thiểu thời gian và chi phí trong quá trình thẩm định tín dụng. Một trong những thách thức lớn là đảm bảo rằng hệ thống có thể xử lý khối lượng lớn dữ liệu mà vẫn duy trì hiệu suất cao và độ tin cậy. Việc kiểm tra xem một số điện thoại có nằm trong danh sách đen hay không cần phải được thực hiện một cách nhanh chóng và chính xác.
III. Cơ sở kiến thức
Luận văn này dựa trên các lý thuyết về cấu trúc dữ liệu Bloom Filter và các biến thể của nó như Counting Bloom Filter và Mergeable Counting Bloom Filter. Bloom Filter cho phép kiểm tra sự tồn tại của một phần tử trong tập hợp mà không cần lưu trữ toàn bộ dữ liệu, đồng thời có thể xảy ra trường hợp dương tính giả. Các hàm băm được sử dụng trong Bloom Filter cần được tối ưu hóa để giảm thiểu tỷ lệ dương tính giả. Ngoài ra, lý thuyết về Lamport Clock và Vector Clock sẽ được áp dụng để ghi nhận sự kiện trong hệ thống phân tán, giúp đảm bảo tính đồng bộ và chính xác trong quá trình chia sẻ dữ liệu. Những kiến thức này sẽ tạo nền tảng cho việc xây dựng hệ thống chia sẻ danh sách đen hiệu quả.
IV. Phương pháp giải quyết vấn đề
Để giải quyết bài toán chia sẻ danh sách đen, luận văn sẽ áp dụng các phương pháp nghiên cứu và phát triển hệ thống dựa trên cấu trúc dữ liệu Bloom Filter. Các bước thực hiện bao gồm: 1) Nghiên cứu và phát triển mô hình Bloom Filter và các biến thể của nó. 2) Tính toán các thông số đầu vào cho Bloom Filter như số lượng hàm băm tối ưu và tỷ lệ dương tính giả. 3) Thiết kế kiến trúc hệ thống chia sẻ dữ liệu giữa các công ty tài chính. 4) Hiện thực hóa hệ thống và đánh giá tính đúng đắn của nó. Hệ thống sẽ được kiểm tra khả năng chịu lỗi và bảo mật thông tin, đảm bảo rằng dữ liệu danh sách đen không bị lộ ra ngoài.
V. Kết luận
Luận văn này không chỉ đóng góp vào việc xây dựng một hệ thống chia sẻ danh sách đen trong lĩnh vực cho vay trực tuyến mà còn nâng cao nhận thức về tầm quan trọng của việc bảo mật thông tin khách hàng trong ngành tài chính. Hệ thống được phát triển sẽ giúp các công ty tài chính tối ưu hóa quy trình thẩm định tín dụng, giảm thiểu rủi ro và nâng cao hiệu quả hoạt động. Tuy nhiên, vẫn còn nhiều vấn đề cần giải quyết như cải thiện khả năng mã hóa và bảo mật thông tin. Các nghiên cứu trong tương lai có thể mở rộng sang các lĩnh vực khác trong tài chính công nghệ, nhằm xây dựng một hệ sinh thái tài chính an toàn và hiệu quả hơn.