Tổng quan nghiên cứu

Trong bối cảnh phát triển mạnh mẽ của thương mại điện tử và nhu cầu bảo mật ngày càng cao, việc thẩm định xác thực chữ ký viết tay trở thành một vấn đề cấp thiết. Theo ước tính, các giao dịch điện tử hiện nay chiếm tỷ trọng lớn trong tổng giao dịch thương mại, đòi hỏi các giải pháp bảo mật hiệu quả để ngăn chặn giả mạo và đánh cắp thông tin. Luận văn tập trung nghiên cứu các phương pháp thẩm định chữ ký viết tay ứng dụng trong thương mại điện tử, nhằm thay thế phương pháp bảo mật truyền thống dựa trên mật khẩu vốn có nhiều hạn chế như dễ bị đánh cắp, quên mật khẩu hoặc giả mạo.

Mục tiêu cụ thể của nghiên cứu là phân tích, đánh giá và phát triển các phương pháp thẩm định chữ ký viết tay dựa trên sinh trắc học và mô hình Markov ẩn, từ đó xây dựng hệ thống thẩm định chữ ký viết tay có độ chính xác cao, giảm thiểu tỷ lệ chấp nhận sai (FAR) và loại bỏ sai (FRR). Phạm vi nghiên cứu tập trung vào dữ liệu chữ ký trực tuyến và offline thu thập từ 25 người dùng với tổng cộng 1000 mẫu chữ ký thật và giả mạo, thực hiện tại Trường Đại học Bách Khoa Hà Nội trong giai đoạn 2004-2006.

Ý nghĩa của nghiên cứu được thể hiện qua việc nâng cao tính bảo mật trong các giao dịch điện tử, giảm thiểu rủi ro giả mạo chữ ký, đồng thời góp phần phát triển các ứng dụng sinh trắc học trong lĩnh vực công nghệ thông tin và thương mại điện tử. Các chỉ số đánh giá hiệu quả như tỷ lệ lỗi trung bình (EER), tỷ lệ chấp nhận sai (FAR) và tỷ lệ loại bỏ sai (FRR) được sử dụng làm thước đo chính cho hệ thống.

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Luận văn dựa trên hai khung lý thuyết chính:

  1. Sinh trắc học (Biometrics): Khái niệm sinh trắc học được định nghĩa là khả năng tự động nhận dạng người dựa trên các đặc điểm hình thái hoặc hành vi cá nhân, trong đó chữ ký viết tay được xem là một dạng sinh trắc học hành vi. Hệ thống sinh trắc học hoạt động dựa trên hai chức năng chính: thẩm định (verification) và nhận dạng (identification). Trong nghiên cứu này, thẩm định chữ ký viết tay được tập trung khai thác nhằm xác thực người ký.

  2. Mô hình Markov ẩn (Hidden Markov Model - HMM): Mô hình HMM là một mô hình thống kê dùng để mô tả các quá trình có trạng thái ẩn, được ứng dụng rộng rãi trong nhận dạng tiếng nói và chữ viết tay. Mô hình bao gồm các tham số xác suất chuyển đổi trạng thái, xác suất quan sát trạng thái và xác suất trạng thái ban đầu. Ba bài toán cơ bản của HMM gồm bài toán đánh giá, giải mã và huấn luyện được giải quyết bằng các thuật toán chuyển tiếp (Forwarding), Viterbi và Baum-Welch.

Các khái niệm chuyên ngành quan trọng bao gồm: Dynamic Time Warping (DTW), Extreme Points Warping (EPW), tỷ lệ chấp nhận sai (FAR), tỷ lệ loại bỏ sai (FRR), khóa riêng sinh trắc học, và thuật toán DSA trong tạo khóa riêng.

Phương pháp nghiên cứu

Nguồn dữ liệu chính được thu thập từ cơ sở dữ liệu gồm 25 người dùng, mỗi người cung cấp 30 chữ ký thật và 10 chữ ký giả mạo, tổng cộng 1000 mẫu chữ ký. Các chữ ký giả mạo được thực hiện bởi người khác có thời gian luyện tập để mô phỏng chữ ký thật.

Phương pháp phân tích bao gồm:

  • Áp dụng thuật toán DTW và EPW để xử lý và so sánh hình dạng chữ ký, trong đó EPW là kỹ thuật làm méo mới chỉ tác động lên các điểm cực trị (EPs) nhằm cải thiện độ chính xác và giảm thời gian tính toán.
  • Mã hóa các đặc trưng sinh trắc học từ chữ ký để tạo chuỗi mã thuộc tính, sau đó sử dụng thuật toán DSA để tạo khóa riêng.
  • Sử dụng mô hình HMM để mô hình hóa và thẩm định chữ ký viết tay, bao gồm cả hệ thống online và offline.
  • Cài đặt chương trình kiểm thử hệ thống thẩm định chữ ký viết tay dựa trên mô hình Markov ẩn.

Timeline nghiên cứu kéo dài trong khoảng 2 năm, từ thu thập dữ liệu, phát triển thuật toán, đến thử nghiệm và đánh giá kết quả.

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

  1. Hiệu quả của kỹ thuật EPW so với DTW: EPW giảm đáng kể thời gian tính toán trung bình từ 415.7ms (DTW) xuống còn khoảng 37ms, đồng thời giảm tỷ lệ lỗi trung bình (EER) trên 5 tín hiệu thử nghiệm. Hệ số tương quan giữa tín hiệu thực và tín hiệu tham chiếu tăng từ 70% lên 95% với EPW, trong khi tín hiệu giả mạo chỉ tăng từ 70% lên 81%.

  2. Tỷ lệ chấp nhận sai (FAR) và loại bỏ sai (FRR): Với hệ số b=5 trong mã hóa thuộc tính, hệ thống đạt FAR khoảng 1.2% và FRR khoảng 28%, cho thấy độ tin cậy cao trong việc phân biệt chữ ký thật và giả mạo.

  3. Ứng dụng mô hình Markov ẩn: Mô hình HMM được huấn luyện và kiểm thử cho cả chữ ký online và offline, cho kết quả thẩm định chính xác với khả năng xử lý chuỗi quan sát ẩn hiệu quả. Thuật toán Viterbi giúp tìm dãy trạng thái tối ưu, trong khi thuật toán Baum-Welch hỗ trợ huấn luyện mô hình tối ưu.

  4. Xây dựng hệ thống kiểm thử: Chương trình kiểm thử được phát triển với các form quản lý người dùng và thẩm định chữ ký, hỗ trợ thu thập dữ liệu, cập nhật thông tin và hiển thị kết quả thẩm định, tạo điều kiện thuận lợi cho việc áp dụng thực tế.

Thảo luận kết quả

Nguyên nhân chính giúp EPW vượt trội so với DTW là do EPW chỉ làm méo các điểm cực trị quan trọng, giữ nguyên các đường cong cục bộ, từ đó ngăn chặn sự thay đổi quá mức của tín hiệu giả mạo trong quá trình xử lý. Điều này không chỉ giảm thời gian tính toán mà còn tăng độ chính xác, phù hợp với yêu cầu xử lý nhanh trong thương mại điện tử.

So sánh với các nghiên cứu trước đây, phương pháp kết hợp sinh trắc học và mã hóa khóa công khai (BioPKI) được cải tiến bằng việc sử dụng EPW và mô hình HMM, giúp giải quyết các hạn chế về bảo mật và hiệu suất. Tỷ lệ FAR và FRR đạt được cho thấy hệ thống có thể ứng dụng thực tế với độ tin cậy cao.

Dữ liệu có thể được trình bày qua biểu đồ so sánh thời gian tính toán và tỷ lệ lỗi giữa DTW và EPW, bảng thống kê FAR và FRR theo các hệ số b khác nhau, cũng như sơ đồ mô hình HMM minh họa các trạng thái và xác suất chuyển đổi.

Đề xuất và khuyến nghị

  1. Triển khai kỹ thuật EPW trong hệ thống thẩm định chữ ký: Nâng cấp các hệ thống hiện có sử dụng DTW sang EPW để giảm thời gian xử lý và tăng độ chính xác, đặc biệt trong các ứng dụng thương mại điện tử có lưu lượng giao dịch lớn. Thời gian thực hiện: 6-12 tháng; chủ thể: các công ty phát triển phần mềm bảo mật.

  2. Phát triển hệ thống thẩm định chữ ký dựa trên mô hình HMM: Áp dụng mô hình Markov ẩn cho cả chữ ký online và offline nhằm nâng cao khả năng nhận dạng và thẩm định chính xác. Thời gian thực hiện: 12 tháng; chủ thể: các viện nghiên cứu và trường đại học.

  3. Tích hợp sinh trắc học với hạ tầng mã hóa công khai (BioPKI): Xây dựng hệ thống quản lý khóa riêng dựa trên đặc trưng sinh trắc học để tăng cường bảo mật, giảm thiểu rủi ro mất khóa riêng. Thời gian thực hiện: 18 tháng; chủ thể: các tổ chức tài chính và ngân hàng.

  4. Đào tạo và nâng cao nhận thức người dùng: Tổ chức các khóa đào tạo về an toàn bảo mật chữ ký điện tử và sinh trắc học cho người dùng cuối, nhằm giảm thiểu rủi ro do yếu tố con người. Thời gian thực hiện: liên tục; chủ thể: các doanh nghiệp và cơ quan quản lý.

Đối tượng nên tham khảo luận văn

  1. Nhà nghiên cứu và sinh viên ngành Công nghệ Thông tin: Luận văn cung cấp kiến thức chuyên sâu về sinh trắc học, mô hình Markov ẩn và các thuật toán xử lý chữ ký viết tay, hỗ trợ nghiên cứu và phát triển các ứng dụng bảo mật.

  2. Chuyên gia phát triển phần mềm bảo mật: Các kỹ thuật EPW, BioPKI và HMM được trình bày chi tiết giúp phát triển các hệ thống thẩm định chữ ký điện tử hiệu quả, giảm thiểu rủi ro giả mạo.

  3. Doanh nghiệp thương mại điện tử và tài chính: Áp dụng các giải pháp thẩm định chữ ký viết tay nâng cao bảo mật giao dịch, tăng cường niềm tin khách hàng và tuân thủ các quy định pháp luật về giao dịch điện tử.

  4. Cơ quan quản lý và chính sách: Tham khảo để xây dựng các tiêu chuẩn, quy định về bảo mật chữ ký điện tử và ứng dụng sinh trắc học trong giao dịch điện tử, góp phần hoàn thiện khung pháp lý.

Câu hỏi thường gặp

  1. Phương pháp EPW khác gì so với DTW trong thẩm định chữ ký?
    EPW chỉ làm méo các điểm cực trị quan trọng trên tín hiệu chữ ký, giữ nguyên các đường cong cục bộ, giúp giảm thời gian tính toán từ trung bình 415.7ms xuống còn 37ms và giảm tỷ lệ lỗi, trong khi DTW làm méo toàn bộ tín hiệu.

  2. Tỷ lệ FAR và FRR có ý nghĩa gì trong hệ thống thẩm định chữ ký?
    FAR (False Accept Rate) là tỷ lệ chấp nhận sai chữ ký giả mạo, FRR (False Reject Rate) là tỷ lệ loại bỏ sai chữ ký thật. Hệ thống hiệu quả cần có FAR thấp để tránh giả mạo và FRR thấp để không từ chối người dùng hợp lệ.

  3. Mô hình Markov ẩn được ứng dụng như thế nào trong thẩm định chữ ký?
    Mô hình HMM mô phỏng quá trình tạo ra chuỗi quan sát chữ ký với các trạng thái ẩn, sử dụng các thuật toán như Viterbi để tìm dãy trạng thái tối ưu, giúp phân biệt chữ ký thật và giả mạo chính xác.

  4. Làm thế nào để tạo khóa riêng từ đặc trưng sinh trắc học chữ ký?
    Chuỗi mã thuộc tính được tạo từ các đặc trưng sinh trắc học của chữ ký, sau đó sử dụng thuật toán DSA để tạo khóa riêng, giúp bảo mật và loại bỏ việc lưu trữ khóa riêng truyền thống.

  5. Hệ thống thẩm định chữ ký viết tay có thể áp dụng trong những lĩnh vực nào?
    Hệ thống phù hợp với thương mại điện tử, ngân hàng, các giao dịch điện tử cần xác thực người ký, cũng như các ứng dụng an ninh, quản lý truy cập và chứng thực tài liệu điện tử.

Kết luận

  • EPW là kỹ thuật làm méo tín hiệu chữ ký hiệu quả, giảm thời gian tính toán và tỷ lệ lỗi so với DTW.
  • Mô hình Markov ẩn cung cấp phương pháp thẩm định chữ ký viết tay chính xác cho cả hệ thống online và offline.
  • Hệ thống BioPKI kết hợp sinh trắc học và mã hóa công khai nâng cao bảo mật khóa riêng.
  • Tỷ lệ FAR đạt khoảng 1.2% và FRR khoảng 28% cho thấy độ tin cậy cao của hệ thống.
  • Các bước tiếp theo bao gồm triển khai thực tế, mở rộng cơ sở dữ liệu và đào tạo người dùng để ứng dụng rộng rãi trong thương mại điện tử.

Luận văn khuyến khích các nhà nghiên cứu và doanh nghiệp tiếp tục phát triển và ứng dụng các phương pháp thẩm định chữ ký viết tay dựa trên sinh trắc học và mô hình Markov ẩn nhằm nâng cao bảo mật và hiệu quả trong giao dịch điện tử.