Luận văn tốt nghiệp: Nghiên cứu và phát triển kỹ thuật tấn công đối kháng trong mô hình nhận diện giọng nói tiếng Việt

Chuyên ngành

Khoa học Máy tính

Người đăng

Ẩn danh

2021

104
0
0

Phí lưu trữ

30.000 VNĐ

Tóm tắt

I. Giới thiệu

Nghiên cứu kỹ thuật tấn công đối kháng trong nhận diện giọng nói tiếng Việt là một lĩnh vực quan trọng trong bối cảnh phát triển trí tuệ nhân tạo (AI) và học máy (machine learning). Nhận diện giọng nói là một ứng dụng phổ biến của AI, nhưng cũng đối mặt với nhiều thách thức về bảo mật. Kỹ thuật tấn công đối kháng có thể gây ra những sai lệch trong quá trình nhận diện, ảnh hưởng đến tính chính xác và độ tin cậy của hệ thống. Nghiên cứu này tập trung vào việc phát triển các mẫu âm thanh tấn công có khả năng làm sai lệch kết quả nhận diện mà vẫn giữ nguyên nội dung âm thanh gốc. Điều này không chỉ giúp nâng cao khả năng bảo mật cho các hệ thống nhận diện giọng nói mà còn mở ra hướng nghiên cứu mới trong bảo mật AI.

1.1 Tổng quan về bảo mật trong trí tuệ nhân tạo

Sự phát triển nhanh chóng của AI đã dẫn đến việc ứng dụng rộng rãi trong nhiều lĩnh vực, từ nhận diện giọng nói đến hệ thống tự hành. Tuy nhiên, vấn đề bảo mật ngày càng trở nên cấp thiết khi mà các kẻ tấn công có thể khai thác những lỗ hổng trong các mô hình học máy. Các cuộc tấn công như tấn công đối kháng không chỉ đe dọa tính toàn vẹn của dữ liệu mà còn ảnh hưởng đến quyền riêng tư của người dùng. Theo nghiên cứu, nhiều mô hình AI hiện nay chỉ được phát triển dưới dạng hộp đen, khiến cho việc bảo vệ và phát hiện các tấn công trở nên khó khăn hơn. Nghiên cứu này sẽ làm rõ những thách thức trong bảo mật AI và đề xuất các giải pháp phòng chống hiệu quả.

II. Kiến thức nền tảng

Để thực hiện nghiên cứu về tấn công đối kháng, cần có kiến thức vững về âm học và các phương pháp nhận diện giọng nói. Các kỹ thuật như biến đổi Fourier, biến đổi wavelet, và Mel frequency cepstral coefficients (MFCC) là những công cụ quan trọng trong việc phân tích và trích xuất đặc trưng âm thanh. Việc hiểu rõ các mô hình như mô hình Markov ẩnmô hình mạng tích chập sẽ giúp xây dựng các hệ thống nhận diện giọng nói hiệu quả. Các nghiên cứu trước đây đã chỉ ra rằng, việc cải tiến các mô hình này có thể giúp nâng cao độ chính xác trong nhận diện giọng nói tiếng Việt. Đồng thời, việc áp dụng các kỹ thuật học sâu cũng mang lại nhiều lợi ích trong việc phát hiện và phân tích các mẫu âm thanh tấn công.

2.1 Tiền xử lý âm thanh

Tiền xử lý âm thanh là bước đầu tiên trong quá trình nhận diện giọng nói. Các kỹ thuật như lọc tần số và chuẩn hóa âm thanh giúp cải thiện chất lượng dữ liệu đầu vào. Việc sử dụng biến đổi Fourier giúp chuyển đổi tín hiệu âm thanh từ miền thời gian sang miền tần số, từ đó dễ dàng phân tích các đặc trưng âm thanh. Biến đổi wavelet cũng được sử dụng để phân tích tín hiệu âm thanh với độ phân giải khác nhau, cung cấp thông tin chi tiết hơn về biến đổi tần số theo thời gian. Những phương pháp này đều đóng vai trò quan trọng trong việc tạo ra các mẫu âm thanh tấn công hiệu quả, nhằm làm sai lệch nhận diện mà vẫn giữ được tính tự nhiên của âm thanh.

III. Một số nghiên cứu liên quan

Các nghiên cứu trước đây đã chỉ ra rằng, tấn công đối kháng không chỉ xảy ra trong lĩnh vực nhận diện hình ảnh mà còn trong nhận diện giọng nói. Những kỹ thuật tấn công như tấn công hộp đenhộp trắng đã được áp dụng để làm sai lệch các mô hình nhận diện giọng nói. Trong đó, tấn công hộp trắng cho phép kẻ tấn công có kiến thức về mô hình, từ đó tạo ra các mẫu tấn công chính xác hơn. Nghiên cứu này sẽ mở rộng phạm vi các kỹ thuật tấn công đối kháng, đồng thời đề xuất các phương pháp cải tiến nhằm nâng cao hiệu quả tấn công. Điều này không chỉ giúp hiểu rõ hơn về các mối đe dọa đối với hệ thống nhận diện giọng nói mà còn giúp phát triển các phương pháp bảo vệ hiệu quả.

3.1 Tấn công trực tiếp mô hình hộp đen

Tấn công hộp đen là một phương pháp phổ biến trong nghiên cứu bảo mật AI. Kẻ tấn công không có thông tin về mô hình nhưng có thể tạo ra các mẫu đầu vào nhằm làm sai lệch đầu ra của mô hình. Các nghiên cứu đã chỉ ra rằng, việc tạo ra các mẫu âm thanh với tần số cao hoặc thay đổi miền thời gian có thể dẫn đến những sai lệch lớn trong nhận diện giọng nói. Điều này cho thấy, việc bảo vệ các mô hình nhận diện giọng nói khỏi các tấn công này là cực kỳ quan trọng, đặc biệt trong bối cảnh ngày càng nhiều ứng dụng AI được triển khai trong thực tế.

09/01/2025
Luận văn tốt nghiệp khoa học máy tính nghiên cứu và phát triển một số kỹ thuật tấn công đối kháng trong một số mô hình nhận diện phân loại giọng nói tiếng việt
Bạn đang xem trước tài liệu : Luận văn tốt nghiệp khoa học máy tính nghiên cứu và phát triển một số kỹ thuật tấn công đối kháng trong một số mô hình nhận diện phân loại giọng nói tiếng việt

Để xem tài liệu hoàn chỉnh bạn click vào nút

Tải xuống

Bài luận văn tốt nghiệp mang tên "Nghiên cứu và phát triển kỹ thuật tấn công đối kháng trong mô hình nhận diện giọng nói tiếng Việt" của tác giả Nguyễn Hữu Hồng Huy, dưới sự hướng dẫn của các giảng viên tại Đại học Bách Khoa Thành phố Hồ Chí Minh, tập trung vào việc nghiên cứu và phát triển các kỹ thuật tấn công đối kháng trong các mô hình nhận diện giọng nói tiếng Việt. Bài viết cung cấp cái nhìn sâu sắc về cách mà những kỹ thuật này có thể ảnh hưởng đến độ chính xác của hệ thống nhận diện giọng nói, từ đó mở ra hướng nghiên cứu mới trong lĩnh vực trí tuệ nhân tạo và nhận diện giọng nói.

Để mở rộng thêm kiến thức về lĩnh vực này, bạn có thể tham khảo bài viết "Nhận diện giọng nói tiếng Việt qua học sâu và mô hình ngôn ngữ", nơi nghiên cứu sự kết hợp giữa học sâu và mô hình ngôn ngữ trong nhận diện giọng nói. Bài viết này cũng được thực hiện tại Đại học Bách Khoa và có nhiều điểm tương đồng về chủ đề với bài luận văn gốc.

Ngoài ra, bạn cũng có thể tìm hiểu về "Ứng Dụng Active Learning trong Lựa Chọn Dữ Liệu Gán Nhãn cho Bài Toán Nhận Diện Giọng Nói", một luận văn thạc sĩ nghiên cứu về cách lựa chọn dữ liệu gán nhãn cho bài toán nhận diện giọng nói, cũng như cách áp dụng các kỹ thuật học máy trong lĩnh vực này.

Cuối cùng, bạn có thể tham khảo bài viết "Nhận diện giọng nói tiếng Việt qua học sâu và mô hình ngôn ngữ" để hiểu rõ hơn về các mô hình và kỹ thuật hiện có trong lĩnh vực nhận diện giọng nói tiếng Việt, từ đó làm phong phú thêm kiến thức của mình về chủ đề này.

Tải xuống (104 Trang - 2.11 MB)