Luận văn thạc sĩ HCMUTE: Nghiên cứu robot hỗ trợ người khiếm thính với công nghệ xử lý ảnh

2017

80
0
0

Phí lưu trữ

30.000 VNĐ

Tóm tắt

I. Giới thiệu đề tài

Nghiên cứu robot hỗ trợ người khiếm thính ứng dụng công nghệ xử lý ảnh là một trong những giải pháp quan trọng nhằm cải thiện khả năng giao tiếp cho người khiếm thính. Theo thống kê của Tổ chức Y tế Thế giới (WHO), có khoảng 278 triệu người khiếm thính trên toàn cầu, trong đó Việt Nam có khoảng 2 triệu người. Việc giao tiếp giữa người khiếm thính và người bình thường gặp nhiều khó khăn do sự khác biệt trong ngôn ngữ. Đề tài này nhằm phát triển một robot hỗ trợ có khả năng nhận diện ngôn ngữ ký hiệu và chuyển đổi thành ngôn ngữ nói, đồng thời nhận diện giọng nói và chuyển đổi thành ngôn ngữ ký hiệu. Điều này không chỉ giúp người khiếm thính giao tiếp dễ dàng hơn mà còn tạo ra một cầu nối giữa họ và cộng đồng.

II. Tổng quan hoạt động của robot hỗ trợ người khiếm thính

Robot hỗ trợ người khiếm thính thực hiện hai nhiệm vụ chính: nhận diện ngôn ngữ ký hiệu và nhận dạng giọng nói. Để thực hiện nhiệm vụ đầu tiên, robot sử dụng công nghệ xử lý ảnh để nhận diện vị trí và cử chỉ của bàn tay, từ đó chuyển đổi thành âm thanh. Nhiệm vụ thứ hai liên quan đến việc nhận dạng giọng nói, sử dụng micro để thu âm và xử lý thông qua các thuật toán điện toán đám mây. Việc sử dụng hệ thống nhận diện hình ảnhcông nghệ AI giúp robot có thể hoạt động hiệu quả trong thời gian thực, tạo điều kiện thuận lợi cho việc giao tiếp giữa người khiếm thính và người bình thường.

III. Công nghệ xử lý ảnh trong nhận diện ngôn ngữ ký hiệu

Công nghệ xử lý ảnh đóng vai trò quan trọng trong việc nhận diện ngôn ngữ ký hiệu. Robot sử dụng camera cảm biến chiều sâu để thu thập dữ liệu về cử chỉ của bàn tay và cánh tay. Các thuật toán như DTW (Dynamic Time Warping) được áp dụng để so sánh và nhận diện các cử chỉ. Việc nhận diện chính xác các cử chỉ không chỉ phụ thuộc vào công nghệ mà còn vào việc xây dựng cơ sở dữ liệu phong phú về ngôn ngữ ký hiệu. Điều này giúp robot có thể hiểu và chuyển đổi các cử chỉ thành âm thanh một cách chính xác, từ đó hỗ trợ người khiếm thính trong giao tiếp.

IV. Nhận dạng tiếng nói và chuyển đổi thành ngôn ngữ ký hiệu

Nhận dạng tiếng nói là một phần quan trọng trong hệ thống robot hỗ trợ người khiếm thính. Hệ thống sử dụng các công nghệ tiên tiến như Google Cloud Speech API để nhận diện giọng nói. Sau khi giọng nói được nhận diện và chuyển đổi thành văn bản, robot sẽ hiển thị ngôn ngữ ký hiệu tương ứng trên màn hình. Việc này không chỉ giúp người khiếm thính hiểu được thông điệp mà còn tạo ra một trải nghiệm giao tiếp tự nhiên hơn. Sự kết hợp giữa nhận diện giọng nói và ngôn ngữ ký hiệu là một bước tiến lớn trong việc hỗ trợ người khiếm thính trong cuộc sống hàng ngày.

V. Giá trị và ứng dụng thực tiễn của nghiên cứu

Nghiên cứu này không chỉ mang lại giá trị lý thuyết mà còn có ứng dụng thực tiễn cao. Việc phát triển robot hỗ trợ người khiếm thính có thể giúp cải thiện chất lượng cuộc sống cho hàng triệu người. Nó mở ra cơ hội cho người khiếm thính giao tiếp hiệu quả hơn với cộng đồng, từ đó giảm bớt sự cô lập và nâng cao khả năng hòa nhập xã hội. Hơn nữa, nghiên cứu này cũng góp phần vào sự phát triển của công nghệ thông minh trong lĩnh vực hỗ trợ người khuyết tật, tạo ra những giải pháp sáng tạo và thiết thực cho các vấn đề xã hội.

25/01/2025
Luận văn thạc sĩ hcmute nghiên cứu robot hỗ trợ người khiếm thính ứng dụng công nghệ xử lý ảnh
Bạn đang xem trước tài liệu : Luận văn thạc sĩ hcmute nghiên cứu robot hỗ trợ người khiếm thính ứng dụng công nghệ xử lý ảnh

để xem tài liệu hoàn chỉnh bạn click vào nút

Tải xuống

Bài viết "Luận văn thạc sĩ HCMUTE: Nghiên cứu robot hỗ trợ người khiếm thính với công nghệ xử lý ảnh" của tác giả Nguyễn Trung Hiếu, dưới sự hướng dẫn của PGS. Nguyễn Trường Thịnh, trình bày một nghiên cứu quan trọng về việc phát triển robot hỗ trợ cho người khiếm thính thông qua công nghệ xử lý ảnh. Nghiên cứu này không chỉ mang lại những giải pháp công nghệ tiên tiến mà còn mở ra cơ hội cải thiện chất lượng cuộc sống cho người khiếm thính, giúp họ giao tiếp và tương tác tốt hơn với môi trường xung quanh.

Để mở rộng thêm kiến thức về các ứng dụng công nghệ trong giáo dục và nhận diện, bạn có thể tham khảo các bài viết liên quan như Luận Văn Thạc Sĩ: Ứng Dụng Active Learning trong Lựa Chọn Dữ Liệu Gán Nhãn cho Bài Toán Nhận Diện Giọng Nói, nơi nghiên cứu về việc áp dụng công nghệ học máy trong nhận diện giọng nói, và Luận văn thạc sĩ: Nhận dạng giọng nói tiếng Việt qua học sâu và mô hình ngôn ngữ, nghiên cứu về nhận diện giọng nói tiếng Việt thông qua các mô hình học sâu. Những tài liệu này sẽ giúp bạn có cái nhìn sâu sắc hơn về ứng dụng công nghệ trong các lĩnh vực liên quan.

Tải xuống (80 Trang - 6.47 MB )