Nghiên cứu và Phát triển Hệ thống Nhận dạng Tiếng Nói Tiếng Việt

Chuyên khảo Và phát triển hệ thống nhận dạng tiếng nói tiếng việt phân tích chuyên sâu các khía cạnh quan trọng trong lĩnh vực hiện nay

Trường đại học

Trường Đại Học Ngoại Ngữ - Tin Học TP.HCM

Chuyên ngành

Công Nghệ Thông Tin

Người đăng

Ẩn danh

Thể loại

khóa luận tốt nghiệp

2014

Phí lưu trữ

30 Point

Mục lục chi tiết

LỜI MỞ ĐẦU

1. CHƯƠNG 1: TỔNG QUAN

1.1. Giới thiệu tổng quan

1.2. Mục tiêu đề tài

1.3. Ý nghĩa của đề tài

1.4. Nội dung thực hiện

1.5. Phạm vi tìm hiểu

1.6. Các kết quả đạt được của đề tài

2. CHƯƠNG 2: KIẾN TRÚC HỆ THỐNG

3. CHƯƠNG 3: NHẬN DẠNG TIẾNG NÓI TIẾNG VIỆT

3.1. Cơ sở lý thuyết

3.2. Các công đoạn xây dựng bộ nhận dạng tiếng nói

3.3. Chuẩn bị tập dữ liệu huấn luyện

3.4. Xây dựng từ điển

3.5. Xây dựng văn phạm

4. CHƯƠNG 4: XỬ LÝ NGÔN NGỮ TỰ NHIÊN

4.1. Cấu trúc cú pháp truy vấn

4.2. Phân tích nghĩa người dùng

4.3. Chuyển thành câu lệnh SQL để tương tác với cơ sở dữ liệu

5. CHƯƠNG 5: THỬ NGHIỆM VÀ ĐÁNH GIÁ

5.1. Thành phần Nhận dạng tiếng nói

5.2. Thành phần Xử lý ngôn ngữ tự nhiên

5.3. Toàn bộ hệ thống

5.4. So sánh với những cách tiếp cận khác

6. CHƯƠNG 6: KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN

6.1. Kết quả đạt được

6.2. Những hạn chế

6.3. Hướng phát triển

TÀI LIỆU THAM KHẢO

PHỤ LỤC 1

PHỤ LỤC 2

PHỤ LỤC 3

PHỤ LỤC 4

PHỤ LỤC 5

PHỤ LỤC 6

PHỤ LỤC 7

Tóm tắt

I. Tổng Quan Nghiên Cứu Hệ Thống Nhận Dạng Tiếng Việt

Nhận dạng tiếng nói đóng vai trò quan trọng trong giao tiếp người - máy. Nó giúp máy tính hiểu và thực hiện hiệu lệnh của con người nhanh hơn. Đề tài nghiên cứu “Thử nghiệm việc nhận dạng tiếng nói tiếng Việt” nhằm nhận dạng các hiệu lệnh bằng tiếng Việt và chuyển thành văn bản để máy tính hiểu và thực thi. Cụ thể hóa, đề tài xây dựng ứng dụng quản lý chi tiêu cá nhân và hệ thống tra cứu thông tin tuyển sinh Đại học HUFLIT. PGS. Vũ Hải Quân dẫn đầu nhóm nghiên cứu tại Đại học Khoa học Tự nhiên TP.HCM, tập trung vào bài toán truy vấn thông tin cho bản tin thời sự tiếng Việt. Nhóm đã thực hiện đề tài cấp quốc gia về khai thác thông tin đa phương tiện hướng ngữ nghĩa và được tài trợ để nghiên cứu về hệ thống tổng hợp tiếng nói tiếng Việt.

1.1. Lịch Sử Phát Triển Công Nghệ Nhận Dạng Tiếng Nói

Ý tưởng xây dựng các hệ thống nhận dạng tiếng nói đã có từ những năm 1950 và đạt được nhiều kết quả đáng kể. Tại Việt Nam, nhóm nghiên cứu của PGS. Vũ Hải Quân đã liên tục trong 10 năm qua xây dựng thành công nhiều hệ thống như: Hệ thống nhận dạng tiếng nói tiếng Việt liên tục, bộ từ vựng không hạn chế; Hệ thống tổng hợp tiếng nói tiếng Việt dựa trên ghép nối. Các hệ thống này có kết quả nhận dạng khá cao, đạt gần 95%; tiếng nói tổng hợp cũng khá tự nhiên. Đặc biệt, nhóm nghiên cứu đã xây dựng thành công một hệ thống voice server hoàn chỉnh với kết quả nhận dạng đến 93.17%, tạo nền tảng cho việc phát triển các ứng dụng tiếng nói như hệ thống hỏi đáp tự động, hệ thu thoại. [2]

1.2. Các Hướng Tiếp Cận Chính Trong Nhận Dạng Tiếng Nói

Có 3 hướng tiếp cận chính cho nhận dạng tiếng nói [1]: (1) Tiếp cận Âm học: dựa vào đặc điểm âm học rút ra từ phổ âm thanh, nhưng kết quả còn thấp vì biến động lớn và đòi hỏi tri thức âm học đầy đủ. (2) Tiếp cận Nhận dạng Mẫu thống kê: sử dụng phương pháp máy học dựa trên thống kê để học và rút ra mẫu tham khảo từ lượng dữ liệu lớn, thường dùng Mô hình Markov ẩn (HMM). (3) Tiếp cận Trí tuệ nhân tạo: kết hợp cả hai hướng trên, là hướng tiếp cận tương lai của nhận dạng tiếng nói. Đề tài tập trung xây dựng bộ nhận dạng tiếng nói tiếng Việt theo hướng tiếp cận Nhận dạng mẫu thống kê.

II. Mục Tiêu Ý Nghĩa Nghiên Cứu Nhận Dạng Tiếng Việt

Mục tiêu của đề tài là tìm hiểu về Nhận dạng tiếng nói, các bước huấn luyện, xây dựng bộ nhận dạng tiếng nói theo mô hình Hidden Markov. Đồng thời, tìm hiểu về Xử lý ngôn ngữ tự nhiên để phục vụ cho giai đoạn hậu xử lý sau khi đã nhận dạng tiếng nói. Đề tài tích hợp các thành phần Nhận dạng tiếng nói, Xử lý ngôn ngữ tự nhiên và Tổng hợp tiếng nói vào thành một ứng dụng, hệ thống giao tiếp tiếng nói hoàn chỉnh. Cụ thể hóa qua ứng dụng "Quản lý chi tiêu cá nhân" và hệ thống "Tra cứu thông tin tuyển sinh Đại học HUFLIT".

2.1. Ứng Dụng Quản Lý Chi Tiêu Cá Nhân Bằng Giọng Nói

Ứng dụng "Quản lý chi tiêu cá nhân" đáp ứng các mục tiêu: Nhận dạng được tiếng nói của nhiều người dùng với độ chính xác cao. Có cơ chế xử lý ngôn ngữ tự nhiên (phân tích cú pháp và ngữ nghĩa câu lệnh) hiệu quả. Thực thi các lệnh truy xuất cơ sở dữ liệu từ người dùng. Xuất kết quả thành âm thanh.

2.2. Hệ Thống Tra Cứu Tuyển Sinh Bằng Giọng Nói Tại HUFLIT

Hệ thống "Tra cứu thông tin tuyển sinh Đại học HUFLIT" đáp ứng các mục tiêu: Người dùng giao tiếp với hệ thống bằng tiếng nói thông qua điện thoại. Hệ thống có khả năng nhận dạng tiếng nói, xử lý ngôn ngữ và phản hồi cho người dùng.

2.3. Tính Mới Và Ý Nghĩa Khoa Học Của Nghiên Cứu

Theo hiểu biết của tác giả, đây là hệ thống đầu tiên tại Việt Nam được trang bị một cơ chế xử lý ngôn ngữ tự nhiên hiệu quả vào ứng dụng tiếng nói, giúp hệ thống thông minh và linh hoạt hơn. Về mặt khoa học, đề tài mở ra hướng phát triển mới trong việc nghiên cứu, xây dựng các hệ thống hỏi đáp có thể hiểu và giao tiếp bằng tiếng Việt với người dùng bằng việc tích hợp xử lý ngôn ngữ tự nhiên trong các ứng dụng tiếng nói.

III. Phương Pháp Xây Dựng Hệ Thống Nhận Dạng Tiếng Việt

Nghiên cứu sử dụng công nghệ và công cụ mã nguồn mở HTK để nhận dạng tiếng nói. Nghiên cứu các vấn đề về phân tích cú pháp và mô hình biểu diễn ngữ nghĩa cho các câu truy vấn tiếng Việt. Tiếp cận phương pháp phân tích cú pháp và ngữ nghĩa câu lệnh tiếng Việt với DCG (Definite Clause Grammar) [5]. Nghiên cứu xây dựng mô hình và tích hợp hệ thống.

3.1. Chuẩn Bị Dữ Liệu Ngữ Âm Cho Ứng Dụng

Đối với ứng dụng "Quản lý chi tiêu cá nhân": Dữ liệu huấn luyện được thu âm từ 9 người với 9000 mẫu câu và 50 giọng đọc khác nhau (nam). Dữ liệu này được lấy mẫu ở mức 16000Hz, 16bit theo định dạng PCM trong điều kiện môi trường có tiếng ồn. Việc thu âm 50 giọng đọc khác nhau tốn nhiều thời gian và công sức, được thực hiện chung với nhóm bạn Nguyễn Vũ Kiều Anh và Nguyễn Phạm Bảo Nguyên. Nhóm chia đều việc thu âm và chuẩn hóa file wav.

3.2. Chuẩn Bị Dữ Liệu Ngữ Âm Cho Hệ Thống Tra Cứu HUFLIT

Đối với hệ thống "Tra cứu thông tin tuyển sinh DH HUFLIT": Dữ liệu huấn luyện được thu âm trong 262 phút với 2550 mẫu câu và 50 giọng đọc khác nhau (nam). Dữ liệu này được lấy mẫu ở mức 8000Hz, 16bit theo định dạng PCM trong điều kiện môi trường ít tiếng ồn.

3.3. Xây Dựng Từ Điển Phát Âm Tiếng Việt Cho Hệ Thống

Từ bộ từ vựng, từ điển phát âm được xây dựng theo kiểu gõ Telex. Ví dụ: A SO AS 0 sp, MUWOWI MUWOWIsp, ... (cho ứng dụng Quản lý chi tiêu cá nhân) và A Asp, CHISNH CHIS NHsp, ... (cho hệ thống Tra cứu HUFLIT).

IV. Xây Dựng Ngữ Pháp Cho Nhận Dạng Tiếng Nói Tiếng Việt

Mô hình ngôn ngữ cung cấp thông tin về cú pháp, ngữ nghĩa, trật tự từ của câu. Thành phần này giúp hệ thống lựa chọn kết quả nhận dạng tốt nhất trong danh sách các ứng viên chọn lọc được. Việc xây dựng mô hình ngôn ngữ bao gồm việc xác định văn phạm cho ngôn ngữ đó. Tính phức tạp của văn phạm phụ thuộc vào mức độ phức tạp của hệ thống cần nhận dạng. Cấu trúc văn phạm là một đồ thị có hướng tổng quát. Nó chứa các cấu trúc câu có thể có trong ngữ cảnh của ứng dụng.

4.1. Vai Trò Của Mô Hình Ngôn Ngữ Trong ASR Tiếng Việt

Mô hình ngôn ngữ giúp loại bỏ các kết quả nhận dạng sai bằng cách đánh giá khả năng xuất hiện của một chuỗi từ trong ngữ cảnh cụ thể. Ví dụ, trong câu "Tôi muốn mua một quyển sách", mô hình ngôn ngữ sẽ đánh giá cao khả năng xuất hiện của cụm từ "quyển sách" hơn là "quyển táo", do từ "sách" thường đi kèm với từ "quyển" hơn là từ "táo".

4.2. Các Phương Pháp Xây Dựng Văn Phạm Cho Nhận Dạng Tiếng Việt

Có nhiều phương pháp xây dựng văn phạm, từ đơn giản như sử dụng danh sách các câu lệnh có thể có, đến phức tạp như sử dụng các mô hình ngôn ngữ thống kê. Trong đề tài này, văn phạm được xây dựng dựa trên các quy tắc cú pháp đơn giản, phù hợp với phạm vi ứng dụng hạn chế. Tuy nhiên, các quy tắc này vẫn đủ để hệ thống hiểu được các câu lệnh cơ bản của người dùng.

V. Kết Quả Thử Nghiệm Đánh Giá Hệ Thống Nhận Dạng Tiếng Việt

Hệ thống được thử nghiệm trên cả hai ứng dụng: "Quản lý chi tiêu cá nhân" và "Tra cứu thông tin tuyển sinh Đại học HUFLIT". Kết quả cho thấy hệ thống hoạt động ổn định và đáp ứng được các yêu cầu đặt ra. Tuy nhiên, độ chính xác của hệ thống vẫn còn hạn chế, đặc biệt trong môi trường có nhiều tiếng ồn.

5.1. Đánh Giá Thành Phần Nhận Dạng Tiếng Nói

Thành phần nhận dạng tiếng nói đạt độ chính xác trên 85%. Tuy nhiên, độ chính xác này có thể giảm xuống khi sử dụng trong môi trường có nhiều tiếng ồn hoặc khi người dùng phát âm không rõ ràng. Cần có các giải pháp để cải thiện độ chính xác của thành phần này, chẳng hạn như sử dụng các thuật toán lọc tiếng ồn hoặc tăng cường dữ liệu huấn luyện.

5.2. Đánh Giá Thành Phần Xử Lý Ngôn Ngữ Tự Nhiên

Thành phần xử lý ngôn ngữ tự nhiên có khả năng phân tích cú pháp và ngữ nghĩa của câu lệnh tiếng Việt khá hiệu quả. Tuy nhiên, thành phần này vẫn còn hạn chế trong việc xử lý các câu lệnh phức tạp hoặc các câu lệnh có nhiều nghĩa. Cần có các giải pháp để cải thiện khả năng của thành phần này, chẳng hạn như sử dụng các mô hình ngôn ngữ phức tạp hơn hoặc tích hợp các kiến thức ngữ nghĩa.

VI. Kết Luận Hướng Phát Triển Hệ Thống Nhận Dạng Tiếng Việt

Đề tài đã xây dựng được một ứng dụng và một hệ thống có hệ nhận dạng và tổng hợp tiếng nói tiếng Việt hoàn chỉnh; xây dựng engine xử lý ngôn ngữ tự nhiên, tích hợp thành công vào ứng dụng; 01 bài báo được đăng trên tạp chí Quốc tế chuyên ngành [11]; 02 bài báo được trình bày tham dự Hội nghị quốc gia lần thứ VII "Nghiên cứu cơ bản và ứng dụng Công nghệ thông tin" - FAIR 2014; 01 bài báo cáo Nghiên cứu khoa học sinh viên dự Giải "Tài năng khoa học trẻ Việt Nam" cấp Bộ.

6.1. Các Kết Quả Đạt Được Trong Quá Trình Nghiên Cứu

Đề tài đã đạt được nhiều kết quả đáng khích lệ, bao gồm việc xây dựng thành công các thành phần quan trọng của hệ thống nhận dạng tiếng nói tiếng Việt và tích hợp chúng vào các ứng dụng thực tế. Các kết quả này là tiền đề quan trọng cho việc phát triển các ứng dụng giao tiếp người-máy bằng tiếng Việt trong tương lai.

6.2. Các Hạn Chế Của Hệ Thống Và Hướng Khắc Phục

Hệ thống vẫn còn một số hạn chế, chẳng hạn như độ chính xác chưa cao, khả năng xử lý các câu lệnh phức tạp còn hạn chế và khả năng hoạt động trong môi trường có nhiều tiếng ồn chưa tốt. Cần có các nghiên cứu tiếp theo để khắc phục các hạn chế này và nâng cao hiệu quả của hệ thống.

6.3. Hướng Phát Triển Tiềm Năng Trong Tương Lai

Hướng phát triển trong tương lai bao gồm: Cải thiện độ chính xác của hệ thống, Mở rộng phạm vi ứng dụng của hệ thống, Nghiên cứu các phương pháp xử lý tiếng ồn hiệu quả hơn, Tích hợp hệ thống với các ứng dụng khác.

25/05/2025

Bạn đang xem trước tài liệu:

Thử nghiệm việc việc nhận dạng tiếng nói tiếng việt với bộ từ vựng giới hạn

Tải đầy đủ

Trích đoạn nội dung tài liệu

vA DAo TAO. TRUONG DH NGOAI NGU - TIN HOC TP.HCM KHOA CONG NGH¥ THONG TIN --G1Wro-- KHOA LuAN • TOT NGHIEP • THU NGHIEM • VIEC • NHAN • DANG • TIENG NOI TIENG VIET• val DO• 1 TU VUNG • Glal HAN• GIANG VIEN HUONG DAN: ThS. TItAN KHAI THI¥N SINH VIEN THljC HI¥N: VAN THE Qu6c -10DH11133 TP. HO CHi MINH - 2014 LOICAMON 2 L01cAMON Xin chan thanh cam on thfty Trftn Khai Thi~n da t~n tinh huang dfin toi trong qua trinh hoan thanh dS tai.

NhUng bu6i trao d6i, nhUng kinh nghi~m cung nhfrng tai li~u cua thfty da giup toi co duQ'c nhUng dinh huang dung d~n va dua ra cac phuong phap t6t dBth\l'c hi~n dS tai. Xin gai lai cam on d~n cac thfty co trong Khoa Cong ngh~ thong tin, nhfrng nguai da diu d~t toi trong su6t 4 nam a DlilihQC. Xin cam on blilnbe va cac blilnsinh vien, nhUng nguai tinh nguy~n giup toi thu am dB hoan thanh dS tai. D~c bi~t, cac blilnnhom blilnNguySn Vti KiSu Anh va NguySn Phlilm Bao Nguyen h6 trQ'toi trong vi~c thu am dii li~u ti~ng noi va gop phftn hoan thi~n dS tai.

Va cu6i cung, nhung quan trQng nhat, xin cam on ba mtt va nhUng nguai than, nhfrng nguai ung hQ toi vS mQi m~t. Khong co S\l quan tam do, toi khong thB hoan thanh t6t dS tai nay. HeM, ngay 20 thang 06 nam 2014 Sinh vien th\lc hi~n Van Th~ Qu6c Ml)C Ll)C 3. LOI cAM ON 2 MlJ C L l) C 3 CHUON G 1 - TONG QU AN 5 1.1 Gi6'i thi~u t6ng quan 5 1 .2 M\lc tieu d~ tid 6 1.3 Y nghia cua d~ tai.4 NQi dung thl,1'chi~n 8 1.5 Phl;lmvi tim hi~u 8 1.6 Cac kSt qua dl;ltduqc cua d~ ffii.

9 CHUONG 2 - KIEN TRUC m THONG 10 CHUONG 3 - NH.NDANG TIENG NOI TIENG VIET 13 3.1 CO'sa Iy thuySt 13 3.2 Cac c6ng dOl;lnxay dl,l'ngbQ nh~n dl;lngtiSng n6i 14 3.3 ChuAn bi t~p dfr li~u hu~n luy~n ; 15 3.4 Xay dl,1'ngill di~n 17 • 3.5 Xay dl,1'ngvan phl;lm 18 CHUONG 4 - xV L Y NGON NGU TV NHIEN 19 4.1 C~u truc cu phap truy v~n : 19 4.1 D6i v6'i ung d\lng "Qmin Iy chi tieu ca nhan" 19 4.1 CU phap cau m~nh I~nh va truy v~n 19 3.2 Phan tich ngfr nghia cau m~nh I~nh va cau truy v~n 21 4.2 Phan dch ngfr nghia ngfr d\lng 23 4.3 Chuy~n thanh cau I~nh SQL d~ tuong tac v6"iCO'sO-dfr li~u 24 4.2 D6i v6"ih~ th6ng "Tra cu.u thOng tin tuy~n sinh Dl;lihoc HUFLIT" 24 4.1 C~u truc cu phap truy v~n 24 4.2 Phan tich ngii' nghia cau I~nh 24 4.3 Chuy~n thanh cau I~nh SQL d~ tuong tac v6"iCO'sO-dfr li~u 26 CHUONG 5 - THlr NGHIEM vA DANH GIA 27 MVCLVC 4 5.1 Thanh ph fin Nh~n dl;lngti@ngn6i 27 5.1 Doi v&i ung dl;lng "Qmln Iy chi tieu ca nhan" 27 5.2 D6i v&i h~ th6ng "Tra cUu thong tin tuy8n sinh Dl;lihQc HUFLIT" 28 5.2 Thanh phfin Xu Iy ngon ngfr tt,r nhien 30 5 ., ung d I;Ing"Q' uan I'y c h"I heu ca'hn an .2 D6i v&i h~ th6ng "Tra cuu thOng tin tuy8n sinh Dl;lihQc HUFLIT" 30 5.3 Toan bQ h~ th6ng 30 5.1 D6i v&i ung dl;lng "QUlln Iy chi tieu ca nhan" 31 5.2 D6i v&i h~ th6ng "Tra cuu thong tin tuy8n sinh Dl;lihQc HUFLIT" 31 5.4 So sanh v&i nhfrng each ti@pc~n khac 31 CWONG 6 - KET LUAN' vA WONG pRAT TRIEN 32 6.1 KSt qua dl;ltduQ'c 32 6.2 Nhfrng hl;lnch@ 32 6.3 Huang phat tri8n 32 TAl LIJ;.U THAM KHAo 34 TiSng Vi~t 34 Ti@ngAnh 34 PHl) L1)C 1 35 PHl) L1)C 2 38 PHl) L1)C 3 42 PHl) L1)C 4 44 PHl) L1)C 5 50 PHl) L1)C 6 51 PHl) L1)C 7 56 CHUONG 1 - TONG QUAN 5 CHUONG 1 - TONG QUAN 1.1 GiOi thi~u tAng quan Nh?n d,;mgti~ng noi dong vai tro quan trQng trong giao ti~p gifra ngum va may tinh. Giup may tinh hiSu va thlJC hi~n hi~u l~nh clla con nguai va con nguai nh?n phan h6i tu may tinh nhanh han phuang phap truySn th6ng. f)S tai tim hiSu "THU NGHIEM VIEe NHAN DANG TIENG NOI. TIENG VI]J:TVal B() TIT yVNG Glal IL;.N" nh~m nh?n d~ng cac diu l~nh b~ng ti~ng noi ti~ng Vi~t clla nguai dung va chuySn thanh d~ng van ban dS may tinh co thS hiSu va th\l'C thi.

f)S C\l thS hoa, toi xay dlJng ling d\lng "Qmin ly chi tieu ca nhan" va h~ th6ng "Tra cuu thong tin tuy~n sinh f)~i hQc HUFLIT". Y tuemg vS xay d1Jllgcac h~ th6ng nh?n d~ng ti~ng noi da: co tu nhfrng nam 50 clla th~ ky 20 va d~n nay da: d~t du9'c nhiSu k~t qua dang kS. d Vi~t Nam n6i b?t la nhom nghien CUu f)~i hQc Khoa hQc tlJ nhien thanh ph6 H6 Chi Minh do PGS. Vli Hai Quan dUng dau.

Cac nghien CUuClla nhom t?P trung vaG bai toan truy v~n thong tin cho ban tin thai SlJti~ng Vi~t. Nhom da: th\l'c hi~n dS tai c~p qu6c gia vai bai toan khai thac thong tin da phuang ti~n huang ngfr nghla. Ngoai ra, nhom cling du9'c tai tr9' tu ngu6n clla d~i hQc Qu6c Gia thanh ph6 H6 Chi Minh dS nghien cUu vS h~ th6ng t6ng hqp ti~ng noi ti~ng Vi~t. Lien t\lC trong 10 nam qua, nhom da: xay d1Jllg thanh cong nhiSu h~ th6ng nhu: - H~ th6ng nh?n d~ng ti~ng noi ti~ng Vi~t lien t\lC, bQ tu v1Jllg khong h~n ch~.

- H~ th6ng t6ng hqp ti~ng noi ti~ng Vi~t dlJa tren ghep n6i. Cac h~ th6ng nay co k~t qua nh?n d~ng kha cao, d~t gan 95%; ti~ng noi t6ng hqp cling kha tv nhien. Trong do, nhom nghien CUuda: xay d1Jllg thanh cong mQt h~ th6ng voice server hoan chinh vai k~t qua nh?n d~ng d~n 93.1 70/0, t~o nSn tang cho vi~c phM triSn cac ung d\lng ti~ng noi nhu h~ th6ng hoi dap tlJ dQng, h~ thu tho~i. [2] Co 3 huang ti~p c?n chinh cho nh?n d~ng ti~ng noi [1]: CHUONG 1 - TONG QUAN 6 Ti~p c~n Am h9C: Huang ti~p c~n nay d\Ia vao cac d~c diSm am hQc duQ'c rut ra duQ'c til ph6 am thanh.

Tuy nhien k~t qua cua huang ti~p c~n nay. con thfip vi trong th\Ic t~, cac d~c trung am hQc co S\I bi~n dQng rfit Ian. Hon nfra phuong phap nay doi hoi tri thuc rfit d~y du vS am hQc (v 6n tri thuc am hQc hi~n nay chua thS dap trng). - Ti~p c~n Nh(in dr;zngmJu th6ng ke: SU d\lng cac phuong phap may hQc d\Ia tren th6ng ke dS hQc va rut ra m~u tham khao til luqng dfr li~u Ian.

Huang nay dang duQ'c su d\lng nhiSu, chu y~u la d\Ia vao Mo hinh Markov ftn (HMM). - Ti~p c~n Tri tU? nhdn tr;zo:la huang k~t hqp cua ca hai huang tren. Phuong phap nay k~t hqp duQ'c ca tri thuc cua chuyen gia va phuong phap m~u th6ng ke. Day se la huang ti~p c~n tuong lai cua nh~n d:~mgti~ng noi.

Trong dS tai nay, chung toi t~p trung chu y~u vao vi~c xay d\Illg bQ nh~n d:~mg ti~ng noi ti~ng Vi~t theo huang ti~p c~n Nhijn d(lng mau thang ke.2 M\lc tieu d~ tiii - Tim hiSu vi~c Nh~n d~ng ti~ng noi, cac buac hufin luy~n, xay d\Illg bQ nh~n dejmgti~ng noi theo mo hinh Hidden Markov. - Tim hiSu vi~c Xu ly ngon ngfr tv nhien vao dS tai dS ph\lc Y\l cho giai do~n h~u xu ly sau khi da:Nh~n d~ng ti~ng noi Tich hqp cac thanh ph~n Nh~n d~ng ti~ng noi, Xu ly ngon ngfr t\I nhien va T6ng hqp ti~ng noi vao thanh mQt trng d\lng, h~ th6ng giao ti~p ti~ng noi hoan chinh. Va C\lthS hoa k~t qua tim hiSu qua trng d\lng "Qmin If chi tieu ca nhin" va h~ th6ng "Tra cuu thong tin tuy~n sinh D~i hQcHUFLIT". 0'ng d\lng "Qmin If chi tieu ca nhin" dap trng cac m\lc tieu sau: - Nh~n d~ng duQ'cti~ng noi cua nhiSu nguai dung vai dQ chinh xac cao.

Co cO"ch~ xu ly ngon ngfr t\I nhien (phan tich cu phap va ngfr nghia cau l~nh) hi~u qua. Th\Ic thi cac l~nh truy xufit CO"sa dfr li~u tU nguai dung. Xufit k~t qua thanh am thanh. CHVONG 1 - TONG QUAN 7 H~ th5ng "Tra CtfU tuy~n sinh D~i hQc HUFLIT" dap ling cac m\lc tieu sau: - Nguai dung giao tiSp vai h~ th5ng b&ng tiSng noi thong qua di~n tho~i.

H~ th5ng co kha nang nh?n d~ng tiSng noi, xu ly ngon ngfr va phfm h6i cho nguai dung.3 Y nghia cua d~ tili Tinh mO'i eua a~fiJi Theo hiSu biSt clla tac gia, day la h~ th5ng d&utien t~i Vi~t Nam duQ'c trang bi mQt co chS xu ly ngon ngfr t\1'nhien (phan tich cu phap va ngfr nghla cau l~nh) hi~u qua vao ling d\lng tiSng noi, giup cho h~ th5ng tra nen thong minh va linh ho~t han. Y nghla eua a~fiJi • Y nghla khoa hQc VS khoa hQc, dS tai cling rna ra mQt huang phat triSn mai trong vi~c nghien Clm, xay d\lllg cac h~ th5ng hoi dap co thS hiSu va giao tiSp b&ng tiSng noi tiSng Vi~t v6i nguai dung b&ng vi~c tich hQ'P xu ly ngon ngfr t\f nhien trong cac ling d\lng tiSng noi. • Y nghla th\1'cti~n KSt qua dS tai hoan toan co thS ap d\lng trong nhiSu IInh V\fC,d~c bi~t la: o Trong giao d\lc - dao t~o: Lam giam cong vi~c cho bQ ph?n tuySn sinh Clla truang d~i hQc va cling giup cho ph\l huynh va cac em hQc sinh lap 12 co thS tim hiSu, l\fa chQn duQ'c nganh nghS va truang phu hQ'Pvai minh trong tuang lai. KSt qua clla nghien Clm nay la co So' dS toi ap d\lng vao vi~c phat triSn cac ling d\lng tuang t\f nhu tra Clm thong tin hQc V\l, tra Clm diSm thi t~i cac truang hQc b&ng tiSng noi.

o Trong kinh tS - xa hQi: KSt qua Clla nghien Clm nay cling co thS giup cho vi~c xay d\lllg cac ling dVng tuang t\f ph\lc V\l cho cac t6 chuc, doanh nghi~p, giup giam thiSu nhan h,rc, tv dQng hoa qua trinh nghi~p V\l nhu h~ tra Clm thong tin tai khoan ngan hang b&ng tiSng noi, tra Clm tuySn xe buyt b&ngtiSng noi. CHVdNG 1 - TONG QUAN 8 1.4 NQi dung th,!c hi~n - Nghien Clm su d\lng cong ngh~ va cong C\l rna ngu6n rna HTK dS nh~n d~;mgti~ng noi. - Nghien Clm cac v~n d~ v~ phan tich cu phap va mo hinh biSu di~n ngfr nghia cho cac cau truy v~n ti~ng Vi~t. Ti~p c~n phuong phap phan tich cu phap va ngfr nghia cau l~nh ti~ng Vi~t vai DCG (Definite Clause Grammar) [5].

- Nghien Clm xay d\ffig mo hinh va tich hqp h~ th6ng. Duai day 1abang 1i~tke chi ti~t cac cong vi~c da th\1'chi~n: STT Cong vicc Ghi chu 1 Tim hieu phuong phap Nh~n d:;mg tieng noi va cach su d\lng cong C\lHTK '.

Nội dung được bảo vệ bản quyền — Tải xuống đầy đủ

Tài liệu "Nghiên cứu và Phát triển Hệ thống Nhận dạng Tiếng Nói Tiếng Việt" cung cấp cái nhìn sâu sắc về công nghệ nhận dạng tiếng nói, đặc biệt là trong ngữ cảnh tiếng Việt. Nghiên cứu này không chỉ phân tích các phương pháp hiện có mà còn đề xuất các giải pháp cải tiến, giúp nâng cao độ chính xác và hiệu suất của hệ thống. Độc giả sẽ tìm thấy những lợi ích rõ ràng từ việc áp dụng công nghệ này trong nhiều lĩnh vực như giáo dục, dịch vụ khách hàng và truyền thông.

Để mở rộng thêm kiến thức về lĩnh vực này, bạn có thể tham khảo tài liệu Khóa luận tốt nghiệp khoa học máy tính đánh giá kiến trúc transformer cho bài toán nhận diện văn bản tiếng việt trong ảnh. Tài liệu này sẽ giúp bạn hiểu rõ hơn về các kiến trúc hiện đại trong nhận diện văn bản, từ đó có thể áp dụng vào các hệ thống nhận dạng tiếng nói. Mỗi liên kết là một cơ hội để bạn khám phá sâu hơn về công nghệ và ứng dụng của nó trong thực tiễn.

#xử lý ngôn ngữ tự nhiên

#công nghệ nhận diện giọng nói

#tiếng Việt trong AI

#ứng dụng AI trong ngôn ngữ

#hệ thống nhận dạng tiếng nói

#Phát triển phần mềm tiếng nói

Chủ đề

Ứng dụng của AI trong ngôn ngữ

Công nghệ nhận dạng tiếng nói hiện đại

Thách thức trong nhận diện tiếng Việt

Phát triển hệ thống AI cho tiếng Việt