Luận văn thạc sĩ nhận dạng thực thể tên cho ngôn ngữ nói tiếng việt và ứng dụng trong tương tác với điện thoại thông minh 04

Luận văn thạc sĩ nghiên cứu nhận dạng thực thể tên trong ngôn ngữ tiếng Việt và ứng dụng cho tương tác trên điện thoại thông minh.

Trường đại học

Đại học Quốc gia Hà Nội

Chuyên ngành

Công nghệ thông tin

Người đăng

Ẩn danh

Thể loại

luận văn thạc sĩ

2015

Phí lưu trữ

30 Point

Mục lục chi tiết

LỜI CAM ĐOAN

1. MỞ ĐẦU

2. CHƯƠNG 1: NHẬN DẠNG TIẾNG NÓI VÀ NHẬN DẠNG THỰC THỂ TÊN CHO NGÔN NGỮ NÓI

1.1. Sự phát triển và ứng dụng của công nghệ nhận dạng tiếng nói

1.2. Nhận dạng thực thể tên

1.2.1. Tại sao cần nhận dạng thực thể tên?

1.2.2. Định nghĩa thực thể tên và nhận dạng thực thể tên

3. CHƯƠNG 2: PHƯƠNG PHÁP NGHIÊN CỨU VÀ CƠ SỞ LÝ THUYẾT

2.1. Các phương pháp điển hình trong nhận dạng thực thể tên

2.2. Cơ sở lý thuyết mô hình học máy

2.2.1. Cực đại hóa Entropy (Maximum Entropy)

2.2.2. Trường điều kiện ngẫu nhiên (Conditional Random Fields)

2.3. Các phương pháp đánh giá hệ thống nhận dạng thực thể tên

2.4. Một số nghiên cứu liên quan

4. CHƯƠNG 3: HỆ THỐNG TRỢ LÝ ẢO VÀ MÔ HÌNH NHẬN DẠNG THỰC THỂ TÊN

3.1. Tổng thể hệ thống trợ lý ảo cho người dùng

3.2. Mô hình hóa bài toán nhận dạng thực thể tên

3.2.1. Xây dựng tập dữ liệu huấn luyện

3.2.2. Xây dựng mô hình dựa trên phương pháp học máy

3.2.2.1. Xây dựng mô hình cực đại hóa Entropy

3.2.2.2. Lựa chọn thuộc tính

3.2.2.3. Huấn luyện mô hình

3.2.3. Các tham số huấn luyện khi sử dụng mô hình MaxEnt

3.2.4. Các tham số huấn luyện khi sử dụng mô hình CRFs

5. CHƯƠNG 4: THỰC NGHIỆM VÀ ĐÁNH GIÁ MÔ HÌNH NHẬN DẠNG THỰC THỂ TÊN

4.1. Dữ liệu thực nghiệm và cài đặt

4.2. Kết quả thực nghiệm và phân tích

4.2.1. Kết quả thực nghiệm sử dụng MaxEnt

4.2.2. Kết quả thực nghiệm sử dụng CRFs

4.3. Kết quả ứng dụng mô hình nhận dạng thực thể tên cho ngôn ngữ nói tiếng Việt trên điện thoại thông minh chạy hệ điều hành Android

6. CHƯƠNG 5: KẾT QUẢ VÀ HƯỚNG PHÁT TRIỂN NGHIÊN CỨU

5.1. Những vấn đề giải quyết được trong luận văn này

5.2. Công việc nghiên cứu trong tương lai

DANH MỤC CÔNG TRÌNH KHOA HỌC CỦA TÁC GIẢ LIÊN QUAN ĐẾN LUẬN VĂN

TÀI LIỆU THAM KHẢO

Tóm tắt

I. Nhận dạng thực thể tên và ứng dụng trong tương tác điện thoại thông minh

Nhận dạng thực thể tên (nhận dạng thực thể tên) là một lĩnh vực quan trọng trong xử lý ngôn ngữ tự nhiên, đặc biệt trong ngữ cảnh tiếng Việt. Công nghệ này cho phép máy tính nhận diện và phân loại các thực thể như tên người, địa điểm, tổ chức trong văn bản. Việc áp dụng nhận dạng thực thể tên trong tương tác với điện thoại thông minh mang lại nhiều lợi ích, giúp người dùng dễ dàng tìm kiếm thông tin và thực hiện các tác vụ qua giọng nói. Các ứng dụng như Siri, Google Now đã chứng minh tính khả thi của công nghệ này trong việc cải thiện trải nghiệm người dùng. Đặc biệt, trong bối cảnh tiếng Việt, việc nhận diện chính xác các thực thể tên là một thách thức lớn do ngữ pháp và cấu trúc câu không giống như tiếng Anh.

1.1. Tại sao cần nhận dạng thực thể tên

Trong thời đại thông tin hiện nay, lượng dữ liệu khổng lồ được tạo ra hàng ngày. Việc xử lý và trích xuất thông tin hữu ích từ khối lượng dữ liệu này là một thách thức lớn. Nhận dạng thực thể tên giúp biến đổi dữ liệu không có cấu trúc thành dữ liệu có cấu trúc, từ đó dễ dàng hơn trong việc tìm kiếm và truy cập thông tin. Kỹ thuật này không chỉ hỗ trợ trong việc tìm kiếm thông tin mà còn giúp cải thiện khả năng hiểu biết của máy tính về ngôn ngữ tự nhiên. Việc áp dụng nhận dạng thực thể tên trong các ứng dụng di động giúp người dùng tương tác một cách tự nhiên và hiệu quả hơn với thiết bị của mình.

1.2. Khó khăn trong nhận dạng thực thể tên tiếng Việt

Nhận dạng thực thể tên trong tiếng Việt gặp nhiều khó khăn do đặc thù ngôn ngữ. Các câu trong ngôn ngữ nói thường ngắn gọn, không có dấu câu và chữ hoa, điều này làm cho việc phân tích ngữ nghĩa trở nên phức tạp. Hơn nữa, các từ có thể bị viết tắt hoặc biến đổi, gây khó khăn trong việc nhận diện chính xác. Những thách thức này đòi hỏi các phương pháp và công nghệ tiên tiến để cải thiện độ chính xác của nhận dạng thực thể tên trong tiếng Việt, từ đó nâng cao hiệu quả của các ứng dụng tương tác điện thoại thông minh.

II. Công nghệ nhận dạng thực thể tên

Công nghệ nhận dạng thực thể tên đã phát triển mạnh mẽ trong những năm gần đây, nhờ vào sự tiến bộ của các phương pháp học máy và trí tuệ nhân tạo. Các mô hình như Maximum Entropy và Conditional Random Fields đã được áp dụng để cải thiện độ chính xác trong việc nhận diện thực thể. Việc sử dụng các kỹ thuật này cho phép hệ thống học hỏi từ dữ liệu huấn luyện và tối ưu hóa quá trình nhận diện. Đặc biệt, trong ngữ cảnh tiếng Việt, việc xây dựng tập dữ liệu huấn luyện phong phú và đa dạng là rất quan trọng để đạt được kết quả tốt nhất.

2.1. Các phương pháp nhận dạng thực thể tên

Các phương pháp như Maximum Entropy (MaxEnt) và Conditional Random Fields (CRFs) đã được chứng minh là hiệu quả trong việc nhận dạng thực thể tên. MaxEnt sử dụng nguyên lý tối đa hóa entropy để xác định xác suất của các thực thể, trong khi CRFs cho phép mô hình hóa mối quan hệ giữa các thực thể trong một chuỗi. Việc áp dụng các phương pháp này trong tiếng Việt giúp cải thiện độ chính xác và khả năng nhận diện các thực thể tên trong ngữ cảnh giao tiếp tự nhiên.

2.2. Đánh giá hiệu quả của mô hình

Để đánh giá hiệu quả của các mô hình nhận dạng thực thể tên, các chỉ số như độ chính xác, độ hồi tưởng và độ đo F1 thường được sử dụng. Việc thực hiện đánh giá chéo (k-fold cross-validation) giúp đảm bảo tính khách quan và độ tin cậy của kết quả. Các nghiên cứu cho thấy rằng việc áp dụng các phương pháp học máy hiện đại có thể đạt được độ đo F1 cao, cho thấy tiềm năng lớn của công nghệ này trong việc cải thiện trải nghiệm người dùng trên các thiết bị thông minh.

25/01/2025

Bạn đang xem trước tài liệu:

Luận văn thạc sĩ nhận dạng thực thể tên cho ngôn ngữ nói tiếng việt và ứng dụng trong tương tác với điện thoại thông minh 04

Tải đầy đủ

Nội dung chính

Tổng quan nghiên cứu

Trong bối cảnh công nghệ nhận dạng tiếng nói tự động (Automatic Speech Recognition – ASR) phát triển mạnh mẽ, việc sử dụng ngôn ngữ tự nhiên để tương tác với các thiết bị thông minh như điện thoại thông minh (ĐTTM) ngày càng phổ biến. Theo ước tính, các ứng dụng trợ lý ảo như Siri, Cortana, Google Now đã trở thành công cụ hỗ trợ quan trọng trong giao tiếp giữa người dùng và thiết bị. Tuy nhiên, để hiểu được ngôn ngữ nói, đặc biệt là trong tiếng Việt, việc nhận dạng thực thể tên (Named Entity Recognition – NER) cho văn bản ngôn ngữ nói vẫn còn nhiều thách thức do đặc điểm ngôn ngữ và dữ liệu đầu vào.

Mục tiêu nghiên cứu của luận văn là xây dựng mô hình nhận dạng thực thể tên cho ngôn ngữ nói tiếng Việt, ứng dụng trong tương tác với ĐTTM, nhằm nâng cao hiệu quả hiểu và xử lý ngôn ngữ tự nhiên trong các ứng dụng trợ lý ảo. Phạm vi nghiên cứu tập trung vào dữ liệu thu thập từ các câu lệnh giao tiếp giữa người dùng và ĐTTM chạy hệ điều hành Android, với tập dữ liệu gồm khoảng 4409 câu nói tự nhiên. Ý nghĩa của nghiên cứu được thể hiện qua việc cải thiện độ chính xác nhận dạng thực thể tên, giúp tăng cường khả năng hiểu và phản hồi chính xác các yêu cầu của người dùng, từ đó nâng cao trải nghiệm tương tác giọng nói trên thiết bị di động.

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Luận văn dựa trên hai mô hình học máy chủ đạo trong xử lý ngôn ngữ tự nhiên:

Mô hình Cực đại hóa Entropy (Maximum Entropy – MaxEnt): Đây là mô hình thống kê linh hoạt, cho phép xây dựng phân phối xác suất có điều kiện dựa trên các thuộc tính quan sát được từ dữ liệu. MaxEnt được lựa chọn vì khả năng xử lý dữ liệu thưa, mã hóa nhiều thuộc tính chồng chéo và hiệu suất huấn luyện nhanh, phù hợp với môi trường ĐTTM.
Mô hình Trường điều kiện ngẫu nhiên (Conditional Random Fields – CRFs): Là mô hình đồ thị vô hướng, dùng để gán nhãn chuỗi dữ liệu, có khả năng mã hóa phụ thuộc tuần tự giữa các vị trí trong chuỗi. CRFs được sử dụng để đánh giá khách quan kết quả mô hình MaxEnt.

Các khái niệm chính bao gồm: thực thể tên (như tên người, địa điểm, thời gian, số điện thoại, địa chỉ email), thuộc tính ngữ cảnh (n-grams, biểu thức chính quy, từ điển), và phương pháp đánh giá (độ chính xác, độ hồi tưởng, độ đo F1).

Phương pháp nghiên cứu

Nguồn dữ liệu chính là tập 4409 câu nói tự nhiên thu thập từ tương tác người dùng với ĐTTM chạy Android, bao gồm 16 tính năng phổ biến như đặt báo thức, gọi điện, tìm đường, mở ứng dụng, hỏi thời tiết, gửi email, v.v. Dữ liệu được chú thích thực thể tên theo định dạng IOB2 với 8 loại thực thể chính: datetime, location, url, cnumber (số điện thoại), cname (tên danh bạ), aname (tên ứng dụng), email, number.

Phương pháp phân tích sử dụng mô hình MaxEnt để huấn luyện và dự đoán nhãn thực thể tên, kết hợp với các thuộc tính phong phú như n-grams, biểu thức chính quy, từ điển chuyên biệt cho từng loại thực thể. Mô hình được huấn luyện bằng thuật toán tối ưu L-BFGS nhằm cực đại hóa hàm log-likelihood. Để đánh giá, sử dụng kỹ thuật kiểm tra đánh giá chéo k-fold (k=4) nhằm đảm bảo tính khách quan và ổn định của kết quả.

Timeline nghiên cứu bao gồm: xây dựng tập dữ liệu và từ điển (6 tháng), thiết kế và huấn luyện mô hình (4 tháng), thực nghiệm và đánh giá (3 tháng), hoàn thiện luận văn và ứng dụng (3 tháng).

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

Hiệu suất mô hình MaxEnt: Mô hình đạt độ đo F1 trung bình 94.88% trên 4 lần kiểm tra đánh giá chéo, cho thấy khả năng nhận dạng thực thể tên chính xác cao trong văn bản ngôn ngữ nói tiếng Việt.
Phân bố thực thể tên: Trong tập dữ liệu, thực thể tên ứng dụng (aname) chiếm 30%, vị trí địa lý (location) chiếm 22%, thời gian (datetime) chiếm 15%, số (number) chiếm 11%, tên danh bạ (cname) chiếm 9%, địa chỉ website (url) chiếm 6%, số điện thoại (cnumber) chiếm 5%, email chiếm 2%.
So sánh MaxEnt và CRFs: Kết quả đánh giá bằng CRFs tương đồng với MaxEnt, khẳng định tính ổn định và độ tin cậy của mô hình MaxEnt trong môi trường ĐTTM.
Tác động của thuộc tính: Việc kết hợp các thuộc tính như n-grams, biểu thức chính quy và từ điển chuyên biệt giúp tăng độ chính xác nhận dạng, đặc biệt trong các thực thể phức tạp như địa chỉ website và số điện thoại.

Thảo luận kết quả

Nguyên nhân của hiệu suất cao đến từ việc mô hình MaxEnt không phụ thuộc vào tách từ hay thông tin từ loại ngữ pháp, giúp giảm thiểu sai số do đặc thù văn bản ngôn ngữ nói thiếu dấu câu, chữ hoa và cấu trúc ngữ pháp không chặt chẽ. Việc sử dụng các bộ từ điển phong phú và biểu thức chính quy giúp mô hình nhận dạng chính xác các thực thể tên đặc thù như địa chỉ email, website, số điện thoại.

So với các nghiên cứu trước đây tập trung vào văn bản viết hoặc ngôn ngữ nói tiếng Anh, tiếng Trung, mô hình này là một trong những nghiên cứu đầu tiên và có kết quả khả quan cho ngôn ngữ nói tiếng Việt. Kết quả có thể được trình bày qua biểu đồ phân bố tỷ lệ các loại thực thể và bảng so sánh độ đo F1 giữa MaxEnt và CRFs.

Ý nghĩa của kết quả là mở ra hướng phát triển các ứng dụng trợ lý ảo tiếng Việt trên ĐTTM, giúp nâng cao khả năng hiểu và phản hồi chính xác các yêu cầu người dùng bằng giọng nói.

Đề xuất và khuyến nghị

Phát triển bộ dữ liệu mở rộng: Tiếp tục thu thập và chú thích thêm dữ liệu ngôn ngữ nói đa dạng về vùng miền, cách diễn đạt để tăng tính bao phủ và độ chính xác mô hình. Thời gian thực hiện: 12 tháng, chủ thể: nhóm nghiên cứu và cộng đồng học thuật.
Tối ưu hóa mô hình cho thiết bị di động: Nghiên cứu các kỹ thuật giảm kích thước mô hình, tăng tốc độ suy luận để phù hợp hơn với giới hạn tài nguyên của ĐTTM. Thời gian: 6 tháng, chủ thể: nhóm phát triển phần mềm.
Mở rộng ứng dụng nhận dạng thực thể tên: Áp dụng mô hình vào các lĩnh vực khác như trợ lý ảo trong y tế, giáo dục, dịch vụ khách hàng để nâng cao tính ứng dụng thực tiễn. Thời gian: 9 tháng, chủ thể: doanh nghiệp công nghệ và viện nghiên cứu.
Tích hợp đa mô hình: Kết hợp MaxEnt với các mô hình học sâu (deep learning) để cải thiện khả năng nhận dạng trong các trường hợp phức tạp, đồng thời duy trì hiệu suất trên thiết bị di động. Thời gian: 12 tháng, chủ thể: nhóm nghiên cứu AI.

Đối tượng nên tham khảo luận văn

Nhà nghiên cứu và sinh viên ngành Công nghệ Thông tin, Xử lý Ngôn ngữ Tự nhiên: Luận văn cung cấp cơ sở lý thuyết, phương pháp và dữ liệu thực nghiệm quý giá cho các nghiên cứu về nhận dạng thực thể tên và hiểu ngôn ngữ nói tiếng Việt.
Phát triển phần mềm trợ lý ảo và ứng dụng di động: Các nhà phát triển có thể áp dụng mô hình và kỹ thuật trong luận văn để xây dựng các ứng dụng tương tác giọng nói hiệu quả trên ĐTTM.
Doanh nghiệp công nghệ và viễn thông: Nghiên cứu giúp cải thiện các dịch vụ hỗ trợ khách hàng qua giọng nói, tăng cường trải nghiệm người dùng trong các sản phẩm thông minh.
Cơ quan quản lý và tổ chức đào tạo: Tham khảo để định hướng phát triển nguồn nhân lực và chính sách hỗ trợ nghiên cứu ứng dụng công nghệ nhận dạng tiếng nói và xử lý ngôn ngữ tự nhiên.

Câu hỏi thường gặp

Nhận dạng thực thể tên là gì và tại sao quan trọng?
Nhận dạng thực thể tên là quá trình xác định và phân loại các từ hoặc cụm từ có ý nghĩa đặc biệt như tên người, địa điểm, thời gian trong văn bản. Nó giúp máy tính hiểu và xử lý ngôn ngữ tự nhiên hiệu quả hơn, phục vụ cho các ứng dụng như trợ lý ảo, tìm kiếm thông tin.
Khó khăn chính khi nhận dạng thực thể tên cho ngôn ngữ nói tiếng Việt là gì?
Văn bản ngôn ngữ nói thiếu dấu câu, chữ hoa, cấu trúc ngữ pháp không chặt chẽ, cùng với sai sót từ công nghệ nhận dạng tiếng nói tự động (ASR) tạo ra nhiều thách thức trong việc nhận dạng chính xác các thực thể tên.
Tại sao mô hình MaxEnt được chọn thay vì các mô hình khác?
MaxEnt phù hợp với dữ liệu thưa, cho phép mã hóa nhiều thuộc tính phong phú, huấn luyện nhanh và mô hình nhỏ gọn, thích hợp cho thiết bị di động, đồng thời đạt hiệu suất cao trong nhận dạng thực thể tên.
Dữ liệu huấn luyện được xây dựng như thế nào?
Tập dữ liệu gồm khoảng 4409 câu nói tự nhiên, được thu thập từ các tương tác thực tế với ĐTTM chạy Android, chú thích 8 loại thực thể tên theo định dạng IOB2, bao phủ 16 tính năng phổ biến của điện thoại.
Mô hình có thể ứng dụng thực tế ra sao?
Mô hình được tích hợp trong phần mềm trợ lý ảo VAV, giúp nhận dạng chính xác các đối số trong câu lệnh người dùng như thời gian, địa điểm, tên ứng dụng, số điện thoại, từ đó thực thi các tác vụ như gọi điện, đặt báo thức, tìm đường đi một cách hiệu quả.

Kết luận

Luận văn đã xây dựng thành công mô hình nhận dạng thực thể tên cho ngôn ngữ nói tiếng Việt với độ đo F1 đạt 94.88%, mở ra hướng nghiên cứu mới trong lĩnh vực xử lý ngôn ngữ tự nhiên tiếng Việt.
Mô hình MaxEnt được lựa chọn nhờ khả năng xử lý dữ liệu thưa, hiệu suất cao và phù hợp với môi trường ĐTTM.
Tập dữ liệu gồm 4409 câu nói tự nhiên, chú thích 8 loại thực thể tên, phản ánh đa dạng các tình huống tương tác thực tế.
Kết quả thực nghiệm được đánh giá khách quan bằng phương pháp kiểm tra chéo và so sánh với mô hình CRFs.
Đề xuất mở rộng dữ liệu, tối ưu mô hình và ứng dụng đa lĩnh vực nhằm nâng cao hiệu quả và phạm vi ứng dụng trong tương lai.

Khuyến khích các nhà nghiên cứu và phát triển phần mềm ứng dụng mô hình vào các sản phẩm trợ lý ảo tiếng Việt, đồng thời tiếp tục mở rộng nghiên cứu để nâng cao độ chính xác và khả năng ứng dụng thực tế.

Trích đoạn nội dung tài liệu

Chương 1 trình bày tổng quan về sự phát triển vượt trội của công nghệ nhận dạng tiếng nói trong một vài năm trở lại đây và những ứng dụng của nó trong thế giới công nghệ hiện nay. Ở chương này cũng trình bày về nhận dạng thực thể tên trong văn bản viết thông thường và trong văn bản ngôn ngữ nói cũng như định nghĩa thế nào là nhận dạng thực thể tên, nêu một số khó khăn thách thức đặc thù của dữ liệu và bài toán nhận dạng thực thể tên cho ngôn ngữ nói tiếng Việt. Chương này cũng đề cập tới việc tại sao cần nhận dạng thực thể tên, nêu bật được ý nghĩa của bài toán nhận dạng thực thể tên cho ngôn ngữ nói tiếng Việt. Chương 2 trình bày khái quát một số phương pháp điển hình đã được áp dụng trong bài toán nhận dạng thực thể tên và một số kiến thức cơ bản trong việc đánh giá kết quả của hệ thống nhận dạng thực thể tên, một số hướng tiếp cận, kỹ thuật tối ưu trong việc ước lượng tham số mô hình học máy, từ đó tìm hiểu chi tiết cơ sở lý thuyết mô hình học máy Cực đại hóa Entropy (Maximum Entropy) và Trường điều kiện ngẫu nhiên (Conditional Random Fields).

Trên cơ sở bài toán và lý thuyết đi tìm hiểu những nghiên cứu có liên quan cả trong văn bản viết thông thường và ngôn ngữ nói đối với bài toán nhận dạng thực thể tên cho ngôn ngữ nói tiếng Việt. Chương 3 trình bày sơ lược về tổng thể hệ thống trợ lý ảo cho người dùng tương tác với điện thoại thông minh bằng ngôn ngữ nói của con người và mô tả rõ cách tích hợp thành phần nhận dạng thực thể tên cho văn bản ngôn ngữ nói trong hệ thống VAV. Tại chương này cũng trình bày chi tiết về cách giải quyết bài toán nhận dạng thực thể tên cho ngôn ngữ nói tiếng Việt sử dụng phương pháp học máy Cực đại hóa Entropy (Maximum Entropy - MaxEnt) do Berger cùng các cộng sự giới thiệu lần đầu vào những năm 1996. Đây cũng là chương chính trình bày cụ thể mô hình hóa bài toán và các bước thực hiện bài toán, kỹ thuật lựa chọn thuộc tính, huấn luyện mô hình dựa trên tập dữ liệu mẫu có nội dung giao tiếp, tương tác giữa người sử dụng và điện thoại thông minh qua ngôn ngữ nói tiếng Việt, nhấn mạnh việc chọn sử dụng phương pháp MaxEnt huấn luyện mô hình ứng dụng trên ĐTTM và các chiến lược trích chọn thuộc tính hiệu quả nhất với bài toán đã đề ra.

Bên cạnh đó cũng đưa ra thêm một cách đánh giá nữa sử dụng phương pháp Trường điều kiện ngẫu nhiên (Conditional Random Fields –CRFs) do Lafferty cùng các cộng sự giới thiệu năm 2001 nhằm đánh giá kết quả mô hình nhận dạng thực thể tên cho ngôn ngữ nói được khách quan hơn. Chương 4 trình bày các kết quả thực nghiệm cụ thể, một cách chi tiết và cẩn thận cho cả hai phương pháp MaxEnt và CRFs, phân tích và đánh giá từng kết quả trung z 3 bình của 4 lần kiểm tra và đánh giá chéo có được cho mỗi loại thực thể tên, bên cạnh đó cũng lý giải rõ vì sao từng loại thực thể đó đã đạt được kết quả như vậy. Chương 5 tổng kết bằng cách nêu lại các việc đã thực hiện và kết quả đạt được, chưa đạt được trong luận văn này. Ngoài ra chương này cũng đề cập tới hướng phát triển nghiên cứu của đề tài trong tương lai.

Nhận dạng tiếng nói và nhận dạng thực thể tên cho ngôn ngữ nói 1. Sự phát triển và ứng dụng của công nghệ nhận dạng tiếng nói Hiện nay, với những thế mạnh vượt trội [8, 11, 12] của công nghệ nhận dạng tiếng nói tự động, việc sử dụng ngôn ngữ tự nhiên để giao tiếp và tương tác với các thiết bị thông minh (TBTM) ngày nay càng trở nên phổ biến. Đây là xu thế phát triển mới và tiềm năng trong tương lai gần. Chúng ta có thể dễ dàng thấy được một trong số các công cụ đã thực hiện thành công ứng dụng công nghệ nhận dạng tiếng nói tự động.

Thứ nhất phải kể đến đó là công cụ dịch tự động từ ngôn ngữ nói sang ngôn ngữ nói [2] của Microsoft1 và AT&T2 là Microsoft Skype Translator hay AT&T Speech – to – Speech Translator. Thứ hai, các ứng dụng trong các trung tâm cuộc gọi tự động (call center) và trong nghành công nghiệp ô tô hiện đại như: điều khiển ô tô tự hành… Bên cạnh đó, gần đây sự xuất hiện của các phần mềm trợ lý ảo cho người dùng trên các TBTM gồm điện thoại thông minh (ĐTTM), máy tính bảng như: Siri3 của Apple, Cortana4 của Microsoft hay Google Now5 của Google là 3 hãng công nghệ lớn nhất và nổi tiếng trên thế giới đã tiên phong hiện thực hóa việc giao tiếp và tương tác bằng giọng nói giữa con người với các TBTM. Mới đây nhất, một hãng công nghệ nổi tiếng ở Châu Á - hãng Sharp của Nhật đã giới thiệu một sản phẩm công nghệ cao là chú robot có tên RoboHon6 có thể giao tiếp trực tiếp với con người thông qua ngôn ngữ nói của con người trong mọi lĩnh vực. Chú robot đó có khả năng hết sức ấn tượng, có thể thực hiện các công việc như: nhắc nhở, đánh thức, thực hiện cuộc gọi cho ai đó theo yêu cầu của người dùng hay giúp người sử dụng trình chiếu các slides, chụp ảnh, quay phim, tìm kiếm thông tin.

Không dừng lại ở đó chú còn có thể hội thoại trực tiếp với người sử dụng, thực hiện các mệnh lệnh do người sử dụng đưa ra với độ chính xác cực cao. Tất cả các ứng dụng này phục vụ với nhiều mục đích khác nhau nhưng tất cả chúng đều có hai giai đoạn chính: nhận dạng tiếng nói tự động (Automatic Speech Recognition – ASR) và hiểu văn bản ngôn ngữ nói (spoken texts understanding) [21]. Nhận dạng thực thể tên (Named Entity Recognition) cho văn bản ngôn ngữ nói chính là một trong những vấn đề cơ bản và cần thiết để giúp cho việc hiểu được ngôn ngữ tự nhiên một cách dễ dàng hơn. Nhận dạng thực thể tên 1.

Tại sao cần nhận dạng thực thể tên? 1 Microsoft Skype Translator: http://research.com/en-us/about/speech-tospeech-milestones.aspx 2 AT&T: Speech–to–speech translation, with no latency.com/projects/Speech_Translation 3 http://www.com/ios/siri/ 4 http://windows.com/en-us/windows-10/getstarted-what-is-cortana 5 https://www.com/landing/now/#whatisit 6 https://robohon.com/special/english/ z 5 Chúng ta đang sống trong thời đại thông tin, trong mọi thời điểm một lượng lớn thông tin được tạo ra trên Internet và một số nguồn khác đã làm gia tăng kích thước thông tin khổng lồ và nhanh chóng. Muốn truy cập và sử dụng lượng thông tin này, chúng ta cần phải thực sự thay đổi hoàn toàn cách làm việc và nghiên cứu với số lượng thông tin khổng lồ đó. Đối với một tổ chức, doanh nghiệp hay công ty việc sở hữu và sử dụng có hiệu quả các thông tin được coi là một phần quan trọng của chiến lược cạnh tranh. Mặt khác, quy mô và phạm vi của các thông tin hữu ích trong lượng thông tin khổng lồ kia mà người sử dụng cần phải xử lý, thao tác tại một thời điểm nhất định là điều vô cùng khó khăn nếu như không có phương pháp hoặc kỹ thuật tốt.

Hơn nữa, việc truy cập thông tin sẽ không được sử dụng nhiều nếu không có cách tiếp cận cũng như kỹ thuật phù hợp để xử lý và trích chọn các thông tin hữu ích đó. Vậy đâu là câu trả lời cho những thách thức khó khăn như vậy? Chính là kỹ thuật trích chọn thông tin (Information Extraction) [23], kỹ thuật này cho phép biến đổi dữ liệu văn bản không có cấu trúc biểu diễn thành dữ liệu có cấu trúc và được hiểu bằng máy. Trích chọn thông tin được nghiên cứu từ nhiều thập kỷ trước và nó có rất nhiều nhánh chủ đề khác nhau được cộng đồng xử lý ngôn ngữ tự nhiên giải quyết một cách nghiêm túc và thấu đáo. Một trong những hội nghị quan trọng nhất về xử lý ngôn ngữ tự nhiên được đánh giá cao đó là hội nghị Message Understanding Conferences.

Cũng ở hội nghị này vào năm 1996 (MUC-67), Grishman và Sundheim lần đầu tiên trình bày nghiên cứu của mình về nhiệm vụ xác định tên cho các thực thể từ các văn bản ngôn ngữ tự nhiên. Do đó nhiệm vụ này còn có tên nhận dạng thực thể tên [4, 5, 20]. Với lượng thông tin lớn và đa dạng phong phú như vậy sẽ là không khả thi cho con người xử lý các dữ liệu đó để xác định tìm kiếm các thông tin. Máy tính và các TBTM hiện nay là cần thiết để thực hiện các công việc tìm kiếm xác định các thông tin hữu ích, có giá trị giúp con người.

Nhận dạng thực thể tên (Named Entity Recognition) là một phương pháp chính đóng vai trò quan trọng cho việc tìm kiếm xác định, trích chọn những thông tin và giúp hiểu hơn về các thông tin đó. Định nghĩa thực thể tên và nhận dạng thực thể tên Nhận dạng thực thể tên được nhiều nhà khoa học nghiên cứu rất nhiều trong suốt gần 20 năm qua. Lần đầu tiên được giới thiệu tại hội nghị MUC6 [6, 9] bởi Grishman và Sundheim và sau đó 2 năm, vào năm 1998 tại MUC7 Chinchor và Robinson cũng có thêm những trình bày mở rộng hơn cho lĩnh vực nghiên cứu này. Ban đầu nhận dạng thực thể tên tập trung vào một số ngôn ngữ như: tiếng Anh, tiếng Trung, tiếng Tây Ban Nha, tiếng Nhật và một số ngôn ngữ khác.

Không có một định nghĩa chính thức “Thế nào là một thực thể tên” từ góc nhìn ngôn ngữ học. Thuật ngữ thực thể tên được chính hai tác giả là Sundheim và Grishman giới thiệu lần đầu tiên tại hội nghị MUC-6. Ý tưởng cơ bản của vấn đề này là tìm kiếm 7 http://www.edu/cs/faculty/grishman/muc6.html z 6 trong văn bản các tên người, tên tổ chức, tên các vị trí, thời gian, tiền tệ, biểu thức tỉ lệ phần trăm … Mục tiêu là trích chọn trong văn bản ngôn ngữ tự nhiên tất cả các từ, cụm từ có cùng loại thực thể. Theo hai tác giả Grishman & Sundheim thuật ngữ nhận dạng thực thể tên được định nghĩa đầy đủ như sau: “Nhận dạng thực thể tên (Named Entity Recognition) là một quá trình xác định tìm kiếm các từ hoặc cụm từ có nghĩa từ văn bản ngôn ngữ tự nhiên phân loại thành các nhóm duy nhất được định nghĩa trước đó như: tên người (person), tên tổ chức (organization), ngày giờ (datetime), địa điểm (location), con số (number), tiền tệ… ”.

Nội dung được bảo vệ bản quyền — Tải xuống đầy đủ

Bài luận văn thạc sĩ mang tiêu đề "Luận văn thạc sĩ về nhận dạng thực thể tên trong ngôn ngữ tiếng Việt và ứng dụng trên điện thoại thông minh" của tác giả Trần Phương Nam, dưới sự hướng dẫn của TS. Phan Xuân Hiếu, được thực hiện tại Đại học Quốc gia Hà Nội vào năm 2015. Bài viết tập trung vào việc phát triển các phương pháp nhận dạng thực thể tên trong ngôn ngữ tiếng Việt, một lĩnh vực quan trọng trong công nghệ thông tin, đặc biệt là trong các ứng dụng tương tác trên điện thoại thông minh. Nghiên cứu này không chỉ giúp cải thiện khả năng xử lý ngôn ngữ tự nhiên mà còn mở ra nhiều cơ hội ứng dụng trong các hệ thống thông minh, từ đó nâng cao trải nghiệm người dùng.

Để mở rộng thêm kiến thức về các ứng dụng công nghệ thông tin trong giáo dục và nhận dạng giọng nói, bạn có thể tham khảo bài viết "Luận Văn Thạc Sĩ: Ứng Dụng Active Learning trong Lựa Chọn Dữ Liệu Gán Nhãn cho Bài Toán Nhận Diện Giọng Nói". Bài viết này cũng đề cập đến các phương pháp học máy trong lĩnh vực nhận diện giọng nói, một chủ đề liên quan mật thiết đến nhận dạng thực thể tên.

Ngoài ra, bạn cũng có thể tìm hiểu thêm về "Luận văn thạc sĩ: Nhận dạng giọng nói tiếng Việt qua học sâu và mô hình ngôn ngữ", nơi nghiên cứu về việc áp dụng học sâu trong nhận dạng giọng nói, một lĩnh vực đang phát triển mạnh mẽ và có nhiều ứng dụng thực tiễn.

Cuối cùng, bài viết "Nghiên cứu ứng dụng học sâu vào dịch từ vựng mà không cần dữ liệu song ngữ" cũng là một tài liệu hữu ích, giúp bạn hiểu rõ hơn về các ứng dụng của học sâu trong xử lý ngôn ngữ tự nhiên, một phần không thể thiếu trong việc phát triển các hệ thống nhận dạng thực thể tên.

#xử lý ngôn ngữ tự nhiên

#công nghệ thông tin

#AI trong ngôn ngữ

#ngôn ngữ tự nhiên

#nhận dạng thực thể tên

#ứng dụng điện thoại thông minh

Chủ đề

Phát triển ứng dụng di động

Ứng dụng AI trong ngôn ngữ

Công nghệ nhận dạng thực thể

Nghiên cứu ngôn ngữ tiếng Việt

Luận văn thạc sĩ nhận dạng thực thể tên cho ngôn ngữ nói tiếng việt và ứng dụng trong tương tác với điện thoại thông minh 04

LỜI CAM ĐOAN

1. MỞ ĐẦU

2. CHƯƠNG 1: NHẬN DẠNG TIẾNG NÓI VÀ NHẬN DẠNG THỰC THỂ TÊN CHO NGÔN NGỮ NÓI

1.1. Sự phát triển và ứng dụng của công nghệ nhận dạng tiếng nói

1.2. Nhận dạng thực thể tên

1.2.1. Tại sao cần nhận dạng thực thể tên?

1.2.2. Định nghĩa thực thể tên và nhận dạng thực thể tên

3. CHƯƠNG 2: PHƯƠNG PHÁP NGHIÊN CỨU VÀ CƠ SỞ LÝ THUYẾT

2.1. Các phương pháp điển hình trong nhận dạng thực thể tên

2.2. Cơ sở lý thuyết mô hình học máy

2.2.1. Cực đại hóa Entropy (Maximum Entropy)

2.2.2. Trường điều kiện ngẫu nhiên (Conditional Random Fields)

2.3. Các phương pháp đánh giá hệ thống nhận dạng thực thể tên

2.4. Một số nghiên cứu liên quan

4. CHƯƠNG 3: HỆ THỐNG TRỢ LÝ ẢO VÀ MÔ HÌNH NHẬN DẠNG THỰC THỂ TÊN

3.1. Tổng thể hệ thống trợ lý ảo cho người dùng

3.2. Mô hình hóa bài toán nhận dạng thực thể tên

3.2.1. Xây dựng tập dữ liệu huấn luyện

3.2.2. Xây dựng mô hình dựa trên phương pháp học máy

3.2.2.1. Xây dựng mô hình cực đại hóa Entropy

3.2.2.2. Lựa chọn thuộc tính

3.2.2.3. Huấn luyện mô hình

3.2.3. Các tham số huấn luyện khi sử dụng mô hình MaxEnt

3.2.4. Các tham số huấn luyện khi sử dụng mô hình CRFs

5. CHƯƠNG 4: THỰC NGHIỆM VÀ ĐÁNH GIÁ MÔ HÌNH NHẬN DẠNG THỰC THỂ TÊN

4.1. Dữ liệu thực nghiệm và cài đặt

4.2. Kết quả thực nghiệm và phân tích

4.2.1. Kết quả thực nghiệm sử dụng MaxEnt

4.2.2. Kết quả thực nghiệm sử dụng CRFs

4.3. Kết quả ứng dụng mô hình nhận dạng thực thể tên cho ngôn ngữ nói tiếng Việt trên điện thoại thông minh chạy hệ điều hành Android

6. CHƯƠNG 5: KẾT QUẢ VÀ HƯỚNG PHÁT TRIỂN NGHIÊN CỨU

5.1. Những vấn đề giải quyết được trong luận văn này

5.2. Công việc nghiên cứu trong tương lai

DANH MỤC CÔNG TRÌNH KHOA HỌC CỦA TÁC GIẢ LIÊN QUAN ĐẾN LUẬN VĂN

TÀI LIỆU THAM KHẢO

I. Nhận dạng thực thể tên và ứng dụng trong tương tác điện thoại thông minh

1.1. Tại sao cần nhận dạng thực thể tên

1.2. Khó khăn trong nhận dạng thực thể tên tiếng Việt

II. Công nghệ nhận dạng thực thể tên

2.1. Các phương pháp nhận dạng thực thể tên

2.2. Đánh giá hiệu quả của mô hình

Tài liệu liên quan

THÔNG TIN CHI TIẾT

Tác giả: Trần Phương Nam

Người hướng dẫn: TS. Phan Xuân Hiếu

Trường học: Đại học Quốc gia Hà Nội

Chuyên ngành: Công nghệ thông tin

Đề tài: Nhận dạng thực thể tên cho ngôn ngữ nói tiếng Việt và ứng dụng trong tương tác với điện thoại thông minh

Loại tài liệu: luận văn thạc sĩ

Năm xuất bản: 2015

Địa điểm: Hà Nội

Tổng quan nghiên cứu

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Phương pháp nghiên cứu

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

Thảo luận kết quả

Đề xuất và khuyến nghị

Đối tượng nên tham khảo luận văn

Câu hỏi thường gặp

Kết luận

Có thể bạn quan tâm