Luận văn thạc sĩ: Nghiên cứu hệ thống trợ lý thông minh ảo trong lĩnh vực máy tính

Trường đại học

Đại học Quốc gia Hà Nội

Chuyên ngành

Công nghệ thông tin

Người đăng

Ẩn danh

2017

52
0
0

Phí lưu trữ

30.000 VNĐ

Mục lục chi tiết

LỜI CAM ĐOAN

LỜI CẢM ƠN

1. CHƯƠNG 1: TỔNG QUAN VỀ HỆ THỐNG TRỢ LÝ ẢO

1.1. Giới thiệu về hệ thống trợ lý ảo

1.2. Cấu trúc hệ thống trợ lý ảo

1.3. Nhận dạng giọng nói tự động (ASR - Automatic Speech Recognition)

1.4. Xử lý hình ảnh IMM (Image Matching)

1.5. Quản lý câu hỏi trả lời QA (Question-Answering)

1.5.1. Cấu tạo của quản lý câu hỏi

1.5.2. Xử lý ngôn ngữ tự nhiên trong Quản lý câu hỏi trả lời

1.5.2.1. Các mức của NLP
1.5.2.2. Ứng dụng NLP trong chatbot
1.5.2.2.1. Cấu tạo hệ thống chatbot

2. CHƯƠNG 2: MỘT SỐ KĨ THUẬT SỬ DỤNG TRONG TRỢ LÝ ẢO

2.1. Mạng học sâu DNNs

2.1.1. Khái niệm mạng học sâu

2.1.2. Xây dựng mô hình. Vấn đề và giải pháp khắc phục

2.2. Quản lý hội thoại

2.2.1. Mô hình quản lý dựa trên khung (Frame based dialog Agents)

2.2.2. Mô hình sinh hội thoại

2.2.3. Ý nghĩa chính của mô hình sinh hội thoại

2.2.4. Đặc điểm của mô hình hội thoại

3. CHƯƠNG 3: THỰC NGHIỆM VÀ ĐÁNH GIÁ

3.1. Phát triển bài toán

3.2. Chương trình thực nghiệm

3.2.1. Cấu trúc Api. Thành phần API. Mô hình xây dựng

3.3. Giao diện ứng dụng

3.4. Dữ liệu thực nghiệm. Mô hình hội thoại

3.5. Dữ liệu phân tích

3.6. Dữ liệu câu hỏi

3.7. Nhận xét và kết quả

TÀI LIỆU THAM KHẢO

Tóm tắt

I. Giới thiệu về hệ thống trợ lý ảo

Hệ thống trợ lý ảo, như Siri của Apple, Google Now của Google và Cortana của Microsoft, đại diện cho một lớp dịch vụ web mới gọi là Ứng dụng Hỗ trợ Cá nhân Thông minh (Intelligent Personal Assistants - IPA). Các IPA sử dụng các yếu tố đầu vào như tiếng nói, hình ảnh và thông tin theo ngữ cảnh của người dùng để hỗ trợ bằng cách trả lời các câu hỏi bằng ngôn ngữ tự nhiên, đưa ra khuyến nghị và hành động. Sự phát triển nhanh chóng của IPA cho thấy nhu cầu sử dụng dịch vụ này đang gia tăng, đặc biệt trên các nền tảng di động. Theo một nghiên cứu, việc sử dụng IPA đã tăng lên đáng kể nhờ vào sự phát triển của công nghệ nhận dạng giọng nói và xử lý ngôn ngữ tự nhiên. Điều này cho phép người dùng tương tác với thiết bị thông minh một cách tự nhiên hơn, không chỉ qua văn bản mà còn qua hình ảnh và giọng nói. Sự tương tác này không chỉ giúp tiết kiệm thời gian mà còn nâng cao trải nghiệm người dùng, cho thấy tầm quan trọng của công nghệ thông tin trong việc phát triển các hệ thống trợ lý thông minh ảo.

II. Cấu trúc hệ thống trợ lý ảo

Cấu trúc của một hệ thống trợ lý ảo bao gồm hai khối chính: khối người dùng và khối xử lý dữ liệu. Khối người dùng nhận đầu vào từ giọng nói, văn bản và hình ảnh, trong khi khối xử lý dữ liệu thực hiện các tác vụ như nhận dạng giọng nói tự động (ASR), xử lý hình ảnh và quản lý hội thoại. Quá trình bắt đầu khi người dùng gửi yêu cầu qua giọng nói hoặc văn bản. Yêu cầu này được chuyển đến máy chủ để xử lý. ASR chuyển đổi giọng nói thành văn bản, sau đó văn bản này được phân loại để xác định xem đó là hành động hay câu hỏi. Nếu là câu hỏi, hệ thống sẽ sử dụng xử lý ngôn ngữ tự nhiên (NLP) để trích xuất thông tin và tìm kiếm câu trả lời từ cơ sở dữ liệu. Điều này cho thấy sự phức tạp và tính hiệu quả của các hệ thống trợ lý ảo trong việc đáp ứng nhu cầu của người dùng.

III. Nhận dạng giọng nói tự động ASR

Khối nhận dạng giọng nói tự động (ASR) là thành phần quan trọng giúp người dùng tương tác với trợ lý ảo thông qua giọng nói. ASR sử dụng các vector đặc trưng để đại diện cho đoạn nói, được tạo ra từ quá trình tiền xử lý và trích xuất đặc tính. Thành phần của ASR thường dựa vào sự kết hợp của mô hình Hidden Markov (HMM) và mô hình hỗn hợp Gaussian (GMM) hoặc mạng nơ-ron sâu (DNN). HMM xây dựng một cây trạng thái cho khung lời nói hiện tại, trong khi GMM hoặc DNN đánh giá xác suất của sự chuyển đổi trạng thái. Việc sử dụng DNN trong ASR đã cho thấy độ chính xác cao hơn, giúp cải thiện khả năng nhận diện giọng nói trong các ứng dụng thực tế. Điều này chứng tỏ rằng công nghệ nhận dạng giọng nói đang ngày càng trở nên quan trọng trong việc phát triển các hệ thống trợ lý thông minh.

IV. Xử lý hình ảnh IMM Image Matching

Khối xử lý hình ảnh IMM cho phép người dùng tương tác với hệ thống trợ lý ảo thông qua hình ảnh. Khi người dùng muốn hỏi về một hình ảnh cụ thể, hệ thống sẽ xử lý dữ liệu hình ảnh đầu vào và cung cấp đầu ra là thông tin liên quan. Quá trình này bắt đầu bằng việc trích xuất các điểm chính từ hình ảnh đầu vào sử dụng thuật toán SURF. Các điểm chính này sau đó được nhóm thành các bộ mô tả tính năng và so sánh với cơ sở dữ liệu hình ảnh. Việc sử dụng các kỹ thuật như tìm kiếm gần nhất (ANN) giúp hệ thống tìm kiếm và trả về thông tin chính xác về hình ảnh. Điều này cho thấy sự phát triển của công nghệ thị giác máy tính trong việc nâng cao khả năng tương tác của người dùng với hệ thống trợ lý ảo.

V. Quản lý câu hỏi trả lời QA Question Answering

Khối quản lý câu hỏi trả lời (QA) là thành phần xử lý dữ liệu tương tác trong hệ thống trợ lý ảo. Khi người dùng đặt câu hỏi, hệ thống sẽ lấy dữ liệu từ khối QA để đưa ra câu trả lời phù hợp. Quá trình này bao gồm việc trích xuất thông tin từ văn bản đầu vào và tìm kiếm câu trả lời từ cơ sở dữ liệu. Hệ thống sử dụng các thuật toán như CRF để phân tích cú pháp và xác định các thành phần ngữ nghĩa trong câu hỏi. Sau khi phân tích, hệ thống sẽ lọc và trả về câu trả lời tốt nhất dựa trên điểm số tổng hợp. Điều này cho thấy tầm quan trọng của xử lý ngôn ngữ tự nhiên trong việc phát triển các hệ thống trợ lý thông minh, giúp nâng cao khả năng tương tác và đáp ứng nhu cầu của người dùng.

25/01/2025

Bài viết "Luận văn thạc sĩ: Nghiên cứu hệ thống trợ lý thông minh ảo trong lĩnh vực máy tính" của tác giả Nguyễn Hữu Cường, dưới sự hướng dẫn của TS. Nguyễn Văn Vinh tại Đại học Quốc gia Hà Nội, tập trung vào việc phát triển và ứng dụng các hệ thống trợ lý thông minh ảo trong công nghệ thông tin. Luận văn này không chỉ cung cấp cái nhìn sâu sắc về các công nghệ hiện đại mà còn chỉ ra những lợi ích mà hệ thống trợ lý thông minh có thể mang lại cho người dùng, từ việc tối ưu hóa quy trình làm việc đến cải thiện trải nghiệm người dùng.

Để mở rộng thêm kiến thức về lĩnh vực này, bạn có thể tham khảo các tài liệu liên quan như Các yếu tố ảnh hưởng đến quyết định chọn nơi làm việc của sinh viên công nghệ thông tin tại Đà Nẵng, nơi phân tích các yếu tố tác động đến sự lựa chọn nghề nghiệp trong ngành công nghệ thông tin. Bên cạnh đó, Luận văn thạc sĩ về quản lý giáo dục và ứng dụng công nghệ thông tin trong dạy học ở huyện Phong Điền, TP Cần Thơ cũng sẽ cung cấp cái nhìn về ứng dụng công nghệ thông tin trong giáo dục, một lĩnh vực có liên quan mật thiết đến việc phát triển hệ thống trợ lý thông minh. Cuối cùng, Nghiên cứu phát triển kỹ thuật hỗ trợ phát hiện đạo văn trong văn bản tiếng Việt sẽ giúp bạn hiểu rõ hơn về các công nghệ hỗ trợ trong lĩnh vực xử lý ngôn ngữ tự nhiên, một phần quan trọng trong việc phát triển trợ lý thông minh.

Những tài liệu này không chỉ mở rộng kiến thức mà còn giúp bạn có cái nhìn đa chiều về các ứng dụng của công nghệ thông tin trong đời sống và giáo dục.