Nghiên cứu nhận diện mức độ hài lòng của du khách tại khách sạn thông qua học máy và xử lý ngôn ngữ tự nhiên

Trường đại học

Đại học Huế

Người đăng

Ẩn danh

Thể loại

luận văn

2023

108
3
0

Phí lưu trữ

30.000 VNĐ

Mục lục chi tiết

LỜI CẢM ƠN

LỜI CAM ĐOAN

MỤC LỤC

DANH MỤC CÁC TỪ VIẾT TẮT

DANH MỤC CÁC BẢNG

DANH MỤC CÁC HÌNH VẼ

I. PHẦN I MỞ ĐẦU

1. TÍNH CẤP THIẾT CỦA ĐỀ TÀI

2. MỤC TIÊU NGHIÊN CỨU

2.1. MỤC TIÊU CHUNG

2.2. MỤC TIÊU CỤ THỂ

3. ĐỐI TƯỢNG VÀ PHẠM VI NGHIÊN CỨU

3.1. ĐỐI TƯỢNG NGHIÊN CỨU

3.2. PHẠM VI NGHIÊN CỨU

4. PHƯƠNG PHÁP NGHIÊN CỨU

5. KẾT CẤU LUẬN VĂN

II. PHẦN II NỘI DUNG NGHIÊN CỨU

1. CHƯƠNG 1. THỰC TRẠNG VÀ CƠ SỞ LÝ THUYẾT

1.1. Tổng quan tình hình nghiên cứu trên thế giới và trong nước

1.1.1. Tình hình nghiên cứu trên thế giới
1.1.2. Tình hình nghiên cứu tại Việt Nam

1.2. THỰC TRẠNG VỀ NGÀNH DU LỊCH Ở VIỆT NAM

1.2.1. Hệ thống khách sạn tại Việt Nam
1.2.2. Đặc điểm khách du lịch quốc tế
1.2.3. Đặc điểm khách du lịch nội địa

1.3. TÍNH CẤP THIẾT CỦA VIỆC NHẬN DIỆN MỨC ĐỘ HÀI LÒNG CỦA DU KHÁCH ĐỐI VỚI CÁC KHÁCH SẠN

1.4. TỔNG QUAN VỀ TRIPADVISOR

1.5. TỔNG QUAN VỀ CÁC KỸ THUẬT ĐƯỢC SỬ DỤNG TRONG NGHIÊN CỨU

1.5.1. Công cụ, phần mềm
1.5.2. Tổng quan về kỹ thuật thu thập dữ liệu website
1.5.3. Tổng quan về các kỹ thuật xử lý ngôn ngữ tự nhiên
1.5.4. Tổng quan về các mô hình học máy

2. ỨNG DỤNG XỬ LÝ NGÔN NGỮ TỰ NHIÊN VÀ MÔ HÌNH HỌC MÁY TRONG NHẬN DIỆN MỨC ĐỘ HÀI LÒNG CỦA DU KHÁCH

3. ĐỀ XUẤT MÔ HÌNH NHẬN DIỆN MỨC ĐỘ HÀI LÒNG CỦA DU KHÁCH ĐỐI VỚI CÁC KHÁCH SẠN THÔNG QUA CÁC LỜI BÌNH LUẬN TRÊN TRIPADVISOR

3.1. ĐỀ XUẤT MÔ HÌNH NGHIÊN CỨU

3.2. GIAI ĐOẠN 1: THU THẬP DỮ LIỆU VÀ GÁN NHÃN

3.2.1. Quá trình thu thập dữ liệu
3.2.2. Gắn nhãn dữ liệu

3.3. GIAI ĐOẠN 2: TIỀN XỬ LÝ DỮ LIỆU

3.3.1. Phân tích và lấy mẫu dữ liệu
3.3.2. Làm sạch dữ liệu
3.3.3. Trích chọn tập con đặc trưng
3.3.4. Biến đổi thuộc tính dữ liệu

3.4. GIAI ĐOẠN 3: TRÍCH XUẤT ĐẶC TRƯNG VĂN BẢN

3.4.1. Trích xuất đặc trưng bằng Embedding
3.4.2. Trích xuất đặc trưng bằng GloVe
3.4.3. Trích xuất đặc trưng bằng TF-IDF

3.5. GIAI ĐOẠN 3: HUẤN LUYỆN VÀ KIỂM THỬ MÔ HÌNH DỰ ĐOÁN PHÂN LOẠI CẢM XÚC

3.5.1. Mô hình BiLSTM
3.5.2. Mô hình RandomForest
3.5.3. Ước lượng hiệu quả của các mô hình bằng phương pháp xác thực chéo k-Fold Cross Validation (k-CV)

3.6. GIAI ĐOẠN 4: ĐÁNH GIÁ MÔ HÌNH

3.6.1. Thước đo điểm F1 trung bình vĩ mô
3.6.2. Thước đo điểm F1 trung bình có trọng số
3.6.3. Thước đo độ chính xác

4. THỰC NGHIỆM MÔ HÌNH ĐỀ XUẤT VÀ PHÂN TÍCH KẾT QUẢ

4.1. THU THẬP DỮ LIỆU VÀ GÁN NHÃN DỮ LIỆU

4.1.1. Thu thập dữ liệu

4.2. TIỀN XỬ LÝ DỮ LIỆU

4.2.1. Lấy mẫu dữ liệu
4.2.2. Làm sạch dữ liệu
4.2.3. Trích xuất tập con đặc trưng
4.2.4. Vector hóa các tập dữ liệu

4.3. TRÍCH XUẤT ĐẶC TRƯNG VĂN BẢN

4.3.1. Trích xuất đặc trưng văn bản với Embedding
4.3.2. Trích xuất đặc trưng văn bản với GloVe
4.3.3. Trích xuất đặc trưng văn bản với TF-IDF

4.4. HUẤN LUYỆN VÀ KIỂM THỬ

4.4.1. Thí nghiệm 1: Trích xuất đặc trưng văn bản bằng nhúng từ kết hợp mô hình phân loại BiLSTM
4.4.2. Thí nghiệm 2: Trích xuất đặc trưng văn bản bằng GloVe kết hợp mô hình phân loại BiLSTM
4.4.3. Thí nghiệm 3: Trích xuất đặc trưng văn bản bằng TF-IDF kết hợp mô hình phân loại BiLSTM
4.4.4. Thí nghiệm 4: Trích xuất đặc trưng văn bản bằng nhúng từ kết hợp mô hình RF
4.4.5. Thí nghiệm 5: Trích xuất đặc trưng văn bản bằng GloVe kết hợp mô hình RF
4.4.6. Thí nghiệm 6: Trích xuất đặc trưng văn bản bằng TF-IDF kết hợp mô hình RF

4.5. KẾT QUẢ THÍ NGHIỆM

III. PHẦN III KẾT LUẬN VÀ KIẾN NGHỊ

MÃ NGUỒN CHƯƠNG TRÌNH THU THẬP DỮ LIỆU

MÃ NGUỒN GIAI ĐOẠN TIỀN XỬ LÝ DỮ LIỆU

MÃ NGUỒN MÔ HÌNH THÍ NGHIỆM

TÀI LIỆU THAM KHẢO

Tóm tắt

I. Giới thiệu về nghiên cứu

Nghiên cứu này tập trung vào việc phân tích mức độ hài lòng của du khách tại các khách sạn thông qua việc áp dụng các công nghệ học máyxử lý ngôn ngữ tự nhiên. Mục tiêu chính là khai thác dữ liệu từ các bài bình luậnnhận xét của du khách trên nền tảng Tripadvisor để đánh giá cảm xúc và mức độ hài lòng của họ. Các phương pháp hiện đại như phân tích sentimentphân tích hành vi sẽ được áp dụng để tạo ra một mô hình có khả năng nhận diện cảm xúc của khách hàng, từ đó cung cấp thông tin hữu ích cho các nhà quản lý khách sạn. Theo báo cáo của ngành du lịch, việc nâng cao chất lượng dịch vụ và cải thiện trải nghiệm khách hàng là rất quan trọng trong bối cảnh cạnh tranh ngày càng gay gắt.

1.1. Tính cấp thiết của nghiên cứu

Trong bối cảnh ngành du lịch đang phát triển mạnh mẽ, việc hiểu rõ về mức độ hài lòng của du khách là rất cần thiết. Nghiên cứu này không chỉ giúp các khách sạn cải thiện dịch vụ mà còn tạo ra một nền tảng dữ liệu lớn để các nhà quản lý có thể đưa ra quyết định chính xác hơn. Hơn nữa, việc áp dụng công nghệ AI trong phân tích dữ liệu từ bình luận sẽ giúp tiết kiệm thời gian và nguồn lực, đồng thời tăng cường khả năng dự đoán và phân tích hành vi của khách hàng.

II. Phương pháp nghiên cứu

Nghiên cứu sử dụng các phương pháp xử lý ngôn ngữ tự nhiên để thu thập và phân tích dữ liệu từ các bài bình luận trên Tripadvisor. Quá trình này bao gồm việc làm sạch dữ liệu, trích xuất đặc trưng và xây dựng mô hình học máy. Các phương pháp như TF-IDF, GloVenhúng từ sẽ được áp dụng để cải thiện độ chính xác của mô hình. Đặc biệt, mô hình BiLSTMRandom Forest sẽ được sử dụng để phân loại cảm xúc của các bình luận thành các nhóm tích cực, tiêu cực và trung lập. Kết quả của mô hình sẽ được đánh giá thông qua các chỉ số như độ chính xác và điểm F1, nhằm đảm bảo tính hiệu quả và khả năng áp dụng thực tế.

2.1. Thu thập và xử lý dữ liệu

Dữ liệu sẽ được thu thập từ các bài bình luận trên nền tảng Tripadvisor, nơi có lượng thông tin phong phú về du kháchkhách sạn. Quá trình thu thập dữ liệu sẽ sử dụng kỹ thuật web scraping để lấy thông tin cần thiết. Sau đó, dữ liệu sẽ được xử lý để loại bỏ các ký tự đặc biệt, từ dừng và chuẩn hóa văn bản. Việc trích xuất đặc trưng sẽ giúp mô hình học máy hiểu rõ hơn về ngữ nghĩa của các bình luận, từ đó nâng cao khả năng phân loại cảm xúc của du khách.

III. Kết quả và thảo luận

Kết quả nghiên cứu cho thấy mô hình học máy có khả năng phân loại cảm xúc của bình luận với độ chính xác lên đến 77%. Điều này chứng tỏ rằng việc áp dụng xử lý ngôn ngữ tự nhiên trong việc phân tích mức độ hài lòng của du khách là rất hiệu quả. Những thông tin thu được từ nghiên cứu này sẽ cung cấp cho các nhà quản lý khách sạn những hiểu biết sâu sắc về cảm xúc của khách hàng, từ đó giúp họ cải thiện chất lượng dịch vụ và tạo ra trải nghiệm tốt hơn cho du khách.

3.1. Ứng dụng thực tiễn

Nghiên cứu này có thể được áp dụng rộng rãi trong ngành du lịch, đặc biệt là trong việc phát triển các chiến lược marketing và cải tiến dịch vụ khách hàng. Các nhà quản lý có thể sử dụng dữ liệu phân tích để điều chỉnh các dịch vụ của mình, nhằm đáp ứng tốt hơn nhu cầu và mong đợi của du khách. Hơn nữa, việc hiểu rõ về cảm xúc của khách hàng sẽ giúp các khách sạn xây dựng được thương hiệu mạnh mẽ hơn và thu hút được nhiều du khách hơn trong tương lai.

10/01/2025
Luận văn thạc sĩ khoa học dữ liệu ứng dụng học máy và xử lý ngôn ngữ tự nhiên trong việc nhận diện mức độ hài lòng của du khách tại các khách sạn thông qua các lời bình luận và nhận xét

Bạn đang xem trước tài liệu:

Luận văn thạc sĩ khoa học dữ liệu ứng dụng học máy và xử lý ngôn ngữ tự nhiên trong việc nhận diện mức độ hài lòng của du khách tại các khách sạn thông qua các lời bình luận và nhận xét

Bài luận văn với tiêu đề "Nghiên cứu nhận diện mức độ hài lòng của du khách tại khách sạn thông qua học máy và xử lý ngôn ngữ tự nhiên" được thực hiện bởi TS. Lê Thị Quỳnh Liên tại Đại học Huế, tập trung vào việc phân tích mức độ hài lòng của du khách thông qua các phương pháp học máy và xử lý ngôn ngữ tự nhiên. Nghiên cứu này không chỉ giúp các nhà quản lý khách sạn hiểu rõ hơn về nhu cầu và mong muốn của khách hàng mà còn cung cấp những thông tin quý báu để cải thiện chất lượng dịch vụ, từ đó nâng cao trải nghiệm của du khách.

Để mở rộng thêm kiến thức, bạn có thể tham khảo các bài viết liên quan như "Luận văn về sự hài lòng của du khách đối với dịch vụ lưu trú tại khách sạn 3 sao", nơi phân tích chi tiết về sự hài lòng của du khách trong bối cảnh dịch vụ lưu trú. Bên cạnh đó, bài viết "Chất lượng dịch vụ tại khách sạn Hàm Rồng: Phân tích và cải thiện" cũng sẽ cung cấp thêm góc nhìn về việc cải thiện chất lượng dịch vụ khách sạn. Cuối cùng, bài "Nghiên cứu chất lượng dịch vụ lưu trú tại khách sạn Hải Phòng" sẽ giúp bạn hiểu thêm về các yếu tố ảnh hưởng đến sự hài lòng của du khách trong một bối cảnh khác. Những tài liệu này không chỉ bổ sung cho kiến thức của bạn mà còn mở ra nhiều hướng nghiên cứu thú vị trong lĩnh vực du lịch và khách sạn.