Khai Phá Quan Điểm Với Kỹ Thuật Học Sâu (Opinion Mining with Deep Learning)

Chuyên khảo kỹ thuật phân tích Khai phá quan điểm với kỹ thuật học sâu, đánh giá các khía cạnh quan trọng, đề xuất hướng nghiên cứu tiếp theo.

Trường đại học

Đại học Đà Nẵng

Chuyên ngành

Khoa học máy tính

Người đăng

Ẩn danh

Thể loại

luận án tiến sĩ

2023

164

Phí lưu trữ

45 Point

Mục lục chi tiết

LỜI CAM ĐOAN

1. CHƯƠNG 1: TỔNG QUAN VỀ KHAI PHÁ QUAN ĐIỂM VÀ KỸ THUẬT HỌC SÂU

1.1. KHAI PHÁ QUAN ĐIỂM

1.2. CÁC CẤP ĐỘ KHAI PHÁ QUAN ĐIỂM

1.2.1. Khai phá quan điểm mức tài liệu

1.2.2. Khai phá quan điểm mức câu

1.2.3. Khai phá quan điểm mức khía cạnh hay mức đặc trưng

1.3. CÁC HƯỚNG NGHIÊN CỨU KHAI PHÁ QUAN ĐIỂM

1.3.1. Hướng tiếp cận dựa trên ngữ liệu

1.3.2. Hướng tiếp cận máy học

1.3.3. Các nghiên cứu liên quan

1.4. MỘT SỐ HẠN CHẾ CỦA CÁC TIẾP CẬN KHAI PHÁ QUAN ĐIỂM HIỆN NAY

1.5. HỌC SÂU VÀ NHÓM KỸ THUẬT HỌC SÂU ĐƯỢC SỬ DỤNG TRONG CÁC MÔ HÌNH KHAI PHÁ QUAN ĐIỂM ĐỀ XUẤT

1.5.1. Các kỹ thuật học sâu phổ biến dùng trong xử lý ngôn ngữ tự nhiên và khai phá quan điểm

1.6. ĐỀ XUẤT NGHIÊN CỨU: KHAI PHÁ QUAN ĐIỂM VỚI KỸ THUẬT HỌC SÂU

1.7. KẾT LUẬN CHƯƠNG 1

2. CHƯƠNG 2: TRÍCH RÚT KHÍA CẠNH TRONG KHAI PHÁ QUAN ĐIỂM VỚI HƯỚNG TIẾP CẬN HỌC SÂU

2.1. TRÍCH RÚT KHÍA CẠNH VỚI HƯỚNG TIẾP CẬN HỌC SÂU

2.2. MÔ HÌNH TRÍCH RÚT KHÍA CẠNH VỚI TIẾP CẬN HỌC SÂU ĐỀ XUẤT

2.2.1. Mô hình tích hợp BiGRU-CRF cho trích rút khía cạnh

2.2.2. Mô hình tích hợp Bi-IndyLSTM-CRF cho trích rút khía cạnh

2.3. KẾT QUẢ THỰC NGHIỆM

2.3.1. Tập dữ liệu và công cụ sử dụng trong thực nghiệm

2.3.2. Kết quả thực nghiệm và đánh giá hiệu quả trích rút khía cạnh

2.4. KẾT LUẬN CHƯƠNG 2

3. CHƯƠNG 3: KHAI PHÁ QUAN ĐIỂM MỨC KHÍA CẠNH ĐA TÁC VỤ VỚI HƯỚNG TIẾP CẬN HỌC SÂU

3.1. KHAI PHÁ QUAN ĐIỂM MỨC KHÍA CẠNH ĐA TÁC VỤ

3.2. MÔ HÌNH KHAI PHÁ QUAN ĐIỂM MỨC KHÍA CẠNH ĐA TÁC VỤ VỚI TIẾP CẬN HỌC SÂU ĐỀ XUẤT

3.2.1. Mô hình CNN-BiGRU cho trích rút khía cạnh và quan điểm

3.2.2. Mô hình CNN-IOB2 cho trích rút từ mục tiêu

3.2.3. Mô hình MABSA cho trích rút và phân loại ba tác vụ tiếp theo: khía cạnh, thực thể và quan điểm

3.3. KẾT QUẢ THỰC NGHIỆM CÁC MÔ HÌNH

3.3.1. Tập dữ liệu và công cụ sử dụng trong thực nghiệm

3.3.2. Kết quả thực nghiệm, đánh giá hiệu quả khai phá quan điểm đa tác vụ

3.4. KẾT LUẬN CHƯƠNG 3

4. CHƯƠNG 4: KHAI PHÁ QUAN ĐIỂM MỨC KHÍA CẠNH ĐA TÁC VỤ, ĐA MIỀN VỚI HƯỚNG TIẾP CẬN HỌC SÂU

4.1. KHAI PHÁ QUAN ĐIỂM MỨC KHÍA CẠNH ĐA MIỀN

4.2. MÔ HÌNH KHAI PHÁ QUAN ĐIỂM MỨC KHÍA CẠNH ĐA TÁC VỤ ĐA MIỀN ĐỀ XUẤT

4.2.1. Mô hình khai phá quan điểm mức khía cạnh đa miền CNN-BiLSTM

4.2.2. Mô hình khai phá quan điểm mức khía cạnh đa tác vụ, đa miền CNN-BiIndyLSTM-Attention

4.3. KẾT QUẢ THỰC NGHIỆM

4.3.1. Tập dữ liệu và công cụ sử dụng trong thực nghiệm

4.3.2. Kết quả thực nghiệm và đánh giá hiệu quả khai phá quan điểm đa tác vụ trên đơn miền và đa miền

4.4. KẾT LUẬN CHƯƠNG 4

KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN

5.1. HƯỚNG PHÁT TRIỂN

DANH MỤC CÁC CÔNG TRÌNH KHOA HỌC ĐÃ CÔNG BỐ

TÀI LIỆU THAM KHẢO

Tóm tắt

I. Tổng Quan Về Nghiên Cứu Khai Phá Quan Điểm 2024

Trong bối cảnh bùng nổ thông tin, các nền tảng truyền thông xã hội và thương mại điện tử đã trở thành nơi người dùng chia sẻ quan điểm cá nhân về sản phẩm, dịch vụ, chính sách và sự kiện. Lượng thông tin này tạo ra một kho dữ liệu khổng lồ, ảnh hưởng đến suy nghĩ và hành vi của người dùng toàn cầu. Việc khai thác và phân tích ý kiến công chúng từ kho dữ liệu này là vô cùng cần thiết để hỗ trợ quá trình ra quyết định của các cá nhân và tổ chức. Luận án tiến sĩ của Đại học Đà Nẵng tập trung nghiên cứu khai phá quan điểm sử dụng kỹ thuật học sâu, với mục tiêu đề xuất và tinh chỉnh mô hình, nâng cao độ chính xác, hiệu suất và tính tiện ích của nó. Theo tài liệu gốc, từ năm 2020, thương mại điện tử đã tăng trưởng ngoạn mục, kéo theo đó là sự gia tăng mạnh mẽ của các bình luận và nhận xét trực tuyến, ảnh hưởng lớn đến quyết định mua hàng của người tiêu dùng. Khai phá quan điểm đang dần trở thành một yếu tố quan trọng trong việc định hình ý kiến công chúng.

1.1. Tầm Quan Trọng Của Phân Tích Quan Điểm Trong Thời Đại Số

Sự phát triển của các nền tảng trực tuyến đã tạo ra một lượng lớn dữ liệu văn bản chứa ý kiến công chúng về mọi lĩnh vực của đời sống. Việc phân tích dữ liệu văn bản này giúp các doanh nghiệp hiểu rõ hơn về nhu cầu của khách hàng, từ đó đưa ra các quyết định kinh doanh sáng suốt hơn. Các tổ chức chính trị cũng có thể sử dụng phân tích quan điểm để đánh giá phản ứng của công chúng đối với các chính sách mới. Tóm lại, phân tích quan điểm là một công cụ mạnh mẽ giúp các tổ chức và cá nhân đưa ra các quyết định dựa trên thông tin chính xác và kịp thời.

1.2. Học Sâu Giải Pháp Mới Cho Bài Toán Xử Lý Ngôn Ngữ Tự Nhiên

Học sâu là một lĩnh vực mới nổi trong machine learning, cho phép máy tính tự động học các đặc trưng quan trọng từ dữ liệu. Với khả năng xử lý lượng lớn dữ liệu văn bản phức tạp, mô hình học sâu đang ngày càng được ứng dụng rộng rãi trong xử lý ngôn ngữ tự nhiên, bao gồm cả khai phá quan điểm. Theo tài liệu nghiên cứu, các giải thuật học sâu đã cho thấy những kết quả khả quan trong việc trích xuất thông tin từ dữ liệu văn bản và đưa ra các dự đoán chính xác.

II. Thách Thức Trong Khai Phá Quan Điểm và Học Sâu 2024

Mặc dù có nhiều tiềm năng, khai phá quan điểm vẫn đối mặt với nhiều thách thức. Các phương pháp truyền thống thường gặp khó khăn trong việc xử lý cấu trúc phức tạp của ngôn ngữ tự nhiên, chẳng hạn như phủ định, mỉa mai và nghĩa bóng. Học sâu có thể giải quyết một số vấn đề này, nhưng đòi hỏi lượng lớn dữ liệu huấn luyện và tài nguyên tính toán. Ngoài ra, việc đánh giá độ tin cậy của các ý kiến công chúng trên mạng cũng là một vấn đề nan giải. Việc xây dựng một hệ thống khai phá quan điểm hiệu quả đòi hỏi sự kết hợp giữa các kỹ thuật xử lý ngôn ngữ tự nhiên tiên tiến và khả năng phân tích dữ liệu một cách toàn diện.

2.1. Hạn Chế Của Các Phương Pháp Tiếp Cận Khai Phá Quan Điểm Truyền Thống

Các phương pháp tiếp cận khai phá quan điểm truyền thống thường dựa trên các đặc trưng được thiết kế thủ công, đòi hỏi nhiều công sức và kiến thức chuyên môn. Hơn nữa, các phương pháp này thường khó xử lý các hiện tượng ngôn ngữ phức tạp như phủ định, mỉa mai và phân tích cảm xúc trong ngữ cảnh cụ thể. Do đó, hiệu quả của các phương pháp này thường bị hạn chế khi áp dụng vào các bài toán thực tế.

2.2. Vấn Đề Dữ Liệu Lớn Và Kỹ Thuật Tiền Xử Lý Dữ Liệu Trong Học Sâu

Học sâu đòi hỏi một lượng lớn dữ liệu huấn luyện để đạt được hiệu quả cao. Tuy nhiên, việc thu thập và tiền xử lý dữ liệu văn bản thường tốn kém và phức tạp. Các kỹ thuật tiền xử lý dữ liệu như làm sạch dữ liệu, loại bỏ nhiễu và chuẩn hóa văn bản là rất quan trọng để đảm bảo chất lượng của dữ liệu đầu vào và cải thiện hiệu quả của mô hình học sâu. Điều này đặc biệt quan trọng khi xử lý dữ liệu từ mạng xã hội, nơi chứa nhiều thông tin không chính xác.

III. Đại Học Đà Nẵng Đề Xuất Mô Hình Học Sâu Trích Rút Khía Cạnh

Luận án của Đại học Đà Nẵng tập trung vào việc đề xuất các mô hình học sâu mới để trích rút khía cạnh trong khai phá quan điểm. Nghiên cứu này giới thiệu các mô hình tích hợp BiGRU-CRF và Bi-IndyLSTM-CRF, nhằm cải thiện độ chính xác trong việc xác định các khía cạnh được đề cập trong dữ liệu văn bản. Các mô hình này tận dụng khả năng của mạng neural hồi quy để nắm bắt thông tin ngữ cảnh và mối quan hệ giữa các từ trong câu. Nghiên cứu cũng tiến hành thực nghiệm trên các tập dữ liệu chuẩn để đánh giá hiệu quả của các mô hình đề xuất.

3.1. Mô Hình Tích Hợp BiGRU CRF Cho Trích Rút Khía Cạnh

Mô hình BiGRU-CRF kết hợp mạng neural hồi quy hai chiều (BiGRU) với lớp điều kiện ngẫu nhiên (CRF) để trích rút khía cạnh từ dữ liệu văn bản. BiGRU có khả năng nắm bắt thông tin ngữ cảnh từ cả hai hướng của câu, trong khi CRF giúp đảm bảo tính nhất quán của kết quả trích xuất. Mô hình này được thiết kế để giải quyết các vấn đề liên quan đến việc xác định ranh giới của các khía cạnh và phân loại chúng một cách chính xác.

3.2. Mô Hình Tích Hợp Bi IndyLSTM CRF Cải Tiến Độ Chính Xác

Mô hình Bi-IndyLSTM-CRF là một cải tiến của mô hình BiGRU-CRF, sử dụng mạng bộ nhớ ngắn hạn dài độc lập hai chiều (Bi-IndyLSTM) thay cho BiGRU. Bi-IndyLSTM có khả năng xử lý các phụ thuộc dài hạn trong câu một cách hiệu quả hơn, từ đó cải thiện độ chính xác của trích rút khía cạnh. Nghiên cứu cho thấy rằng mô hình Bi-IndyLSTM-CRF đạt được kết quả tốt hơn so với các mô hình hiện có trên một số tập dữ liệu chuẩn.

IV. Ứng Dụng Học Sâu Đa Tác Vụ Trong Phân Tích Quan Điểm

Nghiên cứu mở rộng khả năng phân tích quan điểm bằng cách đề xuất các mô hình học sâu đa tác vụ. Các mô hình này có thể đồng thời thực hiện các tác vụ như trích rút khía cạnh, phân loại quan điểm và trích rút thực thể. Điều này giúp tận dụng thông tin chung giữa các tác vụ và cải thiện hiệu quả tổng thể của hệ thống. Luận án giới thiệu các mô hình CNN-BiGRU và CNN-IOB2 cho các tác vụ khác nhau, đồng thời đề xuất mô hình MABSA cho việc trích rút và phân loại ba tác vụ: khía cạnh, thực thể và quan điểm.

4.1. Mô Hình CNN BiGRU Cho Trích Rút Khía Cạnh và Phân Loại Quan Điểm

Mô hình CNN-BiGRU kết hợp mạng neural tích chập (CNN) và BiGRU để đồng thời trích rút khía cạnh và phân loại quan điểm. CNN được sử dụng để trích xuất các đặc trưng quan trọng từ dữ liệu văn bản, trong khi BiGRU giúp nắm bắt thông tin ngữ cảnh và mối quan hệ giữa các từ. Kết quả thực nghiệm cho thấy rằng mô hình CNN-BiGRU đạt được hiệu quả cao trong cả hai tác vụ.

4.2. Mô Hình MABSA Cho Khai Phá Quan Điểm Đa Tác Vụ Khía Cạnh Thực Thể Quan Điểm

Mô hình MABSA (Multitask Aspect/Feature-Based Sentiment Analysis) được thiết kế để đồng thời trích rút và phân loại khía cạnh, thực thể và quan điểm. Mô hình này sử dụng kiến trúc học sâu phức tạp, tận dụng thông tin chung giữa các tác vụ để cải thiện hiệu quả tổng thể. Nghiên cứu cho thấy rằng mô hình MABSA đạt được kết quả tốt hơn so với các mô hình đơn tác vụ truyền thống.

V. Khai Phá Quan Điểm Đa Miền Với Học Sâu Tối Ưu 2024

Để tăng tính ứng dụng của khai phá quan điểm trong các bài toán thực tế, nghiên cứu mở rộng sang lĩnh vực khai phá quan điểm đa miền. Các mô hình được đề xuất có thể xử lý dữ liệu văn bản từ nhiều lĩnh vực khác nhau, chẳng hạn như nhà hàng, laptop và khách sạn. Luận án giới thiệu các mô hình CNN-BiLSTM và CNN-BiIndyLSTM-Attention cho khai phá quan điểm đa miền. Nghiên cứu cũng xây dựng một tập dữ liệu đa miền mới, tích hợp các bình luận của người dùng từ các lĩnh vực khác nhau, để đánh giá hiệu quả của các mô hình đề xuất.

5.1. Mô Hình CNN BiLSTM Cho Khai Phá Quan Điểm Mức Khía Cạnh Đa Miền

Mô hình CNN-BiLSTM kết hợp mạng neural tích chập và mạng bộ nhớ ngắn hạn dài hai chiều để khai phá quan điểm mức khía cạnh trên nhiều lĩnh vực khác nhau. CNN được sử dụng để trích xuất các đặc trưng quan trọng từ dữ liệu văn bản, trong khi BiLSTM giúp nắm bắt thông tin ngữ cảnh và mối quan hệ giữa các từ trong câu. Mô hình này được thiết kế để thích ứng với các đặc trưng ngôn ngữ khác nhau trong các lĩnh vực khác nhau.

5.2. CNN BiIndyLSTM Attention Khai Phá Quan Điểm Đa Tác Vụ Đa Miền

Mô hình CNN-BiIndyLSTM-Attention là một cải tiến của mô hình CNN-BiLSTM, sử dụng mạng bộ nhớ ngắn hạn dài độc lập hai chiều và cơ chế attention để khai phá quan điểm đa tác vụ và đa miền. Cơ chế attention cho phép mô hình tập trung vào các phần quan trọng nhất của câu khi đưa ra dự đoán. Nghiên cứu cho thấy rằng mô hình CNN-BiIndyLSTM-Attention đạt được hiệu quả cao trong việc xử lý dữ liệu văn bản từ nhiều lĩnh vực khác nhau.

VI. Kết Luận Và Hướng Phát Triển Nghiên Cứu Học Sâu 2024

Luận án đã đóng góp vào lĩnh vực khai phá quan điểm bằng cách đề xuất các mô hình học sâu mới cho trích rút khía cạnh và phân tích quan điểm đa tác vụ, đa miền. Các mô hình đề xuất đạt được hiệu quả cao trên các tập dữ liệu chuẩn và có tiềm năng ứng dụng trong nhiều bài toán thực tế. Hướng phát triển trong tương lai bao gồm việc nghiên cứu các kiến trúc học sâu phức tạp hơn, tận dụng thông tin từ các nguồn dữ liệu khác nhau và phát triển các phương pháp đánh giá độ tin cậy của các ý kiến công chúng.

6.1. Tổng Kết Đóng Góp Của Luận Án Vào Lĩnh Vực Khai Phá Quan Điểm

Luận án đã thành công trong việc xây dựng các mô hình học sâu mới cho khai phá quan điểm, đạt được hiệu quả cao trên các tập dữ liệu chuẩn. Các mô hình đề xuất có tiềm năng ứng dụng trong nhiều bài toán thực tế, chẳng hạn như phân tích phản hồi của khách hàng, đánh giá sản phẩm và dịch vụ, và theo dõi ý kiến công chúng về các vấn đề xã hội.

6.2. Hướng Nghiên Cứu Tiềm Năng Trong Lĩnh Vực Học Sâu và NLP

Các hướng nghiên cứu tiềm năng trong tương lai bao gồm việc nghiên cứu các kiến trúc học sâu phức tạp hơn, chẳng hạn như mạng transformer, tận dụng thông tin từ các nguồn dữ liệu khác nhau, và phát triển các phương pháp đánh giá độ tin cậy của các ý kiến công chúng. Ngoài ra, việc nghiên cứu các phương pháp học không giám sát và bán giám sát cho khai phá quan điểm cũng là một hướng đi đầy hứa hẹn.

24/05/2025

Bạn đang xem trước tài liệu:

Khai phá quan điểm với kỹ thuật học sâu

Tải đầy đủ

Trích đoạn nội dung tài liệu

CHƯƠNG 1- TỔNG QUAN VỀ KHAI PHÁ QUAN ĐIỂM VÀ KỸ THUẬT HỌC SÂU Chương này tập trung nghiên cứu sự gắn kết giữa lý thuyết học sâu với bài toán khai phá quan điểm thông qua việc: (i) tìm hiểu, nghiên cứu lý thuyết khai phá và phân tích quan điểm, các mức cụ thể trong khai phá quan điểm và những nghiên cứu đã có trước đây dựa trên các hướng tiếp cận khác nhau cùng với những thuận lợi và hạn chế của các hướng tiếp cận này để có cơ sở định hướng nghiên cứu cho luận án; (ii) tìm hiểu các kỹ thuật học sâu phổ biến hiện nay, từ đó xác định những kỹ thuật nào có thể áp dụng cho trích rút, phân loại quan điểm; (iii) xác định kỹ thuật, hướng tiếp cận khai phá quan điểm và phương pháp đánh giá mô hình khai phá quan điểm được sử dụng trong luận án. Dựa trên cơ sở này, phần cuối chương trình bày các đề xuất cho mô hình trích rút, khai phá quan điểm sử dụng học sâu. Các đề xuất này sẽ được thực hiện và trình bày chi tiết trong các chương tiếp theo của luận án. Khai phá quan điểm Quan điểm thể hiện thái độ, xúc cảm của chủ thể bày tỏ quan điểm đối với một sản phẩm, dịch vụ, một nhân tố cụ thể có tầm ảnh hưởng lớn đối với cộng đồng hay một chính sách mới tác động đến quyền lợi, nghĩa vụ của toàn xã hội.

Quan điểm đóng vai trò nền tảng trong tiến trình ra quyết định của mỗi cá nhân, tổ chức và được chia thành hai loại [11][101]: (1) quan điểm chính quy và (2) quan điểm so sánh. (1) Quan điểm chính quy được chia thành hai loại: quan điểm trực tiếp_được thể hiện trực tiếp trên thực thể hoặc khía cạnh của thực thể và quan điểm không trực tiếp_ không thể hiện trực tiếp trên thực thể hoặc trên khía cạnh của thực thể mà dựa trên những kết quả của nó trên một số thực thể khác. (2) Quan điểm so sánh biểu diễn mối liên quan về độ tương tự hoặc khác nhau của các thực thể hoặc thể hiện quan điểm của chủ thể nắm giữ quan điểm là thích khía cạnh này hơn hay khía cạnh kia hơn. Ngoài ra, khai phá quan điểm cũng có thể phân loại thành: (i) quan điểm hiện hay (ii) quan điểm ẩn, dựa trên cách quan điểm được thể hiện trong văn bản [12].

Quan điểm hiện là một câu chủ quan cung cấp một quan điểm chính quy hay quan điểm so sánh. Quan điểm ẩn là một câu khách quan mang ngụ ý quan điểm chính quy hay quan điểm so sánh. Quan điểm được định nghĩa là nhóm năm thành phần (ei, aij, sijkl, hk, tl) [11] với: - ei : tên của thực thể - aij: khía cạnh của ei - sijkl: quan điểm trên khía cạnh aij của thực thể ei - hk : người nắm giữ quan điểm - tl : thời gian khi quan điểm được biểu diễn bởi hk Bất cứ khi nào cần đưa ra một quyết định, người dùng sẽ có khuynh hướng tìm kiếm những quan điểm của những người đi trước, trải nghiệm trước. Chẳng hạn như các cá nhân thường tìm kiếm quan điểm từ bạn bè, gia đình, người quen hoặc cộng đồng mạng.

Các tổ chức, doanh nghiệp thường tìm kiếm các quan điểm từ các cuộc khảo sát, các nhóm tập trung, các cuộc bỏ phiếu, các chuyên gia tư vấn… Cụ thể khi có một tập tài liệu quan điểm, việc khai phá quan điểm về cơ bản sẽ lần lượt thực hiện những tác vụ sau: ▪ Rút trích, phân loại thực thể ▪ Rút trích, phân loại khía cạnh ▪ Rút trích, phân loại chủ thể nắm giữ quan điểm ▪ Rút trích, chuẩn hoá thời gian ▪ Phân loại quan điểm trên từng khía cạnh là tích cực, tiêu cực hay trung lập ▪ Phát sinh tất cả các nhóm quan điểm năm thành phần (ei, aij, sijkl, hk, tl) có xuất hiện trong tập tài liệu dựa trên kết quả thu được từ các công việc vừa thực hiện. Ví dụ: “(1) Danang is a beautiful and friendly tourist city. (2) My brother and I used to travel here. (3) My brother loves smooth white sandy beach stretching his eyes.

(4) I like shimmering bridges in the evening. (5) We tried seafood here, so delicious. (6) 10 However, my brother still complained about traffic in Danang. Tiếp theo là rút trích khía cạnh biểu diễn: aij = {“sandy beach”, “bridges”, “seafood”, “traffic”}.

Tiếp theo tìm kiếm người nắm giữ quan điểm hk trong câu (1), (4) và (5) là {Mark} và trong câu (3), (5) và (6) là {anh trai của Mark}. Sau đó xác định thời gian tl khi văn bản này được đưa lên vào ngày 18/6/2019. Tác vụ tiếp là phân loại quan điểm sijkl: quan điểm là tích cực trong câu (1) về thành phố du lịch Đà Nẵng. Câu (3) đưa ra một quan điểm tích cực về bãi biển Đà Nẵng.

Câu (4) thể hiện quan điểm tích cực về các cây cầu ở Đà Nẵng. Câu (5) cũng đưa ra một quan điểm tích cực về hải sản ở Đà Nẵng. Câu (6) thể hiện quan điểm tiêu cực về giao thông ở Đà Nẵng. Tác vụ cuối cùng là tiến hành phát sinh tất cả các quan điểm dưới dạng nhóm năm thành phần (ei, aij, sijkl, hk, tl).

Như vậy tác vụ này cuối cùng sẽ sinh ra năm quan điểm là các nhóm năm thành phần: (tourist, general, positive, Mark, June-18-2019) (tourist, sandy beach, positive, Mark’s brother, June-18-2019) (tourist, bridges, positive, Mark, June-18-2019) (tourist, food_quality, positive, Mark and his brother, June-18-2019) (tourist, traffic, negative, Mark’s brother, June-18-2019) Khai phá quan điểm hay phân tích cảm xúc là lĩnh vực nghiên cứu nhằm trích rút thông tin về quan điểm, cảm nghĩ, tính chủ quan, sự đánh giá, thái độ, ảnh hưởng, tầm nhìn, xúc cảm…được diễn tả trong văn bản. Các cấp độ khai phá quan điểm Theo Bing Liu [11][12], khai phá quan điểm có thể được phân chia thành các cấp độ/mức khác nhau, được thể hiện ở Hình 1. 11 Khai phá quan điểm mức khía cạnh Khai phá quan điểm mức câu Khai phá quan điểm mức tài liệu Hình 1. Các cấp độ cụ thể trong khai phá quan điểm Mỗi cấp độ trong Hình 1.1 sẽ phù hợp với các tiêu chí và yêu cầu khai phá quan điểm cụ thể trong từng bài toán nhất định.

Khai phá quan điểm mức tài liệu Trong khai phá quan điểm mức tài liệu, toàn bộ văn bản được phân loại vào một trong các lớp quan điểm tích cực, tiêu cực hoặc trung lập tuỳ thuộc vào độ phân cực của thông tin chủ quan được thể hiện trên tài liệu. Cụ thể với một tài liệu bình luận được người dùng cung cấp, khai phá quan điểm sẽ giúp phát hiện được quan điểm của họ thể hiện trên toàn bộ nội dung bình luận. Khai phá quan điểm mức câu Nếu khai phá quan điểm mức tài liệu tập trung phân loại toàn bộ văn bản vào một trong ba lớp quan điểm thì khai phá quan điểm mức câu sẽ thực hiện ở phạm vi cụ thể và chi tiết hơn, đó là tiến hành phân loại quan điểm thể hiện trên mỗi câu bình luận trong toàn văn bản vào một trong ba lớp tích cực, tiêu cực hoặc trung lập. Khai phá quan điểm mức khía cạnh hay mức đặc trưng Khai phá quan điểm mức khía cạnh liên quan đến việc xác định và trích rút những khía cạnh của sản phẩm từ dữ liệu nguồn và xác định quan điểm bày tỏ trên từng khía cạnh đó.

Việc khai phá quan điểm ở mức tài liệu hay mức câu không thể hiện quan điểm tích cực, tiêu cực hay trung lập của người nắm giữ quan điểm đối với từng khía cạnh cụ thể của thực thể được đề cập trong câu hay tài liệu bình luận. Có thể một tài liệu là tích cực trên một thực thể không có nghĩa rằng người nắm giữ quan điểm có các quan điểm 12 tích cực trên tất cả các khía cạnh của thực thể đó. Tương tự, một tài liệu là tiêu cực không có nghĩa là người nắm giữ quan điểm không thích mọi thứ của thực thể. Thực tế thì trong một tài liệu đánh giá, người nắm giữ quan điểm thường thể hiện cả những quan điểm tích cực và tiêu cực trên mỗi khía cạnh của thực thể mặc dù ý kiến tổng quát trên thực thể đó có thể hoặc tích cực hoặc tiêu cực.

Như vậy để đạt được đến các quan điểm cụ thể trên từng khía cạnh chi tiết của thực thể thì cần khai phá quan điểm ở mức khía cạnh. Khai phá quan điểm dựa trên cơ cấu gồm sáu tác vụ được minh hoạ trong ví dụ ở mục 1.1 được gọi là khai phá quan điểm dựa trên khía cạnh hay khai phá quan điểm mức khía cạnh [90][91]. Một mô hình tổng hợp và khai phá quan điểm mức khía cạnh sẽ đảm bảo cung cấp một công thức hoàn chỉnh, trọn vẹn và chi tiết cho vấn đề khai phá quan điểm. Mô hình sẽ xác định những mẫu thông tin chìa khoá nên được khai phá và mô tả một quá trình tổng hợp quan điểm có cấu trúc được tổng hợp từ những văn bản phi cấu trúc.

Cụ thể mô hình chỉ khai phá những khía cạnh của sản phẩm, dịch vụ mà người dùng bày tỏ quan điểm của họ trên đó và xác định những quan điểm này là tích cực hay tiêu cực. Mỗi một cấp độ trong ba cấp độ khai phá quan điểm đã nêu trong các mục 1.3 có thể hữu dụng trong các ngữ cảnh khác nhau. Việc lựa chọn sử dụng cấp độ nào phụ thuộc vào yêu cầu và mục tiêu cụ thể của một tác vụ khai phá quan điểm nhất định. Ví dụ như khai phá quan điểm mức tài liệu có thể phù hợp để phân tích nhanh quan điểm của một số lượng lớn tài liệu, trong khi khai phá quan điểm mức khía cạnh có thể hữu ích hơn để hiểu quan điểm đối với mỗi khía cạnh hoặc đối tượng cụ thể trong tài liệu.

Luận án tập trung vào khai phá quan điểm mức khía cạnh. Đây là cấp độ chi tiết nhất trong ba cấp độ khai phá quan điểm nhằm giúp hệ thống xác định được quan điểm cụ thể của người dùng thể hiện trực tiếp trên mỗi khía cạnh trong tài liệu bình luận được đề cập. Các hướng nghiên cứu khai phá quan điểm Các hệ thống khai phá quan điểm hiện nay nghiên cứu khả năng phân loại, tổng hợp, tìm kiếm và khôi phục quan điểm… đều tập trung vào một số tác vụ cụ thể như trích rút khía cạnh của thực thể mà chủ thể bình luận thể hiện quan điểm trên đó; trích 13 rút từ hoặc cụm từ thể hiện quan điểm của chủ thể bình luận; xác định hướng quan điểm của từ hoặc cụm từ được trích rút từ đó xác định quan điểm của tài liệu, của câu hay cụ thể là quan điểm trên mỗi khía cạnh được trích rút.

Nội dung được bảo vệ bản quyền — Tải xuống đầy đủ

Tài liệu có tiêu đề Khai Phá Quan Điểm Với Kỹ Thuật Học Sâu: Nghiên Cứu Từ Đại Học Đà Nẵng mang đến cái nhìn sâu sắc về ứng dụng của kỹ thuật học sâu trong việc khai thác và phân tích dữ liệu. Nghiên cứu này không chỉ giúp người đọc hiểu rõ hơn về các phương pháp học máy hiện đại mà còn chỉ ra những lợi ích thiết thực mà chúng mang lại trong nhiều lĩnh vực khác nhau. Đặc biệt, tài liệu nhấn mạnh tầm quan trọng của việc áp dụng các kỹ thuật này trong nghiên cứu và phát triển, từ đó mở ra cơ hội cho các nhà nghiên cứu và sinh viên trong việc nâng cao kỹ năng và kiến thức của mình.

Để mở rộng thêm kiến thức về quản lý và đầu tư trong lĩnh vực xây dựng, bạn có thể tham khảo tài liệu Luận văn thạc sĩ quản lý vốn đầu tư xây dựng cơ bản từ ngân sách nhà nước tại trung tâm nhiệt đới việt nam. Tài liệu này sẽ cung cấp cho bạn những thông tin bổ ích về cách thức quản lý và sử dụng vốn hiệu quả trong các dự án xây dựng, từ đó giúp bạn có cái nhìn toàn diện hơn về lĩnh vực này.

#xử lý ngôn ngữ tự nhiên

#phát triển công nghệ thông tin

#phân tích cảm xúc

#kỹ thuật học sâu

#khai phá quan điểm

#Nghiên cứu tại Đại Học Đà Nẵng

Chủ đề

Nghiên cứu và phát triển tại Việt Nam

Tương lai của công nghệ AI

Ứng dụng của học sâu trong phân tích dữ liệu

Kỹ thuật học máy và ngôn ngữ tự nhiên