Luận văn thạc sĩ về hệ thống tự động tổng hợp ý kiến góp ý trong hội nghị

Luận văn thạc sĩ nghiên cứu hệ thống tự động tổng hợp ý kiến góp ý trong hội nghị 04, đánh giá hiện trạng, phân tích vấn đề, đề xuất biện pháp hoàn thiện trong lĩnh vực .

Trường đại học

Đại học Quốc gia Hà Nội

Chuyên ngành

Công nghệ thông tin

Người đăng

Ẩn danh

Thể loại

luận văn thạc sĩ

2014

Phí lưu trữ

30 Point

Mục lục chi tiết

LỜI CAM ĐOAN

LỜI CẢM ƠN

1. TỔNG QUAN VỀ KHAI PHÁ QUAN ĐIỂM

1.1. Các khái niệm trong khai phá quan điểm

1.2. Đoạn đánh giá

1.3. Các đặc trưng

1.4. Người đưa ra quan điểm

1.5. Các thách thức trong khai phá quan điểm

1.5.1. Phong cách viết khác nhau

1.5.2. Quan điểm thay đổi theo thời gian

1.5.3. Độ mạnh của quan điểm

1.5.4. Các câu với đánh giá pha trộn

1.6. Các bài toán trong khai phá quan điểm

1.6.1. Phân lớp quan điểm

1.6.2. Khai phá quan điểm so sánh

2. CÁC PHƯƠNG PHÁP TỔNG HỢP Ý KIẾN

2.1. Các nghiên cứu liên quan đến tổng hợp ý kiến

2.2. Phân loại tổng hợp ý kiến

2.3. Tổng hợp ý kiến dựa trên đặc trưng

2.3.1. Nhận diện đặc trưng

2.3.2. Dự đoán chiều hướng quan điểm

2.3.3. Sinh bản tổng hợp

2.4. Tổng hợp ý kiến không dựa trên đặc trưng

2.4.1. Tổng hợp cơ bản

2.4.2. Tổng hợp văn bản

2.4.3. Tổng hợp dựa trên thực thể

2.5. Tóm tắt

3. BÀI TOÁN TỔNG HỢP Ý KIẾN GÓP Ý TRONG HỘI NGHỊ

3.1. Chức năng mong muốn của hệ thống

3.2. Thu thập ý kiến

3.3. Tổng hợp ý kiến

3.4. Gợi ý cho ban thư ký

3.5. Mô hình đề xuất

3.5.1. Pha thu thập dữ liệu

3.5.2. Pha tiền xử lý dữ liệu

3.5.3. Pha xác định chủ đề của ý kiến

3.5.4. Pha gom nhóm ý kiến

3.5.5. Pha phân lớp ý kiến

3.5.6. Pha sinh bản tóm tắt

3.6. Phương pháp đánh giá

3.6.1. Đánh giá pha xác định chủ đề

3.6.2. Đánh giá pha phân lớp ý kiến

3.7. Tóm tắt

4. THỰC NGHIỆM VÀ ĐÁNH GIÁ

4.1. Môi trường thực nghiệm

4.2. Công cụ phần mềm

4.3. Dữ liệu thực nghiệm

4.4. Chương trình thực nghiệm

4.5. Kết quả thực nghiệm

4.5.1. Kết quả đánh giá bước xác định chủ đề

4.5.2. Kết quả đánh giá bộ phân lớp NaiveBayes tự xây dựng

4.5.3. Kết quả đánh giá bộ phân lớp sử dụng mã nguồn mở Weka

4.6. Một số giao diện minh họa

4.6.1. Giao diện chính

4.6.2. Giao diện thêm mới ý kiến

4.6.3. Giao diện tổng hợp ý kiến

KẾT LUẬN VÀ ĐỊNH HƯỚNG

TÀI LIỆU THAM KHẢO

Tóm tắt

I. Giới thiệu về hệ thống tự động tổng hợp ý kiến trong hội nghị

Hệ thống tự động tổng hợp ý kiến trong hội nghị là một công cụ quan trọng trong việc quản lý và phân tích thông tin từ các cuộc họp lớn. Với sự gia tăng số lượng người tham gia, việc thu thập và tổng hợp ý kiến trở nên khó khăn hơn. Hệ thống này giúp giảm thiểu gánh nặng cho ban thư ký bằng cách tự động hóa quy trình thu thập và tổng hợp ý kiến. Công nghệ tự động được áp dụng để phân tích và tổng hợp ý kiến từ nhiều nguồn khác nhau, từ đó tạo ra một bản tổng hợp ngắn gọn và dễ hiểu. Điều này không chỉ tiết kiệm thời gian mà còn nâng cao chất lượng thông tin được trình bày trong hội nghị. Theo nghiên cứu, việc sử dụng công nghệ thông tin trong tổng hợp ý kiến đã cho thấy hiệu quả rõ rệt trong việc cải thiện quy trình ra quyết định.

1.1. Mục tiêu của hệ thống

Mục tiêu chính của hệ thống là tự động hóa quy trình tổng hợp ý kiến từ các đại biểu tham gia hội nghị. Hệ thống sẽ thu thập ý kiến, phân tích và tổng hợp chúng thành một bản tóm tắt. Điều này giúp ban thư ký có thể tập trung vào việc xử lý thông tin thay vì phải dành thời gian cho việc tổng hợp thủ công. Hệ thống cũng sẽ cung cấp các gợi ý cho ban thư ký dựa trên các ý kiến đã được tổng hợp. Việc này không chỉ giúp nâng cao hiệu quả làm việc mà còn đảm bảo rằng tất cả các ý kiến đều được xem xét một cách công bằng và đầy đủ. Quản lý hội nghị hiệu quả hơn sẽ dẫn đến những quyết định chính xác hơn và cải thiện sự hài lòng của các đại biểu tham gia.

II. Các phương pháp tổng hợp ý kiến

Trong lĩnh vực tổng hợp ý kiến, có nhiều phương pháp khác nhau được áp dụng. Các phương pháp này có thể được phân loại thành hai nhóm chính: tổng hợp dựa trên đặc trưng và tổng hợp không dựa trên đặc trưng. Tổng hợp dựa trên đặc trưng thường sử dụng các mô hình thống kê để phân tích và tổng hợp ý kiến từ các đặc trưng cụ thể của đối tượng. Ngược lại, tổng hợp không dựa trên đặc trưng thường sử dụng các phương pháp tổng hợp văn bản để tạo ra một bản tóm tắt từ các ý kiến đã thu thập. Việc lựa chọn phương pháp phù hợp sẽ phụ thuộc vào mục tiêu cụ thể của hội nghị và loại thông tin cần tổng hợp. Phân tích ý kiến là một phần quan trọng trong quá trình này, giúp xác định các xu hướng và quan điểm chính từ các ý kiến được thu thập.

2.1. Tổng hợp dựa trên đặc trưng

Tổng hợp dựa trên đặc trưng là phương pháp sử dụng các đặc trưng cụ thể của ý kiến để thực hiện tổng hợp. Phương pháp này thường bao gồm các bước như nhận diện đặc trưng, phân loại ý kiến và tổng hợp thông tin. Việc nhận diện đặc trưng giúp hệ thống hiểu rõ hơn về nội dung của ý kiến và từ đó có thể tổng hợp chúng một cách chính xác hơn. Các mô hình thống kê như Naive Bayes hay Support Vector Machine thường được sử dụng trong quá trình này. Phân tích dữ liệu là một phần không thể thiếu trong việc xác định các đặc trưng quan trọng, từ đó giúp hệ thống đưa ra các quyết định chính xác hơn trong việc tổng hợp ý kiến.

III. Thực nghiệm và đánh giá hệ thống

Thực nghiệm là một phần quan trọng trong việc đánh giá hiệu quả của hệ thống tự động tổng hợp ý kiến. Các thử nghiệm được thực hiện trong môi trường thực tế để kiểm tra khả năng thu thập và tổng hợp ý kiến của hệ thống. Kết quả thực nghiệm cho thấy hệ thống có khả năng xử lý một lượng lớn dữ liệu và cung cấp các bản tổng hợp chính xác và nhanh chóng. Việc đánh giá cũng bao gồm việc so sánh với các phương pháp tổng hợp truyền thống để xác định ưu điểm và nhược điểm của hệ thống. Đánh giá hiệu suất của hệ thống là một yếu tố quan trọng để đảm bảo rằng nó đáp ứng được nhu cầu của người dùng và có thể cải thiện quy trình tổng hợp ý kiến trong các hội nghị.

3.1. Kết quả thực nghiệm

Kết quả thực nghiệm cho thấy hệ thống tự động tổng hợp ý kiến có thể thu thập và xử lý thông tin từ hàng trăm đại biểu tham gia hội nghị. Hệ thống đã cho ra các bản tổng hợp với độ chính xác cao, giúp ban thư ký tiết kiệm thời gian và công sức trong việc tổng hợp ý kiến. Các chỉ số đánh giá như độ chính xác, độ tin cậy và thời gian xử lý đều cho thấy sự cải thiện rõ rệt so với các phương pháp tổng hợp truyền thống. Điều này chứng tỏ rằng công nghệ tự động không chỉ giúp nâng cao hiệu quả làm việc mà còn cải thiện chất lượng thông tin được trình bày trong hội nghị.

25/01/2025

Bạn đang xem trước tài liệu:

Luận văn thạc sĩ hệ thống tự động tổng hợp ý kiến góp ý trong hội nghị 04

Tải đầy đủ

Nội dung chính

Tổng quan nghiên cứu

Trong bối cảnh sự phát triển mạnh mẽ của nền tảng Web 2.0 như blog, diễn đàn, mạng xã hội, việc thu thập và khai thác ý kiến người dùng trở thành một nguồn thông tin quan trọng. Theo một khảo sát với hơn 2000 người trưởng thành tại Mỹ, có khoảng 60% người dùng Internet tìm hiểu sản phẩm qua các nhận xét trực tuyến, trong đó từ 73% đến 87% cho biết các nhận xét này ảnh hưởng đáng kể đến quyết định mua hàng. Tuy nhiên, với số lượng lớn ý kiến đa dạng và phong phú, việc tổng hợp và phân tích các ý kiến này trở thành một thách thức lớn, đặc biệt trong các hội nghị quy mô lớn với hàng trăm đại biểu tham gia.

Luận văn tập trung nghiên cứu xây dựng hệ thống tự động tổng hợp ý kiến góp ý trong hội nghị, nhằm hỗ trợ ban thư ký giảm tải công việc tổng hợp thủ công, đồng thời tạo ra bản tổng hợp thô có cấu trúc rõ ràng theo các chủ đề và tiêu chí đã định sẵn. Nghiên cứu giới hạn trong phạm vi thu thập, xử lý và tổng hợp ý kiến góp ý liên quan đến Dự thảo sửa đổi Hiến pháp năm 1992 tại Việt Nam, với dữ liệu thu thập từ trang thông tin điện tử của Quốc hội, bao gồm 203 ý kiến của đại biểu Quốc hội và 1258 ý kiến của người dân.

Mục tiêu cụ thể của luận văn là xây dựng mô hình tổng hợp ý kiến tự động, bao gồm các pha thu thập, tiền xử lý, xác định chủ đề, gom nhóm, phân lớp ý kiến và sinh bản tóm tắt thô. Hệ thống hướng tới việc hỗ trợ ban thư ký hội nghị trong việc tổng hợp ý kiến góp ý một cách nhanh chóng, chính xác và có cấu trúc, góp phần nâng cao hiệu quả quản lý và ra quyết định trong các hội nghị lớn.

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Luận văn dựa trên các lý thuyết và mô hình nghiên cứu trong lĩnh vực khai phá quan điểm (opinion mining) và tổng hợp ý kiến (opinion summarization). Hai lý thuyết chính được áp dụng gồm:

Khai phá quan điểm (Opinion Mining): Đây là lĩnh vực nghiên cứu nhằm tự động xác định quan điểm, cảm xúc, thái độ của người dùng trong văn bản tự nhiên. Các khái niệm cốt lõi bao gồm đối tượng (object), đặc trưng (feature), quan điểm (opinion), người đưa ra quan điểm (opinion holder) và chiều hướng quan điểm (tích cực, tiêu cực, trung lập). Lý thuyết này giúp phân tích và trích xuất các ý kiến cụ thể liên quan đến từng đặc trưng của đối tượng.
Tổng hợp ý kiến dựa trên đặc trưng (Feature-based Opinion Summarization): Phương pháp này chia văn bản ý kiến thành các khía cạnh hoặc chủ đề con (đặc trưng), sau đó dự đoán cảm xúc cho từng đặc trưng và sinh bản tóm tắt có cấu trúc. Ba bước chính gồm: nhận diện đặc trưng, dự đoán chiều hướng cảm xúc, và sinh bản tổng hợp. Các kỹ thuật NLP như gán nhãn từ loại (POS tagging), phân tích cú pháp, khai phá luật kết hợp và học máy được sử dụng để thực hiện các bước này.

Các khái niệm chuyên ngành như phân lớp quan điểm, tổng hợp tường phản (contrastive opinion summarization), và tổng hợp dựa trên thực thể cũng được tham khảo để nâng cao hiệu quả tổng hợp ý kiến.

Phương pháp nghiên cứu

Nguồn dữ liệu chính của nghiên cứu là các ý kiến góp ý về Dự thảo sửa đổi Hiến pháp năm 1992, thu thập từ trang thông tin điện tử của Quốc hội Việt Nam. Tổng số dữ liệu gồm 203 ý kiến của đại biểu Quốc hội và 1258 ý kiến của người dân.

Phương pháp nghiên cứu bao gồm các bước:

Thu thập dữ liệu: Sử dụng công cụ Jsoup để tải mã nguồn trang web và RegexBuddy để trích xuất nội dung ý kiến, đảm bảo dữ liệu thu thập có cấu trúc phù hợp.
Tiền xử lý dữ liệu: Chuyển đổi dữ liệu ý kiến từ dạng văn bản tự do sang dạng có cấu trúc (XML, JSON), lưu trữ trong cơ sở dữ liệu MySQL với các bảng lưu trữ thông tin ý kiến và đại biểu.
Xác định chủ đề ý kiến: Áp dụng biểu thức chính quy và tập luật để tách ý kiến thành các phần nhỏ theo từng điều khoản, chương của dự thảo, sử dụng thư viện jvnTextPro để phân tách câu.
Gom nhóm và phân lớp ý kiến: Gom nhóm các ý kiến theo chủ đề đã xác định, phân lớp ý kiến theo chiều hướng tích cực, tiêu cực hoặc trung lập dựa trên kỹ thuật học máy và từ điển cảm xúc.
Sinh bản tóm tắt: Tạo bản tổng hợp thô các ý kiến theo chủ đề, hỗ trợ ban thư ký trong việc tổng hợp và chỉnh sửa bản cuối cùng.

Thời gian nghiên cứu kéo dài từ năm 2013 đến 2014, tập trung vào xây dựng mô hình và thử nghiệm với dữ liệu mô phỏng, chuẩn bị cho việc triển khai hệ thống hoàn chỉnh trong giai đoạn tiếp theo.

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

Thu thập và xử lý dữ liệu hiệu quả: Luận văn đã thu thập thành công 1461 ý kiến góp ý (203 ý kiến đại biểu Quốc hội, 1258 ý kiến người dân) liên quan đến Dự thảo sửa đổi Hiến pháp năm 1992. Việc sử dụng công cụ Jsoup và RegexBuddy giúp trích xuất dữ liệu chính xác, giảm thiểu sai sót trong quá trình thu thập.
Xác định chủ đề ý kiến chính xác: Qua việc áp dụng biểu thức chính quy và tập luật, hệ thống có thể tách ý kiến dài của đại biểu Quốc hội thành nhiều ý kiến nhỏ theo từng điều khoản, chương. Khoảng 85% ý kiến đại biểu được phân tách thành các phần nhỏ có chủ đề rõ ràng, giúp tăng độ chính xác trong tổng hợp.
Phân lớp ý kiến theo chiều hướng cảm xúc: Sử dụng kỹ thuật học máy kết hợp từ điển cảm xúc, hệ thống đạt độ chính xác phân lớp ý kiến tích cực, tiêu cực khoảng 78%, cao hơn 15% so với phương pháp dựa trên từ điển đơn thuần. Điều này cho thấy việc kết hợp học máy giúp cải thiện hiệu quả phân loại.
Tổng hợp ý kiến theo chủ đề: Bản tổng hợp thô được tạo ra có cấu trúc rõ ràng, phân chia theo các chủ đề và tiêu chí đã định sẵn, giúp ban thư ký dễ dàng rà soát và chỉnh sửa. So với tổng hợp thủ công, hệ thống giảm thời gian xử lý ý kiến khoảng 40%, đồng thời giảm thiểu sai sót do nhập liệu thủ công.

Thảo luận kết quả

Kết quả nghiên cứu cho thấy việc áp dụng các kỹ thuật khai phá quan điểm và tổng hợp ý kiến dựa trên đặc trưng trong bối cảnh hội nghị quy mô lớn là khả thi và hiệu quả. Việc tách ý kiến dài thành các phần nhỏ theo chủ đề giúp tăng tính chính xác trong phân loại và tổng hợp, đồng thời giảm tải cho người tổng hợp.

So sánh với các nghiên cứu trước đây chủ yếu tập trung vào tổng hợp ý kiến sản phẩm trên mạng xã hội, luận văn đã mở rộng ứng dụng vào lĩnh vực chính trị - xã hội với dữ liệu có tính chất phức tạp và đa dạng hơn. Việc sử dụng dữ liệu thực tế từ trang thông tin điện tử của Quốc hội cũng tăng tính thực tiễn và khả năng áp dụng của hệ thống.

Tuy nhiên, một số hạn chế còn tồn tại như độ chính xác phân lớp chưa đạt mức tối ưu do ngôn ngữ tự nhiên phức tạp, các câu có đánh giá pha trộn gây khó khăn trong phân loại. Ngoài ra, việc tổng hợp ý kiến vẫn dừng ở mức bản tổng hợp thô, cần sự can thiệp của ban thư ký để hoàn thiện bản cuối cùng.

Dữ liệu và kết quả có thể được trình bày qua các biểu đồ so sánh độ chính xác phân lớp, biểu đồ phân bố ý kiến theo chủ đề, và bảng tổng hợp số lượng ý kiến tích cực, tiêu cực theo từng điều khoản, giúp minh họa rõ ràng hiệu quả của mô hình.

Đề xuất và khuyến nghị

Phát triển hệ thống tự động hoàn chỉnh: Tiếp tục hoàn thiện hệ thống tự động tổng hợp ý kiến, mở rộng các module thu thập và tiền xử lý dữ liệu, tích hợp các thuật toán học sâu để nâng cao độ chính xác phân lớp và tổng hợp. Mục tiêu đạt độ chính xác trên 85% trong vòng 12 tháng, do nhóm nghiên cứu và kỹ sư phần mềm thực hiện.
Mở rộng phạm vi ứng dụng: Áp dụng hệ thống cho các hội nghị, diễn đàn khác có quy mô lớn và đa dạng chủ đề, như hội nghị doanh nghiệp, chính quyền địa phương. Thời gian triển khai thử nghiệm trong 6 tháng, phối hợp với các cơ quan tổ chức hội nghị.
Tăng cường đào tạo và hỗ trợ ban thư ký: Cung cấp các khóa đào tạo sử dụng hệ thống cho ban thư ký, giúp họ hiểu và khai thác hiệu quả bản tổng hợp thô, đồng thời thu thập phản hồi để cải tiến hệ thống. Thực hiện định kỳ hàng quý, do đơn vị phát triển phần mềm phối hợp với các tổ chức hội nghị.
Nghiên cứu nâng cao xử lý ngôn ngữ tự nhiên: Đầu tư nghiên cứu các kỹ thuật NLP tiên tiến như xử lý ngôn ngữ phức tạp, nhận diện quan điểm pha trộn, và tổng hợp ý kiến trừu tượng để cải thiện chất lượng bản tổng hợp cuối cùng. Dự kiến nghiên cứu trong 18 tháng, hợp tác với các viện nghiên cứu chuyên ngành.

Đối tượng nên tham khảo luận văn

Nhà nghiên cứu và sinh viên ngành Công nghệ Thông tin, Hệ thống Thông tin: Luận văn cung cấp cơ sở lý thuyết và phương pháp thực nghiệm về khai phá quan điểm và tổng hợp ý kiến, giúp phát triển các đề tài nghiên cứu liên quan.
Các tổ chức, cơ quan tổ chức hội nghị, diễn đàn lớn: Hệ thống tự động tổng hợp ý kiến góp phần nâng cao hiệu quả quản lý, giảm tải công việc tổng hợp thủ công, hỗ trợ ra quyết định chính xác hơn.
Chuyên gia phân tích dữ liệu và xử lý ngôn ngữ tự nhiên: Luận văn trình bày các kỹ thuật xử lý dữ liệu phi cấu trúc, phân lớp cảm xúc và tổng hợp ý kiến theo chủ đề, là tài liệu tham khảo hữu ích cho phát triển các ứng dụng tương tự.
Nhà hoạch định chính sách và quản lý: Việc tổng hợp ý kiến góp ý từ người dân và đại biểu Quốc hội giúp nắm bắt chính xác tâm tư, nguyện vọng xã hội, hỗ trợ xây dựng chính sách phù hợp và hiệu quả.

Câu hỏi thường gặp

Hệ thống tự động tổng hợp ý kiến hoạt động như thế nào?
Hệ thống thu thập ý kiến từ các nguồn dữ liệu, tiền xử lý để chuẩn hóa, xác định chủ đề từng ý kiến, gom nhóm và phân lớp theo chiều hướng cảm xúc, cuối cùng tạo bản tổng hợp thô hỗ trợ ban thư ký hoàn thiện.
Dữ liệu thu thập có đảm bảo tính chính xác và đầy đủ không?
Dữ liệu được thu thập từ trang thông tin điện tử chính thức của Quốc hội, sử dụng công cụ tự động và biểu thức chính quy để trích xuất nội dung, đảm bảo độ chính xác cao và phù hợp với mục tiêu nghiên cứu.
Phân lớp ý kiến dựa trên phương pháp nào?
Phân lớp sử dụng kết hợp kỹ thuật học máy (Naive Bayes, SVM) và từ điển cảm xúc, giúp xác định chiều hướng tích cực, tiêu cực hoặc trung lập của từng ý kiến với độ chính xác khoảng 78%.
Hệ thống có thể áp dụng cho các lĩnh vực khác ngoài hội nghị không?
Có thể, với việc điều chỉnh tập luật và từ điển đặc thù, hệ thống có thể mở rộng ứng dụng cho các lĩnh vực như khảo sát khách hàng, phân tích mạng xã hội, hoặc tổng hợp ý kiến trong các sự kiện lớn.
Làm thế nào để cải thiện độ chính xác của hệ thống?
Cải thiện bằng cách tích hợp các kỹ thuật NLP tiên tiến, mở rộng dữ liệu huấn luyện, sử dụng học sâu và tăng cường xử lý ngôn ngữ phức tạp, đồng thời thu thập phản hồi từ người dùng để điều chỉnh mô hình.

Kết luận

Luận văn đã xây dựng thành công mô hình tự động tổng hợp ý kiến góp ý trong hội nghị với dữ liệu thực tế về Dự thảo sửa đổi Hiến pháp năm 1992.
Hệ thống giúp giảm 40% thời gian tổng hợp ý kiến so với phương pháp thủ công, đồng thời nâng cao độ chính xác và tính nhất quán trong tổng hợp.
Phương pháp xác định chủ đề ý kiến dựa trên biểu thức chính quy và tập luật cho phép tách ý kiến dài thành các phần nhỏ có chủ đề rõ ràng, hỗ trợ phân tích chi tiết.
Kỹ thuật phân lớp kết hợp học máy và từ điển cảm xúc đạt độ chính xác phân loại khoảng 78%, mở ra hướng phát triển nâng cao hơn trong tương lai.
Các bước tiếp theo bao gồm hoàn thiện hệ thống tự động, mở rộng phạm vi ứng dụng và nghiên cứu nâng cao kỹ thuật xử lý ngôn ngữ tự nhiên để cải thiện chất lượng tổng hợp.

Khuyến nghị các tổ chức hội nghị và nhà nghiên cứu trong lĩnh vực công nghệ thông tin áp dụng và phát triển hệ thống, đồng thời phối hợp nghiên cứu để nâng cao hiệu quả và mở rộng ứng dụng trong các lĩnh vực khác.

Trích đoạn nội dung tài liệu

Mở đầu: Đặt ra vấn đề, mục tiêu và giải pháp cho bài toán tổng hợp ý kiến đóng góp trong hội nghị.  Chƣơng 1: Giới thiệu tổng quan - các khái niệm cơ bản về khai phá quan điểm và bài toán tổng hợp quan điểm.  Chƣơng 2: Trình bày các phƣơng pháp cho bài toán tổng hợp ý kiến chung.  Chƣơng 3: Đề xuất mô hình cho bài toán tổng hợp ý kiến trong hội nghị.

 Chƣơng 4: Thực nghiệm và đánh giá các phƣơng pháp, xây dựng demo cho việc xử lý và phân lớp các ý kiến mới.  Kết luận & định hƣớng: Tổng kết lại những kiến thức đã tích lũy, kinh nghiệm đƣợc áp dụng trong suốt quá trình thực hiện luận văn. Đƣa ra đƣợc các hƣớng phát triển trong tƣơng lai. TỔNG QUAN VỀ KHAI PHÁ QUAN ĐIỂM 1.

Giới thiệu Một phần quan trọng trong việc thu thập thông tin là luôn tìm ra “Nh ng i u ng i h c ngh ”. Khi bạn muốn mua một chiếc máy tính xách tay HP Pavilon DV6 bạn đặt ra các câu hỏi “Máy HP có tốt không? Dòng Pavilon của HP dùng thế nào? Pin dùng có lâu không?. Chính nhận xét của những ngƣời đã dùng máy tính HP sẽ là câu trả lời cho các câu hỏi mà bạn thắc mắc [5]. Theo cuộc khảo sát hơn 2000 ngƣời Mỹ trƣởng thành cho thấy 81 ngƣời dùng Internet (chiếm tỷ lệ 60 ngƣời Mỹ) đã thực hiện việc tìm hiểu về một sản phẩm thông qua Internet.

Có từ 73 đến 87 số ngƣời nói r ng các nhận xét về sản phẩm có sự ảnh hƣởng quan trọng đến việc lựa chọn mua sản phẩm của họ [5]. Nhƣ vậy, quan điểm của ngƣời khác giúp chúng ta có thêm thông tin khi quyết định một vấn đề, nó ảnh hƣởng rất lớn đến hành vi của chúng ta. Bất cứ khi nào chúng ta phải đƣa ra một quyết định, chúng ta thƣờng phải tham khảo những ý kiến của những ngƣời khác. Với cá nhân, chúng ta tham khảo từ gia đình và bạn bè.

Với tổ chức, họ tổ chức các cuộc điều tra, thăm dò dƣ luận để nắm bắt đƣợc ý kiến. Sự bùng nổ của nền tảng Web 2.0 nhƣ blog, di n đàn thảo luận, mạng ngang hàng, và nhiều loại truyền thông xã hội khác giúp cho ngƣời tiêu dùng có thể d dàng chia s kinh nghiệm và quan điểm về bất kì sản phẩm hoặc dịch vụ nào. Với sự phong phú của các nguồn tài nguyên về quan điểm, việc sử dụng công nghệ thông tin để tìm kiếm và hiểu đƣợc ý kiến của con ngƣời là một cơ hội và thách thức rất lớn. Khai phá quan điểm là lĩnh vực nghiên cứu mà cố gắng để làm cho hệ thống tự động xác định quan điểm của con ngƣời từ văn bản đƣợc viết b ng ngôn ngữ tự nhiên.

Khai phá quan điểm nghiên cứu về ý kiến, tình cảm, quan niệm chủ quan, đánh giá, thái độ, thẩm định, cảm xúc… đƣợc thể hiện trong văn bản. Những điều đó đƣợc thể hiện qua các nhận xét, blog, các cuộc thảo luận, tin tức, bình luận, phản hồi… hay các tài liệu khác [5]. Khai phá quan điểm dựa trên ngôn ngữ tính toán, truy vấn thông tin, khai thác văn bản, xử lý ngôn ngữ tự nhiên, học máy, thống kê và phân tích dự đoán. Các khái niệm trong khai phá quan điểm Liu [4] đƣa ra định nghĩa quan điểm: Một quan iểm bao gồm 5 yếu tố (ei, aij, sijkl, hk, tl) trong ó ei là tên của chủ thể, aij là ặc tr ng của ei, sijkl là quan iểm v ặc tr ng aij của ei, hk là nguồn của quan iểm và tl là th i iểm mà quan iểm ó ợc biểu ạt bởi hk.

Quan iểm sijkl có thể tích cực, tiêu cực, trung lập hoặc biểu diễn bởi thang nh gi. Một quan iểm nhận xét v sản phẩm iPhone trên Blog Ví dụ: Một quan điểm về điện thoại iPhone trên Blog nhƣ trong Hình 1.1 đƣợc biểu di n dƣới một số bộ năm nhƣ sau: (iPhone, GENERAL , + , Abc123 , 5-1-2008) (iPhone, touch_screen, +, Abc123, 5-1-2008) (iPhone, voice_quality, +, Abc123, 5-1-2008) (Blackberry, keys, -, Abc123, 5-1-2008) Theo Bing Liu [2], các quan điểm có thể thể hiện về bất cứ điều gì, ví dụ nhƣ một sản phẩm, một cá nhân, một tổ chức, một chủ đề… Ông sử dụng thuật ngữ đối tƣợng (Object) để biểu thị các chủ thể đƣợc đề cập.Theo đó, ông đƣa ra một số khái niệm trong khai phá quan điểm bao gồm: Đối tƣợng, các đặc trƣng, đoạn đánh giá, quan điểm, ngƣời đánh giá. Đối tƣợng Dùng để chỉ thực thể (ngƣời, sản phẩm, sự kiện, chủ đề, …) đƣợc đánh giá. Mỗi đối tƣợng có một tập các thành phần (components) hay thuộc tính (attributes) gọi chung là các đặc trƣng (features).

Mỗi thành phần hay thuộc tính lại có một tập các thành phần hay thuộc tính con. Nhƣ vậy, một đối tƣợng O đƣợc biểu di n bởi một cặp [T, A] trong đó T là một cấu trúc phân cấp thành phần cha, thành phần con, A là tập các thuộc tính của đối tƣợng O [3]. Ví dụ: Máy ảnh có một tập thành phân: ống kính, pin và các thuộc tính: kích cỡ, khối lƣợng, chất lƣợng ảnh. Thành phần pin có các thuộc tính con: kích cỡ, thời gian….

Theo định nghĩa này, một đối tƣợng có thể biểu di n nhƣ một cây phân cấp. Gốc của cây chính là đối tƣợng đó, mỗi node không phải gốc là một thành phần hoặc thành phần con của đối tƣợng, mỗi cạnh chỉ một quan hệ part-of. Mỗi node đƣợc gán một tập các thuộc tính, mỗi quan điểm có thể biểu di n thông qua một node bất kỳ và các thuộc tính của node đó. Đoạn đánh giá Gọi một tài liệu quan điểm là d, trong trƣờng hợp tổng quát nhất, d bao gồm một tập các câu tuần tự d = {s1, s2, … sm}.Đoạn đánh giá về một đặc trƣng f của đối tƣợng O trong d là một tập các câu liên tiếp trong d di n tả quan điểm tích cực hay tiêu cực về đặc trƣng f.

Đoạn đánh giá bao gồm tối thiểu ít nhất một câu có thể biểu di n quan điểm về một đối tƣợng hoặc thuộc tính của đối tƣợng. Ngoài ra, một câu đơn cũng có thể biểu di n quan điểm trên một hoặc nhiều đặc đặc trƣng. Ví dụ: “Chất l ợng âm thanh của chiếc iện thoại này tốt, nh ng tuổi thọ pin lại ngắn”. Các đặc trƣng Nếu một đặc trƣng f hoặc bất kì từ đồng nghĩa nào với nó xuất hiện trong câu s, thì f là đặc trƣng hiện (Explicit feature) trong s.

Ngƣợc lại, ta nói f là đặc trƣng ẩn (Implicit feature) [3]. Ví dụ: Máy ảnh này đắt quá: Đặc trƣng “giá” là đặc trƣng ẩn. Màu sắc của chiếc áo này đẹp ghê: Đặc trƣng màu sắc là đặc trƣng hiện. Ngƣời đƣa ra quan điểm Ngƣời đƣa ra quan điểm (Opinion holder) là ngƣời hoặc tổ chức thể hiện quan điểm.

Ngƣời đƣa ra quan điểm còn gọi là nguồn của quan điểm. Trong trƣờng hợp đánh giá sản phẩm, di n đàn, blog thì ngƣời đƣa ra quan điểm thƣờng là các tác giả của đánh giá hay bài viết đó [3]. Ví dụ: “John bày tỏ sự bất ồng ý kiến của mình v hiệp ớc”. Ngƣời đƣa ra quan điểm là “John”.

Quan điểm Một quan điểm trên một đặc trƣng f là một nhận xét, thái độ, cảm xúc hay sự đánh giá tích cực hoặc tiêu cực trên đặc trƣng f từ một ngƣời đƣa ra quan điểm. Chiều hƣớng của một quan điểm trên đặc trƣng f có thể là tích cực, tiêu cực hoặc trung lập. Quan điểm hiện (explicit opinion) là một câu thể hiện quan điểm mang tính chủ quan, di n trả trực tiếp quan điểm tích cực hay tiêu cực của tác giả. Quan điểm ẩn (implicit opinion) về một đặc trƣng f là câu thể hiện quan điểm tích cực hay tiêu cực một cách không tƣờng minh [3].

Các thách thức trong khai phá quan điểm 1. Phong cách viết khác nhau Thực tế, các bình luận hay quan điểm nhập vào bởi những ngƣời khác nhau thì họ có cách viết khác nhau, từ cách thức sử dụng ngôn ngữ, chữ viết tắt và kiến thức của họ là một thách thức riêng của mỗi ngƣời. Mọi ngƣời đều không bày tỏ ý kiến theo cùng một cách. Ngƣời ta có thể sử dụng các thuật ngữ trong một câu tiêu đề xuất hiện trên một tờ báo trực tuyến và xuất hiện trong một di n đàn trực tuyến là rất khác nhau (điều này phụ thuộc vào bối cảnh mà quan điểm đó đƣợc thể hiện).

Trên thực tế, hầu hết trong xử lý văn bản truyền thống thì sự khác biệt nhỏ giữa hai phần của văn bản không thay đổi ý nghĩa nhiều. Tuy nhiên trong khai phá quan điểm, "bộ phim hay" là rất khác với "bộ phim không hay" [22]. Quan điểm thay đổi theo thời gian Một thách thức khác cần phải xét đến là vấn đề làm thế nào để có thể theo dõi các quan điểm thay đổi theo thời gian. Tâm trạng của một ngƣời nào đó có thể thay đổi nhƣng điều đó không nhất thiết r ng quan điểm về một sản phẩm hoặc dịch vụ nhất định sẽ thay đổi theo.

Nếu một sản phẩm cải thiện sau một thời gian có thể là vì nhiều ngƣời đang hài lòng với nó và vì họ có thể bị thuyết phục sau một cuộc thảo luận dài trong một di n đàn về sản phẩm [22]. Độ mạnh của quan điểm Xác định độ mạnh của một quan điểm là một thách thức phải đối mặt trong khai phá quan điểm. Nhiều nỗ lực đã đƣợc thực hiện để xác định các yếu tố quyết định sức mạnh của một ý kiến trong một bối cảnh. Bổ sung thêm việc phân lớp các từ thành các mức độ xu hƣớng quan điểm khác nhau, một số từ bổ nghĩa có thể đƣợc dùng để xác định độ mạnh của quan điểm(“rất”, “một chút”, “hết sức”, “hơi”…).

Cụm từ “rất hài lòng” và “hơi hài lòng” sẽ đƣợc phân lớp thành rất tích cực và kém tích cực nếu “rất” và “hơi” đƣợc phân tích và sử dụng để xác định mức độ đối lập [22]. Các câu với đánh giá pha trộn Một thách thức lớn đối với khai phá quan điểm xuất hiện khi mọi ngƣời thể hiện đánh giá tích cực và tiêu cực trong cùng một câu. Điều này chủ yếu là kết quả khi mọi ngƣời đang giao tiếp thông qua các phƣơng tiện truyền thông không nghi thức nhƣ blog và các di n đàn. Mọi ngƣời có nhiều ý kiến khác nhau trong cùng một câu.

Những câu nhƣ vậy có thể gây khó khăn để phân tích cú pháp hoặc khai phá quan điểm [22].

Nội dung được bảo vệ bản quyền — Tải xuống đầy đủ

Bài luận văn thạc sĩ mang tiêu đề "Luận văn thạc sĩ về hệ thống tự động tổng hợp ý kiến góp ý trong hội nghị" của tác giả Phạm Văn Hà, dưới sự hướng dẫn của TS. Bùi Quang Hưng và PGS. Vũ Duy Lợi, được thực hiện tại Đại học Quốc gia Hà Nội vào năm 2014. Bài viết tập trung vào việc phát triển một hệ thống tự động giúp tổng hợp ý kiến góp ý trong các hội nghị, từ đó nâng cao hiệu quả trong việc thu thập và xử lý thông tin. Hệ thống này không chỉ giúp tiết kiệm thời gian mà còn đảm bảo tính chính xác và khách quan trong việc ghi nhận ý kiến của người tham gia.

Để mở rộng thêm kiến thức về các ứng dụng công nghệ tự động hóa trong các lĩnh vực khác, bạn có thể tham khảo bài viết "Luận văn về ứng dụng hệ thống SCADA trong truyền tải điện", nơi nghiên cứu về việc áp dụng công nghệ tự động hóa trong quản lý và điều khiển hệ thống điện. Ngoài ra, bài viết "Luận văn thạc sĩ về tự động hóa và điều khiển robot biped phi tuyến" cũng cung cấp cái nhìn sâu sắc về việc ứng dụng công nghệ tự động hóa trong lĩnh vực robot. Cuối cùng, bạn có thể tìm hiểu thêm về "Luận văn thạc sĩ về điều khiển robot song song hai bậc tự do trong kỹ thuật cơ điện tử", một nghiên cứu liên quan đến điều khiển tự động trong lĩnh vực cơ điện tử. Những tài liệu này sẽ giúp bạn có cái nhìn tổng quát hơn về các ứng dụng của công nghệ tự động hóa trong nhiều lĩnh vực khác nhau.

#Luận văn Thạc sĩ

#Phân tích dữ liệu

#công nghệ thông tin

#hệ thống tự động

#quản lý hội nghị

#tổng hợp ý kiến

Chủ đề

Công nghệ tự động hóa

Nghiên cứu và phát triển trong giáo dục

Phân tích và xử lý dữ liệu

Quản lý và tổ chức hội nghị