Hệ Thống Nhận Diện Độ Tin Cậy Thông Tin Trên Mạng Xã Hội Việt Nam

Khóa luận nghiên cứu hệ thống nhận diện độ tin cậy thông tin trên mạng xã hội Việt Nam theo thời gian thực bằng phương pháp học sâu.

Trường đại học

Đại học Quốc gia TP. Hồ Chí Minh

Chuyên ngành

Cử nhân ngành Khoa học Dữ liệu

Người đăng

Ẩn danh

Thể loại

khóa luận tốt nghiệp

2023

Phí lưu trữ

35 Point

Mục lục chi tiết

LỜI CẢM ƠN

1. CHƯƠNG 1: CẤU TRÚC KHÓA LUẬN

1.1. Lí do chọn đề tài

1.2. Tổng quan về tin giả và bài toán đánh giá độ tin cậy của tin tức

1.2.1. Khai niệm tin giả

1.2.2. Tổng quan về bài toán đánh giá độ tin cậy của tin tức

1.2.2.1. Phát hiện tự động dựa trên nội dung

1.2.2.2. Phát hiện tự động dựa trên ngữ cảnh xã hội

2. CHƯƠNG 2: CÔNG TRÌNH NGHIÊN CỨU LIÊN QUAN

2.1. Các công trình nghiên cứu về phát hiện tin giả trên thế giới

2.2. Các công trình nghiên cứu về phát hiện tin giả tại Việt Nam

2.3. Các vấn đề còn tồn tại và phương hướng giải quyết của khóa luận

2.3.1. Các vấn đề còn tồn tại

2.3.2. Mục tiêu của đề tài

3. CHƯƠNG 3: PHƯƠNG PHÁP HỌC SÂU TRỰC TUYẾN

3.1. Tiền xử lý dữ liệu văn bản

3.2. Tiền xử lý dữ liệu ảnh

3.3. Tiền xử lý metadata

3.4. Tiền xử lý tên người dùng

3.5. Phương pháp học sâu

3.5.1. Mạng nơ-ron nhiều lớp (Multilayer Perceptron)

3.5.2. Đặc trưng dữ liệu văn bản

3.5.2.1. BiLSTM và BiGRU

3.5.3. Đặc trưng dữ liệu ảnh minh họa

3.5.4. Đặc trưng các số liệu liên quan

3.5.5. Đặc trưng về nguồn tin

3.6. Phương pháp kết hợp đa mô hình

3.7. Phương pháp học trực tuyến và hiện tượng Catastrophic Forgetting

3.7.1. Định nghĩa Học trực tuyến cho mạng nơ-ron nhân tạo

3.7.2. Học chủ động

3.7.3. Catastrophic Forgetting và áp dụng Replay để khắc phục

3.7.3.1. Hiện tượng Concept Drift trong dữ liệu tin tức

3.7.3.2. Cơ chế Replay của hệ thần kinh sinh học

3.7.3.3. Áp dụng Replay cho mạng nơ-ron nhân tạo

4. CHƯƠNG 4: THỰC NGHIỆM SO SÁNH HIỆU SUẤT CÁC MÔ HÌNH

4.1. Bộ dữ liệu

4.1.1. ReINTEL 2020 public train

4.1.2. FEvent: Bài đăng tin tức của Việt Nam trên Facebook theo sự kiện

4.1.3. Nguồn gốc bộ dữ liệu

4.1.4. Phương pháp thu thập

4.2. Xây dựng mô hình

4.2.1. Các dạng bộ nhớ tạm thời

4.2.2. Mô hình cho đặc trưng văn bản

4.2.3. Mô hình dành cho đặc trưng ảnh

4.2.4. Mô hình dành cho đặc trưng metadata

4.2.5. Mô hình dành cho đặc trưng tên người dùng

4.2.6. Các mô hình kết hợp

4.3. Thiết kế luồng dữ liệu thí nghiệm

4.4. Phương pháp đánh giá

4.4.1. Các tiêu chí đánh giá

4.5. Giai đoạn thực nghiệm

4.6. Giai đoạn triển khai

4.7. Kết quả thực nghiệm và thảo luận

4.7.1. Kết quả trên bộ dữ liệu ReINTEL

4.7.2. Kết quả trên bộ dữ liệu FEvent

4.7.3. Nhận xét và thảo luận

4.7.4. Hiệu suất của các mô hình khi được huấn luyện trực tuyến

4.7.5. Khả năng của các dạng bộ nhớ tạm

4.7.6. So sánh mô hình Online và Offline

5. CHƯƠNG 5: XÂY DỰNG HỆ THỐNG XỬ LÝ THỜI GIAN THỰC

5.1. Tổng quan kiến trúc hệ thống

5.2. Kiến trúc Microservices

5.3. Container hóa các mô đun

5.4. Quá trình xây dựng hệ thống

5.5. Xây dựng Tiện ích trên trình duyệt

5.6. Xây dựng Bộ phận xử lý

5.6.1. Mô đun tiền xử lý

5.6.2. Mô đun mô hình

5.6.3. Mô đun lưu trữ

6. CHƯƠNG 6: KẾT LUẬN VÀ PHƯƠNG HƯỚNG PHÁT TRIỂN

6.1. Các kết quả đạt được

6.2. Các điểm hạn chế

6.3. Hướng phát triển

Tóm tắt

I. Tổng quan về Hệ Thống Nhận Diện Độ Tin Cậy Thông Tin Trên Mạng Xã Hội Việt Nam

Hệ thống nhận diện độ tin cậy thông tin trên mạng xã hội Việt Nam đang trở thành một vấn đề cấp thiết trong bối cảnh thông tin sai lệch ngày càng gia tăng. Với sự phát triển mạnh mẽ của các nền tảng mạng xã hội, người dùng dễ dàng tiếp cận và chia sẻ thông tin. Tuy nhiên, điều này cũng dẫn đến việc lan truyền tin giả, gây ảnh hưởng tiêu cực đến xã hội. Hệ thống này không chỉ giúp người dùng phân biệt thông tin đáng tin cậy mà còn hỗ trợ các nhà quản lý trong việc kiểm soát nội dung.

1.1. Khái niệm và tầm quan trọng của độ tin cậy thông tin

Độ tin cậy thông tin là khả năng mà thông tin được cung cấp có thể được xác thực và tin tưởng. Trong bối cảnh mạng xã hội, việc đánh giá độ tin cậy này trở nên khó khăn hơn do sự đa dạng và tốc độ lan truyền của thông tin. Hệ thống nhận diện độ tin cậy giúp người dùng có cái nhìn khách quan hơn về thông tin họ tiếp nhận.

1.2. Tình hình tin giả trên mạng xã hội Việt Nam

Tin giả đang trở thành một vấn nạn nghiêm trọng trên mạng xã hội Việt Nam. Theo thống kê, hàng triệu bài viết sai lệch được phát tán mỗi ngày, ảnh hưởng đến nhận thức và hành vi của người dùng. Việc phát hiện và ngăn chặn tin giả là cần thiết để bảo vệ an toàn thông tin cho cộng đồng.

II. Vấn đề và Thách thức trong Nhận Diện Độ Tin Cậy Thông Tin

Mặc dù có nhiều nghiên cứu và giải pháp được đưa ra, nhưng việc nhận diện độ tin cậy thông tin vẫn gặp nhiều thách thức. Các yếu tố như tính ẩn danh, tốc độ lan truyền và sự phức tạp của nội dung khiến cho việc phát hiện tin giả trở nên khó khăn. Hệ thống cần phải có khả năng phân tích sâu và nhanh chóng để đáp ứng nhu cầu thực tế.

2.1. Những khó khăn trong việc phát hiện tin giả

Một trong những khó khăn lớn nhất là sự đa dạng của các nguồn thông tin. Tin giả có thể được ngụy trang dưới dạng tin thật, khiến cho việc phân loại trở nên phức tạp. Hệ thống cần phải có khả năng phân tích ngữ nghĩa và ngữ cảnh để đưa ra quyết định chính xác.

2.2. Tác động của tin giả đến xã hội

Tin giả không chỉ gây ra sự hoang mang trong cộng đồng mà còn có thể dẫn đến những hậu quả nghiêm trọng như xung đột xã hội và mất niềm tin vào các nguồn thông tin chính thống. Việc phát hiện và xử lý tin giả kịp thời là rất quan trọng để bảo vệ an toàn thông tin cho người dùng.

III. Phương Pháp Nhận Diện Độ Tin Cậy Thông Tin Trên Mạng Xã Hội

Để phát hiện độ tin cậy của thông tin, nhiều phương pháp đã được nghiên cứu và áp dụng. Các phương pháp này bao gồm việc sử dụng các thuật toán học máy và học sâu để phân tích nội dung và ngữ cảnh xã hội. Hệ thống cần phải được thiết kế để có thể tự động cập nhật và cải thiện theo thời gian.

3.1. Các thuật toán học máy trong nhận diện tin giả

Các thuật toán như SVM, Random Forest và Neural Networks đã được áp dụng để phân loại thông tin. Những thuật toán này giúp hệ thống nhận diện được các đặc trưng của tin giả và tin thật, từ đó đưa ra quyết định chính xác hơn.

3.2. Học sâu và ứng dụng trong nhận diện thông tin

Học sâu đã mở ra nhiều cơ hội mới trong việc phát hiện tin giả. Các mô hình như CNN và RNN cho phép hệ thống phân tích sâu hơn về nội dung văn bản và hình ảnh, từ đó nâng cao độ chính xác trong việc nhận diện độ tin cậy thông tin.

IV. Ứng Dụng Thực Tiễn của Hệ Thống Nhận Diện Độ Tin Cậy

Hệ thống nhận diện độ tin cậy thông tin không chỉ có giá trị trong việc bảo vệ người dùng mà còn hỗ trợ các tổ chức trong việc quản lý nội dung. Các ứng dụng thực tiễn của hệ thống bao gồm việc phát hiện tin giả trong thời gian thực và cung cấp thông tin đáng tin cậy cho người dùng.

4.1. Phát hiện tin giả trong thời gian thực

Hệ thống có khả năng phân tích và phát hiện tin giả ngay khi thông tin được đăng tải. Điều này giúp người dùng có thể nhận diện và tránh xa các thông tin sai lệch ngay lập tức.

4.2. Cung cấp thông tin đáng tin cậy cho người dùng

Hệ thống không chỉ phát hiện tin giả mà còn cung cấp các nguồn thông tin đáng tin cậy cho người dùng. Điều này giúp nâng cao nhận thức và khả năng phân tích thông tin của người dùng trong môi trường mạng xã hội.

V. Kết Luận và Tương Lai của Hệ Thống Nhận Diện Độ Tin Cậy

Hệ thống nhận diện độ tin cậy thông tin trên mạng xã hội Việt Nam là một giải pháp cần thiết trong bối cảnh thông tin sai lệch đang gia tăng. Tương lai của hệ thống này sẽ phụ thuộc vào việc cải tiến các thuật toán và công nghệ để nâng cao độ chính xác và khả năng tự động hóa. Việc phát triển hệ thống này không chỉ giúp bảo vệ người dùng mà còn góp phần xây dựng một môi trường mạng xã hội an toàn hơn.

5.1. Hướng phát triển công nghệ trong nhận diện tin giả

Công nghệ nhận diện tin giả sẽ tiếp tục phát triển với sự hỗ trợ của các thuật toán học sâu và trí tuệ nhân tạo. Việc cải tiến các mô hình sẽ giúp nâng cao khả năng phát hiện và phân loại thông tin.

5.2. Tầm quan trọng của giáo dục người dùng

Giáo dục người dùng về cách nhận diện thông tin đáng tin cậy cũng là một phần quan trọng trong việc giảm thiểu tác động của tin giả. Các chương trình đào tạo và hướng dẫn sẽ giúp người dùng nâng cao khả năng phân tích và đánh giá thông tin.

10/07/2025

Bạn đang xem trước tài liệu:

Khóa luận tốt nghiệp khoa học dữ liệu hệ thống nhận diện độ tin cậy của thông tin trên mạng xã hội việt nam theo thời gian thực sử dụng phương pháp học sâu trực tuyến

Tải đầy đủ

Trích đoạn nội dung tài liệu

ĐẠI HỌC QUOC GIA TP. HO CHÍ MINH TRUONG DAI HOC CONG NGHE THONG TIN KHOA KHOA HOC VA KY THUAT THONG TIN BUI ANH KHÔI - 19520649 KHÓA LUẬN TÓT NGHIỆP HE THONG NHAN DIỆN ĐỘ TIN CAY CUA THONG TIN TREN MẠNG XÃ HỘI VIỆT NAM THEO THỜI GIAN THỰC SỬ DỤNG PHƯƠNG PHÁP HỌC SÂU TRỰC TUYẾN ONLINE DEEP LEARNING APPROACH FOR REAL-TIME RELIABLE INTELLIGENCE IDENTIFICATION ON VIETNAMESE SOCIAL NETWORKS CỬ NHÂN NGANH KHOA HỌC DU LIEU GIANG VIEN HUONG DAN TS. Đỗ Trọng Hợp TS. Nguyễn Thanh Bình TP.

HO CHÍ MINH, 2023 LỜI CẢM ƠN Trong thời gian thực hiện luận văn tốt nghiệp này, tôi đã nhận được rất nhiều sự giúp đỡ và hướng dẫn tận tình từ nhiều góc nhìn. Tôi xin gửi lời chào đến tất cả những người đã hỗ trợ mình dé vượt qua khó khăn dé hoàn thành báo cáo vào năm cuôi đại học. Đầu tiên tôi xin chân thành cảm ơn TS. Đỗ Trọng Hợp, người đã hỗ trợ mạnh mẽ và hướng dẫn tôi trong suốt quá trình học tập cũng như hoàn thành khóa luận này.

Mặc dù thầy có nhiều công việc và lịch trình bận rộn, thầy đã sắp xếp thời gian, hướng dẫn và hỗ trợ các cuộc họp mặt rất chỉ tiết. Nhân cơ hội này, tôi cũng bày tỏ lòng biết ơn đối với tất cả các giáo viên đã giúp tôi phát triển và trưởng thành dé có thể tích lũy những kiến thức và bài học quý báu đề hoàn thành luận văn bằng thực lực của mình. Tôi cũng gửi lời cảm ơn đến những người bạn đã hỗ trợ tham gia xây dựng bộ dữ liệu và đóng góp kết quả ở khóa luận này. Nếu không có sự hỗ trợ của họ, tôi đã không thê hoàn thành kết quả nghiên cứu.

Tôi cũng muốn thể hiện sự hài lòng với bản thân mình vì đã là một học sinh có trách nhiệm, có gắng và làm việc chăm chỉ trong hoàn cảnh căng thắng dé có thé hoàn thành khóa luận này. Và cuối cùng cũng là đặc biệt nhất, tôi xin gửi lời cảm ơn đến gia đình, đặc biệt là bố mẹ vi đã luôn bên cạnh cổ vũ ủng hộ tôi. Nhờ có họ tôi đã có thể vững tin bước trên con người học tập của mình và là động lực để tôi thực hiện những điều lớn lao. Tôi xin chân thành cảm ơn! Tác giả MỤC LỤC Chương l.

Cấu trúc khóa luận.-----222V222++++222EEEEY+rtt2EEEEEELrrrrtrrrrrrrrrrrree 3 1. Lí do chọn đề tài. Tổng quan về tin giả và bài toán đánh giá độ tin cậy của tin tức. Khai niệm tin giả.

Tổng quan về bài toán đánh giá độ tin cậy của tin tức. Phát hiện tự động dựa trên nội dung. Phát hiện tự động dựa trên ngữ cảnh xã hội. CÔNG TRÌNH NGHIÊN CỨU LIÊN QUAN.

Các công trình nghiên cứu về phát hiện tin giả trên thé giới. Các công trình nghiên cứu về phát hiện tin giả tại Việt Nam. Các van dé còn tồn tại và phương hướng giải quyết của khóa luận. Các vấn đề còn tồn tại.

Mục tiêu của đề tài.-2222+cc222ExxtreErkrrrrrrrrrrrrrve 0 Chương 3. PHƯƠNG PHÁP HỌC SÂU TRỰC TUYẾN.-------- 1 KG xt LY di Sẽ. _ Tiền xử lý dữ liệu văn bản. Tiền xử lý đữ liệu ảnh.

_ Tiền xử lý metadata. _ Tiền xử lý tên người dùng. Phương pháp học sâu. Mạng nơ-ron nhiều lớp (Multilayer Perceptron).

_ Đặc trưng dữ liệu văn bản. BiLSTM và BiGRU. Đặc trưng dữ liệu ảnh minh họa. Đặc trưng các số liệu liên quan.

Đặc trưng về nguồn tỉn. Phương pháp kết hợp đa mô hình. Phương pháp học trực tuyến và hiện tượng Catastrophic Forgetting. Định nghĩa Học trực tuyến cho mạng nơ-ron nhân tao.

Học chủ động. Catastrophic Forgetting và áp dung Replay dé khắc phục. Hiện tượng Concept Dift trong dữ liệu tin tức. Cơ chế Replay của hệ thần kinh sinh học.

Áp dụng Replay cho mạng nơ-ron nhân tạo. THỰC NGHIỆM SO SÁNH HIỆU SUAT CÁC MÔ HINH. Bộ dữ liệu. ReINTEL 2020 public train.

_ FEvent: Bai đăng tin tức của Việt nam trên Facebook theo sự kién. Nguồn gốc bộ dữ liệu. Phương pháp thu thập. Xây dựng mô hình.

--- «kh HT TT HH it 33 4. Các dạng bộ nhớ tạm thời jMĨ. Mô hình cho đặc trưng văn bản. Mô hình dành cho đặc trưng ảnh.

Mô hình dành cho đặc trưng metadata. | Mô hình dành cho đặc trưng tên người ding. Các mô hình kết hợp. Thiết kế luồng dữ liệu thí nghiệm.

Phương pháp đánh giá. _ Các tiêu chí đánh giá. Giai đoạn thực nghiệm. — Giai đoạn triển khai.

Kết quả thực nghiệm và thảo luận. Kết quả trên bộ dữ liệu RelNTEL. Kết quả trên bộ dữ liệu FEvent. __ Nhận xét và thảo luận.

Hiệu xuất của các mô hình khi được huấn luyện trực tuyến _— 53 4. Khả năng của các dạng bộ nhớ tạm. So sánh mô hình Online và Offline. XÂY DỰNG HE THONG XỬ LY THỜI GIAN THỤC.

Tổng quan kiến trúc hệ thống. St tt HH HH2 0101121021001 re. Kiến trúc MicrOSerViCes. Container hóa các mô đun.

Quá trình xây dung hệ th6ng. | Xây dựng Tiện ích trên trình duyỆt. Xây dựng Bộ phận xử lý. Mô đun tiền xử lý.

M6 đun mô hình. Mô đun lưu trữ.--ccccccttrtetheeerereườn 69 Chương 6. KÉT LUẬN VÀ PHƯƠNG HƯỚNG PHAT TRIỄN. Các kết quả đạt được.

Các điểm hạn chế. Hướng phát triển.----ccc:+-2222E2222+zttttEEEEEErrrrrtrtrrrrrrrrrrrrrrrrrree 72 Hình 1.1: Sơ đồ mô tả Hình 3.1: Quy trình tiền xử lý dữ liệu văn bản.2: Quy trình tiền xử lý dit liệu ảnh.3: Các dạng đặc trưng được sử dụng cho bài toán phát hiện tin giả tự động.4: Kiến trúc mạng nơ-ron nhân tạo nhiều lớp.5: Kiến trúc RNN.cccccccotonnnnn2222122211 re 7 Hình 3.6: Kiếm trúc LSTM.7: Kiến trúc GRU.--22+©2VV++++2EE2++t222E31222221111222211 2221122221 xe 9 Hình 3.8: Kiến trúc của một Khối du (Residual Bloek).9: Sơ đồ kế hợp đa mô hình.-- ¿--2+z+2E+++++2EE++zzttrvzerrrrrscee 22 Hình 3.10: Sơ đồ mô tả quá trình mô hình cập nhật chính nó trên từng mẫu mới đến từ luồng dữ liệu liên tục.:¿-52222+2222+222222E++tE2EEErtEEEkrrrrrrrkrrerrkrrrrrer 23 Hình 3.11: Mô tả phương pháp học chủ động.12: Cơ chế Replay trong mạng thần kinh sinh học [39].13: Mô tả vị trí của Hồi hải mã trong não người [41] Hình 3.14: Hoạt động của cơ chế Replay trong quá trình củng có trí nhớ trong các giai đoạn tỉnh thức, NREM, REM.15: Mô tả kiến trúc mô hình được xây dựng với cơ chế Replay.1: Mô tả phương pháp Prequential Evaluation .1: Tổng quan kiến trúc của Bộ phận xử lý.2: Kiến trúc Container [57].3: Kiến trúc của co 1 .4: Giao diện của tiện ích — Dữ liệu thô đã được gửi đến bộ phận xử lý và tiện ích đang chờ đợi phản hồi.----22222£222VEESS2++tt22EEESEEErrrrtttrErkvrrrrrrrrrrrrreg 65 Hình 5.5: Giao diện của tiện ích — Tiện ích hiển thị dự đoán nhận được từ bộ phận xt LY va hai n0 no.6: Giao diện của tiện ích — Sau khi người dùng thao tác, phản hồi sẽ được gửi về bộ phận xử lý và bài viết sẽ được đánh đấu theo nhãn tương ứng. 66 DANH MỤC BANG Bang 4.1: Mô tả thuộc tính bộ dữ liệu ReINTEL public traïn.2: Hướng dẫn gán nhãn cho bộ dữ liệu FEvent.3: Mô tả thuộc tính bộ dữ liệu FEvenI.4: Chia dữ liệu các sessions trong quá trình thực nghiêm.5: Kết quả hiệu xuất phân loại của các mô hình sử dụng đặc trưng văn bản có G được khởi tạo trong quá trình huấn luyện (trên bộ dữ liệu ReINTEL 2020) .6: Kết quả hiệu xuất phân loại của các mô hình sử dụng đặc trưng văn bản có G là PhoW2V (trên bộ dữ liệu Re[NTEL 2020) .7: Kết quả hiệu xuất phân loại của các mô hình sử dụng đặc trưng văn bản có G 1a phoBERT (trên bộ dit liệu Re[NTEL 2020).8: Kết quả hiệu xuất phân loại của các mô hình sử dụng đặc trưng ảnh (trên bộ dữ liệu ReINTEL 2020) .9: Kết quả hiệu xuất phân loại của các mô hình sử dụng đặc trưng metadata và tên người dùng (trên bộ dữ liệu ReINTEL 2020) „44 Bảng 4.10: Kết quả hiệu xuất phân loại của các mô hình sử dụng kết hợp nhiều đặc trưng (trên bộ dữ liệu ReINTEL 2020).11: Kết quả hiệu suất các mô hình khi trong quá trình khởi tạo (trên bộ dữ I9)85{0060500202000600606ẺSẺẺa1ạ.12: Kết quả hiệu xuất phân loại của các mô hình sử dụng đặc trưng văn bản có G được khởi tạo trong quá trình huấn luyện (trên bộ dữ liệu EEvent).13: Kết quả hiệu xuất phân loại của các mô hình sử dụng đặc trưng văn bản có G là PhoW2V (trên bộ dữ liệu FEvent).14: Kết quả hiệu xuất phân loại của các mô hình sử dụng đặc trưng văn bản có G là phoBERT (trên bộ dữ liệu FEvent).15: Kết quả hiệu xuất phân loại của các mô hình sử dung đặc trưng ảnh (trên bộ dữ liệu FEvent).16: Kết quả hiệu xuất phân loại của các mô hình sử dụng đặc trưng metadata và tên người dùng (trên bộ dữ liệu FEVent).17: Kết quả hiệu xuất phân loại của các mô hình sử dụng kết hợp nhiều đặc trưng (trên bộ dữ liệu FEVeII().18: Hiệu xuất của mô hình PhoBERT+TextCNN trên bộ dữ liệu ReINTEL2020 qua các dạng bộ nhớ tạm.19: So sánh mô hình Online và Offline của các mô hình đơn lẻ trên bộ dữ II )85{006020920200000ẺĐ88a.1: Mô tả các hàm xử lý chính trong Tiện ích Chrome.2: Giới hạn tài nguyên và thứ tự khởi chạy của các thành phần trong hệ n1.3: Thiết lập cho mô đun Websocket.----22¿522szcs2vcvsccsccvseceeex 67 Bang 5.4: Thiết lập cho mô đun tiền xử lY.5: Thiết lập cho mô đun Mô hình.----c:¿-2222222cccz222vvvsecccez 69 DANH MỤC TU VIET TAT STT Tên thuật ngữ Chú thích BERT Bidirectional Encoder Representations from ' Transformers 2 | BiGRU Bidirectional Gated Recurrent Unit 3 | BiLSTM Bidirectional Long Short Term Memory 4 | CNN Convolutional Neural Network 5 |HD Independent and Identically Distributed 6 |MLP Multilayer Perceptron 7 |NLP Natural Language Processing 8 | NON-IID Non - Independent and Identically Distributed 9 | RGB RGB là viết tắt của “red, green, va blue” 10 |RNN Recurrent Neural Network 11 | SVM Support Vector Machine J2 TextCNN Convolutional Neural Network for Text Classification 13 URL Uniform Resource Locator TÓM TÁT KHÓA LUẬN Với sự nở rộ bùng né của của những trang mạng xã hội tại Việt Nam, người dùng đã có một nơi đề dễ dàng tiếp nhận, chia sẻ các nội dung, thông tin, cũng như chức năng kết nối mọi người. Tuy nhiên, với các đặc tính như nặc danh, lan truyền thông tin nhanh cũng đã “tiếp tay” cho vấn nạn tin giả, tin tức thiếu tính tin cậy.

Chính vì lượng thông tin sai lệch được lan truyền khắp nơi đó, nó sẽ ảnh hưởng đến đời sống và an toàn của cá nhân con người và các tổ chức. Với mục đích khắc phục hiện tượng trên, khóa luận này đề xuất một hệ thống có thé hỗ trợ phát hiện các tin tức không đáng tin cậy đồng thời cập nhật chính bản thân nó liên tục theo thời gian thực trong quá trình sử dụng mạng xã hội của người dùng. Hệ thống được xây dựng theo kiến trúc Microservices dudi dạng các container. Điều này tối ưu hóa các thao tác khi triển khai, vận hành và bảo trì.

Nội dung được bảo vệ bản quyền — Tải xuống đầy đủ

Chủ đề

Đánh giá độ tin cậy thông tin

Tin giả và ảnh hưởng xã hội

Phương pháp phát hiện tin giả

Hệ thống xử lý thông tin thời gian thực