Nghiên Cứu Phát Hiện Nội Dung Xúc Phạm Trên Mạng Xã Hội Việt Nam Sử Dụng Mô Hình Phobert-CNN

Khóa luận nghiên cứu nhận diện nội dung xúc phạm trên mạng xã hội Việt Nam bằng mô hình Phobert CNN, góp phần nâng cao an toàn trực tuyến.

Trường đại học

Đại học Quốc gia TP. Hồ Chí Minh

Chuyên ngành

Khoa học dữ liệu

Người đăng

Ẩn danh

Thể loại

Khóa luận tốt nghiệp

2022

133

Phí lưu trữ

35 Point

Mục lục chi tiết

LỜI CẢM ƠN

1. MỞ ĐẦU

2. NỘI DUNG ĐỀ TÀI

2.1. Mục tiêu, phạm vi và đối tượng của đề tài

2.2. Đóng góp chính của đề tài

2.3. Các vấn đề còn tồn đọng

3. PHƯƠNG PHÁP THỰC HIỆN

3.1. Dữ liệu HSD

3.2. Mô hình tiếng Việt

3.3. Tiền xử lý dữ liệu

3.4. PhoBERT-CNN

3.5. Ứng dụng

4. KẾT QUẢ MONG ĐỢI CỦA ĐỀ TÀI

TƯ LIỆU THAM KHẢO

Tóm tắt

I. Tổng Quan Về Phát Hiện Nội Dung Xúc Phạm Trên Mạng Xã Hội

Trong bối cảnh mạng xã hội phát triển mạnh mẽ tại Việt Nam, việc phát hiện nội dung xúc phạm trở thành một vấn đề cấp thiết. Nội dung độc hại không chỉ ảnh hưởng đến tâm lý người dùng mà còn gây ra những hệ lụy nghiêm trọng cho xã hội. Mô hình Phobert-CNN được đề xuất như một giải pháp hiệu quả để nhận diện và phân loại các bình luận xúc phạm trên các nền tảng mạng xã hội.

1.1. Tầm Quan Trọng Của Việc Phát Hiện Nội Dung Xúc Phạm

Việc phát hiện nội dung xúc phạm giúp bảo vệ người dùng, đặc biệt là trẻ em, khỏi những tác động tiêu cực từ môi trường mạng. Nghiên cứu cho thấy rằng nội dung độc hại có thể dẫn đến sự gia tăng bạo lực và phân biệt đối xử trong xã hội.

1.2. Mô Hình Phobert CNN Là Gì

Mô hình Phobert-CNN kết hợp giữa Phobert, một biến thể của BERT cho tiếng Việt, và CNN, một mạng nơ-ron tích chập, nhằm tối ưu hóa khả năng phân loại nội dung. Mô hình này đã chứng minh được hiệu quả trong việc nhận diện các bình luận xúc phạm trên mạng xã hội.

II. Vấn Đề Và Thách Thức Trong Phát Hiện Nội Dung Xúc Phạm

Mặc dù có nhiều tiến bộ trong công nghệ, việc phát hiện nội dung xúc phạm vẫn gặp phải nhiều thách thức. Các bình luận có thể được viết bằng nhiều cách khác nhau, sử dụng từ ngữ địa phương hoặc ngôn ngữ lóng, làm cho việc phân loại trở nên khó khăn.

2.1. Đặc Điểm Của Nội Dung Xúc Phạm Trên Mạng Xã Hội

Nội dung xúc phạm thường mang tính chất đa dạng và phức tạp. Các bình luận có thể chứa từ ngữ thô tục, hoặc chỉ đơn giản là những lời chỉ trích không mang tính xây dựng, gây khó khăn cho việc nhận diện.

2.2. Thách Thức Trong Việc Phân Tích Dữ Liệu

Việc phân tích dữ liệu từ mạng xã hội đòi hỏi phải xử lý một lượng lớn thông tin không có cấu trúc. Điều này tạo ra thách thức lớn cho các mô hình học máy trong việc nhận diện chính xác nội dung xúc phạm.

III. Phương Pháp Phát Hiện Nội Dung Xúc Phạm Bằng Mô Hình Phobert CNN

Mô hình Phobert-CNN được xây dựng dựa trên hai giai đoạn chính: tiền xử lý dữ liệu và huấn luyện mô hình. Quy trình này giúp nâng cao độ chính xác trong việc phân loại các bình luận xúc phạm.

3.1. Quy Trình Tiền Xử Lý Dữ Liệu

Quy trình tiền xử lý bao gồm việc chuẩn hóa văn bản, loại bỏ các ký tự không cần thiết và tách từ. Điều này giúp cải thiện chất lượng dữ liệu đầu vào cho mô hình.

3.2. Huấn Luyện Mô Hình Phobert CNN

Mô hình được huấn luyện trên hai bộ dữ liệu lớn, ViHSD và HSD-VLSP, giúp cải thiện khả năng phân loại. Kết quả cho thấy mô hình có độ chính xác cao trong việc nhận diện nội dung xúc phạm.

IV. Ứng Dụng Thực Tiễn Của Mô Hình Phobert CNN

Mô hình Phobert-CNN không chỉ dừng lại ở việc phát hiện nội dung xúc phạm mà còn có thể được ứng dụng trong nhiều lĩnh vực khác nhau, từ quản lý nội dung trên mạng xã hội đến hỗ trợ các cơ quan truyền thông.

4.1. Ứng Dụng Trong Quản Lý Nội Dung

Mô hình có thể được tích hợp vào các nền tảng mạng xã hội để tự động phát hiện và loại bỏ các bình luận xúc phạm, giúp tạo ra một môi trường trực tuyến an toàn hơn.

4.2. Hỗ Trợ Các Cơ Quan Truyền Thông

Các cơ quan truyền thông có thể sử dụng mô hình để kiểm duyệt nội dung trước khi công bố, đảm bảo rằng thông tin được phát hành không chứa nội dung độc hại.

V. Kết Luận Và Tương Lai Của Phát Hiện Nội Dung Xúc Phạm

Nghiên cứu về phát hiện nội dung xúc phạm trên mạng xã hội bằng mô hình Phobert-CNN mở ra nhiều triển vọng cho tương lai. Việc ứng dụng công nghệ AI trong lĩnh vực này không chỉ giúp bảo vệ người dùng mà còn góp phần xây dựng một môi trường mạng lành mạnh.

5.1. Tương Lai Của Mô Hình Phobert CNN

Mô hình có thể được cải tiến và mở rộng để xử lý nhiều loại nội dung khác nhau, từ đó nâng cao khả năng nhận diện và phân loại.

5.2. Đóng Góp Của Nghiên Cứu Đối Với Xã Hội

Nghiên cứu này không chỉ mang lại giá trị cho lĩnh vực công nghệ mà còn góp phần nâng cao nhận thức của cộng đồng về vấn đề nội dung độc hại trên mạng xã hội.

10/07/2025

Bạn đang xem trước tài liệu:

Khóa luận tốt nghiệp khoa học dữ liệu nhận diện nội dung xúc phạm trên dữ liệu mạng xã hội việt nam sử dụng mô hình phobert cnn

Tải đầy đủ

Trích đoạn nội dung tài liệu

Đặt vấn đề: Cùng với sự phát triển bùng nỗ của cuộc cách mạng công nghiệp lần thứ tư, các trang mạng xã hội, trang thông tin điện tử đã và đang ảnh hưởng theo nhiều chiều hướng đến nhiều mặt của đời sống xã hội và kinh tế. Nhiều chuyên gia truyền thông đánh giá rằng sự tấn công, bắt nạt qua mạng hay thông tin giả trên mạng xã hội. đang nhanh chóng lan rộng, thậm chí dần mắt kiểm soát. Không chi tại Việt Nam, bat cứ quốc gia nảo trên thế giới cũng đều đang đối diện với những vấn đề tiêu cực này.

Thực trạng trên thu hút sự quan tâm, đầu tư của nhiều cơ quan, tổ chức trong việc kiểm duyệt nội dung bình luận chống phá, thù địch nhằm mục đích đảm bảo an toàn cũng như xây dựng môi trường văn hóa mạng lành mạnh. Điều này bởi lẽ những lý do cốt lõi sau: Đầu tiên, những thông tin quan trọng, đặc biệt là các thông tin từ các cơ quan Chính Phủ được đông đảo quan chúng quan tâm theo dõi; Hai là, những thông tin được khai thác từ Internet rất dễ được tái truyền thông bằng các phương thức truyền miệng, chuyên tiếp dưới dạng số hay in ấn van bản,. và khiến chúng rat dễ lan rộng trong xã hội; Ba là, những thông tin gây tranh cãi này thuộc một môi trường số mở cho toàn cau, rất dé truy cập và thu hút sự theo dõi. Chính vì vậy, chủ thê thông tin trên các trang mạng xã hội rất tự do nhưng cũng rất dễ bị gây nhiễu của các bình luận luận điệu, chống phá, gây han có quy mô tác động nhanh, rộng lên nhiều đối tượng thông tin và ảnh hưởng đáng kê đến bộ mặt và giá trị cốt lõi thực sự của các cơ quan, tô chức và Chính Phủ.

Ngoài ra, theo khảo sát của Microsoft [1], cứ 100 người dùng là thanh thiếu niên hoặc trưởng thành tại Việt Nam thì lên tới 70 người tham gia cho biết trong vòng một tháng gần đây họ đã gặp phải một trong 21 hành xử không đúng mực; 97 người thừa nhận ho đã bị tổn thương từ những hành xử đó và 83 người lo lắng rằng họ sẽ gap phải những hành vi tương tự một lần nữa. Đó là một trong những lý do khiến Việt Nam được khảo sát trên xếp hạng thuộc các quốc gia có chỉ số văn minh không gian mạng thấp nhất trong số 25 quốc gia được khảo sát về 21 vấn đề rủi ro gây nên từ các hanh xử không đúng mực. Day là một hôi chuông cảnh báo về mặt trái của các nền tảng mạng xã hội tại Việt Nam đã và đang bị các thành phần có hành vi xấu trục lợi từ “mảnh đất màu mỡ” này dé kích động các quan điểm thù địch, xúc phạm mà không màng tới hậu quả. Vì vậy, nhu cầu của người dùng lên các trang mạng xã hội, trang thông tin điện tử về các cơ chế, chính sách khuyên khích các hành động văn minh trên mạng và sẽ có những hình phạt thích đáng cho các hành vi sai phạm ngày càng tăng cao.

Đặc biệt là các nền tảng có số lượng lớn thành viên là trẻ em, hay người dễ bị ảnh hưởng bởi lời nói tiêu cực lại cần có sự can thiệp sâu sắc. Không những vậy, gần đây cơ quan, t6 chức còn có nhu cầu đánh giá hành vi của các cá nhân thuộc cơ quan, tổ chức. Từ đó cơ quan, tổ chức xác định các cá thé có tư tưởng lệch lạc, chưa đạt các chuẩn mực đạo đức về hành vi, ứng xử trên các trang mạng xã hội. Các đơn vị giáo dục như Trung học cơ sở, Trung học phô thông hay một SỐ trường Đại học cũng theo dõi học sinh, sinh viên của mình từ đó đánh giá hạnh kiểm, đạo đức.

Nhận thấy được tính quan trọng của vấn đề, Bộ Thông tin và Truyền thông vào tháng 6 năm 2021 vừa qua đã ban hành Quyết định về Bộ quy tắc ứng xử trên mạng xã hội. Nội dung quyết định nhằm xây dựng mạng xã hội lành mạnh tại Việt Nam, đảm bảo các quyền về tự do cá nhân, quyền tự do kinh doanh, tôn trong các nhà cung cấp dịch vụ trong và ngoài nước, phủ hợp với thông lệ, chuẩn mực quốc tế. Đây cũng là một động thái từ Chính Phủ góp phần xây dựng các chuẩn mực đạo đức về hành vi, ứng xử trên mạng xã hội, tạo một thói quen tích cực của người dùng, xây dựng nên môi trường mạng an toan, lành mạnh tại Việt Nam. Tuy nhiên, việc kiểm soát được bình luận có nội dung xúc phạm, thù địch trên các nền tảng mạng xã hội gặp rất nhiều thách thức vì đặc trưng khối lượng cực lớn và đa dạng cả về mức độ và chủ đề của chúng.

Theo nghiên cứu năm 2018, “Dental Trauma in Social Media - Analysis of Facebook Content and Public Engagement” của Suha Abu-Ghazale và các cộng sự [2] cho biết, cứ mỗi 60 giây trên nên tảng mạng xã hội tỷ người dùng Facebook, thì có đến 293.000 bài viết được đăng lên, và có hơn 510.000 bình luận được viết. Mặt khác, theo trang báo cáo số liệu uy tín Statista đưa tin năm 2018 [3] Facebook phải gỡ bỏ hơn 11,3 triệu nội dung xúc phạm và thù địch trên toàn cầu. Trong khi Youtube năm 2019 phải loại bỏ hơn 1.800 triệu bình luận bị vi phạm tiêu chuẩn cộng đồng. Con số này ở hai nền tảng còn tăng trưởng khủng khiếp theo thời gian.

Năm 2020, Facebook phải loại bỏ hơn 81 triệu nội dung xúc phạm, thù địch tức là tăng gấp bảy lần so với năm 2018. Trong khi Youtube trong năm 2020 phải loại bỏ hơn 4.800 triệu bình luận tức tăng gấp 2,7 so với năm trước đó. Thành quả trên là công sức của hai nền tảng mạng xã hội lớn nhất thế giới. Theo đưa tin từ Wall Street Journal [4], tính tới thời điểm năm 2018, Facebook đã phải chi hang trăm triệu đô la Mỹ cho đội ngũ kiểm duyệt nội dung của họ.

Còn theo trang thông tin công nghệ lớn của Mỹ - The Verge với bài viết The Terror Queue, Google cũng có đội ngũ lên tới 10.000 người đảm nhiệm nhiệm vụ tương tự. Tuy nhiên, đội ngũ này vẫn còn nhiều bất cập. Thứ nhất, mặc dù Facebook đã có mặt trên 100 ngôn ngữ [4] nhưng chỉ hơn một phan hai trong số chúng có các đội ngũ kiêm soát nội dung chuyên nghiệp. Trong khi, thị trường lớn của Facebook là Đông Nam Á, trong đó có Việt Nam, thì họ lại cực kỳ thiếu nhân lực có chuyên môn cao về ngôn ngữ.

Và Việt Nam lại có môi trường mạng xã hội cực kỳ độc hại theo khảo sát của Microsoft [1]. Thứ hai, công việc của các người kiểm soát nội dung chuyên nghiệp, dẫu cho họ đã được cảnh báo từ trước về nội dung cực kỳ độc hại họ sẽ xử lý, cũng như tổ chức các buồi huấn luyện, chọn lọc của các tập đoàn lớn và nhận hỗ trợ cực kỳ chu đáo từ các tập đoàn này, rất nhiều trong số họ vẫn gặp vấn đề về tâm lý, thậm chí họ còn bị hội chứng Rối loạn căng thắng sau sang chan (Posttraumatic Stress Disorder - PTSD) [5], hội chứng thường gặp sau khi chứng kiến sự kiện kinh hoàng. Và nhiều trong số họ không thể hoàn toàn hồi phục theo nhà báo Deepa Seetharaman (2018) tại The Verge. Thứ ba, các tập đoàn lớn sở hữu mạng xã hội này cũng như các phòng nghiên cứu đã và đang bỏ ra rất nhiều công sức và tiền bạc vào việc xây dựng các hệ thống ứng dụng Trí tuệ nhân tạo vào xử lý bài toán này nhưng chưa thực sự hiệu quả.

Những hệ thong này sử dụng nguồn đữ liệu dôi dào và chat lượng có sẵn trên các nên tảng mạng xã hội của họ, cộng với việc sở hữu các phương pháp tiên tiễn có thé áp dụng trên đa ngôn ngữ, khiến các hệ thông rất mạnh mẽ trong việc phân loại rất rộng và rất nhanh những nội dung xúc phạm và phản cảm [6], [7]. Tuy nhiên, chính vì hệ thống học từ nguồn dữ liệu có sẵn cộng với tinh không chuyên biệt về ngôn ngữ, làm cho các hệ thống này khó nhận diện được những nội dung hay bình luận thiếu ngữ cảnh, chuyên biệt hoá bởi văn hoá vùng miền, khu vực, và hơn hết là chậm trong việc bắt kịp với phương thức được cải tiến liên tục của các nội dung xấu. Và ở Việt Nam, những hệ thống này thậm chí còn chưa có sự nghiên cứu đủ sâu và rộng, những hạn chế vẫn còn tồn đọng trong quá trình xây dựng hệ thống và kết quả thu được cũng chưa đủ mạnh đề có khả năng giải quyết vấn đề thực tế. Chính vì các lý do đó, khoá luận này đưa ra một giải pháp mới và mạnh mẽ nhằm việc phân loại, bóc tách ra bình luận xúc phạm, phản cảm, từ đó đưa ra giải pháp giúp tăng cường cho nỗ lực đưa các môi trường mạng nói chung và môi trường mạng xã hội nói riêng trở nên an toàn.

Mục tiêu khoá luận: Trong khóa luận này, chúng tôi tập trung nghiên cứu các kỹ thuật tiền xử lý dữ liệu, các thuật toán máy học, các kỹ thuật tăng cường đữ liệu và các ứng dụng tương tác với mô hình. Chúng tôi đã đặt ra các mục tiêu cụ thể như sau: - Chung tôi đã thực hiện các kỹ thuật tiền xử lý dữ liệu nghiêm ngặt và hiệu quả dé làm sạch các bình luận được thu thập từ các trang mạng xã hội. Các kỹ thuật này được kỳ vọng sẽ nâng cao chất lượng đữ liệu và giúp cải thiện hiệu suất của các mô hình phân loại. - _ Một mô hình mới được đề xuất dé cải thiện hiệu suất của bài toán nhận diện nội dung xúc phạm, phản cảm trên tiếng Việt.

Đề đạt được mục tiêu này, các thử nghiệm khác nhau đã được tiến hành với bốn phương pháp tiếp cận hiện đại: học máy, học sâu, học chuyền giao và học kết hợp. So với mô hình PhoBERT-CNN được đề xuất của chúng tôi, những cách tiếp cận này hỗ trợ trong việc phát triển các mô hình cơ sở. - Chung tôi áp dụng các kỹ thuật EDA cho bộ dữ liệu VIHSD [8] và bộ dt liệu HSD-VLSP [9] để xử lý dữ liệu mat cân bang và xác minh tính hiệu quả và sự cần thiết của việc tăng cường dữ liệu cho bài toán nhận diện nội dung xúc phạm tiếng Việt. - Đề chứng minh tính hữu ích của hệ thống được đề xuất, chúng tôi đã xây dựng một ứng dụng liên tục truyền đữ liệu từ nguồn dữ liệu không 16 của các nền tảng truyền thông xã hội dé phát hiện các nhận xét thù địch và xúc phạm.

Nội dung được bảo vệ bản quyền — Tải xuống đầy đủ

Tài liệu "Phát Hiện Nội Dung Xúc Phạm Trên Mạng Xã Hội Việt Nam Bằng Mô Hình Phobert-CNN" trình bày một phương pháp hiệu quả để nhận diện và phân loại nội dung xúc phạm trên các nền tảng mạng xã hội tại Việt Nam. Bằng cách áp dụng mô hình Phobert kết hợp với CNN, nghiên cứu này không chỉ giúp nâng cao độ chính xác trong việc phát hiện các nội dung tiêu cực mà còn góp phần bảo vệ môi trường mạng xã hội an toàn hơn cho người dùng.

Độc giả có thể tìm hiểu thêm về các ứng dụng của công nghệ trong việc phân tích và xử lý dữ liệu qua tài liệu Khóa luận tốt nghiệp khoa học dữ liệu nhận diện chuỗi xúc phạm cho tiếng việt, nơi nghiên cứu về việc nhận diện các chuỗi xúc phạm trong bình luận tiếng Việt. Ngoài ra, tài liệu Các yếu tố ảnh hưởng đến quyết định sử dụng mạng xã hội tiktok của người dùng trên địa bàn tp hồ chí minh 2023 cũng cung cấp cái nhìn sâu sắc về hành vi người dùng trên mạng xã hội, điều này có thể liên quan đến việc phát hiện nội dung xúc phạm. Cuối cùng, tài liệu Luận văn thạc sĩ khoa học máy tính phân loại nhóm tuổi người dùng mạng xã hội sẽ giúp độc giả hiểu rõ hơn về cách phân loại người dùng, từ đó có thể áp dụng trong việc phát hiện nội dung không phù hợp theo nhóm tuổi.

Những tài liệu này không chỉ mở rộng kiến thức mà còn cung cấp các góc nhìn đa dạng về việc sử dụng công nghệ trong việc quản lý nội dung trên mạng xã hội.

#xử lý ngôn ngữ tự nhiên

#mạng xã hội Việt Nam

#phân loại bình luận tự động

#an toàn không gian mạng

#dữ liệu mạng xã hội

#Phát hiện nội dung xúc phạm

Chủ đề

Phát triển mô hình học máy

Ứng dụng công nghệ trong xử lý dữ liệu

Tác động của mạng xã hội đến người dùng

Nghiên cứu về nội dung xúc phạm

Nghiên Cứu Phát Hiện Nội Dung Xúc Phạm Trên Mạng Xã Hội Việt Nam Sử Dụng Mô Hình Phobert-CNN

LỜI CẢM ƠN

1. MỞ ĐẦU

2. NỘI DUNG ĐỀ TÀI

2.1. Mục tiêu, phạm vi và đối tượng của đề tài

2.2. Đóng góp chính của đề tài

2.3. Các vấn đề còn tồn đọng

3. PHƯƠNG PHÁP THỰC HIỆN

3.1. Dữ liệu HSD

3.2. Mô hình tiếng Việt

3.3. Tiền xử lý dữ liệu

3.4. PhoBERT-CNN

3.5. Ứng dụng

4. KẾT QUẢ MONG ĐỢI CỦA ĐỀ TÀI

TƯ LIỆU THAM KHẢO

I. Tổng Quan Về Phát Hiện Nội Dung Xúc Phạm Trên Mạng Xã Hội

1.1. Tầm Quan Trọng Của Việc Phát Hiện Nội Dung Xúc Phạm

1.2. Mô Hình Phobert CNN Là Gì

II. Vấn Đề Và Thách Thức Trong Phát Hiện Nội Dung Xúc Phạm

2.1. Đặc Điểm Của Nội Dung Xúc Phạm Trên Mạng Xã Hội

2.2. Thách Thức Trong Việc Phân Tích Dữ Liệu

III. Phương Pháp Phát Hiện Nội Dung Xúc Phạm Bằng Mô Hình Phobert CNN

3.1. Quy Trình Tiền Xử Lý Dữ Liệu

3.2. Huấn Luyện Mô Hình Phobert CNN

IV. Ứng Dụng Thực Tiễn Của Mô Hình Phobert CNN

4.1. Ứng Dụng Trong Quản Lý Nội Dung

4.2. Hỗ Trợ Các Cơ Quan Truyền Thông

V. Kết Luận Và Tương Lai Của Phát Hiện Nội Dung Xúc Phạm

5.1. Tương Lai Của Mô Hình Phobert CNN

5.2. Đóng Góp Của Nghiên Cứu Đối Với Xã Hội

THÔNG TIN CHI TIẾT

Tác giả: Trần Quốc Khánh

Người hướng dẫn: ThS. Nguyễn Văn Kiệt

Trường học: Đại học Quốc gia TP. Hồ Chí Minh

Chuyên ngành: Khoa học dữ liệu

Đề tài: Phát Hiện Nội Dung Xúc Phạm Trên Mạng Xã Hội Việt Nam Bằng Mô Hình Phobert-CNN

Loại tài liệu: Khóa luận tốt nghiệp

Năm xuất bản: 2022

Địa điểm: TP. Hồ Chí Minh

Nghiên Cứu Phát Hiện Nội Dung Xúc Phạm Trên Mạng Xã Hội Việt Nam Sử Dụng Mô Hình Phobert-CNN

LỜI CẢM ƠN

1. MỞ ĐẦU

2. NỘI DUNG ĐỀ TÀI

2.1. Mục tiêu, phạm vi và đối tượng của đề tài

2.2. Đóng góp chính của đề tài

2.3. Các vấn đề còn tồn đọng

3. PHƯƠNG PHÁP THỰC HIỆN

3.1. Dữ liệu HSD

3.2. Mô hình tiếng Việt

3.3. Tiền xử lý dữ liệu

3.4. PhoBERT-CNN

3.5. Ứng dụng

4. KẾT QUẢ MONG ĐỢI CỦA ĐỀ TÀI

TƯ LIỆU THAM KHẢO

I. Tổng Quan Về Phát Hiện Nội Dung Xúc Phạm Trên Mạng Xã Hội

1.1. Tầm Quan Trọng Của Việc Phát Hiện Nội Dung Xúc Phạm

1.2. Mô Hình Phobert CNN Là Gì

II. Vấn Đề Và Thách Thức Trong Phát Hiện Nội Dung Xúc Phạm

2.1. Đặc Điểm Của Nội Dung Xúc Phạm Trên Mạng Xã Hội

2.2. Thách Thức Trong Việc Phân Tích Dữ Liệu

III. Phương Pháp Phát Hiện Nội Dung Xúc Phạm Bằng Mô Hình Phobert CNN

3.1. Quy Trình Tiền Xử Lý Dữ Liệu

3.2. Huấn Luyện Mô Hình Phobert CNN

IV. Ứng Dụng Thực Tiễn Của Mô Hình Phobert CNN

4.1. Ứng Dụng Trong Quản Lý Nội Dung

4.2. Hỗ Trợ Các Cơ Quan Truyền Thông

V. Kết Luận Và Tương Lai Của Phát Hiện Nội Dung Xúc Phạm

5.1. Tương Lai Của Mô Hình Phobert CNN

5.2. Đóng Góp Của Nghiên Cứu Đối Với Xã Hội

Tài liệu liên quan

THÔNG TIN CHI TIẾT

Tác giả: Trần Quốc Khánh

Người hướng dẫn: ThS. Nguyễn Văn Kiệt

Trường học: Đại học Quốc gia TP. Hồ Chí Minh

Chuyên ngành: Khoa học dữ liệu

Đề tài: Phát Hiện Nội Dung Xúc Phạm Trên Mạng Xã Hội Việt Nam Bằng Mô Hình Phobert-CNN

Loại tài liệu: Khóa luận tốt nghiệp

Năm xuất bản: 2022

Địa điểm: TP. Hồ Chí Minh

Có thể bạn quan tâm