Đại Học Medusa: Một Số Bài Toán Tối Ưu Trên Mạng Xã Hội - Luận Án Tiến Sĩ

Trường đại học

Đại học Medusa

Chuyên ngành

Khoa học máy tính

Người đăng

Ẩn danh

Thể loại

Luận án tiến sĩ

2024

172
0
0

Phí lưu trữ

30.000 VNĐ

Tóm tắt

I. Giới Thiệu Luận Án Tiến Sĩ Về Tối Ưu Mạng Xã Hội

Sự phát triển của mạng xã hội trực tuyến đã biến chúng thành nền tảng truyền thông mạnh mẽ, đóng góp vào sự tăng trưởng kinh tế toàn cầu. Gần một nửa dân số thế giới sử dụng mạng xã hội, và nhiều người coi chúng là nguồn thông tin chính thức. Người dùng có thể trao đổi thông tin nhanh chóng, bất chấp khoảng cách địa lý. Mạng xã hội cung cấp nhiều ứng dụng hữu ích, làm cho cuộc sống thuận tiện hơn. Người dùng có thể thu thập thông tin cần thiết và chia sẻ quan điểm cá nhân. Ngoài các đặc tính kế thừa như tương tác, lan truyền thông tin, và tạo ảnh hưởng, mạng xã hội còn có nhiều đặc tính mới: cập nhật thông tin nhanh chóng, thời gian lan truyền tin ngắn, sự bùng nổ thông tin. Có thể nói, mạng xã hội đang trở thành công cụ hữu ích và là kho tri thức dễ dàng tiếp cận. Các chủ đề nghiên cứu về mạng xã hội được nhiều nhà khoa học quan tâm, đặc biệt là các bài toán lan truyền thông tin. Cần có giải pháp hiệu quả để quản lý thông tin, bao gồm phát tán thông tin cần thiết và ngăn chặn thông tin xấu. Việc giải quyết các bài toán tối ưu này nâng cao sự phục vụ và độ tin cậy của mạng xã hội. Kempe và các cộng sự đã đề xuất các mô hình phát tán thông tin đầu tiên là Ngưỡng tuyến tính (LT) và Bậc độc lập (IC) dựa trên các quan sát thực tế.

1.1. Tầm Quan Trọng Của Nghiên Cứu Mạng Xã Hội

Nghiên cứu mạng xã hội ngày càng trở nên quan trọng do tác động mạnh mẽ của thông tin trên mạng xã hội đến cộng đồng người dùng, gián tiếp ảnh hưởng đến công chúng trong thế giới thực. Do đó, các bài toán tối ưu trên mạng xã hội được chú trọng và nghiên cứu ngày càng rộng rãi. Việc giải quyết và áp dụng hai nhóm bài toán tối ưu này trong thực tiễn gặp một số thách thức chính. Các bài toán tối ưu trên mạng xã hội thường thuộc lớp bài toán tối ưu tổ hợp NP-Khó. Thêm vào đó, việc tính toán hàm mục tiêu thường là #P-Khó. Vì vậy, cần có những thuật toán hiệu quả để tìm lời giải tốt trong thời gian cho phép.

1.2. Mục Tiêu Nghiên Cứu Bài Toán Tối Ưu Trên MXH

Để nâng cao hơn nữa tính ứng dụng của mỗi bài toán tối ưu, cần nghiên cứu những biến thể phù hợp với thực tế theo các khía cạnh khác nhau như: thời gian, khoảng cách, chi phí, lợi ích, tính cạnh tranh. Tác giả cùng các cộng sự đã chọn chủ đề nghiên cứu “Một số bài toán tối ưu trên mạng xã hội” với mục tiêu nghiên cứu bài toán tối ưu IM, IB trên các mô hình phát tán truyền thông tin. Qua đó đề xuất nghiên cứu các bài toán biến thể mới có tính ứng dụng trong thực tiễn. Đề xuất các mô hình giải quyết các bài toán trên, nghiên cứu độ phức tạp của chúng trên các mô hình lan truyền thông tin được sử dụng rộng rãi.

II. Phân Tích Các Bài Toán Tối Ưu Thường Gặp Trên MXH

Các bài toán lan truyền thông tin có thể được phân loại thành hai nhóm quan trọng: Tối đa hóa ảnh hưởng (Influence Maximization - IM): Bài toán này yêu cầu chọn một tập hợp nhỏ người dùng (ngân sách giới hạn) để bắt đầu lan truyền thông tin sao cho số người bị ảnh hưởng bởi thông tin đó trên một mạng xã hội đạt cực đại. Nó nảy sinh từ các nhu cầu thực tiễn lan truyền tiếp thị sản phẩm, tối đa hóa lợi ích doanh nghiệp trong quảng bá sản phẩm, ngăn chặn dịch bệnh trên mạng xã hội, giám sát thông tin. Ví dụ, trong lan truyền tiếp thị sản phẩm, các doanh nghiệp thường chọn k người dùng để đưa các sản phẩm dùng thử sau đó yêu cầu những người dùng này đưa các thông tin về tính năng tốt lên các mạng xã hội để bắt đầu quá trình lan truyền thông tin về sản phẩm để số người dùng biết được thông tin và bị ảnh hưởng là lớn nhất. Ngoài ra, các biến thể có tính ứng dụng cao của bài toán tối ưu này cũng được quan tâm nghiên cứu.

2.1. Biến Thể Của Bài Toán Tối Ưu Hóa Ảnh Hưởng IM

Biến thể của bài toán IM theo thời gian, chi phí, khoảng cách, chủ đề quan tâm. Biến thể theo trường hợp có nhiều đối thủ cạnh tranh. Trong trường hợp này cần tối đa hóa ảnh hưởng của một đối thủ trong trường hợp lan truyền thông tin có sự cạnh tranh (bài toán tối đa hóa ảnh hưởng cạnh tranh). Ngăn chặn ảnh hưởng (Influence Blocking - IB): Mục tiêu của bài toán này là tìm một tập người dùng để loại bỏ, hoặc cách ly, hoặc bắt đầu lan truyền thông tin tốt sao cho ảnh hưởng của thông tin xấu (hoặc thông tin đối lập) đạt giá trị cực tiểu.

2.2. Ngăn Chặn Ảnh Hưởng Và Ứng Dụng Thực Tế Của Nó

Có thể hiểu đây là bài toán có mục tiêu ngược so với IM. Bài toán này nảy sinh từ nhu cầu thực tiễn cần có những giải pháp tối ưu trong việc ngăn chặn sự lan truyền của những yếu tố xấu như: thông tin sai lệch, virus, tin đồn trên các mạng xã hội trực tuyến. Có hai hướng tiếp cận cho nhóm bài toán tối ưu này là: Lan truyền thông tin tốt để hạn chế các thông tin xấu (tẩy nhiễm thông tin). Loại bỏ tập các đỉnh hoặc cạnh đóng vai trò quan trọng để hạn chế ảnh hưởng của một nguồn phát tán thông tin cho trước.

III. Đại Học Medusa Giải Pháp Tối Ưu Hóa Lan Truyền Tin Trên MXH

Đại học Medusa đã nghiên cứu bài toán Tối đa ảnh hưởng cạnh tranh tổng quát (Budgeted Competitive Influence Maximization - BCIM) là một biến thể của IM với mục tiêu tối ưu hóa ảnh hưởng trong trường hợp có sự cạnh tranh trên một số mô hình lan truyền thông tin cạnh tranh với ngân sách và thời gian hạn chế. Trước hết luận án đề xuất mô hình ngưỡng tuyến tính cạnh tranh ràng buộc thời gian TCLT để mô hình quá trình lan truyền có sự cạnh tranh của các đối thủ. Luận án xây dựng bài toán BCIM trên mô hình TCLT, chỉ ra tính chất của bài toán tối ưu trên mô hình này. Luận án đề xuất một thuật toán xấp xỉ hiệu quả SPBA cho bài toán BCIM. Thực nghiệm cho thấy thuật toán đề xuất cho kết quả tốt và có thể thực hiện với MXHTT cỡ hàng triệu đỉnh và cạnh.

3.1. Mô Hình TCLT Nền Tảng Cho Bài Toán Tối Ưu BCIM

Đại học Medusa đề xuất một thuật toán xấp xỉ hiệu quả SPBA cho bài toán BCIM. Thực nghiệm cho thấy thuật toán đề xuất cho kết quả tốt và có thể thực hiện với MXHTT cỡ hàng triệu đỉnh và cạnh. Ngoài ra, luận án cũng mở rộng nghiên cứu bài toán BCIM trên mô hình Ngưỡng tuyến tính cạnh tranh xác định. Các kết quả được công bố tại hội nghị quốc tế Computational Data & Social Networks (CSoNet) năm 2018, hội nghị IEEE-RIVF International Conference on Computing and Communication Technolo- gies (RIVF) năm 2019 và tạp chí Applied Sciences (SCIE) năm 2019.

3.2. Ứng Dụng Thực Tế Thuật Toán SPBA Trong Tối Ưu MXH

Thuật toán SPBA có khả năng áp dụng cho các mạng xã hội cỡ lớn. Điều này rất quan trọng vì các mạng xã hội thực tế thường có quy mô rất lớn, với hàng triệu thậm chí hàng tỷ người dùng. Sự hiệu quả của thuật toán SPBA giúp các nhà nghiên cứu và nhà phát triển có thể áp dụng nó vào các ứng dụng thực tế, ví dụ như tối ưu hóa chiến dịch quảng cáo trên mạng xã hội, phân tích sự lan truyền của thông tin trong một cộng đồng lớn, hoặc xác định những người có ảnh hưởng nhất trong một mạng xã hội.

IV. Hướng Dẫn Ngăn Chặn Thông Tin Sai Lệch Hiệu Quả Trên MXH

Đại học Medusa đã nghiên cứu bài toán Hạn chế tối đa thông tin sai lệch (Maximizing Misinformation Restriction-MMR) là một biến thể của bài toán IB, trong đó có xem xét ngân sách và thời gian hạn chế trên một số mô hình lan truyền thông tin. Tác giả đề xuất mô hình giải quyết bài toán MMR trên mô hình ngưỡng tuyến tính mở rộng. Tác giả chỉ ra độ phức tạp của bài toán này và đề xuất các thuật toán hiệu quả cho bài toán bao gồm các thuật toán xấp xỉ: FPTAS, IGA, SG và thuật toán heuristic PR-DAG. Ngoài ra, luận án cũng mở rộng kết quả nghiên cứu bài toán này trong trường hợp mô hình ngưỡng tuyến tính xác định.

4.1. Các Thuật Toán Giải Quyết Bài Toán Hạn Chế Thông Tin Sai Lệch

Các thuật toán xấp xỉ FPTAS, IGA, SG và thuật toán heuristic PR-DAG. Ưu điểm của thuật toán FPTAS là nó cung cấp một giải pháp gần tối ưu trong thời gian đa thức so với kích thước của dữ liệu đầu vào và độ chính xác mong muốn. Điều này rất quan trọng vì các mạng xã hội thường có kích thước rất lớn, và việc tìm kiếm một giải pháp chính xác có thể mất rất nhiều thời gian. Tuy nhiên, FPTAS có một số hạn chế, ví dụ như nó có thể không phù hợp với các mạng xã hội có cấu trúc phức tạp.

4.2. Đánh Giá Hiệu Quả Thuật Toán PR DAG Trong Thực Tế

Thuật toán PR-DAG có thể hoạt động tốt hơn trong các trường hợp mà FPTAS không hiệu quả. PR-DAG là một thuật toán heuristic, có nghĩa là nó không đảm bảo tìm thấy giải pháp tối ưu, nhưng nó có thể tìm thấy một giải pháp tốt trong thời gian hợp lý. Thuật toán này sử dụng cấu trúc đồ thị để ước lượng hàm mục tiêu, giúp nó đưa ra các quyết định thông minh hơn trong quá trình tìm kiếm giải pháp.

V. Phương Pháp Mới Ngăn Chặn Thông Tin Sai Lệch Có Chủ Đích

Trong một kịch bản khác, để hạn chế sự phát tán của thông tin sai lệch đảm bảo số người không bị ảnh hưởng bởi thông tin sai lệch lớn hơn một ngưỡng γ xác định, tác giả đề xuất nghiên cứu bài toán Hạn chế thông tin sai lệch có chủ đích (Targeted Misinformation Blocking-TMB). Tác giả đề xuất mô hình cho bài toán TMB, chỉ ra độ khó của bài toán trên các mô hình lan truyền thông tin phổ biến là IC và LT và đề xuất các thuật toán hiệu quả đối với bài toán này trên hai mô hình IC và LT tương ứng là STMB-IC và STMB-LT. Các kết quả thực nghiệm trên các dữ liệu MXHTT thực chỉ ra hiệu quả của các thuật toán đề xuất, đặc biệt các thuật toán có thể áp dụng cho các mạng cỡ lớn hàng trăm nghìn đỉnh.

5.1. Mô Hình Bài Toán Hạn Chế Thông Tin Sai Lệch Có Chủ Đích

Bài toán Hạn chế thông tin sai lệch có chủ đích (TMB) tập trung vào việc ngăn chặn sự lan truyền của thông tin sai lệch để đảm bảo rằng số người không bị ảnh hưởng bởi thông tin sai lệch lớn hơn một ngưỡng nhất định. Mô hình cho bài toán TMB được đề xuất bởi tác giả giúp định hình rõ ràng các yếu tố quan trọng và ràng buộc của bài toán này. Mô hình này không chỉ xác định mục tiêu cần đạt được mà còn xem xét các yếu tố như chi phí ngăn chặn, mức độ ảnh hưởng của thông tin sai lệch và các ràng buộc về tài nguyên.

5.2. Thuật Toán STMB IC STMB LT Giải Pháp Cho MXH Lớn

Hai thuật toán STMB-IC và STMB-LT được đề xuất để giải quyết bài toán TMB trên các mô hình lan truyền thông tin IC và LT tương ứng. Các thuật toán này được thiết kế để có thể áp dụng cho các mạng xã hội cỡ lớn với hàng trăm nghìn đỉnh, một yêu cầu quan trọng để đảm bảo tính thực tiễn của chúng. Hiệu quả của các thuật toán này được chứng minh thông qua các kết quả thực nghiệm trên các dữ liệu MXHTT thực, cho thấy khả năng của chúng trong việc ngăn chặn sự lan truyền của thông tin sai lệch trong các mạng xã hội có quy mô lớn.

VI. Kết Luận Hướng Nghiên Cứu Mới Về Bài Toán Tối Ưu MXH

Luận án này đã nghiên cứu các bài toán tối ưu trên mạng xã hội, đặc biệt là bài toán tối đa ảnh hưởng cạnh tranh tổng quát (BCIM) và bài toán hạn chế tối đa thông tin sai lệch (MMR), cũng như bài toán hạn chế thông tin sai lệch có chủ đích (TMB). Các mô hình và thuật toán đề xuất có thể áp dụng trong nhiều lĩnh vực, từ tiếp thị sản phẩm đến ngăn chặn thông tin sai lệch. Đại học Medusa tiếp tục nghiên cứu các bài toán liên quan đến bảo mật và quyền riêng tư trên mạng xã hội, cũng như các ứng dụng của trí tuệ nhân tạo trong mạng xã hội.

6.1. Ứng Dụng Các Bài Toán Tối Ưu Trong Thực Tế Đời Sống

Các mô hình và thuật toán được phát triển trong luận án này có thể được áp dụng trong nhiều lĩnh vực khác nhau, từ tiếp thị sản phẩm đến ngăn chặn thông tin sai lệch. Trong lĩnh vực tiếp thị, các doanh nghiệp có thể sử dụng các thuật toán tối ưu hóa ảnh hưởng để xác định những người có ảnh hưởng nhất trong mạng xã hội và tập trung các nỗ lực tiếp thị vào những người này. Trong lĩnh vực an ninh, các tổ chức chính phủ và phi chính phủ có thể sử dụng các thuật toán hạn chế thông tin sai lệch để ngăn chặn sự lan truyền của thông tin sai lệch và bảo vệ công chúng.

6.2. Định Hướng Tương Lai Nghiên Cứu Mạng Xã Hội Tại Medusa

Đại học Medusa có thể tiếp tục nghiên cứu các bài toán liên quan đến bảo mật và quyền riêng tư trên mạng xã hội, cũng như các ứng dụng của trí tuệ nhân tạo trong mạng xã hội. Nghiên cứu về bảo mật và quyền riêng tư trên mạng xã hội là rất quan trọng vì người dùng ngày càng quan tâm đến việc bảo vệ thông tin cá nhân của họ trên mạng. Nghiên cứu về các ứng dụng của trí tuệ nhân tạo trong mạng xã hội có thể giúp cải thiện trải nghiệm người dùng và giải quyết các vấn đề như tối ưu hóa quảng cáo, phát hiện thông tin sai lệch và phân tích tình cảm.

15/05/2025
Một số bài toán tối ưu trên mạng xã hội
Bạn đang xem trước tài liệu : Một số bài toán tối ưu trên mạng xã hội

Để xem tài liệu hoàn chỉnh bạn click vào nút

Tải xuống