Luận văn: Dự báo liên kết mạng đồng tác giả trong nghiên cứu khoa học

Luận văn dự báo liên kết mạng đồng tác giả khoa học: Nghiên cứu mô hình, phương pháp dự đoán kết nối giữa các nhà khoa học, tăng cường hợp tác nghiên cứu.

Chuyên ngành

Hệ thống thông tin

Người đăng

Ẩn danh

Thể loại

Luận văn thạc sĩ

2018

75
1
0

Phí lưu trữ

30 Point

Mục lục chi tiết

LỜI CẢM ƠN

LỜI CAM ĐOAN

DANH MỤC CÁC THUẬT NGỮ CHÍNH

DANH MỤC CÁC KÝ HIỆU CHÍNH

DANH MỤC HÌNH VẼ

DANH MỤC BẢNG BIỂU

1. PHẦN 1: MỞ ĐẦU

1.1. Lý do chọn đề tài

1.2. Lịch sử nghiên cứu

1.3. Mục đích nghiên cứu của luận văn, đối tượng, phạm vi nghiên cứu

1.4. Tóm tắt cô đọng các luận điểm cơ bản và đóng góp mới của tác giả

1.5. Phương pháp nghiên cứu

2. PHẦN 2: NỘI DUNG ĐỀ TÀI

3. CHƯƠNG 1: TỔNG QUAN VỀ DỰ BÁO LIÊN KẾT MẠNG ĐỒNG TÁC GIẢ NGHIÊN CỨU KHOA HỌC

1.1. Giới thiệu tổng quan về mạng xã hội và mạng đồng tác giả

1.1.1. Mạng xã hội

1.1.2. Mạng đồng tác giả

1.2. Bài toán dự báo liên kết

1.3. Tổng quan về các mô hình học máy trong dự báo liên kết trong mạng đồng tác giả

1.4. Vấn đề mất cân bằng dữ liệu trong dự báo liên kết mạng đồng tác giả

4. CHƯƠNG 2: PHƯƠNG PHÁP SUPPORT VECTOR MACHINE ĐỐI VỚI DỮ LIỆU MẤT CÂN BẰNG

2.1. Phương pháp Support Vector Machine

2.1.1. Giới thiệu về phương pháp Support Vector Machine

2.1.2. Bài toán tối ưu trong SVM

2.2. Một số độ đo đánh giá hiệu năng cho phân lớp dữ liệu mất cân bằng

2.3. Một số nghiên cứu cải tiến phương pháp SVM cho phân lớp dữ liệu mỗi cân

2.3.1. Tiếp cận dựa trên SVM cho phân lớp dữ liệu mất cân bằng

2.3.2. New bias SVM

5. CHƯƠNG 3: PHƯƠNG PHÁP SVM CẢI TIẾN CHO DỮ LIỆU MẤT CÂN BẰNG

3.1. Phương pháp SVM cải tiến

3.1.1. Học mô hình Weighted-SVM

3.1.2. Tìm giá trị tối ưu

3.2. Phân tích độ phức tạp tính toán

3.3. Thực nghiệm, đánh giá

3.3.1. Tập dữ liệu thực nghiệm

3.3.2. Cấu hình tham số

3.3.3. Kết quả thực nghiệm

6. CHƯƠNG 4: ỨNG DỤNG DỰ BÁO LIÊN KẾT MẠNG ĐỒNG TÁC GIẢ

4.1. Áp dụng phương pháp SVM cải tiến mg đồng tác giả

4.1.1. Xây dựng chương trình dự báo liên kết

4.1.2. Xây dựng cả đặt công cụ dự báolien kết mang đồng tác giả

4.2. Kết quả

4.3. Đánh giá chương trình

4.3.1. Mô tả dữ liệu mạng đồng tác giả thực nghiệm

4.3.2. Cấu hình các phương pháp phân la

4.3.3. Kết quả thực nghiệm

7. CHƯƠNG 5: KẾT LUẬN

5.1. Những kết luận mới

5.2. Đóng góp mới vã kiến nghị của táo giả về sử dụng kết quả nghiên cứu

TÀI LIỆU THAM KHẢO

Trích đoạn nội dung tài liệu

- BỘ GIÁO DỤC VÀ ĐÀO TẠO TRUONG DAT HOC BACH KHOA HA NOT TRỊNH KHÁC LINH DU BAO LIEN KET MẠNG ĐÔNG TÁC GIẢ NGHIÊN CỨU KHOA HỌC Chuyên ngành : Hệ thống thông tin LUẬN VĂN THẠC SĨ KIIOA HỌC CÔNG NGHE THONG TIX NGƯỜI HƯỚNG DẪN KHOA HỌC PGS. Tran Dinh Khang Hà Nội — Năm 2018 LOI CAM ON Đầu tiên, tôi võ cùng xúc động xi: được gửi lời trì ân sân sắc nhất đến Thấy giảo hướng dẫn PGS. Trân Dinh Khang — người đã trực tiếp dành nhiều thời gian quý báu tận tình hướng dẫn cho tôi những định hướng khoa học sâu sắc, động viên chỉ dẫn sát sao trougr suốt thời gian học tập, nghiên cứu vả thực hiện luận văn này. Thấy cũng dành nhiều thời gian thường xuyên hàng tuần bình luận về các ý tưởng, kết quả của tôi, truyền cho tôi sự nghiêm tủo, niễm cảm hứng trong nghiên cửu khoa hoc. Tôi xin được gửi lời cảm ơn chân thành dến các thấy giáo, cô giáo công tác ở Viện Công nghệ thông tin và Truyền thông đã tận tỉnh chí dạy, chia sẽ kinh nghiệm quý báu vẻ cách tiếp cận và nghiên cứu khoa học cơ bản. Bên cạnh đó tôi cũng xin câm ơn chân thành tới Ban giảm hiệu nhà trường củng toàn. thể các thầy cô Phòng Sau đại học của trường đã quan tâm, lạo điều kiện cho tôi trong suốt thời gian học Sau cũng tôi xin bảy tỏ lòng biết ơn đến cáo bạn cùng lớp, căm ơn gia đình đã luôn sát cánh, động viên tôi Hạc viên Trịnh Khắc Linh LOI CAM DOAN Tôi "Trịnh Khắc Linh xin cam kết Luận văn này lả công trình nghiên cứu của báu. thân tôi dưới sự hướng dẫn của PGS.TS Trần Dinh Khang, Cáo kết quá trình bay trong Luan văn là trung thực, chưa từng được ai công bố trong bat kỳ công trình nào khác. Tắt cả các trích đầu đều được tham chiêu rõ rằng, Tà Nội, ngày — tháng 10 năm 2018 TÁC GIẢ LUẬN VĂN 'Trịnh Khắc Linh 3. Phân tích độ phức tạp tính toát 3. Thực nghiêm, đánh giá 3. Tập dữ liệu thực nghiệm 2. Câu hình tham số. Kết quả thực nghiêm. CHƯƠNG IV: ỨNG DỤNG ĐỰ BẢO LIÊN KẾ MẠNG ĐỒNG TÁC GIÁ 4. Ap dung phương pháp SVM cải tiền mg đồng lác giả. Xây dựng chương trinh dự báo liên k: 4221. Xây dụng cả: đạt công cụ dự báolien kkết mang đồng tác gia, 2. Kết quả 42 Đánh giá chương trình 43.1, Mé tả đữ liệu mạng đồng tác giả thực nghiệm. Câu hình các phương pháp phân la 4. Kết quả thực nghiêm CHƯƠNG V: KÉT LUẬN. Những kết luận mới. Dóng góp mới vã kiến nghị của táo giả về sử dụng kết quả nghiên cứu TAI LIEU TILAM KITAO DANH MUC BANG BIEU Đảng 1 Một số phương pháp phân lớp áp dụng che dự báo liên kết. Mô tả ma trận nhằm lẫn TH TH nh H2 TH nan. ca reeg 30 Bảng 3. Mô tả bộ dữ liệu mi. cản bằng TCT - - ce Al Báng 4. Kết quả thực nghiệm so sánh các phương pháp với đữ liệu UCLL. Mô tả chia cách chia đữ liêu mạng đồng tác giả theo thời gian. Minh họa đũ liệu mạng đồng tác giã thu được - ce ST Bang 7. Mé ta céc t4p dit ligu mang dang tac gid cho thực nghiệm đánh giá. Kết quả đánh giá các phương pháp phân lớp đối với đữ liệu mạng đồng tác giả 52 Bang 9. Kốt quả đánh giá theo các siêu than số Œ.à xvvvevttrrrrrrrerrree 58 MUC LUC LOICAMON. LOLCAM DOAN DANII MUC CAC THUAT NGU CHINTT 1 DANH MUC CAC KY HIEU CHINH 2 DANH MUC HINH VE 3 DANII MUC BANG BE 4 PHAN i: MO DAU. Ly do chon dé tai. Lịch sứ nghiên cửu. Mue dich nghiên cứu của luận văn, đối ttợng, phạm ví nghiên cứu. Tôm tắt cô đọng các luận điểm cơ bản và đông góp mới của tác giả, 8 5, Phương pháp nghiên cứu. „18 PHAN 2: NOI DUNG DE TAL CHUONG L TONG QUAN VE DU BAO LIEN KET MANG BONG TAC GIA NGHIEN CUU KHOA HOC 1. Giới thiệu tổng quan về mạng xã hội và mạng, đồng tác giá. Mang xa hdi - 1. Mang ding tic gia 1. Bái toàn dự báo liên 121. Tổng quan về các mô hình học máy trong đự bảo liền kết trong mạng đồng tie gid. Vấn đề mất cân bằng đữ liệu trong đự bảo liên kết mạng đỏng tác gì: .19 CHƯƠNG II. PHƯƠNG PHÁP SUPPORT VECTOR MACHINE BOI VỚI ĐỮ LIỆU MAT CAN BANG.1, Phuong phip Suppor! Vector Machine 2 2. Giới thiệu về phương pháp Support Vector Machine. Tôi tru lễ rong SVM. Một số độ đo đánh giả hiệu năng cho phân lớp dit gu mat sân bằng . Một số nghiên cứu cải tiên phương pháp SVM cho phân lớp đữ liệu mỗi cân.1 Tiếp cân dua trén SVM cho hin lớp đữ liệu mấtcin bing.4 New bias SVM. 33 CHUONG IIL PHUONG PHAP SVM CẢI TIEN CHO DU LIEU MAT CAN BANG v4 3. Phương phân SVM cải tiễn.1 Hoc mé hinh Weighted-SVM. Tim giá trị tối ưu +*.30 DANH MUC BANG BIEU Đảng 1 Một số phương pháp phân lớp áp dụng che dự báo liên kết. Mô tả ma trận nhằm lẫn TH TH nh H2 TH nan. ca reeg 30 Bảng 3. Mô tả bộ dữ liệu mi. cản bằng TCT - - ce Al Báng 4. Kết quả thực nghiệm so sánh các phương pháp với đữ liệu UCLL. Mô tả chia cách chia đữ liêu mạng đồng tác giả theo thời gian. Minh họa đũ liệu mạng đồng tác giã thu được - ce ST Bang 7. Mé ta céc t4p dit ligu mang dang tac gid cho thực nghiệm đánh giá. Kết quả đánh giá các phương pháp phân lớp đối với đữ liệu mạng đồng tác giả 52 Bang 9. Kốt quả đánh giá theo các siêu than số Œ.à xvvvevttrrrrrrrerrree 58 DANH MỤC CÁC KÝ HIỆU CHỈNH N Số mẫu đữ liệu. Weight vector b Bias xi Vector dặc trưng 9 Nhãn (label) é Slack variable Cc Hằng sẻ phạt Tham số học của mô hình cải tiển K Kemel z “Tham số học của mô hình z-SVMT bà DANH MUC HIiNH VE Hinh 2.1 Minh hoa phân lớp đữ liệu SVM dữ liệu tuy2n tinh .2 Minh hoa phân lớp SVM dữ liệu nhiỄu. nen ereirrrrirrer TTình 2. Minh họa anh xạ đữ liệu vào không gian nhiều chiều Hình 2.4 Minh họa Weighted-SVM.1 Minh hoa ràng buộc alpha trong Weighted-SVM. Mỗ tình đự báo Tiên kết đồng lác giả dựa trên tiên cận học máy, Hình 4. Sơ đỗ đề xuất tổng quan của chương trình dự báo liên kết đẳng tác giả. Sơ đồ đề xuất chương trình dự báo liên kết đẳng tác giả TRình 4. Màn hình huấn huyện mô hình đự báo liền kết mạng đồng Hình 4. Mản hình hiền thị kết quã huần luyện. Màn hình load tmg viên cần dự bảo Hình 4. Màn hình lựa chọn ứng viên / tác giả. Mán hình kết quả dự báo cho ứng viễn lựa chọn. Sự thay đổi của giá trị F1-seore theo tỉ lệ mật cân bằng Hình 4.10 Sự biến thiên của Rccall, Prccision, F1-score, G-rnean theo siêu tham sỏ C.11 Kết qua dink gia thoi gian chay tim + theo kich cỡ mẫu dữ liệu. PHAN 1: MO BAU Ly do chon dé tai. Vải sự phát triển chóng mặt của khoa học, việc tìm kiêm thông tin khoa học đề thực hiện các công việc liên quan đến nghiên cứu là nhn cầu thường xuyên, không thể thiểu dỗi với những người làm nghiên cứu khoa học. Mạng dòng tác giả nghiên cửa. khoa học hay còn gọi là mạng lưới học thuật (acađemie social network) là một loại mang xii hdi đặc biệt, bao gâm các đình (nođe mạng) là cáu táo giả, nhủ nghiên cứu đã từng viết một hoặc nhiều bài báo đã được công bế về chú đề, lĩnh vực nào đó, các cạnh thé hiện môi liên hệ giữa các táo giả, thường là mỗi liên hệ công tác giữa hai tác giả khi cùng tham gia xuất bản một bái bảo. Các mạng dồng tác giá hỗ trợ người sử dụng hoặc các tổ chức để chia sẻ hồ sơ của họ cho mục đích trao đổi học thuật. Những người sử đụng địch vụ đó có thế tìm thấy các ứng cứ viên thich hop những người mả phủ hợp với mục tiêu hay nhu câu hợp tác. Mạng đồng tác giá. mang nhiều đặc trưng học thuật và có nhiều tính chất khác biệt so với mạng xã hội truyền thẳng. Ví du, mức độ công tắc giữa hai tác giã cùng viết chưng cáo bài báo phụ thuộc vào số lượng bài báo, số lượng tác giá, thử tự của các tác giá và thời gian công bổ của các bài bảo mà hai lác giả đã viết chung, Do đó, việc phân lích và khai pha théng tin tit cac mang déng tac gid mang nhiều ý nghĩa quan trọng và thiết thực trong việc mô hình hóa vả nâng cao chất lượng của quả trinh nghiên cửu học thuật, Để giúp các nhà làm nghiên cứu dé dang hon trong việc tiếp cận các (hông tín học thuật hữu ích liên quan, các hệ thống dự báo liên kết trong lĩnh vực học thuật (đu báo liên kết mạng đẳng tác giả) là giải pháp đang duoc quan tâm nghiên cứu trong những rừnn gần dây. Dự báo liên kết là vẫn để cơ bản rữất, việc đự báo liên kết cổ gắng để mrớc lượng khả năng vẻ sự tổn tại của mối liên kết giữa hai node mạng, dựa liên các liên kết. đã quam sát và các đặc trưng của nođe. Mục tiêu của bài toán dự bảo liên kết trong mạng dồng tác giả là dưa ra các cặp tác giả có khả nắng, hợp tác trong tương lai đựa vào cầu trúc của mạng quan sắt được ở thời điểm hiện. w DANH MUC HIiNH VE Hinh 2.1 Minh hoa phân lớp đữ liệu SVM dữ liệu tuy2n tinh .2 Minh hoa phân lớp SVM dữ liệu nhiỄu. nen ereirrrrirrer TTình 2. Minh họa anh xạ đữ liệu vào không gian nhiều chiều Hình 2.4 Minh họa Weighted-SVM.1 Minh hoa ràng buộc alpha trong Weighted-SVM. Mỗ tình đự báo Tiên kết đồng lác giả dựa trên tiên cận học máy, Hình 4. Sơ đỗ đề xuất tổng quan của chương trình dự báo liên kết đẳng tác giả. Sơ đồ đề xuất chương trình dự báo liên kết đẳng tác giả TRình 4. Màn hình huấn huyện mô hình đự báo liền kết mạng đồng Hình 4. Mản hình hiền thị kết quã huần luyện. Màn hình load tmg viên cần dự bảo Hình 4. Màn hình lựa chọn ứng viên / tác giả. Mán hình kết quả dự báo cho ứng viễn lựa chọn. Sự thay đổi của giá trị F1-seore theo tỉ lệ mật cân bằng Hình 4.10 Sự biến thiên của Rccall, Prccision, F1-score, G-rnean theo siêu tham sỏ C.11 Kết qua dink gia thoi gian chay tim + theo kich cỡ mẫu dữ liệu. DANH MUC BANG BIEU Đảng 1 Một số phương pháp phân lớp áp dụng che dự báo liên kết. Mô tả ma trận nhằm lẫn TH TH nh H2 TH nan. ca reeg 30 Bảng 3.

Nội dung được bảo vệ bản quyền — Tải xuống đầy đủ