Đánh Giá Các Phương Pháp Tìm Kiếm Thông Tin Trong Hệ Thống Mạng Ngang Hàng Có Cấu Trúc

Luận văn thạc sĩ VNU UET đánh giá các phương pháp tìm kiếm thông tin trong hệ thống mạng ngang hàng có cấu trúc, cung cấp cái nhìn sâu sắc và phân tích chi tiết.

Trường đại học

Đại học Quốc gia Hà Nội

Chuyên ngành

Công nghệ thông tin

Người đăng

Ẩn danh

Thể loại

luận văn thạc sĩ

2014

Phí lưu trữ

30 Point

Mục lục chi tiết

LỜI CAM ĐOAN

LỜI CẢM ƠN

1. CHƯƠNG 1: TÌM HIỂU MẠNG NGANG HÀNG VÀ CÁC ỨNG DỤNG

1.1. TỔNG QUAN MẠNG NGANG HÀNG

1.2. PHÂN LOẠI MẠNG NGANG HÀNG

2. MẠNG NGANG HÀNG CÓ CẤU TRÚC. GIAO THỨC CHORD

3. GIẢI PHÁP INS/TWINE

4. TỔNG QUAN VỀ ĐÁNH GIÁ HIỆU NĂNG MẠNG

PHỤ LỤC CÁC BẢNG SỐ LIỆU MÔ PHỎNG

LỜI MỞ ĐẦU

DANH MỤC HÌNH ẢNH

KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN TIẾP THEO

Tóm tắt

I. Tổng Quan Về Phương Pháp Tìm Kiếm Thông Tin Trong Mạng Ngang Hàng

Mạng ngang hàng có cấu trúc đã trở thành một phần quan trọng trong việc tìm kiếm thông tin. Các phương pháp tìm kiếm thông tin trong mạng này không chỉ giúp tối ưu hóa quá trình truy xuất dữ liệu mà còn nâng cao hiệu quả sử dụng tài nguyên. Việc hiểu rõ về các phương pháp này là cần thiết để phát triển các ứng dụng hiệu quả hơn.

1.1. Định Nghĩa Mạng Ngang Hàng Có Cấu Trúc

Mạng ngang hàng có cấu trúc (Structured P2P) là mô hình cho phép các node tổ chức và tìm kiếm thông tin một cách hiệu quả thông qua các thuật toán như Bảng băm phân tán (DHT).

1.2. Lợi Ích Của Việc Tìm Kiếm Thông Tin Trong Mạng Ngang Hàng

Việc tìm kiếm thông tin trong mạng ngang hàng giúp tối ưu hóa tài nguyên, giảm thiểu thời gian truy vấn và nâng cao khả năng truy cập thông tin cho người dùng.

II. Vấn Đề Trong Tìm Kiếm Thông Tin Trên Mạng Ngang Hàng

Mặc dù mạng ngang hàng có cấu trúc mang lại nhiều lợi ích, nhưng vẫn tồn tại một số thách thức trong việc tìm kiếm thông tin. Các vấn đề này bao gồm độ chính xác của kết quả tìm kiếm và khả năng mở rộng của hệ thống.

2.1. Độ Chính Xác Trong Tìm Kiếm

Độ chính xác của các phương pháp tìm kiếm thông tin thường bị ảnh hưởng bởi cách thức tổ chức dữ liệu và thuật toán tìm kiếm được sử dụng.

2.2. Khả Năng Mở Rộng Của Hệ Thống

Khi số lượng node trong mạng tăng lên, khả năng mở rộng của hệ thống có thể bị ảnh hưởng, dẫn đến việc giảm hiệu suất tìm kiếm.

III. Phương Pháp Tìm Kiếm Thông Tin Chính Trên Mạng Ngang Hàng

Có nhiều phương pháp tìm kiếm thông tin trong mạng ngang hàng có cấu trúc, bao gồm tìm kiếm chính xác, tìm kiếm theo thuộc tính và tìm kiếm theo khoảng. Mỗi phương pháp có những ưu điểm và nhược điểm riêng.

3.1. Tìm Kiếm Chính Xác

Phương pháp tìm kiếm chính xác cho phép người dùng tìm kiếm các tài nguyên có tên trùng khớp với từ khóa tìm kiếm, giúp nâng cao độ chính xác.

3.2. Tìm Kiếm Theo Thuộc Tính

Tìm kiếm theo thuộc tính cho phép người dùng tìm kiếm thông tin dựa trên các thuộc tính cụ thể của tài nguyên, giúp mở rộng khả năng tìm kiếm.

3.3. Tìm Kiếm Theo Khoảng

Phương pháp tìm kiếm theo khoảng cho phép người dùng tìm kiếm thông tin trong một khoảng giá trị nhất định, rất hữu ích trong nhiều ứng dụng thực tiễn.

IV. Ứng Dụng Thực Tiễn Của Các Phương Pháp Tìm Kiếm

Các phương pháp tìm kiếm thông tin trong mạng ngang hàng có cấu trúc đã được áp dụng trong nhiều lĩnh vực khác nhau, từ chia sẻ tệp tin đến các ứng dụng thương mại điện tử.

4.1. Chia Sẻ Tệp Tin

Trong lĩnh vực chia sẻ tệp tin, các phương pháp tìm kiếm giúp người dùng dễ dàng tìm thấy và truy cập các tài nguyên cần thiết.

4.2. Ứng Dụng Thương Mại Điện Tử

Các phương pháp tìm kiếm cũng được áp dụng trong thương mại điện tử, giúp người dùng tìm kiếm sản phẩm một cách nhanh chóng và hiệu quả.

V. Đánh Giá Hiệu Năng Của Các Phương Pháp Tìm Kiếm

Đánh giá hiệu năng của các phương pháp tìm kiếm là rất quan trọng để xác định tính khả thi và hiệu quả của chúng trong thực tế. Các chỉ số như tỷ lệ truy vấn thành công và thời gian phản hồi là những yếu tố cần xem xét.

5.1. Tỷ Lệ Truy Vấn Thành Công

Tỷ lệ truy vấn thành công là một chỉ số quan trọng để đánh giá hiệu quả của các phương pháp tìm kiếm trong mạng ngang hàng.

5.2. Thời Gian Phản Hồi

Thời gian phản hồi của hệ thống cũng là một yếu tố quan trọng, ảnh hưởng đến trải nghiệm người dùng trong quá trình tìm kiếm thông tin.

VI. Kết Luận Và Tương Lai Của Phương Pháp Tìm Kiếm Thông Tin

Tương lai của các phương pháp tìm kiếm thông tin trong mạng ngang hàng có cấu trúc hứa hẹn sẽ tiếp tục phát triển với sự cải tiến về công nghệ và thuật toán. Việc nghiên cứu và phát triển các phương pháp mới sẽ giúp nâng cao hiệu quả tìm kiếm.

6.1. Xu Hướng Phát Triển

Xu hướng phát triển trong tương lai sẽ tập trung vào việc cải thiện độ chính xác và khả năng mở rộng của các phương pháp tìm kiếm.

6.2. Thách Thức Cần Đối Mặt

Các thách thức như an ninh mạng và bảo mật thông tin cũng cần được xem xét để đảm bảo tính khả thi của các phương pháp tìm kiếm trong tương lai.

22/07/2025

Bạn đang xem trước tài liệu:

Luận văn thạc sĩ vnu uet đánh giá các phương pháp tìm kiếm thông tin trong hệ thống mạng ngang hàng có cấu trúc

Tải đầy đủ

Nội dung chính

Tổng quan nghiên cứu

Mạng ngang hàng (Peer-to-Peer - P2P) đã trở thành một mô hình mạng phổ biến từ cuối những năm 1990, với ứng dụng rộng rãi trong chia sẻ tài nguyên như file, video streaming và các dịch vụ phân tán khác. Theo báo cáo ngành, các ứng dụng P2P chiếm khoảng 50-75% băng thông Internet hiện nay, cho thấy tầm quan trọng và quy mô phát triển của mô hình này. Tuy nhiên, việc tìm kiếm thông tin hiệu quả trong mạng ngang hàng, đặc biệt là mạng ngang hàng có cấu trúc, vẫn là một thách thức lớn do tính phân tán và đa dạng của tài nguyên.

Luận văn tập trung nghiên cứu và đánh giá các phương pháp tìm kiếm thông tin theo cặp thuộc tính - giá trị trong hệ thống mạng ngang hàng có cấu trúc, với phạm vi nghiên cứu chủ yếu trên các giải pháp INS/Twine, Content Discovery System (CDS) và D-AVTree. Thời gian nghiên cứu tập trung vào giai đoạn phát triển và ứng dụng các giải pháp này trong khoảng năm 2010-2014, tại môi trường mạng ngang hàng có cấu trúc sử dụng giao thức Chord làm nền tảng định tuyến.

Mục tiêu chính của nghiên cứu là đánh giá hiệu năng tìm kiếm, khả năng cân bằng tải và tỷ lệ truy vấn thành công của các giải pháp tìm kiếm thông tin trên mạng ngang hàng có cấu trúc, từ đó đề xuất các giải pháp tối ưu phù hợp với các yêu cầu thực tế. Kết quả nghiên cứu có ý nghĩa quan trọng trong việc nâng cao hiệu quả hoạt động của các hệ thống phân tán, đặc biệt trong bối cảnh mạng Internet ngày càng phát triển và nhu cầu truy cập thông tin ngày càng tăng cao.

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Luận văn dựa trên các lý thuyết và mô hình sau:

Mạng ngang hàng có cấu trúc (Structured P2P Networks): Sử dụng kỹ thuật Bảng băm phân tán (Distributed Hash Table - DHT) để tổ chức các nút mạng theo cấu trúc không gian khóa, điển hình là giao thức Chord. Mạng này đảm bảo khả năng mở rộng, chịu lỗi và định tuyến hiệu quả.
Phương pháp tìm kiếm thông tin: Bao gồm tìm kiếm chính xác, tìm kiếm theo cặp thuộc tính - giá trị và tìm kiếm theo khoảng. Trong đó, tìm kiếm theo cặp thuộc tính - giá trị được xem là phù hợp với thực tế người dùng khi họ thường sử dụng nhiều từ khóa để mô tả thông tin cần tìm.
Luật phân bố Zipf: Áp dụng để mô hình hóa sự phân bố không đồng đều của các cặp thuộc tính - giá trị trong tài nguyên và truy vấn, ảnh hưởng đến tải trọng trên các nút mạng.

Các khái niệm chính bao gồm: bảng Finger trong mạng Chord, cây thuộc tính - giá trị (AVTree), ma trận cân bằng tải (Load Balancing Matrix - LBM), và các thuật toán định tuyến DHT.

Phương pháp nghiên cứu

Nghiên cứu sử dụng phương pháp mô phỏng để đánh giá hiệu năng các giải pháp tìm kiếm thông tin trên mạng ngang hàng có cấu trúc. Cụ thể:

Nguồn dữ liệu: Mô phỏng mạng ngang hàng với 200.000 nút, tạo lập tài nguyên và truy vấn dựa trên luật phân bố Zipf với các tham số alpha = 0.6 và 1.0.
Phương pháp phân tích: Sử dụng chương trình mô phỏng viết bằng C++ trên nền tảng CodeBlock, mô phỏng các giải pháp INS/Twine, CDS, D-AVTree và các cải tiến của chúng. Các chỉ số đánh giá gồm số bản sao tài nguyên, số nút cần truy vấn, độ trễ truy vấn, khả năng cân bằng tải và tỷ lệ truy vấn thành công.
Timeline nghiên cứu: Nghiên cứu được thực hiện trong năm 2014, tập trung vào việc xây dựng mô hình, mô phỏng và phân tích kết quả.

Phương pháp mô phỏng được lựa chọn nhằm giảm chi phí và sai số so với phương pháp đo thực tế, đồng thời cho phép điều chỉnh tham số linh hoạt để đánh giá các kịch bản khác nhau.

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

Số bản sao tài nguyên trên mỗi tài nguyên:
- D-AVTree và D-AVTree+ duy trì số bản sao ổn định, không đổi khi tăng số lượng tài nguyên.
- INS/Twine có số bản sao cao nhất, gây tốn kém bộ nhớ.
- CDS và INS/Twine có sự biến động nhẹ nhưng không đáng kể khi thay đổi tham số.
Số nút cần truy vấn cho một truy vấn:
- D-AVTree và D-AVTree+ yêu cầu truy vấn số nút ít hơn so với CDS và INS/Twine.
- Khi tăng số tài nguyên, số nút truy vấn của các giải pháp duy trì ổn định.
- Tham số (h, 1/alpha) ảnh hưởng đến số nút truy vấn trong D-AVTree, với giá trị h lớn giúp giảm số nút truy vấn.
Độ trễ truy vấn (số hop trung bình):
- D-AVTree+ cải tiến giảm đáng kể độ trễ so với các giải pháp khác.
- CDS có độ trễ cao hơn do phải truy vấn nhiều nút trong ma trận LBM.
- INS/Twine có độ trễ trung bình, nhưng có thể tăng khi số lượng truy vấn lớn.
Khả năng cân bằng tải:
- CDS sử dụng ma trận cân bằng tải LBM giúp phân phối đều tải lưu trữ và truy vấn, giảm hiện tượng quá tải tại một số nút.
- D-AVTree có khả năng cân bằng tải tốt nhờ phân bổ khóa dựa trên nhánh AV.
- INS/Twine không đảm bảo cân bằng tải, dễ gây quá tải tại các nút phụ trách khóa phổ biến.
Tỷ lệ truy vấn thành công:
- D-AVTree và D-AVTree+ đạt tỷ lệ truy vấn thành công cao hơn 90% trong các kịch bản mô phỏng.
- CDS có tỷ lệ thành công thấp hơn do chi phí truy vấn lớn và khả năng mất thông tin khi nút quá tải.
- INS/Twine có tỷ lệ thành công trung bình, bị ảnh hưởng bởi ngưỡng tải của nút.

Thảo luận kết quả

Kết quả mô phỏng cho thấy D-AVTree và phiên bản cải tiến D-AVTree+ vượt trội về hiệu quả tìm kiếm và cân bằng tải so với CDS và INS/Twine. Việc sử dụng hàm ánh xạ nhánh AV giúp giảm số lượng bản sao tài nguyên và số nút cần truy vấn, từ đó giảm độ trễ và tăng tỷ lệ truy vấn thành công. CDS với ma trận LBM có ưu điểm trong cân bằng tải nhưng chi phí truy vấn cao làm tăng độ trễ và giảm hiệu quả tổng thể.

So sánh với các nghiên cứu trước đây, kết quả phù hợp với xu hướng phát triển các giải pháp tìm kiếm phân tán ưu tiên cân bằng tải và giảm chi phí truy vấn. Việc lựa chọn tham số hệ thống như h và α trong D-AVTree là yếu tố quan trọng để cân bằng giữa hiệu quả truy vấn và tải trọng nút.

Dữ liệu có thể được trình bày qua các biểu đồ số bản sao tài nguyên, số nút truy vấn, độ trễ truy vấn và tỷ lệ truy vấn thành công theo từng giải pháp và tham số mô phỏng, giúp trực quan hóa sự khác biệt hiệu năng.

Đề xuất và khuyến nghị

Áp dụng giải pháp D-AVTree+ trong các hệ thống mạng ngang hàng có cấu trúc:
- Mục tiêu: Tối ưu hiệu quả tìm kiếm, giảm độ trễ và cân bằng tải.
- Thời gian: Triển khai trong vòng 6-12 tháng.
- Chủ thể thực hiện: Các nhà phát triển hệ thống phân tán, doanh nghiệp công nghệ.
Tối ưu tham số hệ thống (h, α) trong D-AVTree để cân bằng giữa hiệu quả truy vấn và tải nút:
- Mục tiêu: Giảm số nút truy vấn và tránh quá tải tại nút lưu trữ phổ biến.
- Thời gian: Nghiên cứu và thử nghiệm trong 3-6 tháng.
- Chủ thể thực hiện: Nhóm nghiên cứu và phát triển thuật toán.
Ứng dụng ma trận cân bằng tải LBM trong CDS để cải thiện khả năng cân bằng tải:
- Mục tiêu: Giảm hiện tượng quá tải và tăng khả năng mở rộng hệ thống.
- Thời gian: 6 tháng để tích hợp và thử nghiệm.
- Chủ thể thực hiện: Các nhà phát triển phần mềm mạng phân tán.
Phát triển công cụ mô phỏng và đánh giá hiệu năng mở rộng:
- Mục tiêu: Hỗ trợ đánh giá các giải pháp mới trong môi trường mạng thực tế.
- Thời gian: 12 tháng.
- Chủ thể thực hiện: Các viện nghiên cứu, trường đại học.

Các đề xuất trên nhằm nâng cao hiệu quả hoạt động của mạng ngang hàng có cấu trúc, đáp ứng nhu cầu ngày càng tăng về truy cập và chia sẻ thông tin phân tán.

Đối tượng nên tham khảo luận văn

Nhà nghiên cứu và sinh viên ngành Công nghệ Thông tin, đặc biệt chuyên ngành Truyền dữ liệu và Mạng máy tính:
- Lợi ích: Hiểu sâu về các giải pháp tìm kiếm thông tin trong mạng ngang hàng có cấu trúc, áp dụng vào nghiên cứu và phát triển.
- Use case: Phát triển thuật toán tìm kiếm phân tán, tối ưu mạng P2P.
Các kỹ sư phát triển hệ thống phân tán và mạng ngang hàng:
- Lợi ích: Áp dụng các giải pháp tìm kiếm hiệu quả, cân bằng tải trong thiết kế hệ thống thực tế.
- Use case: Xây dựng phần mềm chia sẻ file, dịch vụ phân tán.
Doanh nghiệp công nghệ và nhà cung cấp dịch vụ mạng:
- Lợi ích: Nâng cao hiệu suất dịch vụ, giảm chi phí vận hành mạng phân tán.
- Use case: Triển khai mạng P2P cho chia sẻ nội dung, truyền thông đa phương tiện.
Các tổ chức nghiên cứu và phát triển công nghệ mạng:
- Lợi ích: Tham khảo các phương pháp đánh giá hiệu năng mạng, mô phỏng mạng phân tán.
- Use case: Thiết kế thử nghiệm, đánh giá các giải pháp mạng mới.

Câu hỏi thường gặp

Mạng ngang hàng có cấu trúc khác gì so với mạng không cấu trúc?
Mạng ngang hàng có cấu trúc sử dụng bảng băm phân tán (DHT) để tổ chức các nút theo cấu trúc khóa, giúp định tuyến và tìm kiếm hiệu quả hơn. Mạng không cấu trúc dựa trên flooding, gây tốn băng thông và không đảm bảo tìm kiếm thành công.
Tại sao tìm kiếm theo cặp thuộc tính - giá trị quan trọng trong mạng P2P?
Người dùng thường không biết chính xác tên tài nguyên mà chỉ có một số thông tin cơ bản. Tìm kiếm theo cặp thuộc tính - giá trị giúp mở rộng khả năng tìm kiếm, phù hợp với thực tế sử dụng.
Giải pháp D-AVTree có ưu điểm gì so với INS/Twine và CDS?
D-AVTree có số bản sao tài nguyên thấp, cân bằng tải tốt và số nút truy vấn ít, giúp giảm độ trễ và tăng tỷ lệ truy vấn thành công so với hai giải pháp còn lại.
Luật phân bố Zipf ảnh hưởng thế nào đến hiệu năng mạng?
Zipf mô tả sự phân bố không đồng đều của các cặp thuộc tính - giá trị, dẫn đến một số nút bị quá tải do chứa nhiều tài nguyên phổ biến, ảnh hưởng đến cân bằng tải và hiệu quả tìm kiếm.
Phương pháp mô phỏng được sử dụng trong nghiên cứu có ưu điểm gì?
Mô phỏng giúp đánh giá hiệu năng trong nhiều kịch bản khác nhau với chi phí thấp, giảm sai số so với phương pháp toán học và đo thực tế, đồng thời cho phép điều chỉnh tham số linh hoạt.

Kết luận

Luận văn đã đánh giá chi tiết các giải pháp tìm kiếm thông tin theo cặp thuộc tính - giá trị trên mạng ngang hàng có cấu trúc, bao gồm INS/Twine, CDS và D-AVTree.
Kết quả mô phỏng cho thấy D-AVTree+ là giải pháp tối ưu về hiệu quả tìm kiếm, cân bằng tải và tỷ lệ truy vấn thành công.
Việc lựa chọn tham số hệ thống như h và α trong D-AVTree ảnh hưởng lớn đến hiệu năng và cần được tối ưu hóa.
Giải pháp ma trận cân bằng tải LBM trong CDS giúp cải thiện cân bằng tải nhưng tăng chi phí truy vấn và độ trễ.
Đề xuất triển khai D-AVTree+ và phát triển công cụ mô phỏng mở rộng nhằm nâng cao hiệu quả mạng ngang hàng có cấu trúc trong thực tế.

Next steps: Triển khai thử nghiệm thực tế giải pháp D-AVTree+, tối ưu tham số hệ thống và phát triển công cụ hỗ trợ đánh giá hiệu năng mạng phân tán.

Các nhà nghiên cứu và phát triển hệ thống phân tán nên áp dụng và tiếp tục cải tiến các giải pháp tìm kiếm thông tin dựa trên kết quả nghiên cứu này để đáp ứng nhu cầu ngày càng cao của người dùng mạng ngang hàng.

Trích đoạn nội dung tài liệu

LỜI MỞ ĐẦU Mô hình mạng ngang hàng bắt đầu xuất hiện trên thế giới từ năm 1999 và đƣợc sử dụng rộng rãi trong nhiều ứng dụng, đặc biệt nhƣ các ứng dụng chia sẻ file, video streaming, …. Trong mô hình mạng ngang hàng, các node tham gia mạng có thể chia sẻ tài nguyên nhƣ các file, dữ liệu cho nhau. Điều đó làm tăng tài nguyên của mạng. Tuy nhiên, do các tài nguyên này đƣợc lƣu trữ một cách phân tán, việc tìm kiếm thông tin về tài nguyên một cách hiệu quả là một vấn đề hết sức quan trọng trong các mạng ngang hàng.

Trong thời kỳ đầu mới phát triển, việc tìm kiếm trong mạng ngang hàng hoặc là sử dụng máy chủ lƣu trữ thông tin tài nguyên, hoặc đƣợc thực hiện theo kiểu phát tràn thông báo, gây tốn kém băng thông mạng. Các ứng dụng sau này đã từng bƣớc cải tiến giao thức định tuyến thông báo, làm mạng hoạt động hiệu quả hơn, nhƣng vẫn chƣa đảm bảo việc tìm kiếm thông tin sẽ thành công. Mạng ngang hàng có cấu trúc sử dụng giải thuật Bảng băm phân tán (Distributed Hash Table – DHT [10]) khắc phục nhƣợc điểm trên bằng cách tổ chức các node mạng theo một cấu trúc không gian khóa nhất định nhƣ mạch vòng (giao thức Chord [6]) hay không gian n-chiều (giao thức CAN[5]) và định tuyến thông báo dựa trên cấu trúc này. Tuy nhiên, mạng ngang hàng có cấu trúc chỉ hỗ trợ phƣơng pháp tìm kiếm chính xác, tức là tìm kiếm các tài nguyên có tên trùng với từ khoá tìm kiếm.

Tuy nhiên, trên thực tế ngƣời dùng thƣờng không thể biết chính xác thông tin cần tìm kiếm mà chỉ biết một số thông tin cơ bản. Vì vậy, việc tìm kiếm theo khoảng hoặc theo các cặp thuộc tính giá trị là hết sức cần thiết. Luận văn này tập trung tìm hiểu các giải pháp tìm kiếm thông tin theo cặp thuộc tính - giá trị đã đƣợc đề xuất nhƣ INS/Twine [9], Contens Distribution System [8], D-AVTree [4], … và đánh giá hiệu năng tìm kiếm, khả năng cân bằng tải của các giải pháp này thông qua mô phỏng. Luận văn gồm có 4 chƣơng, trong đó 2 chƣơng đầu giới thiệu tổng quan về mạng ngang hàng, mạng ngang hàng có cấu trúc và các giải pháp tìm kiếm thông tin cơ bản trong hệ thống mạng ngang hàng có cấu trúc.

Chƣơng 3 đi sâu tìm hiểu các giải pháp tìm kiếm thông tin theo cặp thuộc tính - giá trị nhƣ INS/Twine, CDS, D-AVTree và so sánh các giải pháp. Chƣơng cuối cùng, luận văn tập trung đánh giá mô phỏng các giải pháp tìm kiếm nêu trên, đƣa ra những đánh giá chi tiết về hiệu năng của hệ thống, khả năng cân bằng tải, … của từng giải pháp và những đề xuất lựa chọn giải pháp tùy theo yêu cầu của hệ thống. LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com 8 CHƢƠNG 1. TÌM HIỂU MẠNG NGANG HÀNG VÀ CÁC ỨNG DỤNG 1.1 TỔNG QUAN MẠNG NGANG HÀNG Chƣơng này sẽ trình bày tổng quan về mạng ngang hàng, về khái niệm, phân loại và nêu rõ ƣu, nhƣợc điểm của mạng ngang hàng so với mạng dựa trên mô hình client/ server.1 Định nghĩa mạng ngang hàng: Quá trình trao đổi thông tin giữa hai máy tính trên hệ thống mạng có thể diễn ra theo 2 mô hình: mô hình khách hàng/ ngƣời phục vụ (client/ server) (hình 1.) hay mô hình mạng ngang hàng peer to peer (hình 1.

Mô hình Client/Server Mạng ngang hàng (còn gọi là mạng peer to peer, viết tắt là P2P) là mạng đƣợc tạo ra bởi 2 hay nhiều máy tính đƣợc kết nối với nhau và chia sẻ tài nguyên (nhƣ tệp tin, máy in, .) mà không phải thông qua một máy chủ riêng nào. Mô hình mạng ngang hàng P2P Trong hệ thống mạng ngang hàng, các máy tính có thể kết nối với nhau qua cổng USB để truyền tệp tin (file) (2 máy tính), cũng có thể kết nối nhiều máy tính trong một văn phòng nhỏ bằng cáp đồng, hoặc kết nối số lƣợng lớn máy tính với nhau bằng các giao thức, ứng dụng đặc biệt. Có thể hiểu, mạng ngang hàng là một kiểu mạng đƣợc thiết kế cho các thiết bị trong đó có chức năng và khả năng của các thiết bị đó là nhƣ nhau. Mạng ngang hàng P2P không có khái niệm máy trạm (client) hay máy chủ (server), mà chỉ có khái niệm các nốt (peers) đóng vai trò nhƣ cả client và server.

LUAN VAN CHAT LUONG download : add luanvanchat@agmail.2 So sánh mô hình mạng ngang hàng p2p với mô hình client/ server P2P Client/Server Đặc điểm: Một mạng ngang hàng cho Đặc điểm: Dữ liệu đƣợc lƣu trữ ở một phép các node đóng góp, chia sẻ tài Server trung tâm, tốc độ cao (Tốc độ nguyên với nhau. Tài nguyên riêng rẽ truy cập thƣờng lớn hơn so với mạng của các node nhƣ: ổ cứng, CD-ROM, P2P). Các nguồn tài nguyên này có Khi một máy client yêu cầu lấy thông thể đƣợc truy cập từ bất cứ node nào tin nó sẽ phải gửi một yêu cầu theo trong mạng. một tiêu chuẩn do server định ra, nếu Các node đóng vai trò nhƣ cả Client yêu cầu đƣợc chấp nhận thì máy (truy vấn thông tin) và Server (cung cấp server sẽ trả về thông tin mà client thông tin).

Ƣu điểm: Không cần server riêng, các Ƣu điểm: Tốc độ truy cập nhanh. client chia sẻ tài nguyên. Khi mạng Khả năng mở rộng cao. Hoạt động với càng đƣợc mở rộng thì khả năng hoạt bất kì loại ứng dụng nào.

Sử dụng động của hệ thống càng tốt. Dễ cài đƣợc với các ứng dụng chia sẻ CSDL. đặt và bảo trì; thuận lợi cho việc chia sẻ Đáng tin cậy hơn (có server riêng). tài nguyên nhƣ tệp tin, máy in, CD- Mức độ an toàn cao nhất.v… Nhƣợc điểm: Chậm.

Không tốt cho Nhƣợc điểm: Cần server riêng (nghẽn các ứng dụng CSDL. Kém tin cậy. Phức tạp trong việc bảo trì, duy trì hoạt động của mạng.3 Lịch sử phát triển của P2P Lịch sử ra đời và phát triển của P2P gắn liền với phần mềm ứng dụng Napster. Năm 1999, Shawn Fanning một sinh viên Đại học 18 tuổi đã rời bỏ trƣờng Đại học để bắt đầu xây dựng phần mềm mang tên Napster (do bức xúc với việc rất khó khăn trong việc đƣa và chia sẻ các file nhạc online trên Internet mặc dù mọi ngƣời đều có nguồn tài nguyên trong đĩa cứng của mình).

Napster đƣợc xây dựng thành công và trở thành cách chia sẻ file chính (miễn phí), nó đã làm thay đổi cách download file nhạc và dung lƣợng cũng lớn hơn nhiều so với các chƣơng trình chia sẻ file trƣớc đó. Download phần mềm, bạn có thể chia sẻ files từ máy tính của mình với tất cả mọi ngƣời trên thế giới. 60 triệu ngƣời trên thế giới đã sử dụng (1 triệu ngƣời Nhật) vào thời điểm đó. Tuy nhiên, do có quá LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com 10 đông ngƣời dùng và vấn đề bản quyền âm nhạc nên công ty Napster đã bị cấm hoạt động, phần mềm không còn đƣợc sử dụng nữa (2003).

Sau Napster, rất nhiều các chƣơng trình khác nhƣ Gnutella, KaZaa and WinMP đã xuất hiện. Và P2P đã chuyển sang việc chia sẻ file has moved beyond file-sharing, chia sẻ processor power rỗi của các nodes chứ không phải là chia sẻ các file âm nhạc MP3 nữa. Sau sự ra đời của Napster, công nghệ P2P phát triển một cách nhanh chóng. Hiện tại các ứng dụng P2P chiếm khoảng 50% (thậm chí 75%) băng thông trên Internet.4 Ứng dụng trong P2P Mạng ngang hàng P2P đƣợc thiết lập để kết nối các máy tính trong khuôn viên nhỏ nhƣ trong gia đình, các bộ phận của các cơ quan, doanh nghiệp trong phạm vi nhỏ hoặc đƣợc thiết lập trên hệ thống mạng internet nhằm chia sẻ tài nguyên, kết nối, trao đổi thông tin giữa các máy tính trong hệ thống mạng.1 Mạng máy tính trong gia đình: Hầu hết các mạng máy tính trong gia đình hiện nay đều là mạng P2P.

Ngƣời dùng cấu hình các máy tính theo workgroup cho phép các máy có thể chia sẻ files, máy in và các tài nguyên, thiết bị khác. Cả mạng có dây và không dây trong gia đình đều có thể sử dụng để thiết lập mạng P2P. Hệ thống mạng này cũng đƣợc áp dụng ở một số phòng, ban hoặc bộ phận nhỏ của các cơ quan, doanh nghiệp phục vụ chia sẻ file, tài nguyên nhƣ máy in, thiết bị khác.2 Mạng máy tính chia sẻ tệp tin: Là mạng P2P phổ biến và nổi tiếng nhất trên Internet hiện nay. Chức năng chủ yếu của mạng là cho phép tìm kiếm và truyền dữ liệu dựa trên giao thức IP (Internet Protocol).

Để truy cập vào mạng P2P này, ngƣời dùng chỉ cần tải và cài đặt phần mềm ứng dụng phù hợp cho máy tính của mình. Có nhiều mạng P2P và phần mềm ứng dụng P2P tồn tại hiện nay. Một số phần mềm chỉ sử dụng đƣợc cho 1 mạng P2P nhất định, một số hoạt động đƣợc với nhiều mạng P2P khác nhau. Một số mạng P2P nổi tiếng trên Internet gồm: eDonkey, BitTorent, Gnutella.3 Phần mềm ứng dụng P2P.

Một số phần mềm ứng dụng P2P nổi tiếng hiện nay bao gồm: KazaA, eMule, Bittorent, …. LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com 11 KazaA: cho phép tìm kiếm và tải các tệp tin đã đƣợc chia sẻ bởi những nhà cung cấp chuyên nghiệp và ngƣời dùng. KazaA có sử dụng những kết nối nhanh với các SuperNodes: Mỗi SuperNode chứa danh sách các tệp tin chia sẻ bởi ngƣời dùng và nơi lƣu trữ tệp tin. Mô hình mạng ứng dụng Kazaa Emule: Một trong những phần mềm chia sẻ tệp tin trong hệ thống mạng P2P lớn nhất giữa các ngƣời dùng trên Internet.

Có thể sử dụng eMule để chia sẻ và tải tất cả các loại tệp tin trên Internet. Mô hình mạng ứng dụng Skype Skype: Là phần mềm VoIP phát triển bởi những ngƣời đã làm KazaA trong hệ thống mạng ngang hàng. Skype cho phép ngƣời dùng đàm thoại và gửi message tới ngƣời dùng Skype khác. Có 2 loại nút: Original Host (OH) và Super nodes (SN).

OH LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com 12 là một phần mềm ứng dụng cho phép sử dụng để đàm thoại và gửi message. Những nút có địa chỉ IP tĩnh, CPU, memory, băng thông đủ mạnh thì có thể đƣợc xem xét chọn làm super node. OH kết nối với một Super nodes SN và phải đăng kí với Skype để đăng nhập thành công.2 PHÂN LOẠI MẠNG NGANG HÀNG Mạng ngang hàng đƣợc phân loại theo mục đích sử dụng hoặc mức độ tập trung của mạng. Phân loại mạng ngang hàng theo mục đích sử dụng, nhƣ: Chia sẻ file (file sharing), điện thoại VoIP (telephony), đa phƣơng tiện media streaming (audio, video), diễn đàn thảo luận (Discussion forums).

Nội dung được bảo vệ bản quyền — Tải xuống đầy đủ

Chủ đề

Phân tích và mô phỏng hiệu năng mạng

Tổng quan về mạng ngang hàng P2P

Tìm kiếm thông tin trong hệ thống phân tán

Các giải pháp mạng ngang hàng có cấu trúc