Luận văn thạc sĩ nâng cao hiệu quả bài toán sắp xếp với giải thuật song song

Luận văn thạc sĩ nghiên cứu nâng cao hiệu quả bài toán sắp xếp sử dụng giải thuật song song tối ưu tốc độ và hiệu suất xử lý dữ liệu.

Trường đại học

Đại học Quốc gia Hà Nội

Chuyên ngành

Cơ sở toán cho tin học

Người đăng

Ẩn danh

Thể loại

luận văn thạc sĩ

2014

Phí lưu trữ

30 Point

Mục lục chi tiết

LỜI CẢM ƠN

Danh mục viết tắt

Danh mục các hình

Danh mục các bảng

MỞ ĐẦU

1. CHƯƠNG 1: TỔNG QUAN VỀ XỬ LÝ SONG SONG VÀ BÀI TOÁN SẮP XẾP

1.1. Tổng quan về xử lí song song

1.1.1. Tính toán tuần tự và tính toán song song

1.1.2. Kiến trúc máy tính song song

1.1.3. Một số mạng kết nối trên hệ thống song song

1.1.3.1. Mạng liên kết tuyến tính và liên kết vòng

1.1.3.2. Mạng liên kết lưới hai chiều

1.1.3.3. Mạng liên kết hình khối

1.1.4. Cơ sở đánh giá giải thuật song song

1.1.4.1. Thời gian thực hiện

1.1.4.2. Hệ số tăng tốc và độ hiệu quả giải thuật

1.2. Tổng quan về bài toán sắp xếp

1.2.1. Bài toán sắp xếp

1.2.2. Các cấu trúc dữ liệu cho bài toán sắp xếp

1.2.3. Phân lớp các thuật toán sắp xếp dựa trên độ phức tạp

1.2.3.1. Lớp thuật toán có độ phức tạp O(n2)

1.2.3.2. Lớp thuật toán có độ phức tạp O(nlogn)

1.2.3.3. Thuật toán sắp xếp có độ phức tạp thấp với dữ liệu đặc biệt

1.3. Kết luận chương

2. MỘT SỐ THUẬT TOÁN SONG SONG CHO BÀI TOÁN SẮP XẾP

2.1. Chiến lược song song cho bài toán sắp xếp

2.2. Thuật toán sắp xếp song song phát triển dựa trên thuật toán tuần tự

2.2.1. Thuật toán sắp xếp hoán vị chẵn lẻ

2.2.2. Thuật toán Shellsort

2.2.3. Thuật toán Parallel QuickSort

2.2.4. Thuật toán HyperQuicksort

2.3. Thuật toán sắp xếp song song dựa trên các mẫu chuẩn PSRS

2.3.1. Tư tưởng thuật toán

2.3.2. Đánh giá độ phức tạp

2.4. Kết luận chương

3. ỨNG DỤNG LẬP TRÌNH SONG SONG CÀI ĐẶT THUẬT TOÁN SẮP XẾP PSRS VÀ PARALLELQUICKSORT

3.1. Môi trường và phương pháp thực nghiệm

3.1.1. Môi trường thực nghiệm

3.1.2. Phương pháp thực nghiệm

3.2. Các kết quả thực nghiệm

3.2.1. Kết quả thực nghiệm khi chạy trên thuật toán PSRS

3.2.2. So sánh kết quả giữa thuật toán PSRS và ParallelQuicksort

3.3. Kết luận chương

TÀI LIỆU THAM KHẢO

Tóm tắt

I. Tổng quan về luận văn thạc sĩ nâng cao hiệu quả bài toán sắp xếp

Luận văn thạc sĩ này tập trung vào việc nâng cao hiệu quả của bài toán sắp xếp thông qua việc áp dụng các giải thuật song song. Bài toán sắp xếp là một trong những vấn đề cơ bản trong lĩnh vực khoa học máy tính, ảnh hưởng đến nhiều ứng dụng thực tiễn. Việc tối ưu hóa các thuật toán sắp xếp không chỉ giúp cải thiện hiệu suất mà còn giảm thiểu thời gian xử lý dữ liệu lớn.

1.1. Ứng dụng của bài toán sắp xếp trong thực tiễn

Bài toán sắp xếp có ứng dụng rộng rãi trong nhiều lĩnh vực như quản lý dữ liệu, tìm kiếm thông tin, và phân tích dữ liệu. Các ứng dụng này yêu cầu các thuật toán sắp xếp phải hoạt động hiệu quả để xử lý khối lượng dữ liệu lớn trong thời gian ngắn.

1.2. Tầm quan trọng của giải thuật song song trong xử lý dữ liệu

Giải thuật song song cho phép thực hiện nhiều tác vụ đồng thời, từ đó nâng cao hiệu suất xử lý. Việc áp dụng giải thuật song song vào bài toán sắp xếp giúp giảm thiểu thời gian xử lý và tăng cường khả năng mở rộng của hệ thống.

II. Vấn đề và thách thức trong bài toán sắp xếp

Mặc dù có nhiều giải thuật sắp xếp đã được phát triển, nhưng vẫn tồn tại nhiều thách thức trong việc tối ưu hóa hiệu suất. Các vấn đề như độ phức tạp tính toán, khả năng mở rộng và hiệu quả sử dụng tài nguyên vẫn là những yếu tố cần được xem xét kỹ lưỡng.

2.1. Độ phức tạp của các thuật toán sắp xếp

Các thuật toán sắp xếp thường có độ phức tạp khác nhau, từ O(n^2) đến O(n log n). Việc lựa chọn thuật toán phù hợp với kích thước và tính chất của dữ liệu là rất quan trọng để đạt được hiệu quả tối ưu.

2.2. Khả năng mở rộng của giải thuật song song

Khả năng mở rộng của giải thuật song song phụ thuộc vào cách thức phân chia dữ liệu và cách thức giao tiếp giữa các bộ xử lý. Việc tối ưu hóa các yếu tố này sẽ giúp cải thiện đáng kể hiệu suất của thuật toán.

III. Phương pháp nâng cao hiệu quả bài toán sắp xếp với giải thuật song song

Để nâng cao hiệu quả bài toán sắp xếp, nhiều phương pháp đã được nghiên cứu và áp dụng. Các phương pháp này bao gồm việc sử dụng các giải thuật song song như Parallel QuickSort và PSRS, giúp tối ưu hóa thời gian xử lý và hiệu suất tổng thể.

3.1. Giải thuật Parallel QuickSort

Parallel QuickSort là một trong những giải thuật sắp xếp song song phổ biến. Nó chia dữ liệu thành các phần nhỏ và xử lý đồng thời trên nhiều bộ xử lý, từ đó giảm thiểu thời gian sắp xếp.

3.2. Giải thuật PSRS Parallel Sorting by Regular Sampling

PSRS là một giải thuật sắp xếp song song hiệu quả, cho phép phân chia dữ liệu thành các mẫu và xử lý chúng đồng thời. Phương pháp này đã chứng minh được hiệu quả trong việc xử lý các tập dữ liệu lớn.

IV. Kết quả nghiên cứu và ứng dụng thực tiễn

Nghiên cứu đã chỉ ra rằng việc áp dụng các giải thuật song song vào bài toán sắp xếp không chỉ nâng cao hiệu quả mà còn mở ra nhiều cơ hội ứng dụng trong thực tiễn. Các kết quả thực nghiệm cho thấy thời gian xử lý giảm đáng kể khi sử dụng các giải thuật này.

4.1. Kết quả thực nghiệm với thuật toán PSRS

Kết quả thực nghiệm cho thấy thuật toán PSRS có thể xử lý dữ liệu lớn nhanh hơn nhiều so với các thuật toán sắp xếp tuần tự truyền thống. Thời gian xử lý giảm từ hàng giờ xuống chỉ còn vài phút.

4.2. So sánh hiệu suất giữa PSRS và Parallel QuickSort

So sánh giữa PSRS và Parallel QuickSort cho thấy cả hai giải thuật đều có hiệu suất cao, nhưng PSRS thường cho kết quả tốt hơn trong các tình huống dữ liệu lớn và phức tạp.

V. Kết luận và tương lai của nghiên cứu

Luận văn đã chứng minh rằng việc áp dụng giải thuật song song vào bài toán sắp xếp là một hướng đi đúng đắn. Tương lai của nghiên cứu này hứa hẹn sẽ mang lại nhiều cải tiến và ứng dụng mới trong lĩnh vực xử lý dữ liệu.

5.1. Hướng nghiên cứu tiếp theo

Các nghiên cứu tiếp theo có thể tập trung vào việc phát triển các giải thuật mới, tối ưu hóa hơn nữa hiệu suất và khả năng mở rộng của các giải thuật hiện tại.

5.2. Ứng dụng trong các lĩnh vực khác

Việc áp dụng các giải thuật sắp xếp song song không chỉ giới hạn trong lĩnh vực khoa học máy tính mà còn có thể mở rộng ra nhiều lĩnh vực khác như y sinh học, tài chính và thương mại điện tử.

16/08/2025

Bạn đang xem trước tài liệu:

Luận văn thạc sĩ nâng cao hiệu quả bài toán sắp xếp với giải thuật song song

Tải đầy đủ

Nội dung chính

Tổng quan nghiên cứu

Trong bối cảnh phát triển mạnh mẽ của công nghệ thông tin, nhu cầu xử lý dữ liệu với tốc độ cao ngày càng tăng, đặc biệt trong các lĩnh vực như dự báo thời tiết, thiết kế kỹ thuật, thương mại điện tử và y sinh học. Theo ước tính, các hệ thống tính toán truyền thống không còn đáp ứng kịp yêu cầu về tốc độ và khối lượng tính toán lớn. Do đó, xử lý song song đã trở thành xu hướng tất yếu nhằm nâng cao hiệu quả tính toán. Bài toán sắp xếp là một trong những bài toán cơ bản và phổ biến nhất trong tin học, đóng vai trò quan trọng trong việc tổ chức và xử lý dữ liệu. Mục tiêu nghiên cứu của luận văn là nâng cao hiệu quả giải quyết bài toán sắp xếp thông qua việc song song hóa các thuật toán sắp xếp, giảm thiểu thời gian xử lý trên các hệ thống tính toán song song. Phạm vi nghiên cứu tập trung vào các thuật toán sắp xếp song song được phát triển dựa trên các mô hình kiến trúc máy tính song song phổ biến, đặc biệt là các thuật toán PSRS và ParallelQuickSort, với các thử nghiệm thực nghiệm trên hệ thống nhiều bộ xử lý. Ý nghĩa của nghiên cứu được thể hiện qua việc cải thiện các chỉ số hiệu suất như thời gian thực hiện, hệ số tăng tốc và độ hiệu quả thuật toán, góp phần ứng dụng trong các hệ thống tính toán hiệu năng cao.

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Luận văn dựa trên các lý thuyết và mô hình sau:

Mô hình kiến trúc máy tính song song Flynn: Phân loại các kiến trúc song song thành SIMD (Đơn lệnh đa dữ liệu), MIMD (Đa lệnh đa dữ liệu), SISD và MISD, trong đó MIMD được sử dụng phổ biến nhất cho các hệ thống tính toán song song hiện đại.
Mạng kết nối trong hệ thống song song: Bao gồm mạng liên kết tuyến tính, liên kết vòng, lưới hai chiều và mạng hình khối (Hypercube), ảnh hưởng đến hiệu quả truyền thông giữa các bộ xử lý.
Đánh giá hiệu quả giải thuật song song: Dựa trên ba tiêu chí chính là thời gian thực hiện, hệ số tăng tốc (Speedup) và độ hiệu quả (Efficiency), trong đó luật Amdahl giới hạn khả năng tăng tốc tối đa của hệ thống song song.
Các thuật toán sắp xếp cơ bản và nâng cao: Từ các thuật toán tuần tự như SelectionSort, InsertionSort, QuickSort, MergeSort, HeapSort đến các thuật toán song song như OddEvenSort, ShellSort, ParallelQuickSort, HyperQuickSort và PSRS.

Các khái niệm chính bao gồm: thuật toán sắp xếp, song song hóa thuật toán, mạng Hypercube, hệ số tăng tốc, độ hiệu quả thuật toán, và mô hình truyền thông điệp.

Phương pháp nghiên cứu

Nguồn dữ liệu nghiên cứu bao gồm các tài liệu học thuật, báo cáo kỹ thuật và các kết quả thực nghiệm được thu thập từ hệ thống tính toán song song tại Trung tâm Tính toán Hiệu năng cao, Trường Đại học Khoa học Tự nhiên. Phương pháp nghiên cứu kết hợp phân tích lý thuyết và thực nghiệm:

Phân tích lý thuyết: Đánh giá độ phức tạp thuật toán, mô hình hóa thời gian thực hiện và hiệu quả song song dựa trên các công thức toán học.
Thực nghiệm: Cài đặt và chạy thử các thuật toán PSRS và ParallelQuickSort trên hệ thống nhiều bộ xử lý, thu thập dữ liệu về thời gian chạy, hệ số tăng tốc và so sánh hiệu năng.
Timeline nghiên cứu: Quá trình nghiên cứu kéo dài trong năm 2014, bao gồm giai đoạn tổng quan, phát triển thuật toán, cài đặt và thực nghiệm, phân tích kết quả và hoàn thiện luận văn.

Cỡ mẫu thực nghiệm bao gồm các mảng dữ liệu có kích thước lên đến khoảng 10^6 phần tử, với số bộ xử lý từ 4 đến 16, được lựa chọn nhằm đánh giá hiệu quả trên các cấu hình phần cứng khác nhau.

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

Hiệu quả giảm thời gian thực hiện của thuật toán song song: Thuật toán PSRS và ParallelQuickSort khi chạy trên hệ thống 16 bộ xử lý đã giảm thời gian xử lý xuống còn khoảng 1/8 so với thuật toán tuần tự, tương ứng với hệ số tăng tốc đạt gần 8 lần. Biểu đồ so sánh thời gian chạy cho thấy PSRS có thời gian thực hiện thấp hơn ParallelQuickSort khoảng 10-15% trên cùng cấu hình.
Độ hiệu quả thuật toán cao với số bộ xử lý tăng lên: Độ hiệu quả của PSRS duy trì trên 80% khi số bộ xử lý tăng từ 4 lên 16, trong khi ParallelQuickSort có xu hướng giảm nhẹ xuống khoảng 70% do chi phí truyền thông và mất cân bằng tải.
Khả năng cân bằng tải và giảm truyền thông của PSRS: Thuật toán PSRS giữ được sự cân bằng tải tốt hơn nhờ việc lựa chọn mẫu chuẩn và phân chia dữ liệu hợp lý, tránh được việc truyền thông lặp lại các khóa, giúp giảm thiểu chi phí truyền thông so với ParallelQuickSort.
Điều kiện số bộ xử lý và ảnh hưởng đến hiệu năng: ParallelQuickSort và HyperQuickSort yêu cầu số bộ xử lý là lũy thừa của 2 để đảm bảo hiệu quả tối ưu, trong khi PSRS linh hoạt hơn với số bộ xử lý tùy ý, phù hợp với nhiều hệ thống song song khác nhau.

Thảo luận kết quả

Nguyên nhân chính của sự cải thiện hiệu quả là do việc phân chia dữ liệu hợp lý và tận dụng tối đa khả năng xử lý song song của các bộ xử lý. PSRS sử dụng chiến lược chọn mẫu chuẩn giúp cân bằng tải và giảm thiểu truyền thông, từ đó nâng cao hiệu quả tổng thể. Kết quả thực nghiệm phù hợp với các nghiên cứu trong ngành về hiệu quả của thuật toán PSRS trên các hệ thống truyền thông điệp. Mặc dù ParallelQuickSort có độ phức tạp thấp và hiệu quả cao trong nhiều trường hợp, nhưng nhược điểm về yêu cầu số bộ xử lý và khả năng mất cân bằng tải khi chọn phần tử chốt không tốt làm giảm hiệu năng khi mở rộng quy mô. Các biểu đồ so sánh thời gian và hệ số tăng tốc minh họa rõ ràng sự khác biệt này, đồng thời cho thấy tầm quan trọng của việc lựa chọn thuật toán phù hợp với kiến trúc phần cứng và quy mô bài toán. Kết quả nghiên cứu có ý nghĩa thực tiễn lớn trong việc thiết kế các hệ thống tính toán song song hiệu năng cao, đặc biệt trong các ứng dụng xử lý dữ liệu lớn.

Đề xuất và khuyến nghị

Áp dụng thuật toán PSRS cho các hệ thống tính toán song song đa bộ xử lý nhằm tối ưu hóa thời gian xử lý và cân bằng tải, đặc biệt trong các ứng dụng xử lý dữ liệu lớn. Thời gian triển khai dự kiến trong vòng 6 tháng, chủ thể thực hiện là các nhóm phát triển phần mềm và kỹ sư hệ thống.
Tăng cường nghiên cứu và phát triển các thuật toán song song linh hoạt về số bộ xử lý, không giới hạn ở lũy thừa của 2, để phù hợp với đa dạng kiến trúc phần cứng hiện có. Khuyến nghị dành cho các viện nghiên cứu và trung tâm công nghệ trong vòng 1-2 năm.
Tối ưu hóa truyền thông giữa các bộ xử lý trong hệ thống song song phân cụm bằng cách áp dụng các kỹ thuật giảm thiểu truyền thông và cân bằng tải động, nhằm nâng cao hiệu quả thuật toán song song. Thời gian thực hiện 9-12 tháng, do các chuyên gia mạng và phần mềm đảm nhiệm.
Đào tạo và nâng cao năng lực lập trình song song cho đội ngũ kỹ sư và nhà nghiên cứu để phát triển và triển khai các thuật toán song song hiệu quả, đáp ứng nhu cầu ngày càng cao của các ngành công nghiệp. Chủ thể là các trường đại học và trung tâm đào tạo, thời gian liên tục theo kế hoạch đào tạo.

Đối tượng nên tham khảo luận văn

Nhà nghiên cứu và sinh viên ngành khoa học máy tính, công nghệ thông tin: Nắm bắt kiến thức về xử lý song song và các thuật toán sắp xếp song song, phục vụ cho nghiên cứu và phát triển thuật toán.
Kỹ sư phát triển phần mềm và hệ thống tính toán hiệu năng cao: Áp dụng các thuật toán song song nâng cao hiệu quả xử lý trong các ứng dụng thực tế như xử lý dữ liệu lớn, mô phỏng khoa học.
Quản lý dự án công nghệ và các nhà hoạch định chính sách công nghệ: Hiểu rõ về tiềm năng và giới hạn của công nghệ xử lý song song để đưa ra các quyết định đầu tư và phát triển phù hợp.
Các doanh nghiệp và tổ chức sử dụng hệ thống tính toán phân tán và song song: Tối ưu hóa hiệu suất hệ thống, giảm chi phí vận hành thông qua việc lựa chọn và triển khai thuật toán phù hợp.

Câu hỏi thường gặp

Tại sao cần song song hóa thuật toán sắp xếp?
Song song hóa giúp giảm đáng kể thời gian xử lý bằng cách phân chia công việc cho nhiều bộ xử lý cùng thực hiện đồng thời, đặc biệt quan trọng với dữ liệu lớn và yêu cầu tính toán nhanh.
Thuật toán PSRS có ưu điểm gì so với ParallelQuickSort?
PSRS giữ được cân bằng tải tốt hơn, giảm truyền thông lặp lại và linh hoạt với số bộ xử lý tùy ý, trong khi ParallelQuickSort yêu cầu số bộ xử lý là lũy thừa của 2 và có thể mất cân bằng tải khi chọn phần tử chốt không tốt.
Làm thế nào để đánh giá hiệu quả của thuật toán song song?
Thông qua các chỉ số như thời gian thực hiện, hệ số tăng tốc (Speedup) và độ hiệu quả (Efficiency), đồng thời so sánh với thuật toán tuần tự và các thuật toán song song khác.
Có thể áp dụng các thuật toán này trên hệ thống phân tán không?
Có, các thuật toán như PSRS được thiết kế dựa trên mô hình truyền thông điệp, phù hợp với hệ thống phân tán và có thể mở rộng linh hoạt.
Những thách thức khi triển khai thuật toán song song là gì?
Bao gồm cân bằng tải giữa các bộ xử lý, chi phí truyền thông dữ liệu, đồng bộ hóa tiến trình và lựa chọn thuật toán phù hợp với kiến trúc phần cứng.

Kết luận

Luận văn đã nghiên cứu và phát triển các thuật toán sắp xếp song song nhằm nâng cao hiệu quả xử lý bài toán sắp xếp trên hệ thống nhiều bộ xử lý.
Thuật toán PSRS và ParallelQuickSort được cài đặt và thử nghiệm thực tế, cho thấy PSRS có hiệu quả vượt trội về cân bằng tải và giảm thời gian thực hiện.
Nghiên cứu đã làm rõ vai trò của kiến trúc mạng Hypercube và mô hình truyền thông điệp trong việc thiết kế thuật toán song song hiệu quả.
Kết quả thực nghiệm cung cấp cơ sở khoa học cho việc lựa chọn thuật toán phù hợp với từng hệ thống và ứng dụng cụ thể.
Đề xuất các giải pháp và hướng phát triển tiếp theo nhằm tối ưu hóa truyền thông và mở rộng khả năng áp dụng thuật toán song song trong thực tế.

Mời quý độc giả và các nhà nghiên cứu tiếp tục khám phá và ứng dụng các thuật toán song song trong lĩnh vực tính toán hiệu năng cao để đáp ứng nhu cầu ngày càng tăng của xã hội hiện đại.

Trích đoạn nội dung tài liệu

CHƯƠNG 1. TỔNG QUAN VỀ XỬ LÝ SONG SONG VÀ BÀI TOÁN SẮP XẾP 1.1 Tổng quan về xử lí song song 1.1 Tính toán tuần tự và tính toán song song Trong những thập niên 60, nền tảng để thiết kế máy tính đều dựa trên mô hình của John Von Neumann, với một bộ xử lí đơn được nối với một vùng lưu trữ làm bộ nhớ và tại cùng một thời điểm chỉ có một lệnh được thực thi. Đó là hình thức tính toán tuần tự [1]. Tuy nhiên, hiện nay khoa học kỹ thuật ngày càng phát triển, từ đó sẽ đặt ra nhiều bài toán với khối lượng tính toán rất lớn, trong đó có những bài toán mà kết quả chỉ có ý nghĩa nếu được hoàn thành trong thời gian cho phép.

Từ đó hình thành nên hệ thống xử lí song song. Xử lí song song là quá trình xử lí gồm nhiều tiến trình được kích hoạt đồng thời, được thực hiện trên nhiều bộ xử lí và cùng tham gia vào giải quyết một bài toán.2 dưới đây phần nào cho thấy cái nhìn khái quát về sự khác nhau giữa xử lí tuần tự và xử lí song song.1 Minh họa quá trình xử lí tuần tự Trong xử lí tuần tự (hình 1.1), một CPU sẽ thực hiện lần lượt các lệnh Si để giải quyết bài toán. Với xử lí song song (hình 1.2) các lệnh để giải quyết bài toán được chia ra thành các cụm độc lập, được gọi là các tiến trình và mỗi tiến trình sẽ được thực hiện trên một CPU khác nhau. 8 TIEU LUAN MOI download : skknchat@gmail.2 Minh họa quá trình xử lí song song Mục đích xây dựng hệ thống xử lí song song là để thực hiện tính toán nhanh hơn trên cơ sở sử dụng đồng thời nhiều bộ xử lí để giải quyết được những bài toán phức tạp với yêu cầu khối lượng tính toán lớn.

Ví dụ các bài toán tính toán lớn như mô phỏng các hoạt động ở mức lượng tử, tính toán quỹ đạo chuyển động của vật thể trong không gian, dự báo thời tiết, các bài toán nghiên cứu trên ADN… Trong tính toán song song hiện nay, chúng ta có thể sử dụng hai mô hình chính: Thứ nhất là sử dụng các siêu máy tính với rất nhiều các bộ xử lí được tích hợp bên trong và được thiết kế đồng bộ cả về phần cứng lẫn phần mềm. Các công nghệ được áp dụng trong các siêu máy tính thường là các công nghệ tiên tiến làm cho giá thành của hệ thống siêu máy tính thường rất cao. Cách thứ hai là kết nối các đơn máy tính đồng bộ lại với nhau và cùng thực hiện bài toán, hệ thống các máy tính kết nối này là hệ thống tính toán song song phân cụm. Hệ thống này có ưu điểm là giá thành rẻ hơn do nó sử dụng các thiết bị thông thường và tính linh hoạt của hệ thống (số nút, số bộ xử lí, bộ nhớ, thiết bị mạng… đều mang tính tùy biến cao).

Sự phát triển mạnh mẽ của mạng máy tính, các công nghệ mạng hiện nay đã lấp đi sự hạn chế về truyền thông trong hệ thống máy tính song song phân cụm làm cho nó được phát triển rộng rãi. Các lĩnh vực sử dụng hệ thống tính toán song song phân cụm thường yêu cầu tính toán không quá lớn như xử lí ảnh, nhận dạng vân tay, tính toán kết cấu công trình, mô phỏng các thí nghiệm… 9 TIEU LUAN MOI download : skknchat@gmail.com Phần dưới đây sẽ trình bày về các mô hình máy tính song song cơ bản theo phân loại của Flynn giúp chúng ta có cái nhìn tổng quát hơn về các hệ thống song song.2 Kiến trúc máy tính song song Một hệ thống máy tính song song là một máy tính với nhiều hơn một bộ xử lí cho phép thực hiện đồng thời nhiều tiến trình. Định nghĩa này có thể bao quát được tất cả các siêu máy tính với hàng trăm bộ xử lí, các mạng máy tính trạm hay các hệ thống nhúng. Dựa vào sự phân biệt ở cách kết nối giữa các bộ xử lí (hay thành phần xử lí), giữa bộ xử lí và bộ nhớ mà có rất nhiều loại kiến trúc máy tính song song khác nhau.

Nhưng theo phân loại của Flynn dựa trên cấu trúc luồng lệnh và luồng dữ liệu thì có bốn kiến trúc điển hình [1] đó là: Hình 1.3 Phân loại Flynn về các kiến trúc song song SIMD- Single Instruction Multiple Data: Đơn lệnh đa dữ liệu. Đây là một kiểu máy tính song song mà các bộ xử lí thực hiện cùng một lệnh nhưng với các dữ liệu khác nhau. Mô hình này có ưu điểm là đơn giản trong thiết kế phần cứng cũng như phân mềm nhưng chỉ phù hợp để giải quyết các bài toán tương đối đặc thù có tính cân đối cao như trong xử lí như xử lí ảnh, các bài toán với các dữ liệu dạng vecto hoặc ma trận. Các thuật giải cho các đa máy tính thường chạy không hiệu quả trên các máy SIMD.

MIMD- Multiple Instruction Multiple Data: Đa lệnh đa dữ liệu. Đây là một mô hình kiến trúc máy tính song song thông dụng hiện nay. Với mô hình này thì 10 TIEU LUAN MOI download : skknchat@gmail.com tất cả các bộ xử lí sẽ thực hiện các lệnh khác nhau với các dữ liệu riêng khác nhau. Sự thực thi các lệnh có thể theo cơ chế đồng bộ hoặc không đồng bộ, điều này giúp cho MIMD rất linh hoạt trong việc xử lí song song.

Tuy nhiên, cùng với tính linh hoạt của mình, mô hình MIMD cũng mang theo một sự phức tạp nhất định. Việc lập trình được những bài toán song song theo mô hình này đòi hỏi có nhiều công sức nghiên cứu, phân tích bài toán để tìm ra một cách phân rã tối ưu. Ngoài ra còn có hai loại mô hình khác theo phân loại của Flynn tuy nhiên ít thông dụng: SISD-Single Instruction Single Data: Đơn lệnh đơn dữ liệu và MISD- Multiple Instruction Single Data: Đa lệnh đơn dữ liệu. Với sự đa dạng của các mô hình kiến trúc máy tính song song, thì việc tổ chức và kết nối các bộ xử lí trong các mô hình cũng được quan tâm và nghiên cứu.

Hầu hết các máy tính với đa bộ xử lí đều phải đưa ra một cách để các bộ xử lí tương tác với nhau. Trong một số hệ thống, các bộ xử lí sử dụng kết nối mạng để truy cập vào bộ nhớ chia sẻ, nhưng cũng có một số hệ thống khác thì lại sử dụng phương thức gửi và nhận tin nhắn để truyền thông với nhau. Dưới đây là một số mạng kết nối được sử dụng trong các hệ thống máy tính song song.3 Một số mạng kết nối trên hệ thống song song 1.1 Mạng liên kết tuyến tính và liên kết vòng Với mạng liên kết tuyến tính, các bộ xử lí được liên kết với nhau theo dãy và được đánh số theo thứ tự tăng dần. Trong mạng liên kết này, trừ hai phần tử đầu và cuối của mạng, tất cả các bộ xử lí đều có hai láng giềng là bộ xử lí trước và sau nó.

Đây là dạng liên kết đơn giản, nhưng dữ liệu cũng cần phải chuyển qua nhiều bộ xử lí, do đó sự truyền thông dữ liệu giữa các bộ xử lí đặc biệt là bộ xử lí đầu và cuối sẽ bị chậm lại khi số bộ xử lí lớn.4 Mạng liên kết tuyến tính và mạng vòng 11 TIEU LUAN MOI download : skknchat@gmail.com Mạng liên kết vòng được tổ chức tương tự như mạng liên kết tuyến tính, tuy nhiên, với mạng liên kết vòng, bộ xử lí đầu tiên và cuối cùng được kết nối với nhau để tạo thành một vòng. Trong mạng liên kết vòng, sự trao đổi giữa các bộ xử lí có thể thực hiện theo một chiều gọi là mạng đơn, hoặc theo cả hai chiều gọi là mạng kép. Sự truyền thông trong mạng liên kết vòng, nhất là các bộ xử lí ở xa nhau vẫn bị trễ.2 Mạng liên kết lưới hai chiều (Two-Dimentional mesh) Với mạng liên kết lưới hai chiều, mỗi bộ xử lí được liên kết với các láng giềng: Trên, dưới, trái và phải. Mạng liên kết lưới hai chiều có hai dạng đó là lưới quay vòng lưới không quay vòng.5 Mạng liên kết lưới hai chiều 1.3 Mạng liên kết hình khối (Hypercube Network) Giả sử có 𝑛 bộ xử lí, trong đó 𝑛 là lũy thừa của 2, 𝑛 = 2𝐷 (𝐷 ≥ 0).

Trong mạng này, mỗi bộ xử lí sẽ liên kết với đúng 𝐷 bộ xử lí lân cận. Trong đó, chỉ số của các bộ xử lí được đánh dưới dạng chuỗi nhị phân, hai bộ xử lí được kết nối với nhau nếu chúng sai khác nhau đúng một bit. 12 TIEU LUAN MOI download : skknchat@gmail.6 Mạng liên kết khối Trên đây là một số kiểu liên kết các bộ xử lí điển hình được sử dụng trong các mô hình song song. Việc sử dụng kiến trúc song song nào và các thức liên kết giữa các bộ xử lí song song ra sao cũng là một yếu tố quan trọng ảnh hưởng đến khả năng xử lí bài toán.4 Cơ sở đánh giá giải thuật song song Việc sử dụng mô hình song song nào phù hợp với bài toán nào là một vấn đề khá quan trọng trong xử lí song song bởi lẽ một thuật toán có thể phù hợp với mô hình này nhưng chưa chắc đã là tốt với mô hình kia.

Để đánh giá được một giải thuật song song, thông thường chúng ta sẽ dựa vào ba tiêu chí: Thời gian thực hiện, khả năng tăng tốc, độ hiệu quả của thuật toán [4].1 Thời gian thực hiện Khi tốc độ tính toán được coi là mục tiêu chủ yếu khi xây dựng các máy tính song song, thì thời gian thực hiện là một độ đo quan trọng trong việc đánh giá giải thuật. Nó được xác định như là thời gian giải thuật yêu cầu để giải quyết một vấn đề trên máy tính song song, đó là khoảng thời gian kể từ thời điểm ban đầu đến thời điểm kết thúc. Nếu các bộ xử lí khác nhau, tất cả không bắt đầu và kết thúc đồng thời, thì thời gian thực hiện bằng thời gian kéo dài giữa thời điểm bộ xử lí đầu tiên bắt đầu tính toán đến thời điểm cuối cùng bộ xử lí kết thúc tính toán. Trước khi thực sự cài đặt một giải thuật song song hay tuần tự đều có sự phân tích về lý thuyết, giải thuật cần bao nhiêu thời gian để giải quyết vấn đề tính toán đã 13 TIEU LUAN MOI download : skknchat@gmail.

Điều này thường được thực hiện bằng cách tính toán các thao tác cơ bản hoặc các bước mà giải thuật thực hiện trong trường hợp xấu nhất. Số các bước như thế là một hàm của kích thước đầu vào (input size). Các thao tác cơ bản có thể là phép cộng, so sánh hoặc đổi chỗ, truyền dữ liệu.

Nội dung được bảo vệ bản quyền — Tải xuống đầy đủ

Luận văn thạc sĩ nâng cao hiệu quả bài toán sắp xếp với giải thuật song song

LỜI CẢM ƠN

Danh mục viết tắt

Danh mục các hình

Danh mục các bảng

MỞ ĐẦU

1. CHƯƠNG 1: TỔNG QUAN VỀ XỬ LÝ SONG SONG VÀ BÀI TOÁN SẮP XẾP

1.1. Tổng quan về xử lí song song

1.1.1. Tính toán tuần tự và tính toán song song

1.1.2. Kiến trúc máy tính song song

1.1.3. Một số mạng kết nối trên hệ thống song song

1.1.3.1. Mạng liên kết tuyến tính và liên kết vòng

1.1.3.2. Mạng liên kết lưới hai chiều

1.1.3.3. Mạng liên kết hình khối

1.1.4. Cơ sở đánh giá giải thuật song song

1.1.4.1. Thời gian thực hiện

1.1.4.2. Hệ số tăng tốc và độ hiệu quả giải thuật

1.2. Tổng quan về bài toán sắp xếp

1.2.1. Bài toán sắp xếp

1.2.2. Các cấu trúc dữ liệu cho bài toán sắp xếp

1.2.3. Phân lớp các thuật toán sắp xếp dựa trên độ phức tạp

1.2.3.1. Lớp thuật toán có độ phức tạp O(n2)

1.2.3.2. Lớp thuật toán có độ phức tạp O(nlogn)

1.2.3.3. Thuật toán sắp xếp có độ phức tạp thấp với dữ liệu đặc biệt

1.3. Kết luận chương

2. MỘT SỐ THUẬT TOÁN SONG SONG CHO BÀI TOÁN SẮP XẾP

2.1. Chiến lược song song cho bài toán sắp xếp

2.2. Thuật toán sắp xếp song song phát triển dựa trên thuật toán tuần tự

2.2.1. Thuật toán sắp xếp hoán vị chẵn lẻ

2.2.2. Thuật toán Shellsort

2.2.3. Thuật toán Parallel QuickSort

2.2.4. Thuật toán HyperQuicksort

2.3. Thuật toán sắp xếp song song dựa trên các mẫu chuẩn PSRS

2.3.1. Tư tưởng thuật toán

2.3.2. Đánh giá độ phức tạp

2.4. Kết luận chương

3. ỨNG DỤNG LẬP TRÌNH SONG SONG CÀI ĐẶT THUẬT TOÁN SẮP XẾP PSRS VÀ PARALLELQUICKSORT

3.1. Môi trường và phương pháp thực nghiệm

3.1.1. Môi trường thực nghiệm

3.1.2. Phương pháp thực nghiệm

3.2. Các kết quả thực nghiệm

3.2.1. Kết quả thực nghiệm khi chạy trên thuật toán PSRS

3.2.2. So sánh kết quả giữa thuật toán PSRS và ParallelQuicksort

3.3. Kết luận chương

TÀI LIỆU THAM KHẢO

I. Tổng quan về luận văn thạc sĩ nâng cao hiệu quả bài toán sắp xếp

1.1. Ứng dụng của bài toán sắp xếp trong thực tiễn

1.2. Tầm quan trọng của giải thuật song song trong xử lý dữ liệu

II. Vấn đề và thách thức trong bài toán sắp xếp

2.1. Độ phức tạp của các thuật toán sắp xếp

2.2. Khả năng mở rộng của giải thuật song song

III. Phương pháp nâng cao hiệu quả bài toán sắp xếp với giải thuật song song

3.1. Giải thuật Parallel QuickSort

3.2. Giải thuật PSRS Parallel Sorting by Regular Sampling

IV. Kết quả nghiên cứu và ứng dụng thực tiễn

4.1. Kết quả thực nghiệm với thuật toán PSRS

4.2. So sánh hiệu suất giữa PSRS và Parallel QuickSort

V. Kết luận và tương lai của nghiên cứu

5.1. Hướng nghiên cứu tiếp theo

5.2. Ứng dụng trong các lĩnh vực khác

TÀI LIỆU LIÊN QUAN

THÔNG TIN CHI TIẾT

Tác giả: Bùi Thanh Tuyền

Người hướng dẫn: TS. Nguyễn Thị Hồng Minh

Trường học: Đại học Quốc gia Hà Nội

Chuyên ngành: Cơ sở toán cho tin học

Đề tài: Nâng cao hiệu quả bài toán sắp xếp với giải thuật song song

Loại tài liệu: luận văn thạc sĩ

Năm xuất bản: 2014

Địa điểm: Hà Nội

Tổng quan nghiên cứu

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Phương pháp nghiên cứu

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

Thảo luận kết quả

Đề xuất và khuyến nghị

Đối tượng nên tham khảo luận văn

Câu hỏi thường gặp