Nội dung:
Tìm hiểu tính toán song song hóa thuật toán và
ứng dụng song song bài toán sắp xếp theo giỏ
(bucket sort)
MỤC LỤC
TÀI LIỆU THAM KHẢO 15
2
Phần I: MỞ ĐẦU
Bốn thập kỷ qua chứng kiến sự phát triển bùng nổ về sức mạnh máy tính,
tạo tiền đề cho những bước tiến chưa từng thấy về phát minh, năng suất lao động
và phúc lợi cho con người. Nhưng quá trình đó giờ đây đứng trước một trở ngại
mà ít ai nghĩ đến: sự kết thúc của quá trình mở rộng sức mạnh điện toán. Ngành
tin học đã đạt đến giới hạn của những gì từng khả thi với một hay hai vi xử lý
trung tâm hoạt động theo chuỗi truyền thống (serial processing). Ngành nào vẫn
dựa vào mô hình đó để tiếp tục phát triển năng suất, tăng trưởng kinh tế và phát
triển xã hội thì cần phải bắt đầu một bước nhảy mới vào điện toán xử lý song
song (parallel processing).
Ngày nay, với các bài toán yêu cầu xử lý trên một số lượng dữ liệu lớn và
phức tạp như sự mô phỏng những hệ thống phức tạp và "những vấn đề thách
thức lớn" như: dự báo thời tiết và khí hậu, những phản ứng hoá học và hạt nhân,
hệ gen sinh học, đặt ra một nhu cầu lớn về tốc độ tính toán. Những bài toán
này thường yêu cầu một lượng lớn các phép tính lặp lại trên một khối lượng lớn
dữ liệu để đưa ra một kết quả đúng đắn, và các phép tính này cần hoàn thành
trong khoảng thời gian hợp lý. Ví dụ như bài toán dự bào thời tiết không thể xử
lý bằng các máy tính thông thường vì thời gian xử lý là khoảng 10 năm, điều
này hoàn toàn không phù hợp.
Đề giải quyết được các bài toán trên ta cần phải tăng tốc độ tính toán. Mặc
dù trong những thập kỷ vừa qua chúng ta đã được chứng kiến những thành tựu
to lớn về công nghệ vi xử lý. Tốc độ đồng hồ của các bộ xử lý đã tăng từ khoảng
40MHz (MIPS R3000, circa 1988) tới trên 2,0 GHz (Pentium 4, circa 2002);
cùng một lúc các bộ xử lý có khả năng thực hiện đa chỉ lệnh trong cùng một chu
kỳ nhưng do giới hạn về vật lý nên khả năng tính toán của các bộ xử lý không
thể tăng mãi được.
Minh họa một cách đơn giản, tính toán truyền thống giống như việc một
người đọc bài văn theo kiểu tuần tự từ đầu đến cuối, còn tính toán song song thì
giống như tách bài văn đó thành các phần và cho nhiều người khác nhau cùng
đọc một lúc để có kết quả nhanh hơn. Tính toán song song mang lại một nền
tảng mới cho sự phát triển của công nghệ xử lý. Đây là một hướng đi mới, đúng
đắn và hiệu quả cho công nghệ điện toán trong tương lai. Bài viết sau đây về đề
tài “Tìm hiểu về tính toán song song , áp dụng giải quyết một số bài toán” phần
nào thể hiện được những kiến thức cơ bản đầu tiên về tính toán song song, tính
đúng đắn và ứng dụng của nó.
Phần II: NỘI DUNG
I. Những khái niệm cơ bản về tính toán song song
1. Nhu cầu tính toán hiệu năng cao và tính khả dụng của tính toán song song.
a. Nhu cầu tính toán song song
Ví dụ 1: Oregon State University: Mô phỏng các dòng chảy lưu thông của đại
dương > xác định nguyên nhân gây trái đất đang nóng dần lên.
- Phân chia đại dương thành:
• 4096 vùng từ đông sang tây.
• 1024 vùng từ bắc sang nam.
• 12 tầng biển.
• Xấp sỉ 50 triệu khối trong không gian 3 chiều.
- Mô phỏng lưu thông thực hiện ~ 30 tỷ phép tính trong 10 phút. Công
việc này thực hiện liên tục trong năm.
Ví dụ 2: Dự báo thời tiết (weather forecasting):
- Chia bầu khí quyển theo không gian 3 chiều, mỗi khối kích thước 1mile
x 1mile x 1mile.
- Ước tính khoảng 5x10^8 khối (cells).
- Trên mỗi khối cần thực hiện ~ 200 phép toán -> cần thực hiện ~ 10^11
phép toán.
- Nếu cần dự báo cho 1 tuần, chu kỳ 1 phút -> cần thực hiện 10^4 lần, mỗi
lần 10^11phép toán.
- Siêu máy tính có thể thực hiện: 10^9 phép toán trên 1 giây -> cần 10^6
giây ~ 10 ngày để thực hiện.
Ví dụ 3: Mô phỏng tương tác của các protein với phân tử nước (Levin 1990):
- Thực hiện trên máy Cray X/MP (~800 triệu phép toán / 1 giây): để mô
phỏng 10^-12 giây phản ứng protein cần 1 giờ thực hiện.
- Nếu mô phỏng một phản ứng thực sự trên cùng máy Cray X/MP cần
31,688 năm.
TÓM LẠI:
Yêu cầu về thực nghiệm nghiên cứu, mô phỏng -> giải quyết những bài
toán có khối lượng tính toán lớn trong một khoảng thời gian chấp nhận được.
Phương hướng giải quyết vấn đề:
- Thực hiện trên các siêu máy tính mạnh.
- Thực hiện phân chia công việc thực hiện song song trên hệ thống các máy tính
Tính khả dụng của tính toán song song
SIÊU MÁY TÍNH: Khả năng tính toán phụ thuộc nhiều vào tốc độ xử lý
của CPU -> phụ thuộc vào cấu trúc và số lượng transistors chứa trong CPU –>
Có những giới hạn nhất định về kích thước, nhiệt độ -> không thể tăng số
transistors lên mãi được
THỰC HIỆN SONG SONG:
Nguyên tắc: thực hiện phân chia công việc chính thành các công việc con, có thể
thực hiện song song với nhau.
Xây dựng hệ thống song song từ nhiều bộ xử lý riêng biệt. Thực hiện các công
việc song song trên các bộ xử lý đó.
Vấn đề:
- Phương pháp phân chia công việc.
- Môi trường hỗ trợ thực hiện song song.
Ví dụ: Xếp sách trong thư viện
Sách trong thư viện được phân loại theo chữ cái đầu tiên và sắp xếp theo
thứ tự.
Sách cùng nhóm được xếp trên cùng một giá. Các giá đặt trong các tủ
sách.
Thư viện nhập một số lượng sách lớn -> yêu cầu thủ thư phải sắp xếp sách
theo đúng nguyên tắc.
Cách giải quyết hiệu quả nhất?
+ Nếu chỉ có 1 thủ thư
- Cách thứ nhất: Lấy từng cuốn sách rồi sắp xếp vào vị trí thích hợp ->
không hiệu quả.
- Cách thứ hai: Sắp xếp các cuốn sách theo thứ tự trước rồi mang từng
chồng sách cùng vị trí đi sắp xếp.
Rõ ràng cách thứ 2 hiệu quả hơn.
Muốn hiệu quả hơn nữa thì cần có nhiều người làm hơn.
+ Nhiều thủ thư hơn
Cách thứ nhất: Mỗi người lấy 1 cuốn rồi đi sắp đặt vị trí -> không hiệu
quả.
Cách thứ hai: Phân chia mỗi người một nhóm ký tự, khi đó mỗi người chỉ
mang sách thuộc nhóm mình đi sắp xếp.
Cách thứ ba: Sắp xếp sách trước khi mang đi đặt vị trí. Mỗi người đảm
nhận một số ký tự:
Nếu cuốn sách đang cầm của mình thì đặt vào chồng sách của mình.
Nếu của người khác thì chuyển cho người đấy.
Sau đó mang sách đi sắp xếp.
-> cách thứ ba hiệu quả nhất.
Ý nghĩa của tính toán song song
Thực hiện công việc trong khoảng thời gian ngắn hơn -> tiết kiệm thời
gian.
Thực hiện được với số lượng phép toán lớn hơn -> giải quyết được bài
toán lớn.
Hỗ trợ giải quyết nhiều công việc đồng thời.
2. Các ứng dụng trong hệ thống máy tính
Khi các hệ thống máy tính trở nên rộng khắp và sự tính toán trải rộng trên
toàn mạng, thì các vấn đề xử lý song song cũng được ứng dụng nhiều hơn. trong
việc bảo mật máy tính, việc phát hiện xâm phạm là một thử thách đáng kể.
Trong trường hợp phát hiệ xâm phạm mạng, dữ liệu được thu thập từ các trang
phân tán và phải được phân tích một cách nhanh chóng. Việc không thể thu thập
được dữ liệu này tại vị trí trung tâm để phân tích đòi hỏi các thuật giải song song
và phân tán. Trong lĩnh vực mật mã, ứng dụng đặc biệt nhất của tính toán song
song trên Internet tập trung vào việc phân tích các số nguyên cực lớn.
Các hệ thống nhúng tăng dựa trên các thuật toán điều khiển phân tán để
hoàn thành một số tác vụ. Một ô tô hiện đại gồm mười bộ xử lý liên lạc với nhau
5
để thực hiện các tác hợp trong việc tối ưu hoá quá trình tiến hành và sự thực
hiện. Trong các hệ thống này, các thuật toán phân tán và song song truyền thống
để lựa chọn vật dẫn đầu và tập độc lập lớn nhất, vv thường được sử dụng.
3. Các loại máy tính song song
3.1. Phân loại theo Flynn
Dù là máy tính tuần tự hay song song đều phải thực hiện bằng cách thực
thi các chỉ lệnh trên dữ liệu
Dựa vào số lượng dòng lệnh và số lượng dòng dữ liệu thực thi cùng tại
một thời điểm mà Micheal Flynn đã phân các máy tính thành 4 loại:
- Máy tính SISD: Đơn dòng lệnh-đơn dòng dữ liệu
- Máy tính MISD: Đa dòng lệnh – đơn dòng dữ liệu
- Máy tính SIMD: Đơn dòng lệnh – đa dòng dữ liệu
- Máy tính MIMD: Đa dòng lệnh – đa dòng dữ liệu
3.2. Kiến trúc bộ nhớ của máy tính song song
- Hệ thống đa bộ xử lý bộ nhớ chia sẻ
- Hệ thống đa máy tính bộ nhớ phân tán
- Hệ thống bộ nhớ chia sẻ phân tán
4. Các mô hình lập trình song song
Lập trình song song là sự trừu tượng hoá trên các kiến trúc phần cứng và
bộ nhớ của máy tính song song. Mô hình lập trình song song không đặc tả riêng
cho một loại kiến trúc bộ nhớ hay máy tính cụ thể. Một các lý thuyết thì một loại
mô hình lậo trình song song có thể được thể hiện dưới một phần cứng bất kỳ.
4.1. Lập trình chia sẻ bộ nhớ
Trong mô hình lập trình chia sẻ bộ nhớ, các tác vụ chia sẻ không gian địa
chỉ chung nơi các tác vụ đọc và ghi dữ liệu.
Các cơ chế khác nhau như locks/semaphores có thể được dùng để điều
khiển việc truy cập tới bộ nhớ chia sẻ.
Một ưu điểm của mô hình này theo quan điểm của người lập trình đó là
không có quyền sử hữu dữ liệu riêng nên không cần phải đặc tả việc truyền
thông dữ liệu giữa các tác vụ. Việc phát triển chương trình có thể được đơn giản
hoá.
Nhược điểm quan trọng của mô hình là các ngôn ngữ của việc thực hiện
nó trở nên khó hiểu và khó quản lý vùng dữ liệu hơn.
4.2. Lập trình chia sẻ bộ nhớ dựa vào tiến trình
Tiến trình (processes) là một bản thể của chương trình đang thực thi. Yêu
cầu của xử lý song song là khả năng tạo ra một số tiến trình cần thiết cho bài
toán và khả năng huỷ bỏ tiến trình khi phần việc xử lý song song kết thúc để giải
phóng các tài nguyên mà tiến trình đã chiếm giữ và không cản trở hoạt động của
những tiến trình khác.
Các hệ điều hành Linux, Unix hay Windows đều phải điều phối sự hoạt
động đồng bộ của tiến trình. Khi muốn sử dụng bộ nhớ chung, ta cần phải xin
cấp phát bộ nhớ và sau đó khi sử dụng xong phải giải phóng chúng.
Khi có một tiến trình truy cập vào một bộ nhớ với mục đích cập nhật thì
nó phải được đảm bảo rằng không một tiến trình dữ liệu nào khác đọc dữ liệu ở
vùng nhớ đó cho tới khi việc cập nhật đó kết thúc.
6
4.3. Lập trình chia sẻ bộ nhớ dựa vào luồng
Các luồng của một tiến trình có thể chia sẻ với nhau về không gian địa chỉ
chương trình, các đoạn dữ liệu và môi trường xử lý, đồng thời cũng có những
vùng dữ liệu riêng để thao tác.
Công việc của một luồng có thể được miêu tả như là một chương trình
con của một chương trình chính. Một luồng bất kì có thể thực thi một chương
trình con bất kì cùng lúc với các luồng khác.
Các thể hiện của luồng có nhiều hệ điều hành hỗ trợ đa luồng như: SUN
Solaris, Windows NT v.v những nỗ lực tiểu chuẩn hoá không giống nhau đã
đưa tới hai thể hiện rất khác nhau của luồng đó là: POSIX Threads và OpenMP.
4.4. Mô hình truyền thông điệp
Giống như mô hình chia sẻ bộ nhớ, các đơn vị xử lý song song trong mô
hình truyền thông điệp là các tiến trình. Trong mô hình truyền thông điệp.
Các tiến trình có thể thực hiện trên những bộ xử lý khác nhau và không
được truy cập vào không gian bộ nhớ chia sẻ.
Việc truyền thông giữa các tiến trình thông qua việc gửi và nhận thông
điệp.
Việc đồng bộ hoá các tiến trình của một chương trình song song được
thực hiện theo cơ chế truyền thông điệp. Khi một tiến trình muốn gửi một thông
điệp thì nó phải chờ cho đến khi tiến trình nhận sẵn sàng nhận thông điệp đó và
ngược lại, cũng tương tự.
5. Thuật toán song song
5.1. Nguyên lý thiết kế thuật toán song song
Phát triển thuật toán là một phần cơ bản của việc giải quyết bài toán sử
dụng máy tính. Một thuật toán tuần tự về bản chất là một cách làm hay một số
tuần tự các bước để giải quyết bài toán đưa ra bằng một máy tính tuần tự. Một
các tương tự, một thuật toán song song là một cách làm chỉ cho chúng ta làm thế
nào để giải quyết bài toán đưa ra bằng các máy tính song song.
Tuy nhiên, việc đặc tả một thuật toán song song liên quan tới nhiều hơn là
việc sử dụng các máy tính song song
Trong thực tế, việc xây dựng một thuật toán song song có thể gồm một số
hoặc tất cả các bước sau:
- Xác định các phần công việc có thể thực hiện đồng thời.
- Gán các công việc có thể thực hiện đồng thời và nhiều tiến trình chạy
song song.
- Phân tán dữ liệu đầu vào, đầu ra và trung gian.
- Quản lý việc truy cập tới dữ liệu chia sẻ.
- Đồng bộ các xử lý ở các giai đoạn khác nhau của việc thực thi chương
trình.
Có năm nguyên lý chính trong thiết kế thuật toán song song:
- Các nguyên lý lập lịch.
- Nguyên lý hình ống.
- Nguyên lý chia để trị.
- Nguyên lý đồ thị phụ thuộc dữ liệu.
- Nguyên lý điều kiện ganh đua.
7
Trên những kiến trúc máy tính khác nhau thì hiệu quả của thuật toán có
thể rất khác nhau. Việc thiết kế thuật toán song song phải được dựa trên những
kiến thức về kiến trúc máy tính, ngôn ngữ lập trình song song và các phương
pháp tính toán.
- Tác vụ (Task)
- Tiến trình (process)
- Thực hiện tuần tự
- Thực hiện song song
Phương pháp luận để thiết kế thuật toán song song gồm bốn giai đoạn
khác nhau:
- Sự chia nhỏ bài toán (partitioning)
- Thiết lậo kênh truyền (communication)
- Nhóm gom các tác vụ (agglomeration)
- Gán vào hệ thống (mapping)
II. Lập trình song song với MPI
Lập trình song song cũng giống như lập trình tuần tự, có nhiều ngôn ngữ
và công cụ lập trình song song khác nhau. Lập trình theo mô hình truyền thông
điệp trong hệ thống máy tính thực hiện theo 3 cách:
- Sử dụng ngôn ngữ lập trình song song đặc biệt, ví dụ Occam được thiết
kế sử dụng với các Transputer (Inmos 1986).
- Sử dụng ngôn ngữ lập trình bậc cao (tuần tự) truyền thông được mở rộng
bằng cách bổ sung thêm các từ khoá và mở rộng một cú phát để xử lý việc trao
đổi thông điệp, gồm có CC+ (mở rộng từ C++) và Fortram M ( mở rộng từ
Rortran)
- Sủ dụng ngôn ngữ lập trình bậc cao như là ngôn ngữ C và cung cấp một
thư viện các thủ tục bên ngoài để thực hiện truyền thông điệp.
Lập trình song song với MPI là lập trình theo mô hình truyền thông điệp
trong hệ thống máy tính sử dụng cách tiếp cận thứ ba.
III. Thuật toán sắp xếp
1. Sắp xếp theo giỏ (Bucket sort)
Các thuật toán sắp xếp đã được nghiên cứu nhiều trong lập trình tuần tự.
Hầu hết các thuật toán sắp xếp tuần tự đều dựa trên cơ sở so sánh và đổi chỗ các
cặp số. Phần này chúng ta sẽ sử dụng kỹ thuật phân hoạch và chia để trị để song
soag hoá thuật toán sắp xếp theo giỏ (bucket sort).
Thuật toán bucket sort không dựa trên cơ sở so sánh và đổi chỗ, thuật toán
là một phép phân hoạch một cách tự nhiên. Thuật toán bụcket sort chỉ có hiểu
quả khi các số ban đầu có phân bổ đều trên một khoảng cho trước, giả sử từ o
đến a - 1. Khoảng cho trước sẽ được chia thành m khoảng nhỏ, 0 tới a/m-1, a/m
tới 2a/m-1, , và mỗi giỏ được gán để chứa các số trong khoảng đó vậy cần có
m giỏ.
2. Thuật toán tuần tự
Đặt các số vào các khoảng phù hợp: để đặt một số vào khoảng cách thích
hợp, ta có thể so sánh số đó với các số a/m, 2a/m, 3a/m, , sẽ cần nhiều m - 1
8
bước so sánh để đặt được một số vào dãy thích hợp. Hoặc ta có thể chia số đó
cho m, sử dụng kết quả để đặt vào các giỏi tương ứng từ 0 đến m - 1. Nếu m là
luỹ thừa của 2 ta có thể sử dụng các bit trên đầu của mỗi số dưới dạng nhị phân.
Trong bất kì cách nào, ta giả sử để đặt một số vào giỏi cần 1 bước. Vậy để đặt
tất cả các số cần n bước.
Hình 1: sắp xếp theo giỏ
Các số trong mỗi giỏ sẽ được sắp xếp bởi một thuật toán sắp xếp tuần tự:
Giả sử thuật toán sắp xếp tuần tự sử dụng để sắp ở mỗi giỏ đòi hỏi nlogn phép
so sánh, mỗi phép so sánh tương đương với một bước tính toán. Vậy để sắp xếp
n/m số ở mỗi giỏ cần (n/m) log (n/m) bước.
Nối các số trong giỏ đã sắp xếp để đưa ra dãy đã sắp cuối cùng sử dụng
tính toán.
Vậy thời gian xử lý tuần tự là:
t
s
= n+m((n/m)log(n/m))=n+nlog(n/m) = O(nlog(n/m))
Nếu n = km, k là hằng số thì độ phức tạp thời gian là O(n)
3. Thuật toán song song
Một các đơn giản thuật toán bucket sort có thể được song song bằng cách
gán mỗi bộ xử lý cho một giỏ. Khi đớ thời gian sắp xếp ở mỗi giỏi sẽ là
(n/p)log(n/p) với p bộ xử lý (trong đó p=m).
Ta có thể cải thiện thuật toán song song trên để đạt hiệu quả hơn bằng
cách phân hoạch dãy số thành m miền, và mỗĩ miền ứng với một bộ xử lý. Mỗi
bộ xử lý giữ p giỏ nhỏ và tách các số trong miền của nó vào từng giỏ riêng của
mình. Sau đó các giỏ này sẽ được "trút" vào p giỏ cuối cùng để sắp xếp, việc này
yêu cầu mỗi bộ xử lý gửi một giỏ nhỏ tới mỗi bộ xử lý khác (giỏi thứ i tới bộ xử
lý thứ i).
9
Hình 2: Thuật toán bucket sort song song
Phân tích: Thuật toán gồm 4 giai đoạn sau đây:
1. Phân các số vào p miền.
Giả sử cần n bước tính toán để phân n số vào p miền.
t
comp1
= n
Sau khi chia nhỏ, p phần nhỏ mỗi phần chứa n/p số được gửi tới các tiến
trình:
t
comp1
= t
srartup
+ t
data
n
2. Sắp xếp trong các giỏ nhỏ.
Chia mỗi phần của n/p số vào p giỏ nhỏ yêu cầu thời gian là
t
comp2
= n/p
3. Gửi tới các giỏ lớn
Các giỏ nhỏ được phân tán. Mỗi giỏ nhỏ có khoảng n/p
2
số (giả thiết là
phân bố đều). Mỗi tiến trình phải gửi (p-1) giỏ nhỏ tới các tiến trình khác. Cả p
tiến trình phải thực hiện phép truyền thông này, ta có:
t
comp3
= p(p - 1)(t
srartup
+ (n/p
2
) t
data
)
nếu các phép truyền thông này không thể gối nhau về thời gian và sử dụng các
hàm gửi riêng. Nếu tất cả phép truyền thông được gối đầu nhau, có
t
comp3
= (p - 1)(t
srartup
+ (n/p
2
) t
data
)
4. Sắp xếp trong giỏ lớn
Tron giai đoạn này, các giỏ lớn được sắp xếp đồng thời, do đó:
t
comp4
= (n/p)log(n/p)
Vậy tổng thời gian thực hiện là"
t
p
= t
srartup
+ t
data
n + (p-1)(t
srartup
+ (n/p
2
)t
data
) + (n/p)log(n/p)
Công thức trên đạt được khi các số được phân bố đều. Nếu các số không
có phân bố đều thì các số trong mỗi giỏ sẽ khác nhau, điều này sẽ làm tăng tổng
thời gian tính toán. Trường hợp tồi nhất của bài toán là khi tất cả các số cùng
nằm trong một giỏ. Thuật toán bucket sort có thể được phát triển theo hướng
10
phương pháp chia để trị bằng cách chia liên tục các giỏ cho tới khi mỗi giỏ chỉ
chứa một phần tử của dãy. Phương pháp này tương tự như thuật toán quick sort
(sắp xếp nhanh), chỉ khác là trong quick sort sử dụng một phần từ để chia đôi
miền.
Phần III: MÃ NGUỒN
1. Mã code thực hiện song song thuật toán bucket sort bằng cách gán cho mỗi
tiến trình một giỏ.
#include<stdio.h>
#include<stdlib.h>
#include<mpi.h>
int sort(int ar[],int size)
{
int temp;
int i,j;
for(i=size-1; i>=1;i )
for(j=0;j<i;j++)
if(ar[j]>ar[j+1])
{
temp=ar[j];
ar[j]=ar[j+1];
ar[j+1]=temp;
}
}
int main(int argc, char *argv[])
{
int rank,p;
int a,b;
int n;
int *array, *local;
int *counters, *displs;
int start, end, slice;
int count, disp,i;
double tstart,tend;
MPI_Status status;
MPI_Init(&argc,&argv);
MPI_Comm_size(MPI_COMM_WORLD,&p);//p la so tien trinh
MPI_Comm_rank(MPI_COMM_WORLD,&rank);
// khoi tao so ngau nhien
// Cấp phát bộ nhớ cho mảng, gửi thông tin đến các tiến trình con bằng hàm
MPI_Bcast
srand(time(NULL));
if(rank==0)
{
printf("Nhap vao so phan tu cua mang ");
scanf("%d", &n);
array = (int *)malloc(sizeof(int)*n);//cap phat bo nho dong cho mang
printf("Nhap vao gia tri cua a (gia tri cua mang) :");
scanf("%d",&a);
11
// dien cac so ngau nhien vao mang
printf("Dien cac so ngau nhien vao mang :");
for(i=0; i<n; i++)
{
array[i] = rand() % a;
printf("a[%d] = %d ",i, array [i]);
}
printf("\n");
}
tstart = MPI_Wtime();
//gui cac thong so mang,a,n vao cac tien trinh
MPI_Bcast(&n,1,MPI_INT,0,MPI_COMM_WORLD);
MPI_Bcast(&a,1,MPI_INT,0,MPI_COMM_WORLD);
if (rank !=0)
array = (int*)malloc(sizeof(int)*n);
MPI_Bcast(array, n, MPI_INT,0,MPI_COMM_WORLD);
tend = MPI_Wtime();
printf("Thoi gian may chu Broadcast toi cac tien trinh %d : %lf \n",rank,tend-tstart);
tstart=MPI_Wtime();
slice=a/p;
start=rank*slice;
end=(rank==p-1)?a:start+slice;
// Tính toán thời gian xử lý trong các tiến trình con, trả về kết quả cho máy chủ
xử lý
count=0;
local=(int*)malloc(sizeof(int)*n);
//ghep mot cua mang thanh mot nhom
for(i=0; i<n; i++)
if(array[i]<end&&array[i]>=start)
local[count++]=array[i];
//sap xep cac so trong nhom
sort(local, count);
//scan tat ca cac phan tu
MPI_Scan(&count,&disp,1,MPI_INT,MPI_SUM,MPI_COMM_WORLD);
//Master se tap hop va tinh toan ket qua
if(rank==0)
counters=(int*)malloc(sizeof(int)*p);
MPI_Gather(&count,1,MPI_INT,counters,1,MPI_INT,0,MPI_COMM_WORLD);
if(rank==0)
{
displs=(int*)malloc(sizeof(int)*(p+1));
displs[0]=0;
}
MPI_Gather(&disp,1,MPI_INT,displs+1,1,MPI_INT,0,MPI_COMM_WORLD);
//Tap hop ket qua da sap xep
MPI_Gatherv(local,count,MPI_INT,array,counters,displs,MPI_INT,0,MPI_COMM_WORLD
);
tend= MPI_Wtime();
printf("Thoi gian tinh toan tren cac tien trinh %d : %lf \n",rank,tend-tstart);
12
if(rank==0)
{
printf("Da sap xep:");
for(i=0; i<n; i++)
printf("a[%d] = %d ",i, array[i]);
printf("\n");
}
MPI_Finalize();
return 0;
}
2. Kết quả thu được
Chương trình sử dụng sắp xếp nổi bọt xử lỹ chuỗi nhập thành chuỗi có giá
trị tăng dần.
Mãy chủ gửi một số đoạn dãy cho các tiến trình con.
Tiến trình con xử lý rồi gửi lại kết quả cho máy chủ.
Máy chủ tập hợp các tiến trình, tổng hợp kết quả.
Hàm sort nhằm sắp xếp dãy theo thứ tự tăng dần
3. Hình ảnh chương trình nhóm 7 chạy trên máy chủ guest@bkluster
Với số phần tử của mảng là 7 với 5 tiến trình được thực thi
Với số phần tử của mảng là 8 với 5 tiến trình được thực thi
13
14
TÀI LIỆU THAM KHẢO
Tài liệu
[1] Nguyễn Văn Ba, Phát triển hệ thống hướng đối tượng với UML và C++,
Nhà xuất bản ĐH Quốc gia Hà nội, 2007.
[2] Slide bài giảng của TS. Nguyễn Hữu Đức
Trang Web
[1] MPI Tutorial
[2] Open Source High Performance Computing
/>[3] LAM/MPI Parallel Computing
/>[4] Sàng Eratosthenes
/>15