Luận văn thạc sĩ công nghệ thông tin song song hoá bài toán jsp trên một số môi trường tính toán song song và phân tán

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (7.05 MB, 115 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC LẠC HỒNG
***

VŨ ĐÌNH TRUNG

SONG SONG HÓA BÀI TOÁN JSP TRÊN MỘT SỐ MÔI
TRƯỜNG TÍNH TOÁN SONG SONG VÀ PHÂN TÁN

Chuyên ngành: Công nghệ thông tin
Mã ngành: 60 48 02 01

LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN

NGƯỜI HƯỚNG DẪN KHOA HỌC:
PGS. TS. TRẦN VĂN LĂNG

Đồng Nai – Năm 2012
-i-

LỜI CAM
ĐOAN

Tôi xin cam đoan luận văn thạc sĩ công nghệ thông tin “Song song hóa bài toán

JSP trên môi trường tính toán song song và phân tán” là kết quả của quá trình học tập,
nghiên
cứu
khoa học độc lập, nghiêm
túc.

Các số liệu trong luận văn là trung thực, có nguồn gốc rõ ràng, được
trích
dẫn
và có tính kế thừa, phát triển từ các số liệu, tạp chí, các công trình nghiên
cứu
đã
được công bố, trên các
website.

Các phương pháp nêu trong luận văn được rút từ những cơ sở lý luận và
quá
trình nghiên cứu tìm
hiểu.

Đồng Nai, tháng 09 năm
2012

Vũ Đình Trung

-ii-

LỜI CẢM ƠN

Lời đầu tiên tôi xin chân thành cảm ơn đến PGS. TS. Trần Văn Lăng đã tận
tình giúp đỡ tôi trong suốt thời gian học tập vừa qua, và hướng dẫn tôi hoàn thành
đề tài này
Tôi chân thành cảm ơn các thầy cô Khoa Công nghệ thông tin, nơi tôi công
tác và nghiên cứu đã tạo điều kiện và hỗ trợ tôi trong suốt thời gian qua.
Tôi cũng xin chân thành cảm ơn người thân, bạn bè đã giúp đỡ và động viên
tôi trong suốt thời gian học tập cũng như trong thời gian thực hiện luận văn.
Chân thành cảm ơn !
Biên Hòa, ngày 31 tháng 8 năm 2012

Vũ Đình Trung
-iii-

TÓM TẮT

Lập lịch công việc là bài toán đã ra đời từ rất lâu, nhưng đến nay vẫn chưa có
một phương pháp nào giải quyết bài toán lập lịch công việc một cách chính xác với
thời gian ngắn. Những nghiên cứu gần đây theo xu hướng nhắm vào mục đích làm
giảm đến mức thấp nhất thời gian hoàn thành bài toán, ưu điểm lớn của những
hướng đi này là kết quả đạt được với thời gian thấp nhưng lịch trình tìm được chỉ
đạt mức gần đúng trong khả năng chấp nhận được.
Từ mục đích và hạn chế đó tác giả tiến hành nghiên cứu một thuật toán có
thể cải thiện được về mặt thời gian mà kết quả lịch trình cho ra vẫn chính xác.
Qua nhiều nghiên cứu của những công trình trước, thì nhánh cận được xác
định là thuật toán tốt nhất trong các phương pháp tìm kiếm chính xác. Nhưng vấn

đề của thuật toán này là thời gian hoàn thành cho ra kết quả chậm. Do đó thuật toán
nhánh cận là thuật toán được chọn để thực hiện yêu cầu công việc trên. Công việc
cần đạt được tại thời điểm này là tìm ra giải pháp để cải tiến làm giảm thời gian
hoàn thành của thuật toán.
Những năm gần đây tính toán song song đang dần trờ thành xu hướng sử
dụng để cải thiện tốc độ các thuật toán. Vì vậy tác giả đã tiến hành nghiên cứu để
tìm ra phướng án cải tiến thuật toán nhánh cận thành thuật toán song song, và có thể
triển khai trên các môi trường tính toán song song là mục đích cuối cùng của luận
văn.
Cấu trúc luận văn như sau, chương thứ nhất giới thiệu tổng quan về bài toán
lập lịch công việc, chương thứ hai trình bày các môi trường tính toán song song và
các mô hình tính toán song song, chương thứ ba trình bày các nội dung nghiên cứu
và đề xuất các thuật toán song song sẽ sử dụng, chương thứ bốn thử nghiệm các
thuật toán trên môi trường tính toán song song và đánh giá kết quả, cuối cùng là kết
luận.
-iv-
MỤC LỤC

LỜI CAM ĐOAN i
LỜI CẢM ƠN ii
TÓM TẮT iii
MỤC LỤC iv
DANH MỤC CÁC TỪ VIẾT TẮT v
DANH MỤC BẢNG vi
DANH MỤC BIỂU ĐỒ vii
DANH MỤC HÌNH viii
MỞ ĐẦU 1
1. Đặt vấn đề 1
2. Lý do chọn đề tài 2
3. Mục tiêu 4

4. Đối tượng nghiên cứu 4
5. Nội dung nghiên cứu 4
6. Phương pháp nghiên cứu 5
CHƯƠNG 1: TỔNG QUAN VỀ BÀI TOÁN LẬP LỊCH CÔNG VIỆC 6
1.1. Định nghĩa bài toán lập lịch 6
1.1.1. Mô tả bài toán 6
1.1.2. Dữ liệu bài toán 6
1.1.3. Các loại lịch trình 6
1.2. Tình hình nghiên cứu thuật toán tuần tự để giải quyết bài toán lập lịch công việc
9
1.2.1. Tình hình nghiên cứu trên thế giới 9
1.2.1.1. Phương pháp chính xác 11
1.2.1.2. Phương pháp gần đúng 12
1.2.2. Tình hình nghiên cứu trong nước 25
1.2.3. Một số công trình biêu biểu 26
-iv-
1.3. Tình hình nghiên cứu thuật toán song song để giải quyết bài toán lập lịch công
việc 43
1.3.1. Tình hình nghiên cứu ngoài nước 43
1.3.2. Tình hình nghiên cứu trong nước 43
1.3.3. Một số công trình tiêu biểu 44
CHƯƠNG 2: CƠ SỞ LÝ THUYẾT 51
2.1. Tổng quan về tính toán song song 51
2.1.1. Sự cần thiết của tính toán song song và phân tán 51
2.1.2. Mô hình máy tính song song 52
2.1.2.1. Phép phân loại Flynn 52
2.1.2.2. Chia sẻ bộ nhớ cục bộ 55
2.1.3. Mô hình máy tính phân tán 56
2.1.4. Kỹ thuật lập trình song song 56
2.1.4.1. Những mô hình lập trình song song 56

2.1.4.2. Phương pháp xây dựng thuật toán song song 57
2.2. Tổng quan về mô hình lập trình truyền thông điệp – MPI 58
2.2.1. Giới thiệu mô hình truyền thông điệp 58
2.2.2. Lập trình truyền thông điệp – MPI 59
2.2.2.1. Giới thiệu MPI 59
2.2.2.2. Đặc điểm của lập trình với MPI 61
2.2.2.3. Các khái niệm cơ bản 62
2.2.2.4. Cấu trúc chương trình MPI 63
2.3. Tổng quan về GPU 63
2.3.1. Giới thiệu GPU 63
2.3.2. Lịch sử phát triển GPU 64
2.3.3. Kiến trúc GPU 67
2.3.3.1. Đường ống dẫn đồ họa 67
2.3.3.2. Tiến hóa của kiến trúc GPU 69
2.3.3.3. Kiến trúc GPU hiện đại 70
2.3.3.4. Mô hình lập trình trên GPU 72
-iv-
CHƯƠNG 3: XÂY DỰNG THUẬT TOÁN NHÁNH CẬN SONG SONG ĐỂ
GIẢI QUYẾT BÀI TOÁN LẬP LỊCH 74
3.1. Lý do chọn thuật toán
3.2. Thuật toán nhánh cận tuần tự giải quyết bài toán lập lịch công việc 74
3.2.1. Giới thiệu thuật toán nhánh cận 74
3.2.2. Mô tả thuật toán nhánh cận tuần tự giải quyết bài toán lập lịch công việc…
77
3.2.3. Thuật toán nhánh cận cải tiến 85
3.3. Thuật toán nhánh cận song song giải quyết bài toán lập lịch công việc 89
3.3.1. Phương án song song thứ nhất 90
3.3.2. Phương án song song thứ hai 92
3.3.3. Triển khai thuật toán trên môi trường tính toán song song 93
CHƯƠNG 4: ĐÁNH GIÁ KẾT QUẢ THỰC NGHIỆM 97

4.1. Kết quả thử nghiệm trên thuật toán nhánh cận song song giải quyết bài toán lập
lịch trên nhiều máy tính 97
4.2. Kết quả thử nghiệm thuật toán nhánh cận song song giải quyết bài toán lập lịch
công việc trên môi trường CPU – GPU 99.
KẾT LUẬN 102
TÀI LIỆU THAM KHẢO
-v-

DANH MỤC TỪ VIẾT TẮT

CA Clustering agorithm
d Due date
f Fitness
GCA Genetic clustering algorithm
GPU Graphics processing unit
JSP Job shop problem
MIMD Multiple instruction stream, multiple data stream
MPI Message passing interface
MISD Multiple instruction stream, single data stream
L Lateness
LB Lower bound
LIS Language independent specifications
O Operation
PU Processor Unit
r Realease date
SISD Single instruction stream, single data stream
SIMD Single instruction stream, multiple data stream
SPMD Single program multiple data

-vi-

DANH MỤC BẢNG

Bảng 1.1: Bảng mô tả công việc và trình tự thực hiện công việc 1 21
Bảng 1.2: Bảng mô tả công việc và trình tự thực hiện công việc 2 24
Bảng 1.3: Bảng mô tả công việc và trình tự thực hiện công việc 3 27
Bảng 1.4: Bảng mô tả công việc và trình tự thực hiện công việc 4 30
Bảng 1.5: Bảng mô tả công việc và trình tự thực hiện công việc 5 33
Bảng 1.6: Bảng mô tả sự thay đổi E qua từng giai đoạn 38
Bảng 4.1: Bảng mô tả kết quả thực hiện công việc 1 97
Bảng 4.2: Bảng mô tả kết quả thực hiện công việc 2 100

-vii-

DANH MỤC BIỂU ĐỒ

Biểu đồ 1.1: Lịch trình không phải là bán chủ động 7
Biểu đồ 1.2: Lịch trình bán chủ động 7
Biểu đồ 1.3: Biểu đồ biểu diễn công việc khi thay đổi vị trí O
32
và O
31

8
Biểu đồ 1.4: Lịch trình chủ động sau khi thay đổi trình tự công đoạn 9
Biểu đồ 1.5: Biểu đồ Gantt mô tả trình tự thực hiện công việc 1 22
Biểu đồ 1.6: Biểu đồ Gantt mô tả trình tự thực hiện công việc 2 31
Biểu đồ 1.7: Biểu đồ Gantt mô tả trình tự thực hiện công việc 3 34
Biểu đồ 1.8: Biểu đồ Gantt mô tả trình tự thực hiện công việc 4 35
Biều đồ 1.9: Biểu đồ Gantt mô tả trình tự thực hiện công việc 5 36
Biều đồ 1.10: Biểu đồ Gantt mô tả trình tự thực hiện công việc 6 37
Biều đồ 1.11: Biểu đồ Gantt mô tả trình tự thực hiện công việc 7 38

-viii-

DANH MỤC HÌNH

Hình 2.1: Mô hình máy tính SISD 52
Hình 2.2: Mô hình máy tính SIMD 53
Hình 2.3: Mô hình máy MIMD 54
Hình 2.4: Máy tính chia sẻ bộ nhớ 55
Hình 2.5: Máy tính bộ nhớ phân tán 56
Hình 2.6: Mô hình máy tính phân tán 56
Hình 2.7: Mô hình phân chia chức năng 58
Hình 3.1: Nhánh mở rộng từ nút (2, 2) 87
Hình 3.2: Mở rộng nhánh từ (3, 1), LB>minLB 88
Hình 3.3: Mở rộng nhánh từ (3,1), LB <minLB 89
Hình 4.1: Đồ thị biểu diễn thời gian xử lý các thuật toán 1 98
Hình 4.2: Đồ thị biểu diễn thời gian xử lý các thuật toán 2 100

1

MỞ ĐẦU
1. Đặt vấn đề
Cùng với sự phát triển của kinh tế xã hội, khối lượng công việc ngày một
nhiều và phức tạp, vì vậy việc xử lý tất cả các công việc đòi hỏi phải có hiệu quả,
chính xác và trên hết là thời gian xử lý các công việc phải kịp thời để đáp ứng được
nhu cầu của người dùng. Việc áp dụng công nghệ thông tin vào tất cả các lĩnh vực
đã trở thành một nhu cầu tất yếu của cuộc sống. Với phương hướng này thì máy
tính đã trở thành một nhân tố quan trọng quyết định ảnh hưởng đến kết quả đạt
được. Một chiếc máy tính có thể giúp con người xử lý một lượng lớn công việc với
thời gian và hiệu quả tối ưu. Nhưng có cung thì phải có cầu, chiếc máy tính cung
cấp khả năng làm việc là thế, nhưng nhu cầu của con người thì vẫn tiếp tục tăng và
tăng không ngừng đến khi vượt quá khả năng cung cấp của máy tính, đến lúc này
thì chiếc máy tính đã và đang chưa đáp ứng được yêu cầu thực tế. Những hạn chế
đó là gì? Có thể trả lời đó là những hạn chế của tốc độ xử lý của CPU, khả năng lưu
trữ của ổ cứng, tốc độ truy xuất của bộ nhớ,… hay nói đúng hơn các yếu điểm đó
chính là những giới hạn của phần cứng máy tính. Xuất phát từ yêu cầu đó thì nhiều
biện pháp đã được đề xuất để giải quyết bài toán về cấu hình phần cứng của máy
tính, và một lịch trình đã được đề xuất áp dụng “Lịch trình của những chiếc máy
tính cùng nhau xử lý một công việc”.
Ngày nay, các máy tính gần như đã được gắn kết với nhau thông qua
internet. Đây là điều kiện thuận lợi để tận dụng nguồn tài nguyên phần cứng lớn lao
đó. Một khi phần cứng đã được đáp ứng đầy đủ thì tất yếu phần mềm cũng phải
phát triển lên phù hợp với yêu cầu phần cứng. Một nền tảng các máy tính sẵn sàng
cùng nhau thực hiện công việc nhưng nếu chỉ áp dụng phần mềm được thiết kế để
xử lý công việc tuần tự trên một máy tính đơn lẻ ban đầu thì không đem lại hiệu quả
gì. Do đó cần phải có phần mềm phù hợp và được xử lý đồng thời trên các máy để
tận dụng hiệu suất của các máy tính tiến tới mục đích là hoàn thành công việc nhanh
chóng. Từ đó các phần mềm lần lượt ra đời bằng cách chuyển đổi bản chất của

mình, được tạo nên từ cách viết chương trình tuần tự sang cách viết chương trình
song song. Các thuật toán tuần tự cũng được chuyển biến thành thuật toán song
song. Khi phần cứng và phần mềm đã tương thích với nhau thì hiệu suất thực hiện
2

công việc sẽ tăng lên đáng kể và nhu cầu khối lượng công việc cần xử lý cũng như
thời gian hoàn thành công việc sẽ được đáp ứng.
Với phương hướng trên, thì việc xây dựng hoặc cải tiến các thuật toán để tạo
nên thuật toán song song là cần thiết. Cụ thể trong đề tài này tác giả tiến hành
nghiên cứu để tạo nên một thuật toán song song áp dụng giải quyết bài toán “Lập
lịch trình công việc (JSP – Job Shop Problem)”. Việc lập lịch được hình thành từ
khi con người bắt đầu có sự phân công công việc trong xã hội và vẫn tiếp tục tồn
tại, phát triển cùng sự tiến bộ của khoa học kỹ thuật. Một lịch trình tốt sẽ giúp cho
thời gian hoàn thành công việc ngắn lại góp phần tiết kiệm thời gian. Vì thế trải qua
nhiều thập kỷ người ta không ngừng tìm hiểu và phát triển các phương pháp lập
lịch để có được một lời giải tốt nhất.
Vấn đề lập lịch trình công việc có thể áp dụng cho các mục đích khác nhau.
Ví dụ về lập lịch công tác của nhân viên trong một bộ phận của công ty. Với yêu
cầu này ta có thể mô tả sơ bộ như sau: bộ phận của công ty bao gồm một tập hợp
các nhân viên và một tập hợp các công việc phải thực hiện vào những thời gian xác
định. Mỗi nhân viên có khả năng thực hiện một số công việc và có đặc điểm sở
thích riêng của mình về công việc cũng như thời gian làm việc. Lập lịch là gán việc
cho các nhân viên sao cho đảm bảo các công việc phải được hoàn thành đúng kế
hoạch. Với ví dụ điển hình như trên thì ta có thể áp dụng để lập lịch với các kiểu bài
toán tương tự như: lập thời khóa biểu học cho sinh viên, phân ca trực cho y tá trong
bệnh viện, phân giờ dạy cho giáo viên trong các trung tâm đào tạo, phân công ca lái
xe cho các nhân viên công ty vận tải, …
Với nhiều ứng dụng như vậy, bởi lẽ đó thì việc nghiên cứu để đưa ra một
thuật toán song song có thể thống kê một lịch trình để thực hiện các công việc hoàn
thành trong thời gian tối ưu nhất là cần thiết.

2. Lý do chọn đề tài
Năm 1955, bài toán lập lịch bắt đầu được triển khai nghiên cứu và áp dụng
thực hiện trên máy tính. Cho đến nay, bài toán đã được nghiên cứu và giải quyết
bằng nhiều thuật toán khác nhau để tìm ra lời giải tốt. Nhưng có hai vấn đề tranh cãi
xung quanh bài toán lập lịch đó là lịch trình công việc tìm ra đã tối ưu chưa và tốc
độ thực hiện thuật toán nhanh hay chậm. Xuất phát từ những tranh cãi đó, thì có hai
3

phương pháp tiếp cận chính để giải quyết bài toán lập lịch là phương pháp chính
xác và phương pháp gần đúng.
Phương pháp thứ nhất là phương pháp chính xác. Với phương pháp chính
xác thì ưu điểm lớn nhất là sẽ tiến hành tìm kiếm trên toàn bộ không gian bài toán
và sẽ luôn cho ra được một lịch trình thực hiện các công việc tối ưu nhất. Phương
pháp chính xác nhìn nhận sâu vào vấn đề bài toán, đưa ra được những quyết định
với các thông tin quan trọng về cấu trúc của vấn đề hoặc phân tích chính xác các
lịch trình. Tuy nhiên do bản chất là vét cạn nên có nhiều hạn chế khả năng áp dụng
phương pháp này, như tốn nhiều chi phí thực hiện, mất nhiều thời gian xử lý để tìm
ra lời giải…Một số thuật toán giải quyết bài toán theo phương pháp tiếp cận này
bao gồm: “Integer Linear Programming”, “Branch and Bound”, “Lagrangian
Relaxation”, … Trong các thuật toán trên thì thuật toán nhánh cận (Branch and
Bound) được đánh giá là thuật toán tốt nhất trong các thuật toán nghiên cứu theo
phương pháp chính xác.
Phương pháp thứ hai là phương pháp gần đúng. Phương pháp gần đúng sử
dụng các hàm ước lượng heuristic đánh giá để tìm lịch trình công việc, việc sử dụng
các hàm ước lượng này có nhược điểm lớn là lời giải của phương pháp tìm ra không
được chắc chắn là lời giải tối ưu nhất. Trong thực tế, nhiều trường hợp chất lượng
của lời giải tìm ra có thể là không chấp nhận được. Kết quả của bài toán bị ảnh
hưởng nhiều bởi các thông số (kích thước của tập hợp, điểm khởi đầu bài toán, các
lân cận…). Và cách thức để giải quyết bài toán đôi khi được xem như kỹ xảo để xử
lý hơn là khoa học. Tuy nhiên phương pháp này lại có lợi thế hơn so với phương

pháp chính xác là chi phí thời gian tìm kiếm để đưa ra lời giải thấp. Một số thuật
toán mạnh mẽ gần đây tiếp cận bằng phương pháp gần đúng bao gồm: “Taboo
Search”, “Genetic Algorithms”, “Simulated Annearling”, …
Từ hai phương pháp tiếp cận trên, để có thể tìm được một lời giải tối ưu nhất
và thời gian thực hiện nhanh nhất thì tác giả đã chọn thuật toán nhánh cận để tiến
hành giải quyết bài toán lập lịch trình công việc. Với thuật toán nhánh cận thì một
đáp án tối ưu nhất luôn được tìm ra, nhưng vấn đề vấp phải là chi phí tìm kiếm lớn.
Trong điều kiện áp dụng triển khai thuật toán trên môi trường tính toán song song
thì sẽ góp phần giải quyết được nhược điểm về chi phí tìm kiếm của thuật toán. Do
4

đó việc cải tiến thuật toán nhánh cận từ môi trường máy đơn thành thuật toán có thể
xử lý song song trên môi trường tính toán song song là phù hợp với yêu cầu đặt ra.
3. Mục tiêu
Nghiên cứu thuật toán song song để giải quyết bài toán lập kế hoạch thông
qua việc giải quyết bài toán JSP. Từ đó có được sự đánh giá và so sánh với thuật
toán tuần tự.
Bên cạnh đó, cũng đề ra mục tiêu hiện thực thuật toán trên môi trường mạng
các máy tính song song (Networked Parallel Computer) và môi trường khai thác
đồng thời CPU lẫn GPU.
4. Đối tượng nghiên cứu
Với việc áp dụng thuật toán nhánh cận để giải quyết bài toán lập lịch thì một
lời giải tối ưu sẽ được tìm ra. Nhưng chi phí để tìm ra lời giải là quá lớn, các xử lý
và bộ nhớ dùng để lưu trữ đều tập trung tại một máy dẫn đến tình trạng tràn bộ nhớ,
do đó vấn đề cần phải nghiên cứu ở đây là cách thức hoạt động của thuật toán nhánh
cận, từ đó tiến hành xây dựng, phân chia các xử lý về các máy con đồng thời tận
dụng bộ nhớ của các máy con đó, nhằm tiến tới mục đích cuối cùng là tạo ra một
thuật toán song song cho vấn đề lập lịch trình công việc.
5. Nội dung nghiên cứu
▪ Nghiên cứu các loại lịch trình

▪ Nghiên cứu các thuật toán áp dụng giải bài toán lập lịch: thuật toán nhánh
cận, thuật toán di truyền, …
▪ Nghiên cứu thuật toán nhánh cận để giải bài toán lập lịch công việc.
▪ Nghiên cứu các thuật toán tìm đường đi ngắn nhất trong một đồ thị có hướng
phi chu trình: Djisktra, Bellman – ford, Floyd Washall.
▪ Nghiên cứu áp dụng các thuật toán Djisktra, Bell man – ford, Floy Washall
tìm đường đi dài nhất trong đồ thị có hướng phi chu trình.
▪ Nghiên cứu cách thức phân nhánh và tính toán cận trong thuật toán nhánh
cận
5

▪ Nghiên cứu các mô hình song song, lựa chọn mô hình tính toán song song
phù hợp để áp dụng thuật toán
▪ Cải tiến thuật toán bằng cách song song hóa thuật toán để giải bài toán JSP.
▪ Đánh giá so sánh kết quả của thuật toán tìm kiếm tối ưu ban đầu với thuật
toán tìm kiếm tối ưu sau khi song song hóa.
6. Phương pháp nghiên cứu
▪ Đọc các bài báo liên quan đến vấn đề lập lịch JSP để hiểu được cách thức áp
dụng các thuật toán tìm kiếm tối ưu vào bài toán lập lịch.
▪ Nhận xét các ưu và nhược điểm của các thuật toán áp dụng trong các bài báo.
▪ Từ các nhận xét rút ra thuật toán sẽ sử dụng để giải quyết bài toán lập lịch.
▪ Phân tích thuật toán sử dụng để rút ra các đặc điểm phục vụ cho mục đích
song song hóa thuật toán.
▪ Thử nghiệm một số dữ liệu đã chạy thử từ thuật toán tối ưu ban đầu để đánh
giá hiệu quả của thuật toán song song.

6

CHƯƠNG 1: TỔNG QUAN VỀ BÀI TOÁN LẬP LỊCH CÔNG VIỆC

1.1. Định nghĩa bài toán lập lịch
1.1.1. Mô tả bài toán
Giả sử có tập m máy M
j
(j=1,…,m) và tập n công việc J
i
(i=1,…,n). Lịch biểu
cho mỗi công việc là sự phân công xử lý công việc đó trên một hay nhiều máy. Bài
toán lập lịch có một số ràng buộc sau:
▪ Một máy chỉ có thể thực hiện một công việc tại một thời điểm
▪ Một công việc có nhiều nhất là m công đoạn thực hiện
▪ Một công việc khi đã bắt đầu xử lý thì nó không được gián đoạn
▪ Mỗi công việc được xử lý trên các máy theo một trình tự nhất định
▪ Trình tự công đoạn trên các máy chưa được xác định và cần phải xác
định trình tự này để có được thời gian hoàn thành là nhỏ nhất.
1.1.2. Dữ liệu bài toán
Công việc J
i
phải trải qua n
i
công đoạn O
i1
, O
i2
, O
i3
, …, O
in,
, tương ứng với
mỗi công đoạn O

ij
là một thời gian xử lý p
ij
. Nếu công việc J
i
chỉ gồm có một công
đoạn (n
i
=1) thì chúng ta đồng nhất J
i
với O
ij
và thời gian thực hiện là p
i
.
Thời điểm mà kể từ đó công đoạn đầu tiên của công việc J
i
sẵn sàng để được
xử lý gọi là thời điểm sẵn sàng (release date) của công việc J
i
và được ký hiệu là r
i
.
Thời điểm quy định một công việc phải hoàn tất gọi là thời điểm đến hạn của
một công việc (due date) ký hiệu là d
i
.
1.1.3. Các loại lịch trình
Lịch trình bán chủ động (semi-active): một lịch trình gọi là bán chủ động nếu
không có công đoạn nào có thể được xử lý sớm hơn mà không làm thay đổi trật tự

xử lý hoặc vi phạm những ràng buộc [9] .
Ví dụ: một lịch trình không phải bán chủ động trong trường hợp biểu diễn trên biểu
đồ Gantt như biểu đồ 1.1:
7

Biểu đồ 1.1: Lịch trình không phải là bán chủ động
Từ biểu đồ Gantt trên, có thể xác định đây không phải là lịch trình bán chủ
động. Vì có thể thực hiện công đoạn O
12
và O
13
sớm hơn mà trình tự thực hiện vẫn
không đổi. Tiến hành thực hiện công công đoạn O
12
và O
13
sớm hơn để được một
lịch trình bán chủ động. Khi đó biểu đồ gantt thu được như biểu đồ 1.2:

Biểu đồ 1.2: Lịch trình bán chủ động
Lịch trình chủ động (active): một lịch trình được gọi là chủ động nếu không
thể xếp lại lịch cho các công việc thực hiện sớm hơn mà không vi phạm các ràng
buộc. Biểu đồ 1.2 trên là lịch trình bán chủ động, khi đó sẽ không thể thực một bất
cứ một công đoạn nào khác sớm hơn mà không làm thay đổi trình tự thực hiện của
các công đoạn. Tuy nhiên, từ lịch trình bán chủ động nếu thay đổi trình tự thực hiện
các công đoạn tại một máy bất kỳ thì có thể được một lịch trình chủ động. Như vậy
8

có thể kết luận, lịch trình bán chủ động không phải là một lịch trình tối ưu. Lịch

trình tối ưu là lịch trình mà có thời gian hoàn thành tất cả các công việc là nhỏ nhất
và không vi phạm ràng buộc, vấn đề là cần phải thay đổi trình tự các công đoạn
thực hiện từ lịch trình bán chủ động để được một lịch trình chủ động với thời gian
hoàn thành công việc nhỏ hơn, khi đó sẽ được một lịch trình tối ưu đó chính là lịch
trình chủ động. Có hai cách để chỉnh sửa lịch trình khả thi thành lịch trình chủ động.
Cách thứ nhất: là dịch chuyển 1 công đoạn sang trái để thời điểm bắt đầu thực hiện
của công đoạn sớm hơn (a left shift).
Cách thứ hai: cho công đoạn nhảy vào vị trí rỗi để công đoạn bắt đầu thực hiện sớm
hơn (a left jump).
 Một lịch trình khả thi trở thành lịch trình chủ động khi không thể dịch trái hoặc
nhảy sang trái bất cứ một công đoạn nào khác [9].
Ví dụ: Từ lịch trình bán chủ động biểu đồ 1.2, thay đổi trình tự thực hiện công việc
1 và công việc 2 trên máy 3.

Biểu đồ 1.3: Biểu đồ biểu diễn công việc khi thay đổi vị trí O
32
và O
31
Cho công đoạn O
23
nhảy sang vị trí rỗi bên trái, sau đó dời các công đoạn O22,
O33, O13 sang trái. Khi đó biểu đồ Gantt như biểu đồ 1.4:
9

Biểu đồ 1.4: Lịch trình chủ động sau khi thay đổi trình tự công đoạn
1.2. Tình hình nghiên cứu thuật toán tìm kiếm lịch trình tối ưu triển khai trên
một máy tính đơn
1.2.1. Tình hình nghiên cứu trên thế giới
Bài toán lập lịch JSP được hình thành từ năm 1955, ý tưởng về bài toán này

có thể được tìm thấy trong công trình nghiên cứu của Akers và Friedman. Tiếp sau
đó là công trình nghiên cứu của Bowman (1959) và Wagner (1959), khi đó thì các
công việc chỉ có thể được xử lý trên 3 máy tính hoặc ít hơn. Năm 1963 là năm đánh
dấu cột mốc lịch sử quan trọng về bài toán lập lịch JSP, khi đó Fisher và Thompson
đã giới thiệu công trình nghiên cứu xử lý 10 công việc trên 10 máy tính khác nhau.
Từ đó các nỗ lực thách thức về bài toán lập lịch JSP được tạo ra, thực hiện bởi
Brooks và White (1965), Greenberg (1968) dùng phương pháp quy hoạch số
nguyên (integer programming). Sau đó là phương pháp nhân tử Lagrange của Balas
(1969), Charlton và Death (1970), Florian (1971), Ashour và Hiremath (1973), và
Fisher (1973).
Một thuật toán của McMahon và Florian đề xuất ra vào năm 1975 là lịch
trình đầu tiên chính xác nhất. Phương pháp của tác giả kết hợp các giới hạn của vấn
đề lập lịch trên một máy tính bằng cách sử dụng hàm mục tiêu để giảm thiểu thời
gian trễ và liệt kê các lịch trình chủ động (active schedule).
Cũng vào thời điểm đó, phương pháp giải quyết bài toán lập lịch JSP sử
dụng hàm ước lượng heuristic dựa trên các luật ưu tiên được nghiên cứu bởi Gere
(1966), Panwalker và Iskander (1977), Haupt (1989). Xa hơn nữa là một số thuật
10

toán mạnh mẽ được nghiên cứu với các phương pháp tiếp cận tối ưu, năm 1985
Barker và McMahon công bố công trình nghiên với phương pháp giải quyết bài
toán lập lịch bằng cách sử dụng cấu trúc lân cận dựa vào thuật toán tìm kiếm địa
phương (local search).
Năm 1982, bài toán lập lịch JSP xuất hiện tại Pháp và được xem là dạng bài
toán đặc biệt khó về vấn đề tối ưu tổ hợp. Từ các ứng dụng thực tế thì vấn đề này đã
được nghiên cứu bởi nhiều tác giả với những lịch trình khác nhau. [11]
Sau đây là các phương pháp áp dụng để giải bài toán lập lịch JSP:

Hình 1.1: Các phương pháp giải bài toán lập lịch công việc

11

1.2.1.1. Phương pháp chính xác
 Thuật toán nhánh cận (Branch anh Bound)
Thuật toán nhánh cận là phương pháp hiệu quả nhất trong số các phương
pháp chính xác để giải bài toán lập lịch JSP. Nhánh cận là kỹ thuật được phát triển
để giải quyết các vấn đề rời rạc và tổ hợp. Mô hình được sử dụng để tìm kiếm là mô
hình cây phân cấp. Tư tưởng cơ bản của phương pháp là trong quá trình tìm kiếm
lời giải, sẽ phân hoạch tập các phương án của bài toán thành hai hay nhiều tập con
biểu diễn như một nút của cây tìm kiếm và cố gắng bằng phép đánh giá cận các nút,
tìm cách loại bỏ các nhánh cây (những tập con các phương án của bài toán) mà ta
biết chắc chắn không phải là phương án tối ưu. Mặc dù trong trường hợp xấu nhất
thuật toán sẽ duyệt toàn bộ, nhưng những trường hợp cụ thể nó rút ngắn đáng kể
thời gian tìm kiếm.
Hiệu quả của thuật toán nhánh cận phụ thuộc cách thức phân nhánh và đánh
giá cận. Việc phân nhánh sai sẽ không làm giảm việc bỏ bớt các phương án không
tốt hoặc thậm chí cũng không thể thu gọn các miền khả thi xuống. Đánh giá cận sai
sẽ tạo ra các nhánh không chính xác làm ảnh hưởng đến số lượng các phương án
hoặc các tập con có thể lược bỏ được. Như vậy thì một chiến lược nhánh cận không
tốt sẽ làm giảm việc xác định các phương án khả thi và lúc này thuật toán sẽ liệt kê
toàn bộ các cấu hình có thể cho dù bài toán không thực sự lớn. Chính vì thế những
quy tắc khác nhau được áp dụng với mục đích làm sao để phân nhánh và đánh giá
cận đúng là vấn đề quan trọng trong việc xây dựng thuật toán.
Với bài toán lập lịch, thì lịch trình các công việc được mô tả bằng một đồ thị
nối rời (disjunctive graph). Tất cả các công đoạn cùng một công việc được nối
thành một chuỗi các cung nối liền và các cung nối rời giữ các công đoạn thực hiện
trên cùng một máy. Việc lập lịch sẽ trở thành việc sắp thứ tự các công việc trên từng
máy, nghĩa là làm cố định mối liên hệ trước sau giữa các công đoạn trên cùng một
máy bằng cách thay đổi hướng các cung nối rời theo một hướng cố định ta sẽ có
một lời giải khả thi, mỗi lời giải khả thi này ta tính được hàm mục tiêu C

max
là chiều
dài lớn nhất đi từ nút nguồn đến nút đích.
Hiệu quả của lời giải khi sử dụng thuật toán nhánh cận để giải quyết vẫn phụ
thuộc vào hai yếu tố là phân nhánh và đánh giá cận chính xác hay không. Do đó
12

nhiều loại thủ tục khác nhau được đưa ra phát triển để đáp ứng yêu cầu trên: xác
định cận dựa vào phương pháp lagrange nới lỏng (lagrange relaxation), phương
pháp đối ngẫu thay thế (surrogate duality) và các lịch trình tối ưu của một vấn đề
con bao gồm hai hoặc ba công việc trên nhiều máy tính.
Thủ tục nổi bật nhất để xác định cận được đề xuất bởi Carlier (1982) và Pots
(1980). Thủ tục được hình thành bắt nguồn từ một lịch trình chính xác để lập lịch
trên máy đơn dựa vào thời điểm bắt đầu và thời điểm kết thúc để lập một kế hoạch
tối ưu cho vấn đề lập lịch công việc. Về sau thủ tục này được cải tiến bởi Balas,
Lenstra và Vazacopoulous (1995) bằng cách giảm thiểu sự chậm trễ giữa các cặp
công đoạn với nhau. Sau đó nhiều cách thức suy luận khác nhau được bổ sung vào
với cùng mục đích để giới hạn lại không gian tìm kiếm. Florian (1971) đề xuất một
thuật toán nhánh cận trong đó việc xác định tập ứng cử viên có thể phân nhánh như
sau: tại một thời điểm nhất định tập các công đoạn sẵn sàng mà có các công đoạn
trước nó chưa được lên lịch thì đều được xem là ứng viên có thể phân nhánh, và
nhiều phương pháp khác được đưa ra của các tả giả barker và McMaHon (1985),
Brucker (1992, 1994), Carlier và Pinson (1989, 1990, 1994) thuật toán dựa trên các
cặp cung rời xác định nối với nhau hay không trên hai cây con. Năm 1996, Martin
đã đề xuất phương pháp tiếp cận hướng thời gian với một kỹ thuật mạnh mẽ được
gọi là shaving. Trong các phương pháp được đề xuất trước đó thì phương pháp của
Martin được đánh giá là tốt nhất nhưng vấn đề gặp phải ở phương pháp này là thời
gian tính toán quá lớn. [11]
1.2.1.2. Phương pháp gần đúng
 Tìm kiếm địa phương (local search)

Ý tưởng chung của phương pháp tìm kiếm địa phương là đối với một tập các
lời giải hữu hạn S và một hàm số c: S  R cho trước, tiến hành tìm một lời giải
s*∈ S thỏa c(s*) ≤ c(s), ∀s ∈ S
Tìm kiếm địa phương là một thủ tục lặp, di chuyển từ một lời giải này trong
tập S đến một lời giải khác trong tập S khi cần. Để tìm kiếm một cách có hệ thống
trong tập S những sự di chuyển có thể từ một lời giải s đến một lời giải kế tiếp nên
bị giới hạn trong một số điều kiện. Các giới hạn này được mô tả dựa vào cấu trúc
13

lân cận (neighborhood structure) N: S2
s
trong S. N(s) mô tả tập con của S mà có
thể di chuyển đến từ lời giải s. Tập N(s) được gọi là lân cận của lời giải s.
Cấu trúc lân cận được biểu diễn bằng một đồ thị có hướng G=(V, A). Trong
đó V=S và (s, t) ∈ A nếu và chỉ nếu t ∈ N(s). G được gọi là đồ thị lân cận của cấu
trúc lân cận.
Từ các định nghĩa trên phương pháp tìm kiếm địa phương có thể được mô tả
như sau: trong mỗi vòng lặp, bắt đầu thuật toán bằng một lời giải s ∈ S, sau đó lựa
chọn một lời giải s’ trong lân cận N(s). Dựa vào các giá trị c(s) và c(s’), lựa chọn
một lời giải bắt đầu cho vòng lặp kế tiếp. Với những tiêu chí khác nhau được dùng
để lựa chọng lời giải bắt đầu cho vòng lặp kế sẽ hình thành nên các thuật toán tìm
kiếm địa phương khác nhau.
Thuật toán:
▪ Chọn một lời giải ban đầu s ∈ S
▪ Lặp
o Phát sinh lời giải tốt nhất s’ ∈ N(s);
o Nếu c(s) < c(s’)
s = s’
▪ Lặp đến khi c(s’) ≥ c(s)
Giải thuật này kết thúc với một lời giải s*. Giá trị s* chỉ là cực tiểu địa

phương trong miền lân cận N(s) của lời giải s (nghĩa là không có lời giải nào tốt hơn
lời giải hiện tại có được trong miền lân cận này). Tuy nhiên giá trị này có thể khác
đáng kể so với giả trị cực tiểu toàn cục. [7]
 Thuật toán mô phỏng luyện kim (simulated annealing)
Dựa trên cơ sở phương pháp tìm kiếm địa phương, thuật toán mô phỏng
luyện kim là phương pháp tìm kiếm tránh rơi vào cực tiểu địa phương. Mô phỏng
luyện kim là phương pháp ngẫu nhiên vì:
▪ s’ được lựa chọn ngẫu nhiên từ tập N(s)
▪ Tại bước lặp thứ i, lời giải s’ được chấp nhận với xác suất:
min{1, exp(-

′
 ()


)}
14

Xác suất này được hiểu như sau : c(s’) ≤ c(s) thì lời giải s được thay thế bởi
lời giải s’ với xác suất bằng 1. Ngược lại c(s’) > c(s) thì lời giải được thay thế bằng
lời giải s’ với một xác suất. Xác suất này sẽ giảm dần khi i tăng. Như vậy thuật toán
sẽ thoát khỏi cực tiểu địa phương nhưng xác suất để thực hiện việc này sẽ giảm dần
sau một số lớn bước lặp. Trong thuật toán, ký hiệu random[0. 1] tượng trưng cho
một hàm số tạo một giá trị ngẫu nhiên trong khoảng 0 đến 1. Ngoài ra, dãy {c
i
}
được tạo ra bởi hàm số g, nghĩa là c
i+1
=g(c
i

), ∀i. Điều kiện dừng thuật toán là sau
một khoảng thời gian tính toán sẽ dừng, và thời gian này được cho trước.
Thuật toán:
▪ i=0;
▪ Chọn một lời giải ban đầu s ∈ S;
▪ Best = c(s);
▪ s* = s
▪ Lặp
o Tạo một lời giải ngẫu nhiên s’ ∈ N(s);
Nếu random[0, 1] < min{1, exp(-

′
 ()


)} thì
s = s’;
o Nếu c(s’) < best thì
s* = s’;
best = c(s’);
o c
i+1
= g(c
i
);
o i = i+1
▪ Lặp đến khi thỏa tiêu chí dừng
Thuật toán mô phỏng luyện kim có thuận lợi là có thể thoát khỏi được cực
tiểu đại phương. Tuy nhiên bất lợi nhất của phương pháp là khả năng quay lại lời
giải đã xét. Do đó việc lặp lại công việc tại một cực tiểu địa phương là hoàn toàn có

thể xảy ra và điều này dẫn đến mất nhiều thời gian tính toán trên một phần nhỏ của
không gian lời giải. [7]

Luận văn thạc sĩ công nghệ thông tin song song hoá bài toán jsp trên một số môi trường tính toán song song và phân tán

Trích đoạn

Tài liệu liên quan

Tài liệu bạn tìm kiếm đã sẵn sàng tải về