ĐẠI HỌC ĐÀ NẴNG
TRƯỜNG ĐẠI HỌC SƯ PHẠM
KHOA TIN HỌC
GIÁO TRÌNH
TIN HỌC ĐẠI CƯƠNG
TIN HỌC ĐẠI CƯƠNG
(Cho các lớp chuyên tin)
Biên soạn: Đinh thị Đông Phương
Đại Học Sư Phạm Khoa Tin Học
Đà Nẵng, 2005
2
Đại Học Sư Phạm Khoa Tin Học
MỤC LỤC
Chương 1: MÁY TÍNH VÀ BIỂU DIỄN THÔNG TIN TRONG MÁY TÍNH............4
1. Thông tin và tin học.........................................................................................................4
2. Lịch sử máy tính...............................................................................................................4
3. Phân loại máy tính...........................................................................................................4
4. Hệ đếm...............................................................................................................................5
5. Biểu diễn thông tin trong máy tính................................................................................7
6. Giải bài toán trên máy tính...........................................................................................11
Chương 2: CẤU TRÚC MÁY TÍNH...............................................................................23
1. Máy tính là gì?................................................................................................................23
2. Mô hình cấu trúc cơ bản của một máy vi tính............................................................24
3. Central Processing Unit (CPU).....................................................................................24
4. Computer Memory........................................................................................................25
5. Computer Bus.................................................................................................................25
6. Thiết bị ngoại vi..............................................................................................................26
7. Phần mềm máy tính.......................................................................................................27
Chương 3: HỆ ĐIỀU HÀNH WINDOWS......................................................................28
1. Khái niệm hệ điều hành.................................................................................................28
2. Phân loại hệ điều hành..................................................................................................28
3. Microsoft Windows .......................................................................................................29
Chương 4: MẠNG VÀ INTERNET.................................................................................37
1. Mạng máy tính................................................................................................................37
2. Internet............................................................................................................................37
Chương 5: SOẠN THẢO VĂN BẢN BẰNG MS WORD.............................................39
1. Giới thiệu chung.............................................................................................................39
2. Các thao tác cơ bản trên tập tin văn bản....................................................................40
3. Soạn thảo tài liệu............................................................................................................41
4. Định dạng văn bản.........................................................................................................52
5. Phân cột – Lập bảng......................................................................................................57
6. In tài liệu.........................................................................................................................61
Chương 6. MICROSOFT EXCEL...................................................................................63
1. Giới thiệu Excel..............................................................................................................63
2. Thao tác cơ bản với book..............................................................................................64
3.Khái niệm cơ bản............................................................................................................65
4. Các thao tác đối với Sheet.............................................................................................67
5. Các thao tác đối với hàng, cột và cell...........................................................................69
6. Các kiểu dữ liệu của excel.............................................................................................71
7. Tính toán trong excel.....................................................................................................77
8. Quản trị dữ liệu..............................................................................................................85
PHỤ LỤC
..............................................................................................................................................90
3
Đại Học Sư Phạm Khoa Tin Học
Chương 1: MÁY TÍNH VÀ BIỂU DIỄN THÔNG TIN TRONG
MÁY TÍNH
1. Thông tin và tin học
Dữ liệu (Data) chưa mang lại hiểu biết về đối tượng
Thông tin (Information): dữ liệu sau khi được xử lý, cho ta hiểu biết về đối tượng
Ví dụ:
- Ảnh mây vệ tinh: Dữ liệu
- Bản tin dự báo thời tiết: Thông tin
Tin học: Là ngành khoa học nghiên cứu các vấn đề thu thập và xử lý dữ liệu để có được
thông tin mong muốn, sử dụng máy tính như một công cụ hỗ trợ chính.
2. Lịch sử máy tính
Chúng ta có thể điểm qua một số mốc chính và các tên tuổi trong tiến trình phát triển của
máy tính:
• 1937, Turing, khái niệm về các con số tính toán và máy Turing.
• 1943-1946, ENIAC
o Máy tính điện tử đa chức năng đầu tiên.
o J.Mauchly & J.Presper Eckert.
• 1945, John Von Neumann đưa ra khái niệm về chương trình được lưu trữ.
• 1952, Neumann IAS parallel-bit machine.
• 1945 – 1954, thế hệ 1 (first generation)
o Bóng đèn chân không (vacuum tube)
o Bìa đục lỗ
o ENIAC: 30 tấn, 18.000 bóng đèn, 100.000 phép tính/giây.
• 1955-1964, thế hệ 2
o Transitor
o Intel transitor processor
• 1965-1974, thế hệ 3
o Mạch tích hợp (Intergrated Circuit – IC)
• 1975, Thế hệ 4
o LSI (Large Scale Integration), VLSI (Very LSI), ULSI (Ultra LSI).
3. Phân loại máy tính
Tùy theo hình thức và mục đích sử dụng máy tính có thể được phân thành các loại như
sau:
• Personal Computer (PC)/Microcomputer: Máy tính cá nhân, máy vi tính
• Minicomputer
o Nhanh hơn PC 3-10 lần
• Mainframe
o Nhanh hơn PC 10-40 lần
• Supercomputer: Siêu máy tính
o Nhanh hơn PC 50-1.500 lần
o Phục vụ nghiên cứu là chính
o VD: Earth Simulator (NEC, 5104 CPUs, 35.600 GF).
• Laptop Computer: Máy tính xách tay.
• Handheld Computer: Pocket PC, Palm, Mobile devices.
4
Đại Học Sư Phạm Khoa Tin Học
4. Hệ đếm
4.1. Khái niệm
Hệ đếm là hệ thống ký hiệu sử dụng để đếm (biểu diễn thông tin số). Cơ số là số
lượng ký hiệu trong hệ đếm.
Ví dụ: hệ đếm cơ số 10
10 ký hiệu (cơ số 10) : 0..9.
123789 là một số trong hệ 10.
Hệ đếm cơ số a có a ký hiệu.
4.2. Hệ đếm cơ số 10
Hệ đếm cơ số 10 sử dụng 10 ký hiệu: 0,1,2,…,9
a
n
a
n-1
…a
0
= a
n
.10
n
+ a
n-1
.10
n-1
+…+ a
0
.10
0
Ví dụ: 123 = 1.10
2
+ 2.10
1
+3.10
0
Ta viết một số trong hệ đếm cơ số 10 ví dụ số “2005” là 2005 hoặc 2005
10
4.3. Hệ đếm cơ số a bất kỳ
Sử dụng a ký hiệu để biểu diễn.
- Ký hiệu có giá trị nhỏ nhất là ‘0’
- Ký hiệu có giá trị lớn nhất là ‘a-1’
Một số N trong hệ cơ số a ký hiệu N
a
và:
Được biểu diến: N
a
= b
n
b
n-1
…b
1
b
0
b
-1
…b
-m
Giá trị của N: b
n
.a
n
+ b
n-1
.a
n-1
+ … + b
1
.a
1
+ b
0
.a
0
+ b
-1
.a
-1
+… +b
-m
.a
-m
.
Ở đây các chử số ở phần thập phân được đánh số âm (-1,-2,…,-m).
4.4. Hệ đếm cơ số 2
Hệ đếm cơ số 2 hay hệ nhị phân (Binary) sử dụng 2 ký hiệu 0 và 1 để biểu diễn các
số.
Hệ đếm này được sử dụng để biểu diễn thông tin trong máy tính vì
Các linh kiện điện tử chỉ có hai trạng thái:
- Đóng hoặc mở (công tắc).
- Có điện hoặc không có điện.
Do đó chỉ cần sử dụng 2 ký hiệu để biểu diễn
Một số nhị phân ‘0’, hoặc ‘1’ tương ứng với một BIT (BInary digiT).
Ta viết số nhị phân như sau: 1001
2
hoặc 1001
B
4.4.1. Chuyển từ hệ 2 sang hệ 10
Để chuyển các số từ hệ 2 sang hệ 10 ta áp dụng quy tắc biểu diễn số ở cơ số 2 ở trên:
(a
n
a
n-1
…a
0
)
B
= a
n
.2
n
+ a
n-1
.2
n-1
+…+ a
0
.2
0
Ví dụ: 0
B
= 0; 10
B
= 2
1001
B
= 1.2
3
+ 0.2
2
+0.2
1
+ 1.2
0
= 9
4.4.2. Chuyển từ hệ 10 sang hệ 2
Ta có quy tắc chuyển một số từ hệ 10 sang hệ 2 như sau:
- Gọi D = số cần chuyển
- Chia D (chia nguyên) liên tục cho 2 cho tới khi kết quả phép chia = 0
- Lấy phần dư các lần chia viết theo thứ tự ngược lại.
Như ví dụ trên số 11
10
sẽ tương ứng với số 1011
B
5
Đại Học Sư Phạm Khoa Tin Học
4.4.3. Chuyển đổi số lẻ thập phân từ hệ 10 sang hệ 2
Để chuyển đổi các số có phần lẻ thập phân (Ví dụ: 12,73) ta có quy tắc sau:
• Phần nguyên:
- Chia liên tiếp cho 2.
- Viết phần dư theo chiều ngược lại.
• Phần thập phân
- X = phần thập phân.
- Nhân X với 2 ta có kết quả:
Phần nguyên là một trong 2 số (0,1)
Còn lại phần thập phân
- Lặp lại từ bước đầu, đến khi muốn dừng hoặc kết quả=0.
- Viết các phần nguyên theo đúng thứ tự được kết quả.
4.4.4. Các phép toán trên hệ cơ số 2
• Cộng hai số nhị phân
Cộng có nhớ các cặp số cùng vị trí từ phải sang trái
Bảng cộng:
Ví dụ: 1010
B
+ 1111
B
= 11001
B
• Số bù hai (số âm)
Số bù một: Đảo tất cả các bit của một số nhị phân ta được số bù một của nó.
Lấy số bù một cộng 1 ta được số bù hai của số nhị phân ban đầu.
Ví dụ:
B = 1001
Bù một của B: 0110
Bù hai của B: 0111
• Trừ hai số nhị phân B1- B2
B2 + bù hai của B2 = 0 (lấy số chữ số = số chữ số của B2).
Có thể coi bù hai của B2 là số đối của B2.
B1 – B2 = B1 + bù hai của B2.
• Nhân hai số nhị phân
Nhân từ trái phải qua trái theo cách thông thường
Ví dụ: 1011 x 101 = 110111
6
Đại Học Sư Phạm Khoa Tin Học
• Chia hai số nhị phân
Sau khi đã biết cách nhân, cộng, trừ các số nhị phân, ta có cách chia số nhị phân giống
như trong số hệ 10.
Ví dụ: 11101/101=101, dư 100.
4.4.5. Chuyển đổi hệ 16 và hệ 2
Một chữ số hệ 16 tương đương 4 BIT của hệ hai
1
H
= 0001
B
F
H
= 1111
B
Xem bảng chuyển đổi các hệ
• Chuyển đổi hệ 16 sang hệ 2
Căn cứ vào bảng chuyển đổi, thay thế 1 chữ số của số hệ 16 bằng 4 bit nhị phân.
Ví dụ:
A
H
= 1100
B
7
H
= 0111
B
A7
H
= 1100 0111
B
5. Biểu diễn thông tin trong máy tính
5.1. Cách biểu diễn
Thông tin trong máy tính biểu diễn dưới dạng nhị phân.
Ví dụ:
- 5 bit biểu diễn được 32 trạng thái
7
Đại Học Sư Phạm Khoa Tin Học
- 5 bit có thể dùng để biểu biểu diễn 26 ký tự…
5.2. Đơn vị thông tin
Ta sử dụng các đơn vị sau để định lượng thông tin
BIT: Là đơn vị nhỏ nhất, chỉ nhận giá trị 0 hoặc 1
5.3. Mã hóa
Dù thông tin lưu trữ ở đâu cũng cần có quy luật để hiểu nó do đó thông tin phải được mã
hóa.
Ví dụ:
Mã SV: 20041021234
2004: Vào trường năm 2004
102: Mã ngành
1234: Số hiệu sinh viên
Phòng: B209 (Nhà B - Tầng 2 - Phòng 09)
Biển số xe,…
Mã hoá phải thỏa mãn hai yêu cầu: “rõ ràng” và “đầy đủ”
5.3.1. Mã hóa trong máy tính
Ta sử dụng số nhị phân để mã hóa thông tin trong máy tính. Ở đây độ lớn của mã = số
bit sử dụng để mã hoá.
Ví dụ: Sử dụng 5 bit để mã hoá chữ cái hoa A..Z (26 chữ cái)
00000 ß A
00001 ß B
…
11001 ß Z
11001 – 11111: chưa sử dụng
5.3.2. Biểu diễn kí tự
a. Mã ASCII
ASCII (American Standard Code for Information Interchange) bảng mã hóa ký tự của
Mỹ sử dụng 8 bit để mã hoá các chữ cái. Mỗi chữ cái được gọi là một ký tự.
Mã hoá được 2
8
= 256 ký tự.
Các ký tự từ 0à31,127: Các ký tự điều khiển
32à126: Các ký tự thông thường
128à255: Các ký tự đặc biệt
b. Mã Unicode
Sử dụng nhiều hơn 8 bit để mã hoá ký tự. Với 2 Bytes Unicode có thể mã hoá được
216 = 65536 ký tự. Do đó bảng mã có thể mã hóa được hầu hết các chữ cái của các
nước trên thế giới như: Việt Nam, Trung Quốc, Nga, Thái …
8
1Byte 8 BIT
1KB 2
10
Bytes = 1024 Bytes
1MB 1024 KB
1GB 1024 MB
Đại Học Sư Phạm Khoa Tin Học
5.3.3 Biểu diễn số
Số được biểu diễn ở dạng nhị phân. Có các phương pháp biểu diễn sau:
a. Phương pháp dấu lượng (sign - magnitude)
Theo cách biểu diễn này, bit cực trái được dùng làm bit dấu (1 là dấu + và 0 là dấu -) các
bit còn lại biểu diễn độ lớn của số.
Ví dụ: Với mẫu là 4 bit thì các số biểu diễn như sau:
Mẫu bit Giá trị được biểu diễn
1111 7
1110 6
1101 5
1100 4
1011 3
1010 2
1001 1
1000 0
0111 -1
0110 -2
0101 -3
0100 -4
0011 -5
0010 -6
0001 -7
0000 -8
b. Phương pháp biểu diễn số bù 1 (one’s complement)
Theo cách biểu diễn này vẫn dùng bit cực trái làm bit dấu nhưng với qui định có thay
đổi là 0 cho số dương và 1 cho số âm. Ðể biểu diễn số n theo dạng bù 1 ta thực hiện các
thao tác sau: biểu diễn dưới dạng nhị phân của trị tuyệt đối n theo mẫu k bit cố định cho
trước. Nếu n < 0 thì đổi 1 thành 0 và ngược lại trong dãy số nhị phân.
Ví dụ: - Với n = 5 dùng mẫu 4 bit thì biểu diễn theo phương pháp bù 1 là 0101
n = -5 dùng mẫu 4 bit thì biểu diễn theo phương pháp bù 1 là 1010
- Với n = 6 dùng mẫu 4 bit thì biểu diễn theo phương pháp bù 1 là 0110
n = -6 dùng mẫu 4 bit thì biểu diễn theo phương pháp bù 1 là 1001
- Nếu biểu diễn nhị phân của 6 là: 0110
thì -6 được biểu diễn theo bù 1 là: 1001
c. Phương pháp biểu diễn số bù 2 (two’s complement)
Theo cách biểu diễn này vẫn sử dụng bit cực trái làm bit dấu giống như bù 1,
nhưng có một số khác biệt khi đổi sang hệ nhị phân có dấu, các buớc thực hiện như sau:
Biểu diễn dưới dạng nhị phân của trị tuyệt đối n theo mẫu k bit cố định cho trước.
Nếu n < 0 thì bắt đầu từ phải qua trái giữ nguyên các bit cho đến khi gặp bit có giá trị là 1
đầu tiên, sau đó các bit tiếp theo bên trái bit 1 đầu tiên đó đổi 1 thành 0 và ngược lại.
Ví dụ:
Cho n = -6 thì biểu diễn nhị phân của trị tuyệt đối của n cho mẫu 4 bit là 0110
khi đó biểu diễn của số bù 2 cho -6 là 1010
Biểu diễn số bù 2 qua mẫu 4 bit
9
Đại Học Sư Phạm Khoa Tin Học
Mẫu bit Giá trị được biểu diễn
0111 7
0110 6
0101 5
0100 4
0011 3
0010 2
0001 1
0000 0
1111 -1
1110 -2
1101 -3
1100 -4
1011 -5
1010 -6
1001 -7
1000 -8
** Thực chất số biểu diễn dưới dạng bù 2 là số biểu diễn ở bù 1 sau đó ta cộng thêm 1.
Ví dụ:
Số -6 có biểu diễn bù 1 là 1001 nếu ta lấy số bù 1 này cộng thêm 1 thì kết quả là
1001 + 1 = 1010 đây chính là dạng bù 2
Hình vẽ sau sẽ minh hoạ biểu diễn số bù 2 cho số -6:
nếu biểu diễn nhị phân của 6 là 0 1 1 0
thì biểu diễn số bù 1 của -6 sẽ là 1 0 0 1
cộng thêm 1 + 1
thì biểu diễn số bù 2 của -6 sẽ là = 1 0 1 0
d. Phép cộng khi số được biểu diễn ở bù 1 và bù 2
- Ðối với số dạng bù 1 khi thực hiện phép cộng ta vẫn thực hiện như phép toán tương
ứng trên hệ nhị phân, nếu ở 2 bit cực trái khi thực hiện phép cộng mà phát sinh bit nhớ thì
sẽ cộng nhớ vào kết quả.
Ví dụ 1:
-6 biểu diễn ở bù 1 với mẫu 4 bit là 1001
4 biểu diễn ở bù 1 với mẫu 4 bit là 0100
Kết quả phép cộng ở dạng bù 1 là 1101 (là biểu diễn của -2 ở bù 1)
10
Đại Học Sư Phạm Khoa Tin Học
Ví dụ 2:
-6 biểu diễn ở bù 1 với mẫu 5 bit là 11001
-4 biểu diễn ở bù 1 với mẫu 5 bit là 11011
Kết quả phép cộng ở dạng bù 1 là 10100 và còn nhớ 1 khi cộng 2 bit cực trái khi
đó kết quả sẽ là 10100 + 1 = 10101 là biểu diễn của số -10 ở dạng bù 1.
- Ðối với bù 2 ta vẫn thực hiện như phép cộng nhị phân, nhưng nếu ở 2 bit cực trái
phát sinh bit nhớ thì bỏ.
Ví dụ 1:
-6 biểu diễn ở bù 2 với mẫu 4 bit là 1010
4 biểu diễn ở bù 2 với mẫu 4 bit là 0100
Kết quả phép cộng ở dạng bù 2 là 1110 (là biểu diễn của -2 ở bù 2)
Ví dụ 2:
-6 biểu diễn ở bù 2 với mẫu 5 bit là 11010
-4 biểu diễn ở bù 2 với mẫu 5 bit là 11100
Kết quả phép cộng ở dạng bùø 2 là 10110 và còn nhớ 1 khi cộng 2 bit cực trái
nhưng ta bỏ nhớ này và kết quả là 10110 là biểu diễn của -10
5.3.4 Lỗi tràn số
Trong các ví dụ trên bạn đọc chắc cũng thắc mắc tại sao ở ví dụ 2 trong phép cộng
số bù 2 ta lại dùng mẫu 5 bit chứ không là 4 bit? Ý nghĩa của lỗi tràn số đã giới thiệu ở
các các phần trước, đó là hiện tượng xảy ra khi số cần biểu diễn vượt quá số bit cho trước
để biểu diễn nó.
Ví dụ:
nếu ở ví dụ 2 ta dùng mẫu 4 bit cho biểu diễn bù 2 cho -6 và -4, khi đó bài toán
được thực hiện như sau:
-6 biểu diễn ở bù 2 với mẫu 4 bit là 1010
-4 biểu diễn ở bù 2 với mẫu 4 bit là 1100
Kết quả phép cộng ở dạng bù 1 là 0110 là biểu diễn của +6, do đó kết quả bị sai.
Nguyên nhân là do ta lấy số lượng bit để biểu diễn quá ít nên xảy ra lỗi tràn số.
Do đó người sử dụng máy tính phải lường trước được tình huống này khi muốn lưu trữ
dữ liệu, để khắc phục ta tăng số lượng bit nhiều hơn thì sẽ không gây hiện tượng tràn. Ví
dụ với mẫu 32 bit thì giá trị dương lớn nhất là 2147483647.
⊕ Tổng quát ta có số ở phép biểu diễn bù 1 và bù 2 thì giá trị dương lớn nhất cho phép
khi dùng mẫu n bit là: 2
n-1
-1 và giá trị âm nhỏ nhất là -2
n-1
6. Giải bài toán trên máy tính
6.1 Thuật toán
Thuật toán là một khái niệm cơ sở của Toán học và Tin học. Hiểu một cách đơn
giản, thuật toán là một tập các hướng dẫn nhằm thực hiện một công việc nào đó. Ðối với
việc giải quyết một vấn đề - bài toán thì thuật toán có thể hiểu là một tập hữu hạn các
hướng dẫn rõ ràng để người giải toán có thể theo đó mà giải quyết được vấn đề. Như
vậy, thuật toán là một phương pháp thể hiện lời giải của vấn đề - bài toán.
Việc nghiên cứu về thuật toán có vai trò rất quan trọng trong khoa học máy tính vì
máy tính chỉ giải quyết được vấn đề khi đã có hướng dẫn giải rõ ràng và đúng. Nếu
hướng dẫn giải sai hoặc không rõ ràng thì máy tính không thể giải đúng được bài toán.
Trong khoa học máy tính, thuật toán được định nghĩa là một dãy hữu hạn các bước không
11
Đại Học Sư Phạm Khoa Tin Học
mập mờ và có thể thực thi được, quá trình hành động theo các bước này phải dừng và
cho được kết quả như mong muốn.
Số bước hữu hạn của thuật toán và tính chất dừng của nó được gọi chung là tính
hữu hạn. Số bước hữu hạn của thuật toán là một tính chất khá hiển nhiên. Ta có thể tìm ở
đâu một lời giải vấn đề - bài toán có vô số bước giải ? Tính "không mập mờ" và "có thể
thực thi được" gọi chung là tính xác định.
Giả sử khi nhận một lớp học mới, Ban Giám hiệu yêu cầu giáo viên chủ nhiệm
chọn lớp trưởng mới theo các bước sau:
1. Lập danh sách tất các học sinh trong lớp.
2. Sắp thứ tự danh sách học sinh.
3. Chọn học sinh đứng đầu danh sách để làm lớp trưởng.
Khi nhận được thông báo này, giáo viên chắc chắn sẽ rất bối rối vì không hiểu là
trong danh sách học sinh cần có những thông tin gì? Danh sách chỉ cần họ tên, hay cần
thêm ngày tháng năm sinh? Có cần thêm điểm trung bình không? Yêu cầu 2 lại càng gây
nhiều thắc mắc. Cần phải sắp xếp danh sách theo chiều tăng dần hoặc giảm dần ? Sắp
theo chỉ tiêu gì? Theo tên, theo ngày tháng năm sinh hay theo điểm trung bình chung, ...
Giả sử sắp theo điểm trung bình thì nếu có hai học sinh cùng điểm trung bình thì học sinh
nào sẽ sắp trước, học sinh nào sẽ sắp sau ? ...
Hướng dẫn ở trên vi phạm tính chất "không mập mờ" của thuật toán. Nghĩa là, có
quá nhiều thông tin còn thiếu để làm cho các bước 1,2 được hiểu đúng và hiểu theo một
nghĩa duy nhất. Nếu sửa lại một chút ít thì hướng dẫn trên sẽ trở nên rõ ràng hơn rất nhiều
và có thể gọi là một thuật toán chọn lớp trưởng !
1. Lập danh sách tất các học sinh trong lớp theo hai thông tin: Họ và Tên; Ðiểm
trung bình cuối năm.
2. Sắp hạng học sinh theo điểm trung bình theo thứ tự giảm dần (từ điểm cao đến
điểm thấp). Hai học sinh có cùng điểm trung bình sẽ có cùng hạng.
3. Nếu chỉ có một học sinh có hạng nhất thì chọn học sinh đó làm lớp trưởng.
Trường hợp có nhiều học sinh đồng hạng nhất thì chọn học sinh có điểm môn Toán cao
nhất làm lớp trưởng.
Nếu vẫn còn nhiều hơn một học sinh đồng hạng nhất và có cùng điểm môn Toán
cao nhất thì tiến hành bốc thăm.
Ở đây chúng ta cần phân biệt mập mờ và sự chọn lựa có quyết định. Mập mờ là
thiếu thông tin hoặc có nhiều chọn lựa nhưng không đủ điều kiện để quyết định. Còn chọn
lựa có quyết định là hoàn toàn xác định duy nhất trong điều kiện cụ thể của vấn đề.
Chẳng hạn trong vấn đề chọn lớp trưởng ở trên, bước 3 thể hiện một sự lựa chọn có quyết
định. Tất nhiên, khi chưa lập danh sách, chưa xếp hạng theo điểm trung bình thì giáo viên
không thể biết được sẽ chọn lớp trưởng theo cách nào. Nhưng khi đã sắp xong danh sách
thì chỉ có một phương án chọn duy nhất.
Tính "thực thi được" cũng là một tính chất khá hiển nhiên. Rõ ràng nếu trong
"thuật toán" tồn tại một bước không thể thực thi được thì làm sao ta có được kết quả đúng
như ý muốn? Tuy nhiên, cần phải hiểu là "thực thi được" xét trong điều kiện hiện tại của
bài toán. Chẳng hạn, khi nói "lấy căn bậc hai của một số âm" là không thể thực thi được
nếu miền xác định của bài toán là số thực, nhưng trong miền số phức thì thao tác "lấy căn
bậc hai của một số âm" là hoàn toàn thực thi được. Tương tự, nếu ta chỉ đường cho một
người đi xe máy đến một bưu điện nhưng con đường ta chỉ là đường cụt, đường cấm hoặc
đường ngược chiều thì người đi không thể đi đến bưu điện được.
Tính "dừng" là tính chất dễ bị vi phạm nhất, thường là do sai sót khi trình bày
thuật toán. Dĩ nhiên, mọi thuật toán đều nhằm thực hiện một công việc nào đó nên sau
một thời gian thi hành hữu hạn thì thuật toán phải cho chúng ta kết quả mong muốn. Khi
không thỏa tính chất này, ta nói rằng "thuật toán" bị lặp vô tận hoặc bị quẩn. Ðể tính tổng
các số nguyên dương lẻ trong khoảng từ 1 đến n ta có thuật toán sau:
12
Đại Học Sư Phạm Khoa Tin Học
B1. Hỏi giá trị của n.
B2. S = 0
B3. i = 1
B4. Nếu i = n+1 thì sang bước B8, ngược lại sang bước B5
B5. Cộng thêm i vào S
B6. Cộng thêm 2 vào i
B7. Quay lại bước B4.
B8. Tổng cần tìm chính là S.
Ta chú ý đến bước B4. Ở đây ta muốn kết thúc thuật toán khi giá trị của i vượt
quá n. Thay vì viết là "nếu i lớn hơn n" thì ta thay bằng điều kiện "nếu i bằng n+1" vì theo
toán học" i = n+1" thì suy ra "i lớn hơn n". Nhưng điều kiện "i=n+1" không phải lúc nào
cũng đạt được. Vì ban đầu i = 1 là số lẻ, sau mỗi bước, i được tăng thêm 2 nên i luôn là số
lẻ. Nếu n là số chẵn thì n+1 là một số lẻ nên sau một số bước nhất định, i sẽ bằng n+1.
Tuy nhiên, nếu n là một số lẻ thì n+1 là một số chẵn, do i là số lẻ nên dù có qua bao nhiêu
bước đi chăng nữa, i vẫn khác n+1. Trong trường hợp đó, thuật toán trên sẽ bị quẩn.
Tính "đúng" là một tính chất khá hiển nhiên nhưng là tính chất khó đạt tới nhất.
Thực vậy, khi giải quyết một vấn đề-bài toán, ta luôn luôn mong muốn lời giải của mình
sẽ cho kết quả đúng nhưng không phải lúc nào cũng đạt được. Mọi học sinh khi làm bài
kiểm tra đều muốn bài làm của mình có đáp số đúng nhưng trên thực tế, trong lớp học chỉ
có một số học sinh nhất định là có khả năng đưa ra lời giải đúng!
Bên cạnh 3 đặc trưng chính là xác định, hữu hạn và đúng, thuật toán còn có thêm
3 đặc trưng phụ khác.
1. Ðầu vào và đầu ra (input/output): mọi thuật toán, dù có đơn giản đến mấy cũng
phải nhận dữ liệu đầu vào, xử lý nó và cho ra kết quả cuối cùng.
2. Tính hiệu quả (effectiveness): tính hiệu quả của thuật toán được đánh giá dựa
trên một số tiêu chuẩn như khối lượng tính toán, không gian và thời gian khi thuật toán
được thi hành. Tính hiệu quả của thuật toán là một yếu tố quyết định để đánh giá, chọn
lựa cách giải quyết vấn đề-bài toán trên thực tế. Có rất nhiều phương pháp để đánh giá
tính hiệu quả của thuật toán. Trong mục 3 của chương , ta sẽ tìm hiểu một tiêu chuẩn
được dùng rộng rãi là độ phức tạp của thuật toán.
3. Tính tổng quát (generalliness): thuật toán có tính tổng quát là thuật toán phải áp
dụng được cho mọi trường hợp của bài toán chứ không phải chỉ áp dụng được cho một số
trường hợp riêng lẻ nào đó. Chẳng hạn giải phương trình bậc hai sau đây bằng Delta đảm
bảo được tính chất này vì nó luôn giải được với mọi giá trị số thực a,b,c bất kỳ. Tuy
nhiên, không phải thuật toán nào cũng đảm bảo được tính tổng quát. Trong thực tế, có lúc
người ta chỉ xây dựng thuật toán cho một dạng đặc trưng của bài toán mà thôi.
6.1.1 Thuật toán giải phương trình bậc hai ax2 + bx + c = 0
1. Yêu cầu cho biết giá trị của 3 hệ số a, b, c
2. Nếu a = 0 thì
1. Yêu cầu đầu vào không đảm bảo.
2. Kết thúc thuật toán.
3. Trường hợp a khác 0 thì
3.1. Tính giá trị D = b
2
-4ac
3.2. Nếu D > 0 thì
3.2.1. Phương trình có hai nghiệm phân biệt x
1
và x
2
3.2.2. Giá trị của hai nghiệm được tính theo công thức sau
a
b
x
2
1
∆+−
=
a
b
x
2
1
∆−−
=
3.2.3. Kết thúc thuật toán.
13
Đại Học Sư Phạm Khoa Tin Học
3.3. Nếu D = 0 thì
3.3.1. Phương trình có nghiệm kép x
0
3.3.2. Giá trị của nghiệm kép là
a
b
x
2
0
−
=
3.3.3. Kết thúc thuật toán
3.4. Nếu D < 0 thì
3.4.1. Phương trình vô nghiệm.
3.4.2. Kết thúc thuật toán.
6.1.2 Thuật toán tìm hộp có trọng lượng nặng nhất
Vấn đề: Có n hộp có khối lượng khác nhau và một cái cân dĩa. Hãy chỉ ra cách cân để
tìm được hộp có trọng lượng nặng nhất. Vấn đề này là thể hiện của một bài toán tổng
quát: Cho một tập hợp A hữu hạn và một thứ tự toàn phần trên A. Hãy xây dựng thuật
toán tìm phần tử lớn nhất của A. Bài toán trong toán học có vẻ rất phức tạp nhưng một
thể hiện trên thực tế lại rất dễ hiểu, và cách giải quyết cũng đơn giản. Từ đó ta có thể dễ
dàng suy ra cách giải bài toán tổng quát.
Giải thuật
1. Nếu chỉ có 1 hộp (n=1) thì
1.1. Hộp đó chính là hộp nặng nhất.
1.2. Kết thúc thuật toán.
2. Ngược lại nếu có từ hai hộp trở lên (n>1)
2.1. Chọn hai hộp bất kỳ và đặt lên bàn cân.
2.2. Giữ lại hộp nặng hơn, cất hộp nhẹ hơn sang chỗ khác.
3. Nếu còn hộp chưa được cân thực hiện các bước sau, nếu không còn hộp nào
nữa, sang bước 5.
3.1. Chọn một hộp bất kỳ và để lên dĩa cân còn trống.
3.2. Giữ lại hộp nặng hơn, cất hộp nhẹ hơn sang chỗ khác.
4. Trở lại bước 3.
5. Hộp còn lại trên cân chính là hộp nặng nhất. Kết thúc.
6.1.3 Thuật toán Euclid tìm ước số chung lớn nhất
Bài toán:Cho hai số nguyên dương a và b. Tìm ước số chung lớn nhất của a và b.
Giải thuật:
1. Yêu cầu cho biết giá trị của a, b.
2. a
0
= a
3. b
0
= b
4. i = 0
5. Nếu a
i
khác b
i
thì thực hiện các thao tác sau, ngược lại qua bước 7.
5.1 Tăng i lên 1
5.2. Nếu a
i-1
> b
i-1
thì
a
i
= a
i-1
- b
i-1
b
i
= b
i-1
5.3. Ngược lại
b
i
= b
i-1
- a
i-1
a
i
= a
i-1
6. Trở lại bước 5
7. Ước số chung lớn nhất của a, b là a
i
14
Đại Học Sư Phạm Khoa Tin Học
6.2 Các phương pháp biểu diễn thuật toán
Khi chứng minh hoặc giải một bài toán trong toán học, ta thường dùng những ngôn từ
toán học như: "ta có", "điều phải chứng minh", "giả thuyết", ... và sử dụng những phép
suy luận toán học như phép suy ra, tương đương, ...Thuật toán là một phương pháp thể
hiện lời giải bài toán nên cũng phải tuân theo một số quy tắc nhất định. Ðể có thể truyền
đạt thuật toán cho người khác hay chuyển thuật toán thành chương trình máy tính, ta phải
có phương pháp biểu diễn thuật toán. Có 3 phương pháp biểu diễn thuật toán:
6.2.1 Ngôn ngữ tự nhiên
Trong cách biểu diễn thuật toán theo ngôn ngữ tự nhiên, người ta sử dụng ngôn ngữ
thường ngày để liệt kê các bước của thuật toán (Các ví dụ về thuật toán trong mục 1 của
chương sử dụng ngôn ngữ tự nhiên). Phương pháp biểu diễn này không yêu cầu người
viết thuật toán cũng như người đọc thuật toán phải nắm các quy tắc. Tuy vậy, cách biểu
diễn này thường dài dòng, không thể hiện rõ cấu trúc của thuật toán, đôi lúc gây hiểu lầm
hoặc khó hiểu cho người đọc. Gần như không có một quy tắc cố định nào trong việc thể
hiện thuật toán bằng ngôn ngữ tự nhiên. Tuy vậy, để dễ đọc, ta nên viết các bước con lùi
vào bên phải và đánh số bước theo quy tắc phân cấp như 1, 1.1, 1.1.1, ... Bạn có thể tham
khảo lại ba ví dụ trong mục 1 của chương để hiểu cách biểu diễn thuật toán theo ngôn ngữ
tự nhiên.
6.2.2 Lưu đồ - sơ đồ khối
Lưu đồ hay sơ đồ khối là một công cụ trực quan để diễn đạt các thuật toán. Biểu diễn
thuật toán bằng lưu đồ sẽ giúp người đọc theo dõi được sự phân cấp các trường hợp và
quá trình xử lý của thuật toán. Phương pháp lưu đồ thường được dùng trong những thuật
toán có tính rắc rối, khó theo dõi được quá trình xử lý.
Ðể biểu diễn thuật toán theo sơ đồ khối, ta phải phân biệt hai loại thao tác. Một thao tác là
thao tác chọn lựa dựa theo một điều kiện nào đó. Chẳng hạn: thao tác "nếu a = b thì thực
hiện thao tác B2, ngược lại thực hiện B4" là thao tác chọn lựa. Các thao tác còn lại không
thuộc loại chọn lựa được xếp vào loại hành động. Chẳng hạn, "Chọn một hộp bất kỳ và
để lên dĩa cân còn trống." là một thao tác thuộc loại hành động.
a. Thao tác chọn lựa (decision)
Thao tác chọn lựa được biểu diễn bằng một hình thoi, bên trong chứa biểu thức điều kiện.
b. Thao tác xử lý (process)
Thao tác xử lý được biểu diễn bằng một hình chữ nhật, bên trong chứa nội dung xử lý.
c. Ðường đi (route)
Khi dùng ngôn ngữ tự nhiên, ta mặc định hiểu rằng quá trình thực hiện sẽ lần lượt đi từ
bước trước đến bước sau (trừ khi có yêu cầu nhảy sang bước khác). Trong ngôn ngữ lưu
đồ, do thể hiện các bước bằng hình vẽ và có thể đặt các hình vẽ này ở vị trí bất kỳ nên ta
phải có phương pháp để thể hiện trình tự thực hiện các thao tác.
Hai bước kế tiếp nhau được nối bằng một cung, trên cung có mũi tên để chỉ hướng thực
hiện. Chẳng hạn trong hình dưới, trình tự thực hiện sẽ là B1, B2, B3.
15
a = b ∆ >
0
Tăng i lên 1 Chọn một hộp bất kỳ
Đại Học Sư Phạm Khoa Tin Học
Từ thao tác chọn lựa có thể có đến hai hướng đi, một hướng ứng với điều kiện
thỏa và một hướng ứng với điều kiện không thỏa. Do vậy, ta dùng hai cung xuất phát từ
các đỉnh hình thoi, trên mỗi cung có ký hiệu Ð/Ðúng/Y/Yes để chỉ hướng đi ứng với điều
kiện thỏa và ký hiệu S/Sai/N/No để chỉ hướng đi ứng với điều kiện không thỏa.
d. Ðiểm cuối (terminator)
Ðiểm cuối là điểm khởi đầu và kết thúc của thuật toán, được biểu diễn bằng hình ovan,
bên trong có ghi chữ bắt đầu/start/begin hoặc kết thúc/end. Ðiểm cuối chỉ có cung đi ra
16
Bước 1 Bước 2
Bước 3
∆ >
0
S
∆ =
0
Đ
Có 2 nghiệm
phân biệt x
1
, x
2
∆ >
0
S
∆ =
0
Đ
Có 2 nghiệm
phân biệt x
1
, x
2
∆ = b
2
– 4ac
Nhập a, b, c
Bắt đầu
S
Có nghiệm
kép x
0
Đ
Vô nghiệm
a
b
x
2
2,1
∆−±
=
a
b
x
2
0
−
=
Kết thúc
Hình 2.9: Lưu đồ thuật
toán giải phương trình bậc
2. Đường chấm ứng với
đường đi khi a = 1, b = 2, c
= 1 (Nghiệm kép)
Đại Học Sư Phạm Khoa Tin Học
(điểm khởi đầu) hoặc cung đi vào (điểm kết thúc). Xem lưu đồ thuật toán giải phương
trình bậc hai ở trên để thấy cách sử dụng của điểm cuối.
e. Ðiểm nối (connector)
Ðiểm nối được dùng để nối các phần khác nhau của một lưu đồ lại với nhau. Bên trong
điểm nối, ta đặt một ký hiệu để biết sự liên hệ giữa các điểm nối.
f. Ðiểm nối sang trang (off-page connector)
Tương tự như điểm nối, nhưng điểm nối sang trang được dùng khi lưu đồ quá lớn, phải
vẽ trên nhiều trang. Bên trong điểm nối sang trang ta cũng đặt một ký hiệu để biết được
sự liên hệ giữa điểm nối của các trang.
Ở trên chỉ là các ký hiệu cơ bản và thường được dùng nhất. Trong thực tế, lưu đồ còn có
nhiều ký hiệu khác nhưng thường chỉ dùng trong những lưu đồ lớn và phức tạp. Ðối với
các thuật toán trong cuốn sách này, ta chỉ cần sử dụng các ký hiệu trên là đủ.
17
S < a + b
S
S >
0
Đ
1
S
Đ
1
S < a + b
S
S >
0
Đ
S
Đ
#1
#1
Đại Học Sư Phạm Khoa Tin Học
6.2.3 Mã giả
Tuy sơ đồ khối thể hiện rõ quá trình xử lý và sự phân cấp các trường hợp của thuật toán
nhưng lại cồng kềnh. Ðể mô tả một thuật toán nhỏ ta phải dùng một không gian rất lớn.
Hơn nữa, lưu đồ chỉ phân biệt hai thao tác là rẽ nhánh (chọn lựa có điều kiện) và xử lý mà
trong thực tế, các thuật toán còn có thêm các thao tác lặp (Chúng ta sẽ tìm hiểu về thao
tác lặp trong các bài sau).
Khi thể hiện thuật toán bằng mã giả, ta sẽ vay mượn các cú pháp của một ngôn ngữ lập
trình nào đó để thể hiện thuật toán. Tất nhiên, mọi ngôn ngữ lập trình đều có những thao
tác cơ bản là xử lý, rẽ nhánh và lặp. Dùng mã giả vừa tận dụng được các khái niệm trong
ngôn ngữ lập trình, vừa giúp người cài đặt dễ dàng nắm bắt nội dung thuật toán. Tất nhiên
là trong mã giả ta vẫn dùng một phần ngôn ngữ tự nhiên. Một khi đã vay mượn cú pháp
và khái niệm của ngôn ngữ lập trình thì chắc chắn mã giả sẽ bị phụ thuộc vào ngôn ngữ
lập trình đó. Chính vì lý do này, chúng ta chưa vội tìm hiểu về mã giả trong bài này (vì
chúng ta chưa biết gì về ngôn ngữ lập trình!). Sau khi tìm hiểu xong bài về thủ tục - hàm
bạn sẽ hiểu mã giả là gì !
* Một đoạn mã giả của thuật toán giải phương trình bậc hai
if Delta > 0 then begin
x
1
=(-b-sqrt(delta))/(2*a)
x
2
=(-b+sqrt(delta))/(2*a)
xuất kết quả: phương trình có hai nghiệm là x
1
và x
2
end
else
if delta = 0 then
xuất kết quả: phương trình có nghiệm kép là -b/(2*a)
else {trường hợp delta < 0 }
xuất kết quả: phương trình vô nghiệm
6.3 Độ phức tạp của thuật toán
Một chương trình máy tính thường được cài đặt dựa trên một thuật toán đúng để giải
quyết bài toán hay vấn đề. Tuy nhiên, ngay cả khi thuật toán đúng, chương trình vẫn có
thể không sử dụng được đối với một dữ liệu đầu vào nào đó vì thời gian để cho ra kết quả
là quá lâu hoặc sử dụng quá nhiều bộ nhớ (vượt quá khả năng đáp ứng của máy tính).
Khi tiến hành phân tích thuật toán nghĩa là chúng ta tìm ra một đánh giá về thời
gian và "không gian" cần thiết để thực hiện thuật toán. Không gian ở đây được hiểu là các
yêu cầu về bộ nhớ, thiết bị lưu trữ, ... của máy tính để thuật toán có thể làm việc. Việc
xem xét về không gian của thuật toán phụ thuộc phần lớn vào cách tổ chức dữ liệu của
thuật toán. Trong phần này, khi nói đến độ phức tạp của thuật toán, chúng ta chỉ đề cập
đến những đánh giá về mặt thời gian mà thôi.
Phân tích thuật toán là một công việc rất khó khăn, đòi hỏi phải có những hiểu
biết sâu sắc về thuật toán và nhiều kiến thức toán học khác. Ðây là công việc mà không
phải bất cứ người nào cũng làm được. Rất may mắn là các nhà toán học đã phân tích cho
chúng ta độ phức tạp của hầu hết các thuật toán cơ sở (sắp xếp, tìm kiếm, các thuật toán
số học, ...). Chính vì vậy, nhiệm vụ còn lại của chúng ta là hiểu được các khái niệm liên
quan đến độ phức tạp của thuật toán.
Ðánh giá về thời gian của thuật toán không phải là xác định thời gian tuyệt đối
(chạy thuật toán mất bao nhiêu giây, bao nhiêu phút,...) để thực hiện thuật toán mà là xác
định mối liên quan giữa dữ liệu đầu vào (input) của thuật toán và chi phí (số thao tác, số
phép tính cộng,trừ, nhân, chia, rút căn,...) để thực hiện thuật toán. Sở dĩ người ta không
quan tâm đến thời gian tuyệt đối của thuật toán vì yếu tố này phụ thuộc vào tốc độ của
máy tính, mà các máy tính khác nhau thì có tốc độ rất khác nhau. Một cách tổng quát, chi
phí thực hiện thuật toán là một hàm số phụ thuộc vào dữ liệu đầu vào:
18
Đại Học Sư Phạm Khoa Tin Học
T = f(input)
Tuy vậy, khi phân tích thuật toán, người ta thường chỉ chú ý đến mối liên quan
giữa độ lớn của dữ liệu đầu vào và chi phí. Trong các thuật toán, độ lớn của dữ liệu đầu
vào thường được thể hiện bằng một con số nguyên n. Chẳng hạn: sắp xếp n con số
nguyên, tìm con số lớn nhất trong n số, tính điểm trung bình của n học sinh, ... Lúc này,
người ta thể hiện chi phí thực hiện thuật toán bằng một hàm số phụ thuộc vào n:
T = f(n)
Việc xây dựng một hàm T tổng quát như trên trong mọi trường hợp của thuật toán
là một việc rất khó khăn, nhiều lúc không thể thực hiện được. Chính vì vậy mà người ta
chỉ xây dựng hàm T cho một số trường hợp đáng chú ý nhất của thuật toán, thường là
trường hợp tốt nhất và xấu nhất.
Chúng ta trở lại ví dụ về thuật toán tìm hộp nặng nhất trong n hộp cho trước,
nhưng lần này ta làm việc trên một thể hiện khác của vấn đề. Ðây là một thuật toán tương
đối đơn giản nên chúng ta có thể tiến hành phân tích được độ phức tạp. Trước khi phân
tích độ phức tạp, ta nhắc lại đôi điều về thuật toán này.
Xét bài toán: Tìm số lớn nhất trong một dãy số
a. Bài toán: Cho một dãy số a có n phần tử a
1
, a
2
, ...a
n
. Hãy xây dựng thuật toán để
tìm con số lớn nhất trong dãy a.
b. Nhận xét
1. Nếu dãy chỉ có 1 phần tử thì phần tử đó là số lớn nhất.
2. Giả sử dãy có n phần tử và ta đã xác định được phần tử lớn nhất là amax .
Nếu bổ sung thêm phần tử thứ an+1 vào dãy mà an+1 > amax thì an+1 chính
là phần tử lớn nhất của dãy có n+1 phần tử. Trường hợp ngược lại, nghĩa là
an+1 £ amax thì amax vẫn là phần tử lớn nhất của dãy có n+1 phần tử.
c. Thuật toán
1. Ghi nhớ a
max
= a
1
.
2. i = 2.
3. Nếu (i £ n) thì thực hiện các bước sau, ngược lại sang bước 5.
3.1. Nếu (a
i
> a
max
) thì
3.1.1. Ghi nhớ a
max
= a
i
3.2. Tăng i lên 1
4. Trở lại bước 3
5. Phần tử lớn nhất dãy a chính là amax.Kết thúc.
Trong thuật toán trên, để đơn giản, ta chỉ xem chi phí là số lần so sánh ở bước 3.1
và số lần "ghi nhớ" trong bước 3.1.1. Trường hợp tốt nhất của thuật toán này xảy ra khi
con số lớn nhất nằm đầu dãy (a
max
= a
1
); trường hợp xấu nhất xảy ra khi con số lớn nhất
nằm ở cuối dãy (a
max
=a
n
) và dãy được sắp xếp theo thứ tự tăng dần.
19
Đại Học Sư Phạm Khoa Tin Học
Dựa theo sơ đồ khối của thuật toán, ta nhận thấy rằng, trong mọi trường hợp của
bài toán, phép "ghi nhớ" ở bước 3.1 luôn được thực hiện và số lần thực hiện là n-1 (ứng
với việc xét từ phần tử a
2
đến a
n
). Ta gọi đây là chi phí cố định hoặc bất biến của thuật
toán.
* Trường hợp tốt nhất: do a
max
= a
1
suy ra, với mọi i ³ 2, a
i
< a
max
. Do đó, điều kiện
a
i
>a
max
ở bước 3.1 luôn không thỏa nên bước 3.1.1 không bao giờ được thực hiện. Như
vậy, chi phí chung cho trường hợp này chính là chi phí cố định của bài toán.
T = f(n) = n-1
* Trường hợp xấu nhất:
Ta có: với mọi i > 1, a
i
-1 < a
i
(do định nghĩa dãy được sắp xếp tăng dần) nên điều
kiện a
i
>a
max
ở bước 3.1 luôn thỏa, bước 3.1.1 luôn được thực hiện. Như vậy, ngoài chi phí
chung là n-1 phép so sánh, ta cần phải dùng thêm n-1 phép "ghi nhớ" ở bước 3.1.1. Như
vậy, tổng chi phí của trường hợp này là : T = f(n) = 2(n-1)=2n-2
Ðịnh nghĩa: Cho hai hàm f và g có miền xác định trong tập số tự nhiên. Ta viết
f(n) = O(g(n)) và nói f(n) có cấp cao nhất là g(n) khi tồn tại hằng số C và k sao cho:
|f(n)| ≤ C.|g(n)| với mọi n > k
Tuy chi phí của thuật toán trong trường hợp tốt nhất và xấu nhất có thể nói lên
nhiều điều nhưng vẫn chưa đưa ra được một hình dung tốt nhất về độ phức tạp của thuật
toán. Ðể có thể hình dung chính xác về độ phức tạp của thuật toán, ta xét đến một yếu tố
khác là độ tăng của chi phí khi độ lớn n của dữ liệu đầu vào tăng.
Theo định nghĩa ở trên, ta nhận thấy chi phí thấp nhất và lớn nhất của thuật toán
tìm số lớn nhất đều bị chặn bởi O(n) (tồn tại hằng số C = 10, k = 1 để 2n - 2 < 10n với
mọi n > 1).
Một cách tổng quát, nếu hàm chi phí của thuật toán (xét trong một trường hợp nào
đó) bị chặn bởi O(f(n)) thì ta nói rằng thuật toán có độ phức tạp là O(f(n)) trong trường
hợp đó.
20
i <=
n
S
i = 2
Ghi nhớ a
max
= a
1
Bắt đầu
Ghi nhớ a
max
= a
i
Đ
Kết thúc
a
max
là phần tử
lớn nhất
a
i
> a
max
Đ
S
Tăng i lên 1
Lưu đồ thuật toán tìm phần tử lớn nhất
Đại Học Sư Phạm Khoa Tin Học
Như vậy, thuật toán tìm số lớn nhất có độ phức tạp trong trường hợp tốt nhất và
xấu nhất đều là O(n). Người ta gọi các thuật toán có độ phức tạp O(n) là các thuật toán có
độ phức tạp tuyến tính.
Sau đây là một số "thước đo" độ phức tạp của thuật toán được sử dụng rộng rãi.
Các độ phức tạp được sắp xếp theo thứ tự tăng dần. Nghĩa là một bài toán có độ phức tạp
O(nk) sẽ phức tạp hơn bài toán có độ phức tạp O(n) hoặc O(log
a
n).
Tên gọi Ký hiệu
Độ phức tạp hằng O(C)
Độ phức tạp logarit O(log
a
n)
Độ phức tạp nlogn O(n.log
a
n)
Độ phức tạp đa thức O(n
k
)
Độ phức tạp luỹ thừa O(a
n
)
Độ phức tạp giai thừa O(n!)
6.4 Phân loại bài toán
Ðộ phức tạp của thuật toán chính là yếu tố cơ sở để phân loại vấn đề-bài toán. Một
cách tổng quát, mọi bài toán đều có thể chia làm 2 lớp lớn là: giải được và không giải
được. Lớp giải được chia làm 2 lớp con. Lớp con đầu tiên là các bài toán có độ phức tạp
đa thức: nghĩa là bài toán có thể giải được bằng thuật toán có độ phức tạp đa thức (hay
nói ngắn gọn: lớp đa thức) được xem là có lời giải thực tế. Lớp con thứ hai là những bài
toán có độ phức tạp không phải là đa thức mà lời giải của nó được xem là thực tế chỉ cho
những số liệu đầu vào có chọn lựa cẩn thận và tương đối nhỏ. Cuối cùng là những bài
toán thuộc loại NP chưa thể phân loại một cách chính xác là thuộc lớp bài toán có độ
phức tạp đa thức hay có độ phức tạp không đa thức.
6.4.1 Lớp bài toán có độ phức tạp đa thức
Các bài toán thuộc lớp này có độ phức tạp là O(n
k
) hoặc nhỏ hơn O(n
k
). Chẳng hạn như
các bài toán có độ phức tạp là O(nlog
2
n) được xem là các bài toán thuộc lớp đa thức vì
nlog
2
n bị chặn bởi n
2
( nlog
2
n ≤ n
2
với mọi n > 0). Như vậy các bài toán có độ phức tạp
hằng O(1), phức tạp tuyến tính O(n) và logarit O(nlog
a
n) đều là các bài toán thuộc lớp đa
thức. Còn các bài toán có độ phức tạp lũy thừa O(a
n
) hoặc giai thừa O(n!) là không thuộc
lớp đa thức.
Tuy độ phức tạp chỉ là số đo về độ tăng của chi phí ứng với độ tăng của dữ liệu
đầu vào nhưng nó cũng cho chúng ta có một đánh giá tương đối về thời gian thi hành
thuật toán. Các thuật toán thuộc lớp đa thức được xem là các bài toán có lời giải thực tế.
Lời giải thực tế được hiểu rằng là chi phí về mặt thời gian và không gian cho việc giải bài
toán là chấp nhận được trong điều kiện hiện tại. Bất kỳ một bài toán nào không thuộc lớp
này thì đều có chi phí rất lớn.
Có thể giải được hay không?
Người ta đã ước tính thời gian cần thiết để giải một mật mã được mã hóa bằng
khóa 128-bit là trên 1 triệu năm với điều kiện làm việc trên các siêu máy tính mạnh nhất
hiện nay!
Chính vì lý do này, một bài toán được xem là có thể giải được trên thực tế hay
không phụ thuộc vào độ phức tạp của bài toán đó có phải là đa thức hay không.
6.4.2 Lớp bài toán có độ phức tạp không đa thức
Thật không may mắn, nhiều bài toán thực sự có lời giải lại không thuộc lớp của
bài toán đa thức. Ví dụ: cho một tập hợp có n phần tử, hãy liệt kê tất cả các tập con khác
trống của tập hợp này. Bằng toán học, người ta đã chứng minh được rằng số tập con của
21
Đại Học Sư Phạm Khoa Tin Học
một tập hợp có n phần tử là 2
n-1
. Lời giải tuy đã có nhưng khi thể hiện lời giải này bằng
bất kỳ thuật toán nào thì phải tốn ít nhất 2
n-1
bước. Dễ thấy rằng độ phức tạp của bài toán
này cũng cỡ O(2
n
). Như vậy bài toán này không thuộc lớp của bài toán đa thức. Với n vào
khoảng 16, số bước cần thiết chỉ khoảng vài chục ngàn là hoàn toàn giải được trên các
máy tính hiện nay. Nhưng khi số phần tử lên đến 32 thì ta đã tốn một số bước lên đến 4
tỷ, chỉ thêm một phần tử nữa thôi, chúng ta đã tốn 8 tỷ bước! Với số lượng bước như vậy,
dù chạy trên một siêu máy tính cũng phải tốn một thời gian đáng kể! Các bài toán không
thuộc lớp đa thức chỉ giải được với một độ lớn dữ liệu đầu vào nhất định.
6.4.3 Lớp bài toán NP
Chúng ta đều biết rằng tính xác định là một trong ba đặc tính quan trọng của thuật
toán. Nghĩa là mỗi bước của thuật toán phải được xác định duy nhất và có thể thực thi
được. Nếu có sự phân chia trường hợp tại một bước thì thông tin tại bước đó phải đầy đủ
để thuật toán có thể tự quyết định chọn lựa trường hợp nào. Trong mục 4.3 này, ta tạm gọi
các thuật toán thỏa mãn tính xác định là các thuật toán tự quyết.
Vậy thì điều gì sẽ xảy ra nếu ta đưa ra một "thuật toán" có tính không tự quyết?
Nghĩa là tại một bước của "thuật toán", ta đưa ra một số trường hợp chọn lựa nhưng
không cung cấp đầy đủ thông tin để "thuật toán" tự quyết định? Thật ra, trong cuộc sống,
những "thuật toán" thuộc loại này rất hay được áp dụng. Chẳng hạn ta có một lời chỉ dẫn
khi đi du lịch: "Khi đi hết khu vườn này, bạn hãy chọn một con đường mà bạn cảm thấy
thích. Tất cả đều dẫn đến bảo tàng lịch sử.". Nếu là khách du lịch, bạn sẽ cảm thấy bình
thường. Nhưng máy tính thì không! Nó không thể thực thi những hướng dẫn không rõ
ràng như vậy!
Ðến đây, lập tức sẽ có một câu hỏi rằng "Tại sao lại đề cập đến những thuật toán
có tính không tự quyết dù máy tính không thể thực hiện một thuật toán như vậy?". Câu trả
lời là, khi nghiên cứu về thuật toán không tự quyết, dù không dùng để giải bài toán nào đi
nữa, chúng ta sẽ có những hiểu biết về hạn chế của những thuật toán tự quyết thông
thường.
Ðến đây, ta hãy xem sự khác biệt về độ phức tạp của một thuật toán tự quyết và
không tự quyết để giải quyết cho cùng một vấn đề.
* Xét bài toán người bán hàng
Một nhân viên phân phối hàng cho một công ty được giao nhiệm vụ phải giao
hàng cho các đại lý của công ty, sau đó trở về công ty. Vấn đề của người nhân viên là làm
sao đi giao hàng cho tất cả đại lý mà không tiêu quá số tiền đổ xăng mà công ty cấp cho
mỗi ngày. Nói một cách khác, làm sao đừng đi quá một số lượng cây số nào đó.
Một lời giải cổ điển cho bài toán này là liệt kê một cách có hệ thống từng con đường có
thể đi, so sánh chiều dài mỗi con đường tìm được với chiều dài giới hạn cho đến lúc tìm
được một con đường phù hợp hoặc đã xét hết tất cả các con đường có thể đi. Tuy nhiên,
cách giải quyết này có độ phức tạp không phải đa thức. Bằng toán học, người ta đã chứng
minh được rằng độ phức tạp của thuật toán này là O(n!). Như vậy, với số đại lý lớn thì
thuật toán trên được xem là không thực tế. Bây giờ, chúng ta xem qua một thuật toán
không tự quyết.
1. Chọn một con đường có thể và tính chiều dài của nó.
2. Nếu chiều dài này không lớn hơn giới hạn thì báo là thành công, ngược lại báo
chọn lựa sai.
Quan điểm của ta trong cách giải quyết này là nếu chọn sai thì là do lỗi của người
chọn chứ không phải lỗi của thuật toán!
Theo thuật toán này thì chi phí để tính chiều dài của con đường được chọn sẽ tỷ lệ
với số đại lý; chi phí để so sánh chiều dài quãng đường với giới hạn cho phép thì không
liên quan đến số thành phố. Như vậy, chi phí của thuật toán này là một hàm có dạng T =
22
Đại Học Sư Phạm Khoa Tin Học
an + b với n là số đại lý và a,b là các hằng số. Ta kết luận rằng, độ phức tạp của thuật toán
này là O(n) hay độ phức tạp thuộc lớp đa thức.
Như vậy, nếu dùng thuật toán tự quyết thì bài toán người bán hàng sẽ có độ phức
tạp không thuộc lớp đa thức, còn nếu dùng thuật toán không tự quyết thì bài toán sẽ có độ
phức tạp đa thức.
Ðịnh nghĩa
Một bài toán khi được giải bằng một thuật toán không tự quyết mà có độ phức tạp
thuộc lớp đa thức thì được gọi là một bài toán đa thức không tự quyết hay viết tắt là bài
toán NP.
Theo định nghĩa trên thì bài toán người bán hàng là bài toán thuộc lớp NP.
Cho đến nay người ta chưa chứng minh được rằng tồn tại hay không một thuật
toán tự quyết có độ phức tạp đa thức cho bài toán người bán hàng rong. Vì vậy, bài toán
này (là một bài toán NP) chưa thể xếp được vào lớp đa thức hay không đa thức. Do đó,
lớp bài toán NP chưa thể phân loại là thuộc lớp đa thức hay không.
Dĩ nhiên, lớp bài toán NP cũng chứa những bài toán thuộc lớp đa thức thực sự,
bởi vì nếu một bài toán được giải bằng thuật toán tự quyết có độ phức tạp đa thức thì chắc
chắn khi dùng thuật toán không tự quyết thì cũng sẽ có độ phức tạp đa thức.
Chương 2: CẤU TRÚC MÁY TÍNH
1. Máy tính là gì?
Máy tính Là thiết bị xử lý dữ liệu để có thông tin mong muốn.
Dữ liệu được xử lý theo sơ đồ sau:
Một máy tính tạo nên bởi: Phần cứng (hardware) là các thiết bị vật lý của máy tính và
phần mềm (software) là các chương trình lập sẵn.
Hình sau là hình dáng bên ngoài của một máy vi tính (PC):
23
Nhập dữ liệu vào
Xử lý dữ liệu
theo chương trình lập sẵn
Đưa thông tin ra
Đại Học Sư Phạm Khoa Tin Học
2. Mô hình cấu trúc cơ bản của một máy vi tính
Hình sau là cấu trúc cơ bản của một máy tính, bao gồm các phần chính sau:
- Bộ vi xử lý CPU.
- Thiết bị ngoại vi (Peripheral Devices).
- Bộ nhớ chính (Main Memory).
3. Central Processing Unit (CPU)
3.1. Chức năng
- Điều khiển MT hoạt động theo chương trình
- Xử lý dữ liệu
3.2. Nguyên tắc hoạt động
- Nhận lệnh từ chương trình nằm trong bộ nhớ chính
- Giải mã lệnh
- Thực hiện lệnh tuần tự
3.3. Cấu tạo
Một CPU bao gồm:
- CU – Control Unit: Khối điều khiển.
- ALU – Arithmetic and Logic Unit: Khối tính toán.
- Registers: Tập thanh ghi.
Khối điều khiển (CU - Control Unit): Điều khiển hoạt động của CPU và các thành phần khác:
- Đọc lệnh từ chương trình trong bộ nhớ chính (instruction fetch).
- Giải mã lệnh (instruction decode).
- Thực thi lệnh đã giải mã một cách tuần tự (instruction excution).
Khối tính toán (ALU - Arithmetic Logic Unit): Thực hiện các phép toán số học và logic
- Các phép toán số học: +,-,*,/.
- Các phép toán logic: NOT, AND, OR,…
- Các phép so sánh…
Dữ liệu tính toán là:
- Số nguyên (integer).
- Số dấu phảy tĩnh (fixed point number).
- Số dấu phảy động (floating point number).
Tập thanh ghi (Registers)
24
Đại Học Sư Phạm Khoa Tin Học
Lưu trữ toán hạng, kết quả và các thông số khác trong quá trình tính toán của CPU.
Bao gồm:
- Con trỏ chương trình (PC - Program Counter).
- Các thanh ghi đa chức năng.
- Thanh ghi chỉ số (index register).
- Thanh ghi cờ (flag register).
4. Computer Memory
Bộ nhớ được sử dụng để lưu trữ chương trình, dữ liệu.
Bao gồm:
Bộ nhớ đệm (cache)
Bộ nhớ chính (main memory)
Bộ nhớ ngoài (auxiliary or external memory)
Bộ nhớ nào càng “gần” CPU thì tốc độ và giá thành chế tạo càng cao
4.1. Bộ nhớ chính (main memory)
Chứa chương trình và dữ liệu đang xử lý. Được kết nối và có thể trao đổi dữ liệu trực
tiếp với CPU và được tổ chức thành các ngăn nhớ, đánh địa chỉ trực tiếp bởi CPU
Bao gồm:
- ROM (Read Only Memory): CPU chỉ đọc bộ nhớ này, Rom chứa các chương trình,
dữ liệu cơ bản của máy tính.
- RAM (Random Access Memory): CPU có thể đọc và ghi bộ nhớ này, Ram chứa dữ
liệu, chương trình được nạp, đang thực hiện
4.2. Bộ nhớ đệm (cache)
Đặt giữa CPU là bộ nhớ chính. Có tốc độ rất cao và dung lượng nhỏ
Mục đích: Tăng tốc độ trao đổi thông tin giữa CPU và RAM
Được chia thành nhiều mức:
- Cache L1 (Level 1)
- Cache L2
Càng gần CPU thì tốc độ càng cao
Ví dụ: CPU Intel Petium III 256KB Cache
5. Computer Bus
Tập hợp các đường dây kết nối các thành phần của máy tính lại với nhau
Độ rộng bus: số lượng dây có khả năng vận chuyển thông tin đồng thời (dùng cho bus
địa chỉ và dữ liệu)
Bao gồm:
- Bus địa chỉ (address bus): Vận chuyển địa chỉ từ CPU đến mô-đun nhớ (bộ nhớ trong
được tạo bởi nhiều mô-đun).
- Bus dữ liệu (data bus) vận chuyển các lệnh từ bộ nhớ tới CPU và dữ liệu giữa các
thành phần.
- Bus điều khiển (control bus): vận chuyển tín hiệu điều khiển (đọc, ghi, ngắt,…)
25