Chương 7. Giải thuật xử lý thông
tin và ngôn ngữ lập trình
Học phần: LẬP TRÌNH CƠ BẢN
Tài liệu tham khảo
2
Giáo trình tin học cơ sở, Hồ Sỹ Đàm, Đào Kiến Quốc, Hồ
Đắc Phương. Đại học Sư phạm, 2004 – Chương 7, 9.
Giải thuật xử lý thông tin và ngơn ngữ lập trình
NỘI DUNG
Khái niệm bài toán và giải thuật
Đặc trưng (yêu cầu) của giải thuật
Các phương pháp diễn đạt giải thuật
Sơ lược về đánh giá giải thuật
Ngơn ngữ lập trình và các mức khác nhau của ngơn ngữ
lập trình
3
Q trình thực hiện chương trình trên ngơn ngữ bậc cao
Giải thuật xử lý thơng tin và ngơn ngữ lập trình
Input
u cầu
KHÁI NIỆM BÀI TỐN
Output
Cho số tự
nhiên n
n có phải số
ngun tố hay
khơng
“có” hay
“khơng”
Cho hồ sơ
điểm sinh viên
Tìm tất cả các sinh
viên có điểm trung
bình trên 8
Danh sách sv
thoả mãn
Thiết kế hình
học, tải trọng
Tính sức bền
Độ bền
Cho một bài tốn nghĩa là cho input,
và u cầu để tìm (tính) ra output
4
Giải thuật xử lý thông tin và ngôn ngữ lập trình
KHÁI NIỆM THUẬT TỐN
Thuật tốn (algorithm) là một q trình gồm một dãy hữu hạn các thao
tác có thể thực hiện được sắp xếp theo một trình tự xác định dùng để
giải một bài tốn
Ví dụ : thuật tốn Euclid tìm ước số chung lớn nhất của hai số tự
nhiên. Thay vì phải tính tốn theo định nghĩa chỉ làm rõ cấu trúc của
USCLN (tích của các ước số chung với số mũ nhỏ nhất) thuật toán
Euclid dựa trên các tính chất sau:
5
USCLN(a,b) = USCLN (b,a))
Nếu a> b, USCLN(a,b) = USCLN (a-b,b)
USCLN(a,a)= a
Giải thuật xử lý thông tin và ngôn ngữ lập trình
THUẬT TỐN EUCLID
TIM USCLN CỦA HAI SỐ TỰ NHIÊN
Bài tốn: Cho hai số m, n tìm d = USCLN(m,n)
1.
Bước 1: Kiểm tra nếu m= n thì về bước 5, nếu khơng thực hiện tiếp
bước 2
2.
Bước 2: Nếu m> n thì về bước 4 nếu không thực hiện tiếp bước 3
3.
Bước 3: m
4.
Bước 4: bớt m đi một lượng bằng n và quay về bước 1
5.
Bước 5: Lấy d chính là giá trị chung của m và n. Kết thúc
6
Giải thuật xử lý thông tin và ngôn ngữ lập trình
VÍ DỤ CÁC BƯỚC CỦA THUẬT TỐN EUCLID
m n
15 21
15 6
m
m>n
9
6
m>n
3
3
6
3
m
m=n
USCLN(15,21) = 3
7
Giải thuật xử lý thông tin và ngôn ngữ lập trình
CÁC ĐẶC TRƯNG CỦA THUẬT TỐN
Input
Output
Tính xác định: Sau mỗi bước, bước tiếp theo hồn tồn xác định.
Tính khả thi: các chỉ dẫn đặt ra đều có thể thực hiện được
Tính dừng: q trình tính tốn ln phải dừng sau một số hữu hạn bước.
Tính phổ dụng: mỗi thuật tốn khơng chỉ dùng cho một bài tốn với dữ
liệu cụ thể mà có thể áp dụng với một lớp các bài tốn cùng kiểu. Chẳng
hạn người ta nói tới thuật tốn tìm USCLN của hai số tự nhiên bất kỳ chứ
khơng phải thuật tốn tìm USCLN của 15 và 21.
8
Giải thuật xử lý thơng tin và ngơn ngữ lập trình
CÁC PHƯƠNG PHÁP BIỂU DIỄN THUẬT TỐN
Dùng ngơn ngữ tự nhiên
Dùng sơ đồ khối
Dùng mã giả (pseudo-code)
9
Giải thuật xử lý thơng tin và ngơn ngữ lập trình
CÁC PHƯƠNG PHÁP BIỂU DIỄN THUẬT TỐN
Ví dụ
Thuật tốn giải PT bậc nhất: ax + b = 0
(a, b là các số thực).
Đầu vào: a, b thuộc R
Đầu ra: nghiệm phương trình ax + b = 0
Tư duy:
• Nếu a = 0
• b = 0 thì phương trình có nghiệm bất kì.
• b ≠ 0 thì phương trình vơ nghiệm.
• Nếu a ≠ 0
• Phương trình có nghiệm duy nhất x = -b/a
Biểu diễn thuật toán: Sử dụng ngôn
ngữ tự nhiên
Đầu
Đầu
1.
2.
vào: a, b thuộc R
ra: nghiệm phương trình ax + b = 0
Nhập 2 số thực a và b.
Nếu a = 0 thì
2.1. Nếu b = 0 thì
2.1.1. Phương trình vơ số nghiệm
2.1.2. Kết thúc thuật tốn.
2.2. Ngược lại
2.2.1. Phương trình vơ nghiệm.
2.2.2. Kết thúc thuật tốn.
3. Ngược lại
3.1. Phương trình có nghiệm.
3.2. Giá trị của nghiệm đó là x = -b/a
3.3. Kết thúc thuật toán.
Sử dụng lưu đồ - sơ đồ khối
Khối giới hạn
Chỉ thị bắt đầu và kết thúc.
Khối vào ra
Nhập/Xuất dữ liệu.
Khối lựa chọn
Tùy điều kiện sẽ rẽ nhánh.
Khối thao tác
Ghi thao tác cần thực hiện.
Đường đi
Chỉ hướng thao tác tiếp theo.
Sử dụng lưu đồ - sơ đồ khối
Bắt đầu
Đọc a,b
Đ
Đ
Xuất
“VSN”
b=0
a=0
S
S
Tính
x = -b/a
Xuất
“VN”
Kết thúc
Xuất x
Sử dụng mã giả
Vay mượn ngơn ngữ nào đó (ví dụ Pascal) để biểu diễn
thuật toán.
Đầu vào: a, b thuộc R
Đầu ra: nghiệm phương trình ax + b = 0
If a = 0 Then
Begin
If b = 0 Then
Xuất “Phương trình vơ số nghiệm”
Else
Xuất “Phương trình vơ nghiệm”
End
Else
Xuất “Phương trình có nghiệm x = -b/a”
Cài đặt thuật toán bằng C/C++
#include <stdio.h>
#include <conio.h>
void main()
{
int a, b;
printf(“Nhap a, b: ”);
scanf(“%d%d”, &a, &b);
if (a == 0)
if (b == 0)
printf(“Phương trình VSN”);
else
printf(“Phương trình VN”);
else
printf(“x = %.2f”, -float(b)/a);
}
Sơ lược về đánh giá giải thuật
Với mỗi bài toán có thể có nhiều thuật tốn khác nhau. Tuy nhiên
hiệu quả của chúng có thể rất khác nhau.
Trong tin học người ta quan tâm nhiều đến độ phức tạp về thời gian:
giải bài tốn đó cần bao nhiêu thời gian, vấn đề này được quy về số
phép tính cơ bản cần được thực hiện
Độ phức tạp không gian: sự tiêu tốn không gian nhớ.
Vấn đề hiệu quả thời gian là vấn đề được nghiên cứu nhiều hơn cả.
16
Giải thuật xử lý thơng tin và ngơn ngữ lập trình
VÍ DỤ HIỆU QUẢ TÌM KIẾM
Ví dụ bài tốn tìm kiếm: cho một dãy n số khác nhau a1,a2...ai... an và
một số x.Hãy cho biết x có trong dãy số đó hay khơng và ở vị trí thứ
bao nhiêu. Thuật tốn tìm kiếm tuần tự như sau:
Bước 1. Cho i = 1
Bước 2. Nếu ai = x thì chuyển tới bước 5, nếu không thực hiện tiếp
bước 3
Bước 3. Tăng i lên 1 và kiểm tra i > n. Nếu đúng về bước 4. Nếu sai
quay về bước 2
Bước 4. Tun bố khơng có số x. Kết thúc
Bước 5. Tun bố số x chính là số thứ i. Kết thúc
Số bước tìm trung bình là n/2. Nếu có 1 triệu phần tử thì phải mất khoảng
500.000 phép so sánh
17
Giải thuật xử lý thơng tin và ngơn ngữ lập trình
HIỆU QUẢ CỦA THUẬT TOÁN
Nếu sắp xếp dãy số theo thứ tự tăng dần có thể tìm bằng thuật tốn tìm kiếm nhị
phân, với tư tưởng thu hẹp dần vùng tìm kiếm
Bước 1. Cho d := 1, c:=n (d: đầu, c: cuối, g: giữa)
Bước 2. Tính g := [(d+c)/2]
Bước 3. So x với ag. Nếu x=ag chuyển tới bước 7. Nếu khác thì tiếp tục thực hiện bước 4
Bước 4. Nếu d=c thì tun bố khơng có số x và kết thúc. Nếu khơng thì thực hiện bước 5 tiếp theo
Bước 5. Nếu x < ag thì thay c bằng ag và quay về bước 2. Nếu khơng thì thực hiện bước 6 tiếp theo
Bước 6. Thay d bằng ag và quay về bước 2
Bước 7. Tuyên bố số x chính là số thứ g. Kết thúc
Cứ mỗi lần khơng tìm được ta lại giảm độ dài vùng tìm kiếm đi hai lần. Số bước tìm trung bình là log 2n.
Nếu có 1 triệu phần tử thì chỉ mất khoảng 20 lần tìm, rất nhỏ so với tìm tuần tự
18
Giải thuật xử lý thơng tin và ngơn ngữ lập trình
Vấn đề cài đặt tḥt toán và ngơn ngữ
lập trình
Ngơn ngữ lập trình (programming language) là ngơn ngữ biểu
diễn thuật tốn dùng để điều khiển máy tính thực hiện các công
việc đã định.
Các quy tắc viết được gọi là cú pháp (syntax) của ngôn ngữ. ý
nghĩa mà ngôn ngữ chuyển tải gọi là ngữ nghĩa (semantic)
Một chương trình máy tính (program)phải được thể hiện trên
một ngôn ngữ xác định. Như vậy một thuật tốn có thể diễn đạt
bằng nhiều chương trình khác nhau trên những ngơn ngữ khác
nhau.
19
Giải thuật xử lý thơng tin và ngơn ngữ lập trình
CÁC MỨC CỦA NGƠN NGỮ LẬP TRÌNH
Ngơn ngữ máy: ngơn ngữ thể hiện trực tiếp trong hệ lệnh của máy. Nói chung
ngơn ngữ máy là ngơn ngữ ở mức các bít, nên cũng được gọi là ngơn ngữ nhị
phân
Hợp ngữ (assembly) là loại ngôn ngữ về cơ bản là gần với ngôn ngữ nhị phân,
mỗi lệnh của ngôn ngữ máy có một lệnh tương ứng của hợp ngữ nhưng hợp
ngữ sử dụng mã chữ
Ngơn ngữ bậc cao – cịn gọi là ngơn ngữ thuật tốn (Algorithmic language) là
ngơn ngữ biểu diễn thuật toán độc lập với hệ lệnh của máy
Mỗi ngôn ngữ xác định một kiểu diễn đạt kịch bản điều khiển máy tính Mỗi
một kịch bản điều khiển máy viết trên một ngơn ngữ lập trình gọi là một
chương trình (program)
20
Giải thuật xử lý thơng tin và ngơn ngữ lập trình
NGƠN NGỮ MÁY
Chính là ngơn ngữ được viết bằng lệnh máy trong hệ nhị phân
hoặc hệ 16
Ưu điểm, tận dụng được khả năng của máy, tối ưu được thời gian
chạy
Nhược điểm: khó viết, khó chữa lỗi, phụ thuộc vào từng loại máy.
Nói chung chi phí cao.
Mã máy nhị phân
Mã hexa
Ý nghĩa
1001 0001 0110 0000 0001 0000
A1 60 10
Nạp 1060 lên TG AX
0000 0011 0110 0110 0001 0000
03 66 10
Cộng AX với 1066 -> AX
Ghi từ AX về 2B00
21
thuật xử lý thơng tinA3
và ngơn
ngữ lập trình
00 2B
1010
0011 0000 0000Giải0010
1011
HỢP NGỮ (ASSEMBLY)
Về cơ bản, mỗi lệnh hợp ngữ tương tự với một lệnh máy – nhưng dùng
mã chữ nên dễ hiểu, dễ sửa.
Phải dịch ra ngôn ngữ máy (thay mã lệnh và địa chỉ)
Có các lệnh macro, cho phép thay thế hiệu quả hơn
Ưu điểm: dễ lập trình dễ sửa lỗi hơn ngơn ngữ máy
Nhược điểm: vẫn cịn phức tạp và phụ thuộc vào máy
Hợp ngữ
22
Mã máy trong hệ hexa
MOV AX CHIEU_DAI
A1 64 10
ADD AX CHIEU_RONG
03 66 10
MOV NUA_CHU_VI AX
A3 00 2B
Giải thuật xử lý thông tin và ngôn ngữ lập trình
DỊCH HỢP NGỮ (ASSEMBLY)
Để máy có thể chạy được thì phải dịch chương trình trên hợp ngữ thành một chương
trình trên ngơn ngữ máy -> nhờ một phần mềm có tên là bộ hợp dịch (assembler)
đầu tiên bộ hợp dịch sẽ phải bố trí khơng gian nhớ cho các đối tượng, sau đó thay
thế mã lệnh và địa chỉ bằng các mã số.
Thay thế được thực hiện với các lệnh macro, là các lệnh tương đương với nhiều
lệnh.
Kết quả của bước dịch đầu tiên là tạo ra các mô đun đối tượng, là các đoạn chương
trình dưới dạng nhị phân nhưng chưa có cấu trúc hồn chỉnh để sẵn sàng chạy ngay.
Thường thực hiện một bước khác là liên kết, để kết hợp nhiều mô đun đối tượng
thành một chương trình nhị phân hồn chỉnh. Sau đó mới nạp chương trình này vào
thi hành
23
Giải thuật xử lý thơng tin và ngơn ngữ lập trình
NGƠN NGỮ BẬC CAO
Ngơn ngữ máy và hợp ngữ phụ thuộc vào máy, lại khó dùng, vì nó buộc
người lập trình phải viết tinh tế đến mức lệnh máy.
Người ta muốn các ngơn ngữ chỉ diễn tả thuật tốn mà thôi, không liên
quan đến các hệ lệnh đặc thù của máy tính cụ thể. Các ngơn ngữ này gọi là
ngơn ngữ bậc cao (high level language) hay còn gọi là ngơn ngữ thuật tốn
(algorithmic language)
Ngơn ngữ thuật tốn có hình thức giống với ngơn ngữ tự nhiên hoặc ngơn
ngữ tốn học nên dễ diễn đạt hơn nhiều so với ngôn ngữ máy hoặc hợp ngữ
24
Giải thuật xử lý thông tin và ngơn ngữ lập trình
VÍ DỤ VỀ NGƠN NGỮ BẬC CAO
Ví dụ giải phương trình
bậc 2 trên PASCAL
DELTA := B*B - 4*A*C;
IF DELTA >= 0 THEN
BEGIN
X1 := (- B + SQRT(DELTA))/
(2*A);
X2 := (- B - SQRT(DELTA))/
(2*A);
WRITE (X1,X2);
END
ELSE
WRITE(‘Vô nghiệm)
25
20
10
40
30
FORTRAN
DELTA = B*B - 4* A*C
IF DELTA < 0 GOTO 10
X1= (- B + SQRT(DELTA))/
(2*A)
X2 =(- B - SQRT(DELTA))/
(2*A)
WRITE (3,20) X1, X2
FORMAT ('NGHIEM 1= ',
F8.3, NGHIEM 2 = ', F8.3)
GOTO 30
WRITE(3,40)
FORMAT('VO NGHIEM')
END
Giải thuật xử lý thông tin và ngơn ngữ lập trình