1
1
TIN HỌC ĐẠI CƯƠNG
TIN HỌC ĐẠI CƯƠNG
PHẦN 1: TIN HỌC CĂN BẢN
PHẦN 1: TIN HỌC CĂN BẢN
Chương 02: Biểu diễn dữ liệu trong máy tính
Chương 02: Biểu diễn dữ liệu trong máy tính
KHOA
KHOA
C¤NG NGHÖ
C¤NG NGHÖ
TH¤NG TIN
TH¤NG TIN
FACULTY OF
FACULTY OF
INFORMATION TECHNOLOGY
INFORMATION TECHNOLOGY
2
2
Nguyễn Thị Thu Trang, SE-FIT-HUT
Nguyễn Thị Thu Trang, SE-FIT-HUT
Chương 02:
Chương 02:
Biểu diễn dữ liệu trong máy tính
Biểu diễn dữ liệu trong máy tính
2.1. Biểu diễn dữ liệu trong máy tính,
2.1. Biểu diễn dữ liệu trong máy tính,
đơn vị thông tin
đơn vị thông tin
2.2.
2.2.
Biểu diễn số trong các hệ đếm
Biểu diễn số trong các hệ đếm
2.3. Biểu diễn số nguyên
2.3. Biểu diễn số nguyên
2.4. Tính toán số học với số nguyên
2.4. Tính toán số học với số nguyên
2.5. Tính toán logic với số nhị phân
2.5. Tính toán logic với số nhị phân
2.6. Biểu diễn ký tự
2.6. Biểu diễn ký tự
2.7. Biểu diễn số thực
2.7. Biểu diễn số thực
3
3
Nguyễn Thị Thu Trang, SE-FIT-HUT
Nguyễn Thị Thu Trang, SE-FIT-HUT
Chương 02:
Chương 02:
Biểu diễn dữ liệu trong máy tính
Biểu diễn dữ liệu trong máy tính
2.1. Biểu diễn dữ liệu trong máy tính,
2.1. Biểu diễn dữ liệu trong máy tính,
đơn vị thông tin
đơn vị thông tin
2.2.
2.2.
Biểu diễn số trong các hệ đếm
Biểu diễn số trong các hệ đếm
2.3. Biểu diễn số nguyên
2.3. Biểu diễn số nguyên
2.4. Tính toán số học với số nguyên
2.4. Tính toán số học với số nguyên
2.5. Tính toán logic với số nhị phân
2.5. Tính toán logic với số nhị phân
2.6. Biểu diễn ký tự
2.6. Biểu diễn ký tự
2.7. Biểu diễn số thực
2.7. Biểu diễn số thực
4
4
Nguyễn Thị Thu Trang, SE-FIT-HUT
Nguyễn Thị Thu Trang, SE-FIT-HUT
2.1.1. Mã hóa dữ liệu cho máy tính
2.1.1. Mã hóa dữ liệu cho máy tính
Mọi dữ liệu khi đưa vào máy tính đều phải được mã hóa thành số nhị phân
Mọi dữ liệu khi đưa vào máy tính đều phải được mã hóa thành số nhị phân
Các loại dữ liệu:
Các loại dữ liệu:
Dữ liệu nhân tạo: Do con người quy ước
Dữ liệu nhân tạo: Do con người quy ước
Dữ liệu tự nhiên:
Dữ liệu tự nhiên:
Tồn tại khách quan với con người.
Tồn tại khách quan với con người.
Phổ biến là các tín hiệu vật lý như âm thanh, hình
Phổ biến là các tín hiệu vật lý như âm thanh, hình
ảnh,…
ảnh,…
5
5
Nguyễn Thị Thu Trang, SE-FIT-HUT
Nguyễn Thị Thu Trang, SE-FIT-HUT
Nguyên tắc mã hóa dữ liệu
Nguyên tắc mã hóa dữ liệu
Mã hóa dữ liệu nhân tạo:
Mã hóa dữ liệu nhân tạo:
Dữ liệu số: Mã hóa theo các chuẩn quy ước
Dữ liệu số: Mã hóa theo các chuẩn quy ước
Dữ liệu ký tự: Mã hóa theo bộ mã ký tự
Dữ liệu ký tự: Mã hóa theo bộ mã ký tự
Mã hóa dữ liệu tự nhiên:
Mã hóa dữ liệu tự nhiên:
Các dữ liệu cần phải số hóa trước khi đưa vào máy
Các dữ liệu cần phải số hóa trước khi đưa vào máy
tính
tính
Theo sơ đồ mã hóa và tái tạo tín hiệu vật lý
Theo sơ đồ mã hóa và tái tạo tín hiệu vật lý
6
6
Nguyễn Thị Thu Trang, SE-FIT-HUT
Nguyễn Thị Thu Trang, SE-FIT-HUT
Sơ đồ mã hóa và tái tạo tín hiệu vật lý
Sơ đồ mã hóa và tái tạo tín hiệu vật lý
7
7
Nguyễn Thị Thu Trang, SE-FIT-HUT
Nguyễn Thị Thu Trang, SE-FIT-HUT
2.1.2. Dữ liệu trong máy tính
2.1.2. Dữ liệu trong máy tính
Có 2 loại dữ liệu trong máy tính:
Có 2 loại dữ liệu trong máy tính:
Dữ liệu cơ bản
Dữ liệu cơ bản
Dữ liệu có cấu trúc
Dữ liệu có cấu trúc
8
8
Nguyễn Thị Thu Trang, SE-FIT-HUT
Nguyễn Thị Thu Trang, SE-FIT-HUT
a. Dữ liệu cơ bản
a. Dữ liệu cơ bản
Dữ liệu số nguyên:
Dữ liệu số nguyên:
Số nguyên không dấu: Biểu diễn theo mã nhị phân
Số nguyên không dấu: Biểu diễn theo mã nhị phân
thông thường.
thông thường.
Số nguyên có dấu: Biểu diễn dưới dạng mã bù hai.
Số nguyên có dấu: Biểu diễn dưới dạng mã bù hai.
Dữ liệu số thực: Được biểu diễn bằng số dấu chấm động.
Dữ liệu số thực: Được biểu diễn bằng số dấu chấm động.
Dữ liệu ký tự: Được biểu diễn bằng mã ký tự dựa trên các bộ mã ký tự.
Dữ liệu ký tự: Được biểu diễn bằng mã ký tự dựa trên các bộ mã ký tự.
9
9
Nguyễn Thị Thu Trang, SE-FIT-HUT
Nguyễn Thị Thu Trang, SE-FIT-HUT
b. Dữ liệu có cấu trúc
b. Dữ liệu có cấu trúc
Là tập hợp các loại dữ liệu cơ bản được cấu thành theo một cách nào đó.
Là tập hợp các loại dữ liệu cơ bản được cấu thành theo một cách nào đó.
Ví dụ: kiểu dữ liệu mảng, xâu ký tự, tập hợp, bản ghi,…
Ví dụ: kiểu dữ liệu mảng, xâu ký tự, tập hợp, bản ghi,…
10
10
Nguyễn Thị Thu Trang, SE-FIT-HUT
Nguyễn Thị Thu Trang, SE-FIT-HUT
2.1.3. Đơn vị đo thông tin
2.1.3. Đơn vị đo thông tin
Bit (BInary digiT): Là đơn vị thông tin nhỏ nhất, nhận 1 trong 2 giá trị nhị phân là 0
Bit (BInary digiT): Là đơn vị thông tin nhỏ nhất, nhận 1 trong 2 giá trị nhị phân là 0
hoặc 1
hoặc 1
Byte: Chuỗi 8 bit
Byte: Chuỗi 8 bit
Kilobyte (KB), 1KB = 2
Kilobyte (KB), 1KB = 2
10
10
Byte = 1024 Byte
Byte = 1024 Byte
Megabyte (MB), 1MB = 2
Megabyte (MB), 1MB = 2
10
10
KB = 2
KB = 2
20
20
Byte
Byte
= 1,048,576 Byte
= 1,048,576 Byte
Gigabyte (GB), 1GB = 2
Gigabyte (GB), 1GB = 2
10
10
MB = 2
MB = 2
30
30
Byte
Byte
Terabyte (TB), 1TB = 2
Terabyte (TB), 1TB = 2
10
10
GB = 2
GB = 2
40
40
Byte
Byte
Petabyte (PB), 1PB = 2
Petabyte (PB), 1PB = 2
10
10
TB = 2
TB = 2
50
50
Byte
Byte
Exabyte (EB), 1EB = 2
Exabyte (EB), 1EB = 2
10
10
PB = 2
PB = 2
60
60
Byte
Byte
11
11
Nguyễn Thị Thu Trang, SE-FIT-HUT
Nguyễn Thị Thu Trang, SE-FIT-HUT
Chương 02:
Chương 02:
Biểu diễn dữ liệu trong máy tính
Biểu diễn dữ liệu trong máy tính
2.1. Biểu diễn dữ liệu trong máy tính,
2.1. Biểu diễn dữ liệu trong máy tính,
đơn vị thông tin
đơn vị thông tin
2.2. H
2.2. H
ệ đếm
ệ đếm
2.3. Biểu diễn số nguyên
2.3. Biểu diễn số nguyên
2.4. Tính toán số học với số nguyên
2.4. Tính toán số học với số nguyên
2.5. Tính toán logic với số nhị phân
2.5. Tính toán logic với số nhị phân
2.6. Biểu diễn ký tự
2.6. Biểu diễn ký tự
2.7. Biểu diễn số thực
2.7. Biểu diễn số thực
12
12
Nguyễn Thị Thu Trang, SE-FIT-HUT
Nguyễn Thị Thu Trang, SE-FIT-HUT
2.2.
2.2.
Hệ đếm
Hệ đếm
Hệ đếm
Hệ đếm
:
:
Là tập hợp các ký hiệu và qui tắc sử dụng tập ký
Là tập hợp các ký hiệu và qui tắc sử dụng tập ký
hiệu đó để biểu diễn và xác định giá trị các số.
hiệu đó để biểu diễn và xác định giá trị các số.
Mỗi hệ đếm có một số ký tự/số (ký số) hữu hạn.
Mỗi hệ đếm có một số ký tự/số (ký số) hữu hạn.
Tổng số ký số của mỗi hệ đếm được gọi là
Tổng số ký số của mỗi hệ đếm được gọi là
cơ số
cơ số
(base hay radix), ký hiệu là b (b
(base hay radix), ký hiệu là b (b
≥
≥
2).
2).
Ví dụ: Trong hệ đếm cơ số 10, dùng 10 ký tự là:
Ví dụ: Trong hệ đếm cơ số 10, dùng 10 ký tự là:
các chữ số từ 0 đến 9.
các chữ số từ 0 đến 9.
Về mặt toán học, ta có thể biểu diễn 1 số theo hệ
Về mặt toán học, ta có thể biểu diễn 1 số theo hệ
đếm cơ số bất kì.
đếm cơ số bất kì.
13
13
Nguyễn Thị Thu Trang, SE-FIT-HUT
Nguyễn Thị Thu Trang, SE-FIT-HUT
2.2.
2.2.
Hệ đếm (tiếp)
Hệ đếm (tiếp)
Khi nghiên cứu về máy tính, ta quan tâm đến các hệ đếm sau đây:
Khi nghiên cứu về máy tính, ta quan tâm đến các hệ đếm sau đây:
Hệ thập phân (Decimal System)
Hệ thập phân (Decimal System)
→
→
Con người sử dụng
Con người sử dụng
Hệ nhị phân (Binary System)
Hệ nhị phân (Binary System)
→
→
Máy tính sử dụng
Máy tính sử dụng
Hệ đếm bát phân (Octal System)
Hệ đếm bát phân (Octal System)
→
→
Dùng để viết gọn số nhị phân.
Dùng để viết gọn số nhị phân.
Hệ mười sáu (Hexadecimal System)
Hệ mười sáu (Hexadecimal System)
→
→
Dùng để viết gọn cho số nhị phân (thường
Dùng để viết gọn cho số nhị phân (thường
dùng hơn hệ bát phân)
dùng hơn hệ bát phân)
14
14
Nguyễn Thị Thu Trang, SE-FIT-HUT
Nguyễn Thị Thu Trang, SE-FIT-HUT
2.2.1. Hệ đếm thập phân
2.2.1. Hệ đếm thập phân
(Decimal system, b=10)
(Decimal system, b=10)
Hệ đếm thập phân hay hệ đếm cơ số 10 bao gồm 10 ký số theo ký hiệu sau:
Hệ đếm thập phân hay hệ đếm cơ số 10 bao gồm 10 ký số theo ký hiệu sau:
0, 1, 2, 3, 4, 5, 6, 7, 8, 9
0, 1, 2, 3, 4, 5, 6, 7, 8, 9
Dùng n chữ số thập phân có thể biểu diễn được 10
Dùng n chữ số thập phân có thể biểu diễn được 10
n
n
giá trị khác nhau:
giá trị khác nhau:
00 000 = 0
00 000 = 0
99 999 = 10
99 999 = 10
n
n
- 1
- 1
15
15
Nguyễn Thị Thu Trang, SE-FIT-HUT
Nguyễn Thị Thu Trang, SE-FIT-HUT
2.2.1. Hệ đếm thập phân (tiếp)
2.2.1. Hệ đếm thập phân (tiếp)
Giả sử một số A được biểu diễn dưới dạng:
Giả sử một số A được biểu diễn dưới dạng:
A: a
A: a
n
n
a
a
n-1
n-1
… a
… a
1
1
a
a
0
0
.
.
a
a
-1
-1
a
a
-2
-2
… a
… a
-m
-m
→
→
Giá trị của A được hiểu như sau:
Giá trị của A được hiểu như sau:
16
16
Nguyễn Thị Thu Trang, SE-FIT-HUT
Nguyễn Thị Thu Trang, SE-FIT-HUT
2.2.1. Hệ đếm thập phân (tiếp)
2.2.1. Hệ đếm thập phân (tiếp)
Ví dụ: Số 5246 có giá trị được tính như sau:
Ví dụ: Số 5246 có giá trị được tính như sau:
5246
5246
(10)
(10)
: 5 x 10
: 5 x 10
3
3
+ 2 x 10
+ 2 x 10
2
2
+ 4 x 10
+ 4 x 10
1
1
+ 6 x 10
+ 6 x 10
0
0
Ví dụ: Số 254.68 có giá trị được tính như sau:
Ví dụ: Số 254.68 có giá trị được tính như sau:
254.68
254.68
(10)
(10)
: 2 x 10
: 2 x 10
2
2
+ 5 x 10
+ 5 x 10
1
1
+ 4 x 10
+ 4 x 10
0
0
+ 6 x 10
+ 6 x 10
-1
-1
+ 8 x 10
+ 8 x 10
-2
-2
17
17
Nguyễn Thị Thu Trang, SE-FIT-HUT
Nguyễn Thị Thu Trang, SE-FIT-HUT
2.2.2. Hệ đếm cơ số b
2.2.2. Hệ đếm cơ số b
Hệ đếm cơ số b (với b ≥ 2,nguyên) mang tính chất sau :
Hệ đếm cơ số b (với b ≥ 2,nguyên) mang tính chất sau :
Có b ký tự để thể hiện giá trị số.
Có b ký tự để thể hiện giá trị số.
Ký số nhỏ nhất là
Ký số nhỏ nhất là
0
0
và lớn nhất là
và lớn nhất là
b-1
b-1
.
.
Số N(b) trong hệ đếm cơ số b) được biểu diễn bởi:
Số N(b) trong hệ đếm cơ số b) được biểu diễn bởi:
N
N
(b)
(b)
: a
: a
n
n
a
a
n-1
n-1
a
a
n-2…
n-2…
a
a
1
1
a
a
0
0
.a
.a
-1
-1
a
a
-2
-2
…a
…a
-m
-m
Giá trị ở hệ 10:
Giá trị ở hệ 10:
18
18
Nguyễn Thị Thu Trang, SE-FIT-HUT
Nguyễn Thị Thu Trang, SE-FIT-HUT
2.2.3. Hệ đếm nhị phân
2.2.3. Hệ đếm nhị phân
(Binary system, b=2)
(Binary system, b=2)
Sử dụng 2 ký số: 0, 1
Sử dụng 2 ký số: 0, 1
Chữ số nhị phân gọi là
Chữ số nhị phân gọi là
BIT
BIT
(
(
BI
BI
nary digi
nary digi
T)
T)
Ví dụ: Bit 0, bit 1
Ví dụ: Bit 0, bit 1
Bit là đơn vị thông tin nhỏ nhất
Bit là đơn vị thông tin nhỏ nhất
Dùng n bit có thể biểu diễn được 2
Dùng n bit có thể biểu diễn được 2
n
n
giá trị khác nhau:
giá trị khác nhau:
00 000 = 0 (trong hệ thập phân)
00 000 = 0 (trong hệ thập phân)
11 111 = 2
11 111 = 2
n
n
- 1 (trong hệ thập phân)
- 1 (trong hệ thập phân)
VD: Dùng 3 chữ số thì biểu diễn được các số từ 0 đến
VD: Dùng 3 chữ số thì biểu diễn được các số từ 0 đến
7 (trong hệ thập phân).
7 (trong hệ thập phân).
19
19
Nguyễn Thị Thu Trang, SE-FIT-HUT
Nguyễn Thị Thu Trang, SE-FIT-HUT
2.2.3. Hệ đếm nhị phân (tiếp)
2.2.3. Hệ đếm nhị phân (tiếp)
Giả sử có số A được biểu diễn theo hệ nhị phân như sau:
Giả sử có số A được biểu diễn theo hệ nhị phân như sau:
A:
A:
a
a
n
n
a
a
n-1
n-1
… a
… a
1
1
a
a
0
0
.
.
a
a
-1
-1
a
a
-2
-2
… a
… a
-m
-m
Với a
Với a
i
i
là các chữ số nhị phân, khi đó giá trị của A là:
là các chữ số nhị phân, khi đó giá trị của A là:
20
20
Nguyễn Thị Thu Trang, SE-FIT-HUT
Nguyễn Thị Thu Trang, SE-FIT-HUT
2.2.3. Hệ đếm nhị phân (tiếp)
2.2.3. Hệ đếm nhị phân (tiếp)
Ví dụ: Số nhị phân 1101001.1011 có giá trị được xác định như sau:
Ví dụ: Số nhị phân 1101001.1011 có giá trị được xác định như sau:
1101001.1011
1101001.1011
(2)
(2)
= 2
= 2
6
6
+ 2
+ 2
5
5
+ 2
+ 2
3
3
+ 2
+ 2
0
0
+ 2
+ 2
-1
-1
+ 2
+ 2
-3
-3
+ 2
+ 2
-4
-4
= 64 + 32 + 8 + 1 + 0.5 + 0.125 + 0.0625
= 64 + 32 + 8 + 1 + 0.5 + 0.125 + 0.0625
= 105.6875
= 105.6875
(10)
(10)
21
21
Nguyễn Thị Thu Trang, SE-FIT-HUT
Nguyễn Thị Thu Trang, SE-FIT-HUT
2.2.4. Hệ đếm bát phân
2.2.4. Hệ đếm bát phân
(Octal system, b=8)
(Octal system, b=8)
Sử dụng các chữ số: 0,1,2,3,4,5,6,7
Sử dụng các chữ số: 0,1,2,3,4,5,6,7
Dùng n bit có thể biểu diễn được 8
Dùng n bit có thể biểu diễn được 8
n
n
giá trị khác nhau:
giá trị khác nhau:
00 000 = 0 (trong hệ thập phân)
00 000 = 0 (trong hệ thập phân)
77 777 = 8
77 777 = 8
n
n
-1 (trong hệ thập phân)
-1 (trong hệ thập phân)
22
22
Nguyễn Thị Thu Trang, SE-FIT-HUT
Nguyễn Thị Thu Trang, SE-FIT-HUT
2.2.4. Hệ đếm bát phân (tiếp)
2.2.4. Hệ đếm bát phân (tiếp)
Giả sử có số A được biểu diễn theo hệ nhị phân như sau:
Giả sử có số A được biểu diễn theo hệ nhị phân như sau:
A:
A:
a
a
n
n
a
a
n-1
n-1
… a
… a
1
1
a
a
0
0
.
.
a
a
-1
-1
a
a
-2
-2
… a
… a
-m
-m
Với a
Với a
i
i
là các chữ số trong hệ bát phân, khi đó giá trị của A là:
là các chữ số trong hệ bát phân, khi đó giá trị của A là:
23
23
Nguyễn Thị Thu Trang, SE-FIT-HUT
Nguyễn Thị Thu Trang, SE-FIT-HUT
2.2.4. Hệ đếm bát phân (tiếp)
2.2.4. Hệ đếm bát phân (tiếp)
VD: 235.64
VD: 235.64
(8)
(8)
có giá trị như sau
có giá trị như sau
235. 64
235. 64
(8)
(8)
=
=
2
2
x8
x8
2
2
+
+
3
3
x8
x8
1
1
+
+
5
5
x8
x8
0
0
+
+
6
6
x8
x8
-1
-1
+
+
4
4
x8
x8
-2
-2
= 157. 8125
= 157. 8125
(10)
(10)
24
24
Nguyễn Thị Thu Trang, SE-FIT-HUT
Nguyễn Thị Thu Trang, SE-FIT-HUT
2.2.5. Hệ đếm thập lục phân
2.2.5. Hệ đếm thập lục phân
hệ 16
hệ 16
(
(
Hexa-decimal system, b=16)
Hexa-decimal system, b=16)
Sử dụng 16 ký số:
Sử dụng 16 ký số:
0,1,2,3,4,5,6,7,8,9,A,B,C,D,E,F
0,1,2,3,4,5,6,7,8,9,A,B,C,D,E,F
Các chữ in:
Các chữ in:
A, B, C, D, E, F
A, B, C, D, E, F
biểu diễn các giá trị số
biểu diễn các giá trị số
tương ứng (trong
tương ứng (trong
hệ 10) là: 10, 11, 12, 13, 14, 15.
hệ 10) là: 10, 11, 12, 13, 14, 15.
25
25
Nguyễn Thị Thu Trang, SE-FIT-HUT
Nguyễn Thị Thu Trang, SE-FIT-HUT
2.2.5. Hệ đếm thập lục phân (tiếp)
2.2.5. Hệ đếm thập lục phân (tiếp)
Giả sử có số A được biểu diễn theo hệ nhị phân như sau:
Giả sử có số A được biểu diễn theo hệ nhị phân như sau:
A =
A =
a
a
n
n
a
a
n-1
n-1
… a
… a
1
1
a
a
0
0
.
.
a
a
-1
-1
a
a
-2
-2
… a
… a
-m
-m
Với a
Với a
i
i
là các chữ số trong hệ thập lục phân, khi đó giá trị của A là:
là các chữ số trong hệ thập lục phân, khi đó giá trị của A là: