Midterm test 204 b10 11 hk2 2011 2012

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (283.69 KB, 7 trang )

Trường Đại Học Bách Khoa - Tp. HCM
Khoa Khoa Học & Kỹ Thuật Máy Tính
***
Mã đề: 11

Kiểm tra giữa kỳ
Mơn: Hệ Quản Trị Cơ Sở Dữ Liệu (503004)
Ngành Khoa Học Máy Tính – HK2 – 2011-2012
Thời gian làm bài: 75 phút
(Bài kiểm tra gồm 20 câu hỏi. Sinh viên được tham khảo ghi chú trong 2 tờ giấy A4.)
Sinh viên chọn 1 câu trả lời đúng nhất. Nếu chọn câu (e) thì sinh viên cần trình bày đáp án khác so với đáp án ở
các câu (a), (b), (c), và (d) và/hoặc giải thích lựa chọn (e) của mình.
Câu 1. Đơn vị dữ liệu đọc/ghi giữa bộ nhớ sơ cấp
(primary memory) và bộ nhớ thứ cấp (secondary
memory) là gì?
a. Phần tử/biến dữ liệu (data item/variable)
b. Bản ghi (record)
c. Khối (block)
d. Tập tin (file)
e. Ý kiến khác.
Câu 2. Tập tin có thứ tự (ordered/sequential file)
không hiệu quả cho trường hợp nào sau đây?
a. Thêm mới các bản ghi (record) vào tập tin.
b. Tìm kiếm một bản ghi trong tập tin dựa trên giá trị
của vùng tin sắp thứ tự (ordering field).
c. Truy đạt tất cả các bản ghi theo thứ tự trên vùng
tin sắp thứ tự.
d. Tất cả trường hợp a, b, và c.
e. Ý kiến khác.
Câu 3. Cho kích thước của một khối (block) là B =
512 bytes. Một tập tin gồm 120000 bản ghi (record)

có chiều dài cố định. Mỗi bản ghi gồm các vùng tin
(field) sau: NAME (30 bytes), SSN (9 bytes),
ADDRESS (4 bytes), JOBCODE (4 bytes),
GENDER (1 byte). Hãy cho biết số khối dữ liệu cần
dùng để chứa các bản ghi của tập tin này với cách
phân khối không phủ (unspanned blocking).
a. 120000
b. 12000
c. 1200
d. 120
e. Ý kiến khác.
Câu 4. Đặc điểm nào của kỹ thuật bộ đệm đôi
(double buffering) sau đây không đúng?
a. Kỹ thuật sử dụng 2 bộ đệm để có khơng gian chứa
dữ liệu chuyển từ bộ nhớ thứ cấp vào bộ nhớ sơ cấp
nhiều hơn.

b. Kỹ thuật sử dụng 2 bộ đệm trong trường hợp
đọc/ghi dữ liệu từ những khối liền kề nhau trong bộ
nhớ thứ cấp.
c. Kỹ thuật sử dụng 2 bộ đệm có thể giảm được thời
gian tìm kiếm và độ trễ quay khi dịch chuyển những
khối liền kề nhau trong bộ nhớ thứ cấp.
d. Kỹ thuật sử dụng 2 bộ đệm sẽ chiếm nhiều không
gian hơn trong bộ nhớ sơ cấp nhưng có thể giảm
được thời gian đợi dữ liệu của các chương trình xử
lý.
e. Ý kiến khác.
Câu 5. Cho 1 thiết bị lưu trữ từ hóa thứ cấp có dung
lượng là 4GB = 4*106*1024 bytes. Thiết bị lưu trữ

này gồm 1 chồng đĩa (disk pack) gồm 100 đĩa hai
mặt (double-sided), mỗi mặt đĩa gồm 400 rãnh
(track), kích thước mỗi khối dữ liệu là B = 512 bytes,
giữa 2 khối dữ liệu trên cùng rãnh có khoảng trống
(interblock gap) với kích thước là G = 128 bytes.
Xác định dung lượng hiệu dụng (useful capacity)
của mỗi track trên thiết bị lưu trữ này theo đơn vị
khối (block).
a. 20
b. 40
c. 60
d. 80
e. Ý kiến khác.
Câu 6. Công nghệ lưu trữ RAID (Redundant Arrays
of Inexpensive/Independent Disks) khơng có đặc
điểm nào sau đây?
a. Hỗ trợ song song hóa truy đạt đĩa dùng kỹ thuật
chia vệt dữ liệu (data striping) để cải thiện hiệu suất
(efficiency).
b. Cho phép chia sẻ dữ liệu để giảm tải kiểm tra lỗi
của bộ điều khiển đĩa (disk controller).
c. Hỗ trợ dư thừa dữ liệu (data redundancy) để gia
tăng độ đáng tin cậy (reliability).
1

d. Tùy theo phiên bản RAID khác nhau, khả năng
phát hiện và sửa lỗi có thể được thực hiện cho 0, 1, 2,
hoặc n đĩa hỏng.
e. Ý kiến khác.

Câu 7. Xác định toán tử (operator) được sử dụng
hiệu quả trong điều kiện tìm kiếm (search condition)
trên vùng tin băm (hashing field) của một tập tin.
a. <
b. >
c. =
d. between
e. Ý kiến khác.
Câu 8. Một tập tin có các bản ghi được tổ chức theo
kỹ thuật băm tuyến tính (linear hashing). Giả sử: mỗi
thùng (bucket) gồm 1 khối dữ liệu (block); mỗi khối
dữ liệu chỉ có thể chứa 2 bản ghi (record); kỹ thuật
băm tuyến tính sử dụng hàm băm (hashing function)
là h(K) = K mod 2iM và bắt đầu với i = 0 và M = 1
với M là số thùng ban đầu. Thông tin về các bản ghi
lần lượt được thêm vào tập tin được cho ở Bảng 1.
Xác định đặc điểm của tập tin ngay sau khi thêm bản
ghi có giá trị vùng tin băm là 7115.
a. Thùng #0 được tách thành thùng #0 và thùng #2 và
thùng #1 được tách thành thùng #1 và thùng #3. Bản
ghi 5659 và 7115 được đặt trong thùng #3.
b. Thùng #0 được tách thành thùng #0 và thùng #2 và
thùng #1 được tách thành thùng #1 và thùng #3. Bản
ghi 5659 được phân phối lại vào thùng #3 và bản ghi
7115 được đặt ở vùng tràn của thùng #1.
c. Thùng #0 được tách thành thùng #0 và thùng #2.
Bản ghi 7115 được đặt ở vùng tràn của thùng #1 và
bản ghi 1074 được phân phối lại vào thùng #2.
d. Thùng #0 và thùng #1 được giữ nguyên. Bản ghi
7115 được đặt ở vùng tràn của thùng #1.

e. Ý kiến khác.
Câu 9. Cho cây B+-tree trong Hình 1 dùng cho
việc tạo chỉ mục đa mức của 1 tập tin với p = 4
(nghĩa là, mỗi nút nội có ít nhất 2 con trỏ cây (tree
pointer)) và pleaf = 3 (nghĩa là, mỗi nút lá có ít nhất 2
con trỏ dữ liệu (data pointer)). Xác định số truy đạt
khối cần thực hiện để đọc được bản ghi có giá trị
vùng tin lập chỉ mục là 59.
a. 2
b. 3
c. 4
d. 5
e. Ý kiến khác.

Câu 10. Cho cây B+-tree trong Hình 1 dùng cho
việc tạo chỉ mục đa mức của 1 tập tin với p = 4
(nghĩa là, mỗi nút nội có ít nhất 2 con trỏ cây (tree
pointer)) và pleaf = 3 (nghĩa là, mỗi nút lá có ít nhất 2
con trỏ dữ liệu (data pointer)). Xác định đặc điểm
của cây B+-tree sau khi thêm phần tử 72.
a. Chiều cao, số nút lá, và số nút nội đều không đổi.
b. Chiều cao và số nút nội không đổi, số nút lá tăng
1.
c. Chiều cao và số nút lá tăng 1, số nút nội tăng 2.
d. Chiều cao tăng 1, số nút lá và số nút nội không
đổi.
e. Ý kiến khác.
Câu 11. Cho tập tin có số bản ghi r = 30000 bản ghi,
số lượng khối cần dùng để chứa các bản ghi là b =
10000 blocks. Các bản ghi của tập tin được sắp thứ

tự vật lý theo các giá trị của vùng tin khóa (key field).
Xác định số lượng mục tin chỉ mục (index entry) của
chỉ mục được lập trên vùng tin khóa này.
a. 3
b. 10000
c. 30000
d. Không thể xác định được do thông tin mô tả về chỉ
mục này chưa đầy đủ chi tiết.
e. Ý kiến khác.
Câu 12. Giả sử bậc của cây B+-tree cho các nút nội
là p = 34 và bậc của cây B+-tree cho các nút lá là
pleaf = 31, mỗi nút của cây B+-tree chứa đầy ít nhất
50%. Xác định số bản ghi có thể được chỉ mục khi
số mức (level) của cây B+-tree này là 5 kể cả mức
gốc (root). Lưu ý lấy cận trên khi làm tròn.
a. < 100000
b. >= 100000 và <= 250000
c. >= 250000 và <= 1000000
d. > 1000000
e. Ý kiến khác.
Câu 13. Giả sử bậc của cây B-tree là p = 23, mỗi nút
của cây B-tree chứa đầy ít nhất 50%. Xác định số
mức (level) tối thiểu của cây (kể cả mức gốc (root))
để cây B-tree này có thể chỉ mục được 100000 bản
ghi. Lưu ý lấy cận trên khi làm tròn.
a. 3
b. 4
c. 5
d. 6
e. Ý kiến khác.

2

Câu 14. Cho: vùng đệm (buffer) có thể chứa được 3
khối dữ liệu (buffer size = 3); mỗi khối dữ liệu
(block) chứa được 1 bản ghi (record); một tập tin có
12 bản ghi. Xác định số truy đạt khối (block access)
cần thực hiện khi sắp thứ tự ngoại (external sorting)
các bản ghi của tập tin này.
a. 72
b. 48
c. 24
d. 12
e. Ý kiến khác.
Câu 15. Việc xử lý truy vấn có toán tử gộp
(aggregate operator) và mệnh đề GROUP BY cần
thực hiện phân hoạch các bản ghi (record) của tập tin
vào các nhóm bản ghi trước khi áp dụng hàm gộp
(aggregate function) trên mỗi nhóm. Cách phân
hoạch nào sau đây có thể có được thực hiện?
a. Sắp thứ tự các bản ghi theo giá trị của các thuộc
tính gom nhóm (grouping attribute).
b. Áp dụng kỹ thuật băm (hashing) trên giá trị của
các thuộc tính gom nhóm.
c. Tận dụng chỉ mục cụm (clustering index) trên các
thuộc tính gom nhóm.
d. Tất cả cách a, b, và c.
e. Ý kiến khác.
Câu 16. Cho biểu thức đại số quan hệ dùng để lấy
các bản ghi về DEPARTMENT trong tập tin dữ liệu

như sau: σDNUMBER>5(DEPARTMENT). Tập tin dữ
liệu DEPARTMENT chứa các bản ghi được sắp thứ
tự vật lý theo giá trị vùng tin DNUMBER. Một chỉ
mục B+-tree được tạo trên vùng tin DNUMBER của
tập tin này. Phương thức tìm kiếm nào sau đây nên
được chọn để tính tốn biểu thức này?
a. Tìm kiếm thơng qua chỉ mục trên vùng tin
DNUMBER.
b. Tìm kiếm nhị phân (binary search) trên vùng tin
DNUMBER.
c. Tìm kiếm tuyến tính (linear search) trên vùng tin
DNUMBER.
d. Khơng thể xác định được phương thức tìm kiếm
phù hợp do cịn thiếu mơ tả về các vùng tin khác và
các dạng chỉ mục khác trên tập tin này.
e. Ý kiến khác.
Câu 17. Cho 2 quan hệ EMPLOYEE
DEPARTMENT có lược đồ như sau:

và

EMPLOYEE
(ENAME,
SSN,
ADDRESS,
SALARY, DNO)
DEPARTMENT (DNAME, DNUMBER, MGRSSN)

Câu lệnh SQL sau dùng để truy vấn tên (ENAME) và
địa chỉ (ADDRESS) của tất cả nhân viên làm việc ở

phòng 'RESEARCH' có lương lớn hơn lương trung
bình của tất cả nhân viên:
SELECT ENAME, ADDRESS
FROM EMPLOYEE, DEPARTMENT
WHERE DNO = DNUMBER
AND DNAME = 'RESEARCH'
AND SALARY > (SELECT AVERAGE(SALARY)
FROM EMPLOYEE);
Hãy cho biết các biểu thức đại số quan hệ nào sau
đây không là dạng biểu diễn của câu lệnh SQL trên.
a. avg_sal ← ℑMAX SALARY (EMPLOYEE);
result ← πENAME, ADDRESS(σDNO=DNUMBER AND
DNAME='RESEARCH' AND SALARY>avg_sal(EMPLOYEE x
DEPARTMENT))
b. avg_sal ← ℑMAX SALARY (EMPLOYEE);
result
←
πENAME,
ADDRESS((σSALARY>avg_sal(EMPLOYEE))
DNO=DNUMBER

(σDNAME='RESEARCH'(DEPARTMENT)))
c. avg_sal ← ℑMAX SALARY (EMPLOYEE);
result
←
πENAME,ADDRESS(σSALARY>avg_sal(σDNO=DNUMBER(EMPL
OYEE x (σDNAME='RESEARCH'(DEPARTMENT)))))
d. avg_sal ← ℑMAX SALARY (EMPLOYEE);
result ← πENAME, ADDRESS((σSALARY>avg_sal(πENAME,
ADDRESS,

SALARY(EMPLOYEE)))
DNO=DNUMBER
(σDNAME='RESEARCH'(DEPARTMENT)))
e. Ý kiến khác.
Câu 18. Cho biểu thức đại số quan hệ dùng để lấy
các bản ghi về EMPLOYEE trong tập tin dữ liệu như
sau: σDNO=5 OR SALARY>30000 OR ADDRESS='HCM'
(EMPLOYEE). Tập tin dữ liệu EMPLOYEE chứa
các bản ghi được sắp thứ tự vật lý theo giá trị vùng
tin SSN. Một chỉ mục B+-tree được tạo trên vùng tin
DNO và một chỉ mục B-tree được tạo trên vùng tin
SALARY. Chọn phát biểu sai về q trình tính tốn
biểu thức này.
a. Do khơng có lối truy đạt (access path) hiệu quả
nào tồn tại dựa trên giá trị vùng tin ADDRESS nên
tìm kiếm tuyến tính trên tập tin cần được sử dụng để
kiểm tra mỗi bản ghi thỏa 1 trong 3 điều kiện chọn
không.
b. Trong trường hợp khơng có lối truy đạt hiệu quả
nào tồn tại dựa trên giá trị vùng tin ADDRESS nên
không thể tận dụng các lối truy đạt trên các vùng tin
DNO và SALARY để thực hiện hội các bản ghi kết
quả thỏa mỗi điều kiện chọn.
3

c. Mặc dù khơng có lối truy đạt hiệu quả nào tồn tại
dựa trên giá trị vùng tin ADDRESS nhưng vẫn có thể
tận dụng các lối truy đạt trên các vùng tin DNO và
SALARY để thực hiện hội các bản ghi kết quả thỏa 2

điều kiện chọn đầu tiên và sau đó hội với kết quả
thỏa điều kiện thứ 3 bằng cách dùng tìm kiếm tuyến
tính trên vùng tin ADDRESS.
d. Với điều kiện dùng tốn tử OR, q trình xử lý
truy vấn chỉ có thể được tối ưu khi mỗi điều kiện
được tối ưu với sự tồn tại của lối truy đạt trên các
vùng tin liên quan.
e. Ý kiến khác.
Câu 19. Cho 2 quan hệ EMPLOYEE
DEPARTMENT có lược đồ như sau:

và

EMPLOYEE
(ENAME,
SSN,
ADDRESS,
SALARY, DNO);
DEPARTMENT (DNAME, DNUMBER, MGRSSN)
Câu lệnh SQL sau dùng để truy vấn tên (ENAME) và
địa chỉ (ADDRESS) của tất cả nhân viên làm việc ở
phịng 'RESEARCH' có lương lớn hơn 50000.
Hãy cho biết cây truy vấn (query tree) nào sau đây là
dạng biểu diễn của câu lệnh SQL này hiệu quả nhất

dựa trên các qui tắc biến đổi tối ưu (optimization
transformation rule)?
SELECT ENAME, ADDRESS
FROM EMPLOYEE JOIN DEPARTMENT ON
DNO = DNUMBER

WHERE DNAME = 'RESEARCH'
AND SALARY > 50000;
a. Hình 2
b. Hình 3
c. Hình 4
d. Hình 5
e. Ý kiến khác.
Câu 20. Cho đoạn mã chương trình trong Hình 6.
Xác định tác vụ được hiện thực trên hai tập tin (quan
hệ) R và S bởi đoạn mã chương trình này.
a. Kết tự nhiên (natural join)
b. Hội (union)
c. Giao (intersection)
d. Hiệu (difference)
e. Ý kiến khác.

Bảng 1 - Câu 8: Thông tin về các bản ghi lần lượt thêm vào tập tin với kỹ thuật băm tuyến tính
Thứ tự thêm
Giá trị vùng tin băm của mỗi mod 1
mod 2
mod 4
mod 8
mod 16
vào tập tin
bản ghi
0
0
0
0
0

1
3760
0
1
3
3
11
2
5659
0
1
1
5
13
3
1821
4
5
6
7

1074
7115
1620
3943

0
0
0
0

0
1
0
1

2
3
0
3

2
3
4
7

2
11
4
7

mod 32
16
27
29
18
11
20
7

Hình 1 - Câu 9 và 10: Cây B+-tree ban đầu, trước khi thêm phần tử 72

4

Hình 2 - Câu 19.a: Cây truy vấn

Hình 3 - Câu 19.b: Cây truy vấn

Hình 4 - Câu 19.c: Cây truy vấn

5

Hình 5 - Câu 19.d: Cây truy vấn

sort the tuples in R and S using the same unique sort attributes;
set i ← 1, j ← 1;
while (i≤n) and (j≤m)
do {
if R(i) > S(j)
then {
output S(j) to T;
set j ← j+1;
}
elseif R(i) < S(j)
then {
output R(i) to T;
set i ← i+1;
}

else set j ← j+1
}
if (i≤n) then add tuples R(i) to R(n) to T;
if (j≤m) then add tuples S(j) to S(m) to T;
Hình 6 - Câu 20: Đoạn mã chương trình hiện thực tác vụ trên 2 tập tin (quan hệ) R và S

6

Họ - Tên: ……………………………………………………………………………….
Mã Số Sinh Viên: ………………………………………………………………………
Phần trả lời
Câu hỏi

a

b

c

d

1
2
3
4
5
6
7
8

9
10
11
12
13
14
15
16
17
18
19
20

Môn: Hệ Quản Trị Cơ Sở Dữ Liệu (503004)
Học kỳ 2 - 2011-2012
Ngày thi: .....03/04/2012......
Phòng thi: ............................
Mã đề: 11

e (Ý kiến khác)

Midterm test 204 b10 11 hk2 2011 2012

Tài liệu liên quan

Tài liệu bạn tìm kiếm đã sẵn sàng tải về