Bài thí nghiệm Kiến trúc máy tính 3
2010
Bài 3. Hoạt động của bộ đệm, tối ưu hóa bộ đệm
(Bài thí nghiệm này được biên soạn dựa trên bài thí nghiệm mơn học Kỹ thuật máy tính của F.
Lundevall, Khoa cơng nghệ thông tin và truyền thông, Học viện công nghệ Hồng gia, Thụy Điển [1])
1 Mục đích
Trong bài thí nghiệm này sinh viên sẽ tìm hiểu bộ đệm trong bộ xử lý MIPS và học cách tối ưu hóa
các tham số bộ đệm, hoặc cách thay đổi cấu trúc chương trình để có được hiệu suất tính tốn cao
hơn.
2 Cơng cụ
Bài thí nghiệm sử dụng bộ phần mềm MIPSIT [1] để mô phỏng hoạt động của một hệ thống máy tính
dựa trên bộ xử lý MIPSIT.
3 Lý thuyết
Sinh viên cần nắm rõ về bộ đệm; các tham số của bộ đệm mà có ảnh hưởng đến hiệu suất tính tốn
của bộ xử lý. Ngồi ra sinh viên cần có kiến thức về cách sắp xếp các lệnh máy và các biến trong bộ
nhớ (eng. memory mapping). (bài giảng chương 2, chương 3). Sách tham khảo [3].
Sinh viên cần hiểu các khái niệm trong bộ đệm như: tỉ lệ trúng (eng. hit rate), tổn hao trượt (eng.
miss penalties), thời gian truy cập (eng. access time), bộ đệm ánh xạ trực tiếp (eng. direct mapped
cache), bộ đệm kết hợp toàn phần (eng. fully associative cache), bộ đệm kết hợp k đường (eng. kway associative cache).
4 Thực hiện
4.1 Cài đặt và làm quen với phần mềm
4.1.1
Cài đặt
Tải bộ công cụ MIPSIT từ địa chỉ:
/>Giải nén tệp “MipsICT.zip” và chạy tệp nhận được “MipsICT.exe” để phầm mềm tự giải nén vào thứ
mục: “C:\MipsIT”.
Trong bộ phần mềm MIPSIT, ta sẽ sử dụng 2 phần mềm MIPSITStudio (xem bài thí nghiệm số 2) và
Mips Simulator.
4.1.2
Giới thiệu MIPSITStudio
Mipsitstudio là phần mềm mô phỏng hoạt động của hệ thống máy tính dựa trên bộ xử lý MIPS. Gọi
chương trình bằng cách chạy tệp “C:\MipsIT\bin\Mips.exe” (Hình 1).
Phầm mềm mơ phỏng việc thực hiện một chương trình (được biên dịch bằng MIPSITStudio) trên một
hệ thống máy tính gồm:
1.
2.
3.
4.
5.
Bộ xử lý MIPS (CPU)
Bộ đệm lệnh (I-Cache)
Bộ đệm dữ liệu (D-Cache)
Bộ nhớ chính (RAM)
Cửa sổ console (Console)
Khoa Điện tử- Viễn thơng
Page 1
Bài thí nghiệm Kiến trúc máy tính 3
2010
6. Thiết bị ngoại vi (I/O)
Cửa sổ hiển thị trạng thái của các khối trong hệ thống nói trên được mở bằng cách bấm vào các khối
tương ứng trên sơ đồ khối ở Hình 1.
Hình 1. Chương trình mơ phỏng hệ thống máy tính dùng CPU MIPS.
Hình 2. Cửa sổ hiển thị trạng thái của bộ xử lý (Register), bộ nhớ chính (Memory), vào ra
(Input&Output), và cửa sổ Console.
Khoa Điện tử- Viễn thông
Page 2
Bài thí nghiệm Kiến trúc máy tính 3
2010
Trạng thái của CPU là giá trị của các thanh ghi hiển thị trong cửa sổ thanh ghi (Hình 2). Trạng thái của
RAM là nội dung các ơ nhớ (Hình 2). Trạng thái của Console là cửa sổ hiển thị nội dung được chương
trình ghi ra bằng câu lệnh in ra màn hình ví dụ như “printf” (Hình 2). Trạng thái của I/O là cửa sổ hiển
thị nội dung các cổng điều khiển đèn LED ra và các cơng tắc vào (Hình 2). Cửa sổ D-Cache và I-Cache
hiển thị cấu trúc bộ đệm (ánh xạ trực tiếp, kết hợp toàn phần, hay kết hợp k đường) và nội dung lưu
trong bộ đệm (Hình 3).
Hình 3. Cửa sổ hiển thị trạng thái bộ đệm lệnh (I-Cache) và bộ đệm dữ liệu (D-Cache).
4.1.3
Thiết lập tham số bộ đệm
Trước khi thực hiện mô phỏng, các tham số của bộ đệm cần được thiết lập bằng cách lựa chọn menu
“Edit->Cache/Mem Config”.
Trong các tab “Inst. Cache” và “Data Cache” của cửa sổ thiết lập (Hình 4), các tham số cấu trúc của
bộ đệm lệnh và bộ đệm dữ liệu như kích thước bộ đệm (eng. size), kích thước đường/khối (eng.
block size), số lượng đường/khối trong tập (eng. blocks in sets). (Cần chú ý số lượng đường sẽ xác
định loại bộ đệm: ánh xạ trực tiếp, kết hợp toàn phần hoặc kết hợp k đường).
Ngoài ra, với bộ đệm dữ liệu, ta có thể thiết lập chính sách thay thế (eng. Replacement policy), và
chính sách ghi (eng. Write policy).
Ta có thể vơ hiệu hóa (loại bỏ) bộ đệm khỏi hệ thống bằng cách chọn “Disable”. Tổn hao trượt bộ
đệm (thời gian truy cập bộ nhớ chính) sẽ khơng được tính đến khi mơ phỏng nếu chọn “Disable
penalty”.
Hình 4. Cửa sổ thiết lập các tham số cấu trúc bộ đệm I-Cache, D-Cache.
Khoa Điện tử- Viễn thông
Page 3
Bài thí nghiệm Kiến trúc máy tính 3
2010
Tổn hao trượt phụ thuộc vào thời gian truy cập bộ nhớ chính. Các tham số này được thiết lập bằng
tab “Memory” (Hình 5). Thời gian đọc và ghi bộ nhớ chính được xác định bằng số chu kz xung nhịp
của CPU. Ở đây có giá trị mặc định là 50 chu kz. Các tham số này phụ thuộc vào công nghệ chế tạo
bộ nhớ chính, được xác định dựa trên các tham số thời gian của RAM (Tham khảo [4]).
Hình 5. Thiết lập thời gian truy cập bộ nhớ chính.
4.1.4
Thực hiện mơ phỏng
Chương trình sau khi được biên dịch thành tệp thực thi sẽ được nạp vào bộ nhớ hệ thống mô phỏng
từ phần mềm MIPSITStudio bằng cách lựa chọn menu “Build->Upload->To Simulator” hoặc bằng
phím tắt F5.
Phần mềm mơ phỏng sẽ thực hiện chương trình đã đươc nạp bằng cách bấm nút
cơng cụ.
trên thanh
Các kết quả mô phỏng như số lần trúng, trượt bộ đệm, tỉ lệ trúng, số chu kz thực hiện chương trình
được hiện ở phần “Cache Statistics” bên dưới phải của cửa sổ “I-Cache”, “D-Cache”.
Để thực hiện một lần mô phỏng mới, hệ thống cần được khởi tạo lại (eng. reset) bằng menu “CPU>Reset”. Sau khi khởi tạo lại, vì bộ đệm và bộ nhớ sẽ trở về trạng thái mặc định, các tham số bộ đệm,
bộ nhớ phải được thiết lập lại. Thêm vào đó, chương trình đã được biên dịch cần được nạp lại từ
MIPSITStudio.
4.2 Tối ưu bộ đệm lệnh cho chương trình copy chuỗi
4.2.1
Bước 1: Chuẩn bị chương trình C.
Tạo một đề án C(minimal)/Assembler trong mơi trường MIPSITStudio. Đặt tên đề án này là Bai3-1.
Chọn thư mục để lưu là “C:\MipsIt\Projects\Bai3-1”. Tạo một tệp chương trình C với tên “bai3-1.c”.
Soạn thảo đoạn mã C vào tệp chương trình như Hình 6.
Biên dịch đề án bằng cách lựa chọn menu “Build -> Build Bai3-1” hoặc phím F7.
Khoa Điện tử- Viễn thông
Page 4
Bài thí nghiệm Kiến trúc máy tính 3
2010
1.
/* strcpy.c */
2.
3.
4.
#include <stdio.h>
#include <idt_entrypt.h>
/* C stringcopy */
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
static void str_cpy( char *to, const char *from)
{
while( *from)
{
*to++ = *from++;
}
*to = '\0';
}
int main()
{
static char* hello = "Hello";
static char to[4711] = "Function str_cpy";
int Time;
18.
19.
20.
printf("String before copy: %s\n", hello);
flush_cache(); /* khởi tạo lại các bộ đo bộ đệm */
timer_start(); /* bắt đầu tính thời gian thực hiện hàm str_cpy*/
21.
str_cpy( to, hello);
22.
23.
24.
25.
Time = timer_stop(); /* kết thúc tính thời gian thực hiện hàm str_cpy*/
printf("Time to copy: %d\n",Time); /* In ra tổng thời gian copy */
printf("String after copy: %s\n", to);
}
Hình 6. Chương trình bai3-1.c
4.2.2
Bước 2: Mơ phỏng.
Chạy phần mềm mơ phỏng “C:\MipsIT\bin\Mips.exe”. Quay về phần mềm MIPSITStudio, nạp chương
trình đã biên dịch vào phần mềm mơ phỏng (phím tắt F5). Chương trình có câu lệnh in ra thời gian
thực hiện hàm str_cpy tính bằng số chu kz đồng hồ. Trả lời các câu hỏi:
Câu 1. Thực hiện mô phỏng xác định các kết quả: số lần trúng, số lần trượt bộ đệm, tỉ lệ trúng, số
chu kz thực hiện chương trình thống kê bởi phần mềm mơ phỏng (eng. Cycle count) và số chu kz tính
bởi chương trình (eng. Time to copy).
89
Hit count = ………………………………………………………………………………………………………………………………………….
Miss count = ……………………………………………………………………………………………………………………………………….
68
0,57
Hit rate = …….………………………………………………………………………………………………………………………………………
11862
Cycle count=………………………………………………………………………………………………………………………………………..
9272
Time to copy=………………………………………………………………………………………………………………………………………
Tính tốn chỉ số CPI khi hệ thộng thực hiện hàm str_cpy (chú ý thời gian thực tế thực hiện hàm copy
khác thời gian thống kê bởi phần mềm mô phỏng, ở đây ta dùng thời gian thống kê bởi phần mềm
mô phỏng)
CPI=……………………………………………………………………………………………………………………………………………………..
1,279
Khoa Điện tử- Viễn thông
Page 5
Bài thí nghiệm Kiến trúc máy tính 3
2010
Câu 2. Thay đổi chuỗi hello trong chương trình bằng các giá trị “Hello!”, “Hello!!”, “Hello!!!”,
“Hello!!!!” trong đó độ dài của chuỗi tăng lần lượt thêm 1 ký tự. Biên dịch lại chương trình bằng
MIPSITStudio, nạp lại vào phần mềm mơ phỏng và mô phỏng lại. Xác định các kết quả cho mỗi lần
mô phỏng và điền vào bảng dưới đây. (Số lệnh là tổng của số lần trúng và số lần trượt của bộ đệm
lệnh).
TT
Chuỗi
Hit
count
Miss
count
Number of
instructions
Hit rate
Cycle count
Time to
copy
CPI
1
Hello
89
68
157
0,57
11862
9272
1,279
2
Hello!
101
74
175
0,58
13150
10540
1,245
3
Hello!!
113
80
193
0,59
14398
11808
1,219
4
Hello!!!
125
86
211
0,59
13466
10776
1,25
5
Hello!!!!
137
92
229
0,60
14234
11544
1,233
Bảng 1. Kết quả mơ phỏng chương trình copy các chuỗi có độ dài khác nhau.
Câu 3. Khi ta thêm 1 ký tự vào chuỗi cần copy như trong thí nghiệm ở Câu 2, số lượng lệnh được
thực hiện tăng tương ứng với số lệnh trong vòng lặp từ dòng 7 đến dòng 10 ở Hình 6. Từ Bảng 1 hãy
xác định số lệnh trong vòng lặp của hàm copy chuỗi str_cpy.
…………………………………………………………………………………………………………………………………………………………….
S l nh trong vòng l p c a hàm copy chu i str_copy : 18 l nh .
…………………………………………………………………………………………………………………………………………………………….
…………………………………………………………………………………………………………………………………………………………….
…………………………………………………………………………………………………………………………………………………………….
…………………………………………………………………………………………………………………………………………………………….
…………………………………………………………………………………………………………………………………………………………….
Câu 4. So sánh kích thước bộ đệm lệnh và số lệnh trong vòng lặp xác định ở Câu 3 và giải thích tại
sao tỉ lệ trúng của bộ đệm lệnh trong Bảng 1 lại thấp.
…………………………………………………………………………………………………………………………………………………………….
…………………………………………………………………………………………………………………………………………………………….
…………………………………………………………………………………………………………………………………………………………….
…………………………………………………………………………………………………………………………………………………………….
…………………………………………………………………………………………………………………………………………………………….
…………………………………………………………………………………………………………………………………………………………….
4.2.3
Bước 3: Tối ưu hóa bộ đệm lệnh
Trong phần này, ta thực hiện mô phỏng với các tham số bộ đệm lệnh khác nhau để tìm ra tham số
bộ đệm lệnh tối ưu khi thực hiện chương trình str_cpy.
Câu 5. Thực hiện bài mơ phỏng một cách có hệ thống: thay đổi tham số kích thước, kích thước khối,
độ kết hợp của bộ đệm lệnh và tiến hành mô phỏng lại và xác định các kết quả mô phỏng để điền
vào bảng dưới đây. (Tham số về thời gian truy cập bộ nhớ chính được cho trước). Chú ý trước khi
thực hiện lần mô phỏng mới, cần khởi tạo lại CPU, thiết lập các tham số bộ đệm và nạp chương trình
từ MIPSITStudio vào hệ thống.
Khoa Điện tử- Viễn thơng
Page 6
Bài thí nghiệm Kiến trúc máy tính 3
2010
Kích
thước
Kích
thước
khối
Độ kết
hợp
Thời gian
truy cập
16
2
1
50
16
4
1
16
2
32
64
Cycle
count
CPI
I-Cache
hit rate
I-Cache
miss
count
Dcache
hit rate
D-cache
miss
count
11862 1,279
0,57
68
0,63
39
35
11922 1,259
0,74
41
0,64
38
2
50
10662
1,337
0,57
87
0,74
28
2
1
50
7462
1,532
0,75
40
0,78
2
1
50
6362
1,687
0,75
39
0,88
23
13
Bảng 2. Kết quả mô phỏng thực hiện chương trình copy chuỗi khi thay đổi cấu trúc bộ đệm lệnh.
Câu 6. Giải thích ý nghĩa kết quả mơ phỏng trong Bảng 2. Từ đó rút ra tham số bộ đệm tối ưu cho
việc thực thi chương trình str_cpy.
T b ng 2 : khi tăng kích thư c b đ m thì s chu k th c hi n gi m đ ng th i làm tăng t l
…………………………………………………………………………………………………………………………………………………………….
trúng b đ m, tuy nhiên tăng kích thư c b đ m cũng làm tăng CPI .
…………………………………………………………………………………………………………………………………………………………….
…………………………………………………………………………………………………………………………………………………………….
…………………………………………………………………………………………………………………………………………………………….
…………………………………………………………………………………………………………………………………………………………….
…………………………………………………………………………………………………………………………………………………………….
4.3 Tối ưu cho chương trình cộng ma trận
4.3.1
Bước 1: Chuẩn bị chương trình C.
Tạo một đề án C(minimal)/Assembler trong mơi trường MIPSITStudio. Đặt tên đề án này là Bai3-2.
Chọn thư mục để lưu là “C:\MipsIt\Projects\Bai3-2”. Tạo một tệp chương trình C với tên “bai3-2.c”.
Soạn thảo đoạn mã C vào tệp chương trình như Hình 7. Chương trình bai3-2.c.
Biên dịch đề án bằng cách lựa chọn menu “Build -> Build Bai3-2” hoặc phím F7. Trước khi biên dịch,
thiết lập mức tối ưu biên dịch (eng. Optimization level) là High như Hình 8 bằng cách chọn menu
“Project->Settings…”.
Khoa Điện tử- Viễn thông
Page 7
Bài thí nghiệm Kiến trúc máy tính 3
2010
1.
2.
3.
/* matris.c */
#include <stdio.h>
#include <idt_entrypt.h>
4.
5.
6.
#define MATRIXSIZE 16
#define MATRIXSIZE_ROWS 16
#define MATRIXSIZE_COLS 16
7.
8.
9.
10.
11.
12.
/* Cộng 2 ma trận */
void matrisadd( int res[MATRIXSIZE_ROWS][MATRIXSIZE_COLS],
int a[MATRIXSIZE_ROWS][MATRIXSIZE_COLS],
int b[MATRIXSIZE_ROWS][MATRIXSIZE_COLS] )
{
int i,j;
13.
14.
15.
16.
for(j=0; j < MATRIXSIZE; ++j)
/* xét từng cột */
for(i=0; i < MATRIXSIZE; ++i)
/* xét từng hàng */
res[i][j] = a[i][j] + b[i][j];
}
17.
18.
19.
20.
21.
22.
int main()
{
static int a[MATRIXSIZE_ROWS][MATRIXSIZE_COLS];
static int b[MATRIXSIZE_ROWS][MATRIXSIZE_COLS];
static int res[MATRIXSIZE_ROWS][MATRIXSIZE_COLS];
int i,j, Time;
23.
24.
25.
26.
27.
28.
29.
/* khởi tạo 2 ma trận */
for( i=0; i
for( j=0; j
{
a[i][j] = i+j;
b[i][j] = i-j;
}
30.
31.
flush_cache();
timer_start();
32.
matrisadd( res, a, b);
33.
34.
35.
Time = timer_stop();
printf("Time: %d\n",Time);
/* khởi tạo lại bộ đếm cahce */
/* bắt đầu tính thời gian */
/* kết thúc tính thời gian */
}
Hình 7. Chương trình bai3-2.c
Khoa Điện tử- Viễn thơng
Page 8
Bài thí nghiệm Kiến trúc máy tính 3
2010
Hình 8. Thiết lập mức tối ưu biên dịch High.
4.3.2
Bước 2: Mô phỏng.
Chạy phần mềm mô phỏng “C:\MipsIT\bin\Mips.exe”. Thiết lập các tham số bộ đệm như sau:
Bộ đệm lệnh
Size = 32 words
Block size = 2 words
Blocks in sets: 1
Bộ đệm dữ liệu
Size = 16 words
Block size = 2 words
Blocks into sets = 1
Write policy = write-back
Quay về phần mềm MIPSITStudio, nạp chương trình đã biên dịch vào phần mềm mơ phỏng (phím tắt
F5).
Khi thực hiện mô phỏng, cần chú ý số chu kz thực hiện chương trình hiển thị cùng cửa sổ I-Cache, DCache bị giới hạn bởi 5 chữ số, do đó kết quả hiển thị ở đây khơng chính xác nếu số chu kz lớn hơn
99999. Để có được kết quả đúng cho số chu kz, sử dụng số ở cửa sổ thống kê bộ đệm (hiển thị bằng
cách chọn menu “View->I-Cache Stats” và menu “View->D-Cache Stats” (Hình 9).
Hình 9. Cửa sổ thống kê bộ đệm.
Trả lời các câu hỏi:
Câu 7. Thực hiện mô phỏng xác định các kết quả: số lần trúng, số lần trượt bộ đệm, tỉ lệ trúng, số
chu kz thực hiện chương trình thống kê bởi phần mềm mô phỏng (eng. Cycle count). Điền vào bảng
dưới đây.
Khoa Điện tử- Viễn thông
Page 9
Bài thí nghiệm Kiến trúc máy tính 3
2010
TT
Cycle count
Hit count
1
Number of instructions
4273
2
I-Cache hit rate
0,99
3
I-Cache miss count
31
4
D-Cache hit rate
0,01
5
D-Cache miss count
771
Bảng 3. Kết quả mơ phỏng chương trình cộng 2 ma trận.
Câu 8. Tại sao trong Bảng 3 ta thu được tỉ lệ trúng bộ đệm lệnh cao? Tại sao tỉ lệ trúng bộ đệm dữ
liệu lại thấp?.
Do kích thư c b đ m l nh l n hơn
…………………………………………………………………………………………………………………………………………………………….
…………………………………………………………………………………………………………………………………………………………….
…………………………………………………………………………………………………………………………………………………………….
…………………………………………………………………………………………………………………………………………………………….
…………………………………………………………………………………………………………………………………………………………….
…………………………………………………………………………………………………………………………………………………………….
4.3.3
Bước 3: Tối ưu hóa bộ đệm dữ liệu
Trong phần này, ta thực hiện mô phỏng với các tham số bộ đệm dữ liệu khác nhau để tìm ra tham số
bộ đệm lệnh tối ưu khi thực hiện chương trình cộng ma trận. Trong phần này hãy thiết lập tham số
cho bộ đệm lệnh ánh xạ trực tiếp như sau: Size = 32 words; Block size = 2 words, Blocks in Sets = 1.
Với bộ đệm dữ liệu đặt giá trị chính sách ghi: Write Policy = Write back.
Câu 9. Thay đổi các giá trị kích thước bộ đệm dữ liệu với các giá trị 16, 32, 64, 128, 256, 512, 1024.
Đặt giá trị tham số Block size = 2 words; Blocks into sets = 1. Thực hiện mô phỏng và điền kết quả
vào bảng dưới đây.
Cache Size
16
32
64
128
256
512
1024
D-Cache
Hit rate
0,01
0,01
0,01
0,01
0,01
0,17
0,50
Cycle
count
108698
107998
106398
103198
96798
83798
45396
Bảng 4. Kết quả mô phỏng chương trình matrisadd khi thay đổi kích thước bộ đệm dữ liệu
Câu 10. Tại sao tỉ lệ trúng của bộ đệm dữ liệu lại thấp? Bắt đầu từ kích thước nào của bộ đệm dữ liệu
thì tỉ lệ trúng bắt đầu tăng? Tại sao?
T l trúng th p do kích thư c b đ m nh , t giá tr kích thư c b ng s12 thì t l trúng b t đ u tăng .
…………………………………………………………………………………………………………………………………………………………….
…………………………………………………………………………………………………………………………………………………………….
…………………………………………………………………………………………………………………………………………………………….
…………………………………………………………………………………………………………………………………………………………….
…………………………………………………………………………………………………………………………………………………………….
…………………………………………………………………………………………………………………………………………………………….
…………………………………………………………………………………………………………………………………………………………….
Khoa Điện tử- Viễn thông
Page 10
Bài thí nghiệm Kiến trúc máy tính 3
2010
…………………………………………………………………………………………………………………………………………………………….
…………………………………………………………………………………………………………………………………………………………….
…………………………………………………………………………………………………………………………………………………………….
…………………………………………………………………………………………………………………………………………………………….
…………………………………………………………………………………………………………………………………………………………….
Câu 12. Thay đổi giá trị độ kết hợp (eng. associativity) của bộ đệm dữ liệu (tham số blocks in sets)
với các giá trị 1, 2, 4. Đặt kích thước bộ đệm dữ liệu Size = 128 words; Block size = 4 words. Tham số
chính sách thay thế là LRU. Thực hiện mơ phỏng và điền vào bảng dưới đây.
Associativity
1
2
4
D-Cache Hit
rate
0,01
0,01
0,01
Cycle count
205798
208598
208998
Bảng 5. Kết quả mơ phỏng thực hiện chương trình matrisadd khi thay đổi độ kết hợp bộ đệm dữ
liệu.
Câu 13. Thay đổi giá trị kích thước khối của bộ đệm dữ liệu (tham số block size) với các giá trị 1, 2, 4.
Đặt kích thước bộ đệm dữ liệu Size = 128 words; Blocks in sets = 1 words. Thực hiện mô phỏng và
điền vào bảng dưới đây.
Block size
1
2
4
D-Cache Hit
rate
0,01
0,01
0,01
Cycle count
51798
103198
205798
Bảng 6. Kết quả mơ phỏng thực hiện chương trình matrisadd khi thay đổi độ kích thước khối bộ
đệm dữ liệu.
Câu 14. Từ kết quả trong Bảng 4, Bảng 5 và Error! Reference source not found. hãy xác định tham số
tối ưu cho bộ đệm dữ liệu.
size : 1024
…………………………………………………………………………………………………………………………………………………………….
Block size : 1
…………………………………………………………………………………………………………………………………………………………….
Block inset : 1
…………………………………………………………………………………………………………………………………………………………….
…………………………………………………………………………………………………………………………………………………………….
4.3.4
Bước 4: Tối ưu hóa chương trình.
Trong phần này, ta thực hiện thay đổi chương trình nhằm tìm hiểu cấu trúc chương trình tối ưu.
Thay đổi vịng lặp ở dịng 13-15 của chương trình ở Hình 7 để việc cộng được thực hiện cho từng
hàng trước như sau:
13.
14.
15.
for(i=0; i < MATRIXSIZE; ++i)
/* xét từng hàng */
for(j=0; j < MATRIXSIZE; ++j)
/* xét từng cột */
res[i][j] = a[i][j] + b[i][j];
Mô phỏng với các tham số bộ đệm dữ liệu khác nhau để tìm ra tham số bộ đệm lệnh tối ưu khi thực
hiện chương trình cộng ma trận. Trong phần này hãy thiết lập tham số cho bộ đệm lệnh ánh xạ trực
tiếp như sau: Size = 32 words; Block size = 2 words, Blocks in Sets = 1.
Với bộ đệm dữ liệu đặt giá trị chính sách ghi: Write Policy = Write back.
Khoa Điện tử- Viễn thông
Page 11
Bài thí nghiệm Kiến trúc máy tính 3
2010
Câu 15. Thay đổi các giá trị kích thước bộ đệm dữ liệu với các giá trị 16, 32, 64, 128, 256, 512, 1024.
Đặt giá trị tham số Block size = 2 words; Blocks into sets = 1. Thực hiện mô phỏng và điền kết quả
vào bảng dưới đây.
Cache Size
16
32
64
128
256
512
1024
D-Cache
Hit rate
0,01
0,01
0,01
0,01
0,01
0,17
0,50
107181
105561
102361
95961
82961
Cycle
count
107961
44561
Bảng 7. Kết quả mơ phỏng chương trình matrisadd v.2 khi thay đổi kích thước bộ đệm dữ liệu
Câu 16. Bắt đầu từ kích thước nào của bộ đệm dữ liệu thì tỉ lệ trúng bắt đầu tăng? Tại sao? So sánh
với kết quả ở Câu 10.
B t đ u t kích thư c b ng s12 thì t l c a b đ m d li u b t đ u tăng
…………………………………………………………………………………………………………………………………………………………….
…………………………………………………………………………………………………………………………………………………………….
…………………………………………………………………………………………………………………………………………………………….
…………………………………………………………………………………………………………………………………………………………….
…………………………………………………………………………………………………………………………………………………………….
…………………………………………………………………………………………………………………………………………………………….
…………………………………………………………………………………………………………………………………………………………….
…………………………………………………………………………………………………………………………………………………………….
…………………………………………………………………………………………………………………………………………………………….
…………………………………………………………………………………………………………………………………………………………….
…………………………………………………………………………………………………………………………………………………………….
…………………………………………………………………………………………………………………………………………………………….
Câu 17. Thay đổi giá trị độ kết hợp (eng. associativity) của bộ đệm dữ liệu (tham số blocks in sets)
với các giá trị 1, 2, 4. Đặt kích thước bộ đệm dữ liệu Size = 128 words; Block size = 4 words. Tham số
chính sách thay thế là LRU. Thực hiện mô phỏng và điền vào bảng dưới đây.
Associativity
1
2
4
D-Cache Hit
rate
0,01
0,01
0,75
Cycle count
204961
207761
54561
Bảng 8. Kết quả mơ phỏng thực hiện chương trình matrisadd v.2 khi thay đổi độ kết hợp bộ đệm
dữ liệu.
Câu 18. Thay đổi giá trị kích thước khối của bộ đệm dữ liệu (tham số block size) với các giá trị 1, 2, 4.
Đặt kích thước bộ đệm dữ liệu Size = 128 words; Blocks in sets = 1 words. Thực hiện mô phỏng và
điền vào bảng dưới đây.
Khoa Điện tử- Viễn thông
Block size
1
2
4
D-Cache Hit
rate
0,01
0,01
0,01
Cycle count
50961
102361
204961
Page 12
Bài thí nghiệm Kiến trúc máy tính 3
2010
Bảng 9. Kết quả mơ phỏng thực hiện chương trình matrisadd v.2 khi thay đổi độ kích thước khối
bộ đệm dữ liệu.
Câu 19. Từ kết quả trong Bảng 7, Bảng 8 và Bảng 9 hãy xác định tham số tối ưu cho bộ đệm dữ liệu.
size : 1024
…………………………………………………………………………………………………………………………………………………………….
Block size : 4
…………………………………………………………………………………………………………………………………………………………….
Block in sets : 4
…………………………………………………………………………………………………………………………………………………………….
…………………………………………………………………………………………………………………………………………………………….
5 Tài liệu tham khảo
[1] Ola Bergqvist and Georg Fischer. A Simulation and Development Environment Using Animation
for Computer Architecture Education. Version 1.3.0, 1999.
/> />[2] Mats Brorsson. MipsIt - A Simulation and Development Environment Using Animation for
Computer Architecture Education. Proceedings of The workshop on Computer architecture
education. 2002. />[3] David A. Patterson and John L. Hennessy. Computer Organization and Design, Fourth Edition: The
Hardware/Software Interface. In The Morgan Kaufmann Series in Computer Architecture and Design.
Nov 10, 2008.
[4] Kris Boughton and Rajinder Gill. Everything You Always Wanted to Know About SDRAM
(Memory): But Were Afraid to Ask. Aug. 2010. />
Khoa Điện tử- Viễn thông
Page 13