Tải bản đầy đủ (.docx) (19 trang)

TIỂU LUẬN môn học KIẾN TRÚC máy TÍNH đề tài nghiên cứu tìm hiểu về thế hệ vi xử lý intel pentium IV

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.01 MB, 19 trang )

Trường đại học công nghiệp Hà nội
Khoa Công Nghê Thông
Tin
----------

BAI TIÊU LUÂN MÔN HOC: KIÊN TRUC MAY TINH
ĐÊ TAI: Nghiên cứu tìm hiểu về thê hệ vi xư ly InTel Pentium IV
Giáo iênohươngo dn: Nguyên
Thanh Hai
Lớ: Đại học KTPM3-K9
Nhomosô: 3

HaoNôi,ongào1o
hango11onămo2015

Trường đại học công nghiêp
Hà nội

Khoa Công Nghê Thông
Tin


oBáocáobaiotậpolơnomơnohọc:oooooooo
oKiếnotrúcoMàotính
ĐÊ TAI: Nghiên cứu tìm hiểu về thê hệ vi xư ly InTel Pentium IV
Nhóm thực hiện:oNhomo3–
LơpoKTPM3-K9
Thành
viênthị
trong
1. Leo


lan nhóm:
Hương
2. Trần hải Linh
3. Nguyễn thị Nga
4. Nguyễn thị Nhã
5. Trần thị Qun
Giáo viên hướng
dẫn:ooNgnoThanhoHai
(GV Kiên Trúc Máy Tính)
ooooooHaoNơio,ngào1othang
o11onămo2015

 Mở đầu
1. Nhiệm vụ của bài
Nghiên cứu tìm hiểu về thê hê vi xư ly InTel
Pentium IV.
2. Bố cục
* Lich sư phat triển cua VXL
Pentium
IVra
: đời cua VXL
- Hồn
canh

IV.cơng nghê chung cua VXL Pentium IV.
- Pentium
Đăc trưng
* Đăc trưng công nghê chi tiêt cua tưng loại biên thể
(version)
Pentium

IV cua VXL

2


 Nội dung
A.Lịch sư phat triên cca VXL Pentium IV
Pentium 4 là bộ vi xư ly kiên trúc x86 thê hê thứ 7 do Intel san xuất, và
là thiêt kê CPU
hoàn toàn mới đầu tiên cua họ kể tư Pentium III năm 1995. Thiêt kê mới
này được gọi
là kiên trúc NetBurst. Không như Pentium II, Pentium III, và cac loại
Celeron khac
nhau, kiên trúc này khac được tạo mới hoàn toàn và thưa kê rất ít tư
thiêt
Bộ vikê
xưPentium
ly Pentium 4 đầu tiên, mã hiêu là "Willamette", chạy với
tốc
độ 1.4 và
Pro/P6.
1.5 GHz và đã được phat hành vào thang 11 năm 2000 trên nền
Socket 423, và sau đó
đã chạy với tốc độ tư 1.5 GHz tới 2 GHz trên Socket 478. Được ghi
nhận cùng với sự

ra đời cua Pentium 4 là bus FSB(Front side bus) nhanh với tốc độ 400
MT/s. Khi đó,
chip AMD Athlon đang chạy với tốc độ 266 MT/s.
Dòng vi xư ly Pentium 4 đã kêt thúc

vào
ngày 27 thang 7 năm 2006, được
thay thể bởi
"Conroe".
dòng Intel Core 2 - dòng sư dụng
nhân

Pentium 4

Produced

From 2000 to
2008

Max. CPU clock

1.30 GHz to 3.80
GHz

rate

Pentium 4 được san xuất vào thang 11
năm 2011

FSB speeds

400 MT/s to 1066
MT/s

và được giới thiêu là bộ vi xư ly thê hê

mới.

Instruction set

x86 (i386), x86-64,
MM

Nêu bộ vi xư ly này được đăt số thay vì
tên nó

X,SSE, SSE2, SSE3
Microarchitecture NetBurst

sẽ được gọi là 786 bởi vì nó đại diên cho
Transistors
một
thê hê sau những bộ xư ly 686. Vài hình
thức

chúng được dựa trên kiên trúc và khuôn Socket(s)
bộ xư

Socket
423

Predecessor

Socket
478
Pentium

LGA 775 III

Successor

Pentium D

3

Northwood và Prescott.

55M 130nm
169M 130nm
(P4EE)
1
25M 90nm
188M 65nm

khac nhau cua Pentium 4 được ra mắt
công

ly được dựa trên cac nhân Willametter,

42M 180nm


Một số công nghê nổi bật được ap dụng trong
kiên trúc
NetBurst như Hyper Pipelined Technology(Công
nghê siêu
ống) mở rộng số hàng lênh xư ly, làm hiêu suất

may có thể
tăng
30%.
Execution
Trace xư
Cache
tranh
tìnhbus
Engine
tang
tốc bộ đồng
ly toan
học,
trạng
lênh bi

thống
(system bus) 400 MHz và 533 MHz; cac
chậm
trễ khi chuyển tư bộ nhớ dên CPU, Rapid
công nghê
Advanced
Execution Transfer Cache, Advanced Dynamic
Execution,
Enhanced Floating point và Multimedia Unit, Streaming SIMD
Extensions 2
(SSE2) cũng được cai tiên nhằm tạo ra những BXL tốc độ cao hơn,
kha năng tính
toan mạnh hơn, xư ly đa phương tiên tốt hơn. Ghi nhận cùng với
sự ra đời cua

Pentium 4 là công nghê Quad Data Rate cho phép FSB (Front Side
Bus) đạt đên tốc
độ 400
đó, chip
AMD
đang
chạy với tốc
độ chêt
FSB là
Bộ viMHz.
xư lí Khi
Pentium
IV có
đênAthlon
42 triêu
Tranzito,kích
thước
266cua
MHz
nó là 217
(cơng
nghê Double
Data
mm2,công
suất tiêu
thụ Rate).
55 W khi làm viêc ở mức 1,5GHz.Tốc độ
bus hê thống 3,2
GB/s , rất cao ở thời diểm bấy giờ.


Bang: So sánh hiệu suất Pentium 3 và Pentium 4
Bang trên là sự so sanh hiêu suất cua Pentium IV 1,5GHz và
Petium III 1,0
GHz.Rõ ràng ta có thể thấy tính vượt trội dành cho Pentium IV.Cac
ứng dụng số
4


nguyên cao hơn 15-20 %,trong khi Ứng dụng dấu chấm động và
multimedia lên tới
3
0-70%.
Pentium 4 đầu tiên (tên mã là Willamette) xuất hiên cuối năm
chấm
hêt cho
2000
đăt “triều
dấu đại” Pentium III. Willamette xuất san xuất trên
cơng nghê 0,18
có 42 triêu transistor(nhiều hơn gần 50% so với Pentium III),bus hê
thống (system
bus) 400 MHz,bộ nhớ đêm tích hợp L2 256 KB,socket 423 và 478 ,
Socket
chỉ thê bởi socket 478 .P4 Willamette có tốc độ như 1.3,
2001 và423
bi thay
1.4, hiên
1.5, 1.6,
xuất
trong khoang thời gian rất ngắn, tư thang 11 năm 2000

1
đên
thang
.7, 1.8,
1.98 ,năm
2.0 GHz.
P4 Northwood xuất hiên vào thang 1 năm 2002,được san xuất
trên cơng nghê
0
,13, có khoang 55 triêu transistor,bộ nhớ đêm tích hợp L2
4512 KB,socket
178.Northwood có 3 dịng gồm Northwood A(system bus 400
2MHz),tốc độ 1.6,

.8, 2.0,
2.2, 2.4,
2.5, 2.6, và 2.8 GHz.Northwoood
luồng
Hyper
Threading-HT).Northwood
C (system B(system
bus 800 bus
533
MHz)
tốc
độ
MHz,tất ca hỗ trợ
HT),gồm 2.4,2.6, 3.0, 3.2, 3.4
.26, 2.4, 2.53, 2.66, 2.8, 3.06 GHz(riêng 3.06 GHz có hỗ trợ công
GHz.

P4 siêu
Prescott
nghê
phân(năm 2004).Là BXL đầu tiên san xuất theo cơng
nghê 90nm,kích
thước vi mạch giam 50% so với P4 Willamette.Điều này cho phép
tích hợp nhiều
transistor hơn trên cùng kích thước (125 triêu transistor so với 55
triêu transistor cua
P4 Northwood),tốc độ chuyển đổi cua transistor nhanh hơn,tăng kha
năng xư ly,tính
toan.Dung lượng bộ nhớ đêm tích hợp L2 cua P4 Prescott gấp đôi
chạy
hơn.Đây là giai đoạn “giao thời ”
so vớinhanh
P4
giữa socket
478-775LGA,system
bus
533 MHz-800MHz
Northwood(1MB so với
512KB).Ngoài
tập lênhvà
mỗi san
MMX,SSE,SSE2,Prescott
được
bổ dùng càng bối rối
phẩm được đăt tên khiên
người
khi

sungchọn
tập lênh SSE3 giúp cac ứng dụng xư ly video và game
mua.
Prescott A(FSB 533MHz)có cac tốc độ 2.4, 2.26, 2.8
(socket 478),Prescott 505 (2,66GHz), 505J(2.66 GHz),506
(2,66 GHz), 511 (2,8GHz), 515J (2,93GHz), 516 (2,93GHz) , 519J
(3,06GHz), 519
J(3,06GHz) sư dụng socket 775LGA.
5


Prescott E,F (năm 2004) có bộ nhớ đêm L2 1MB(cac phiên ban
sau được mở
rộng 2MB),bus hê thống 800 MHz.Ngoài tập lênh
MMX,SSE2,SSE3 tích
hợp, Prescott E,F cịn hỗ trợ cơng nghê siêu phân luồng,một số
phiên
bansư
sau
có hỗ
Dịng
dụng
socket 478 gồm Pentium 4 HT 2.8E (2,8GHz),
3.0E toan
(3,0 64
GHz),
trợ
bit.
3.2Etính
(3,2 GHz),

3.4E(3,4 GHz).Dịng sư dụng socket 775LGA
gồm Pentium
4
HT 3.2F, 3.4F, 3.6F, 3.8F, với cac tốc độ tương ứng tư 3,2
HT
517,520,520J,521,524,530,530J,531,540,540J,541,550,560,560J,
GHz.Pentium
4
561,570J,571
với cac tốc độ tư 2.8 GHz đên 3,8
GHz.
*Những điểm kĩ thuật chính cua Pentium 4
gồm:
bao
Tốc
độ tư 1.3GHz đên
3.8GHz
 phần mềm tương thích với những bộ xư ly Intel 32
bit trước.

Một số phiên ban hỗ trợ EM64T
 Bus bộ xư ly (font-side) chạy ở 400MHz, 533Mhz, SOOMHz hay
1066MHz.

Những bộ logic số học (ALUs) chạy gấp hai lần tần số nhân bộ
 xư ly
 Công
luồng (20-30
hỗ trợ tất
ca bộ xư ly 2.4GHz và nhanh

Công nghê
nghê siêu
siêu phân
dân đường
tầng)
hơn chạy Bus
800MHz, tất ca bộ xư ly 3.06GHz và nhanh hơn chạy Bus
533MHz.
 Thực thi tập lênh ngoài lênh chuyên
nghiêp
 Bộ dự đoan phụ được mở
rộng
 Bộ nhớ đêm LI 8KB ha>16KB cộng với bộ nhớ đêm theo vêt thực thi
vi lênh 12k

Bộ nhớ đêm L2 56bit trên khuôn tốc độ nhân 256KB, 512KB, 1MB
hoăc 2MB kêt
 Bộ
đêm L3 tốc độ nhân 2MB tích hợp trên khn.
hợpnhớ
8 đường
 SSE2-SSE cộng với 144 tập lênh mới chưa xư ly âm
thanh và đồ họa

B. Nôi dung trong tâm
I. Cac công nghê
mới

Kha năng cung cấp một số cơng nghê mới và cac tính năng được
tăng cường trên


đây dựa vào cac tiên bộ mới nhất cua Intel trong lĩnh vực thiêt kê
viêc
tiêu
thụly
năng lượng và tính toan khơng thể thực hiên được ở
mạch,
quan
cac mơ hình vi
6


kiên trúc cua cac thê hê CPU trước. Bộ dấu chấm động được mở rộng.
Có nhiều
trạng thai năng lượng thấp hơn. Intel bo những số La Mã bằng một sự
chỉ đinh 4, số
A-rập tiêu chuẩn đối với Pentium 4. Bên trong pentium 4 có một kiên
trúc mới mà
Intel gọi là vi kiên trúc NetBurst, là thuật ngữ thi trường không phai
thuật ngữ kĩ
thuật. Intel dùng NetBurst để thí nghiêm cơng nghê siêu đường dân,
một bộ may thực
thi nhanh, bus hê thống tốc độ cao (400MHz, 533MHz, 800MHz và
1066MHz) và bộ
nhớ đêm theo vêt thực thi. Công nghê siêu đường dân là làm tăng
gấp đôi hay gấp ba
lần độ sâu đường dân tập lênh so với Pentium III ( hay Athlon/Athlon
64) nghĩa là
nhiều bước nho hơn được yêu cầu để thực thi tập lênh. Măc dù điều
này có thể dường

như kém hữu hiêu, nhưng nó cho phét đạt tới những xung cao hơn
nhiều. Bộ may
thực thi nhanh cho phép hai bộ logic số nguyên ( ALUs) chạy gấp đôi
tần số nhanh
Trong những vấn đề trên thì Bus bộ xư ly tốc độ cao là đắng kể nhất,
bộ
xư lyky
cóthuật
nghĩa là có những tập lênh có thể thực thi trong nữa chu
về măt
ky đồng hổ.Bus
mà nói bus bộ xư ly là bus quad-pumped 100MHz, 133MHz, 200MHz

400MHz/533MHz/800Mhz/1066Mhz là bus quad-pumped
haythống
266MHz
chạy
hơn đồng hay 1066Mhz bởi vì bus dung lượng 64bit (8byte)
533Mhz,800Mhz
chuyển giao dữ liêu
gấp bốn lần trong một chu ky (4x) cho tốc độ
cho
tốc
độ400Mhz,
lưu
hồ

thống
100Mhz/133Mhz/200Mhz/266Mhz
hiêu

dụng
lượng 3200MBps, 4266MBps, 6400MBps hay chuyển giao dữ liêu
gấp
bốn lần
8532MBps.
Trong
kiên chu
trúc kì
nội
bộ đường
tầng
hayvêt
30thực
tầngthi
cua
trong mỗi
đồng
hồ. Bộdân
nhớ20
đêm
theo
là pentium
bộ nhớ 4
những
tập
lênh
đêm L1 tốc độ cao

đơn
ba thành

tầng nho
hơn so
với giai
bộ xư
ly Nó
trước
như pentium
chưabiđược
lượngnhiều
12K những
vi hoạt
động
mã.
di chuyển
bộ
III,
làm
cho

giai mã tập lênh
hầu
như giống
bộ xư
RISC. làm
Khơng
may
cóxư
thể
tư đường
dân thực

thilychính,
tăng
tốclàđộ
ly. thêm vào số chu ky
thực thi
những tập lênh nêu chúng không được tối ưu chô bộ xư ly. Một ưu
điểm kiên trúc
quan trọng khac là cơng nghê siêu phân luồng, có thể được tìm thấy
trong tất ca
Pentium 4 2.4GHz và nhanh hơn chạy bus 800MHz hay tất ca Pentium
4 3.06GHz và
7

nhanh hơn chạy bus 533Mhz. Siêu phân luồng cho phép một bộ xư ly
đơn chạy hai
luồng cùng thời, hoạt động như thê nó là hai bộ xư ly thay vì một.


Pentium 4 đời đầu sư dụng socket 423 có 423 chân trong sự sắp xêp
SPGA 39x39.
Nhưng phiên ban sau cùng socket 47H, phiên ban hiên nay dùng
socket T (I.GA775)
có những chân thêm để hỗ trợ tính năng mới như EM64T ( sự mở
rộng 64 bit), bit vơ
hiêu hóa thực thi ( sự bao vê chống những tan công cua tràn bộ nhớ
đêm), cơng nghê
ao Intel, và những tính năng tiên tieean khac. Celeron không bao giờ
được thiêt kê để
làm viêc trong socket 423, nhưng celeron và celeron D có socket 478
hay socket T

1.
Hyper-Pipelined
Technology
Công
nghê
( LGA775),
cho phép
hê thống -hạ
gia so
với Pentium 4. Bộ chọn điên
Siêu
ống
Là công
ap được
tạo ranghê mới được giới thiêu trong Vi kiên trúc Netburst™
cua Intel. Nó
tăng
gấp Module
đơi "độ điều
sâu"chỉnh
cua "ống"
xư tự
ly động
lênh cua
CPU
sobo
sanh
với
nhờ vào
điên ap

được
đătkhi
trên
mạch

Vi kiên
chỉ hình
và được
nối
trúc
P6
được sư dụng ở cac thê hê CPU Pentium III. Lênh được thực
đên
socket.
20
giai
đoạn (20 stages) trong vi kiên trúc Netburst, so với 10 giai
hiên
trong
đoạn trong vi kiên
trúc P6. Ống lênh dài giúp chip Pentium 4 có thể đạt được mức
xung nhip cao hơn.
2. Execution Trace
CacheLà bộ nhớ đêm cấp 1 . Bên cạnh 8KB bộ nhớ đêm dùng để
chứa dữ liêu ,
Pentium 4 có kha năng lưu trữ đên 12K vi lênh đã được giai mã
nhằm giúp tăng
cường tốc độ thực thi lênh cua CPU.
3. Rapid Execution Engine - Cơ chê thực thi (lênh)
nhanhĐiều

chóng
này được thực hiên dựa trên hai Đơn vi Luận ly Số Học được
thiêt kê bên
trong Pentium 4. Nó cho phép Pentium 4 thực hiên cac lênh số học
(cộng, trư, nhân
chia) và luận ly (And, Or...) chính với tốc độ gấp 2 lần tần số xư ly cơ
ban cua bộ xư
ly. Như vậy CPU Pentium 4 - 2.0Ghz có kha năng thực hiên cac lênh
trên với tốc
4. Advanced Transfer Cache
độ
4.0Ghz và CPU Pentium 4 - 2.53Ghz thực hiên với tốc độ
(ATC)
Là bộ nhớ đêm cấp 2 (L2 Cache) được thiêt kê bên trong Pentium
5.1Ghz.
4. ATC có hai
loại: 512 KB L2 ATC với cac tốc độ CPU 2.8Ghz - 2.53Ghz - 2.40Ghz
2
.40(B)Ghz -2.26Ghz - 2.20Ghz - 2.0(A)Ghz và 1.6(A)Ghz; 256 KB L2
tốc
tư cac
1.2Ghz - 2.0Ghz. ATC cung cấp kênh truyền có thơng
ATCđộvới
lượng rất cao
với nhân cua CPU . ATC bao gồm một giao diên 256-bit (32 byte) để
truyền dữ liêu
8


trên mỗi xung clock. Điều này cho phép ATC (L2 Cache) hỗ trợ tốc độ

cao gấp 4 lần
tốc độ truyền dữ liêu cua L2 Cache sư dụng trong cac CPU Pentium
III.
Ví dụ: CPU Pentium 4 - 2.53Ghz có tốc độ truyền dữ liêu lên tới
81GB/giây,
5. Out-Of-Order
so
với tốc độ truyền dữ liêu 16GB/giây cua Pentium III - 1.0 Ghz.
Execution
Nhân hỗ trợ Out-of-Order Execution có thể sắp xêp lại cac vi
lênh, cho phép
lênh (cùng với đầu vào và cac tài nguyên hê thống cần thiêt) để
thực thi ngay khi có
thể và tranh lãng phí thời gian. Khi một vi lênh đang chờ được cấp
phat tài nguyên
hoăc dữ liêu, cac lênh khac (thường là trong buffer) có thể chen vào
thực song
thi. Nhờ
lênh
song, những khoang trễ cua pipeline bi loại bo. Nhân có
thể
thi nhiều
thựcthực
thi cac
lênh trong mỗi giai đoạn cua pipeline. Sau đó in-order retirement unit
sẽ tìm cac lênh
được hiên xong và khơng cịn phụ thuộc dữ liêu cũng như liên quan
đên cac lênh rẽ
6. Branch Prediction (phong đoan
nhanh

chưa hoàn thất để xư ly và lưu kêt qua ra bộ nhớ theo trật tự
nhanh)
Kiên
trúc
NetBurst
có thể nhớ được cac nhanh trong chương trình
ban đầu cua
nó.
chạy, giúp làm
giam độ trễ trong qua trình nhay và nạp đầy ống lênh , Cac nhanh được
lưu giữ trên cơ
sở đia chỉ lênh bên trong Branch Target Buffer (BTB). Bộ vi xư ly có
thể dự đoan
7. Rapid Execution
được
cac nhanh sắp tới trước ca khi lênh rẽ nhanh được thực hiên.
Engine
Trong Pentium 4, có 2 ALU và hai AGU chạy với mức xung gấp đôi
xung clock.
Rapid execution engine được giới thiêu là làm giam độ trễ cua viêc
thực hiên cac
phép toan đơn gian . Điều này thực sự có y nghĩa vì hiêu năng và
tốc độ cua
8. Quad Data
vi
xư ly phụ thuộc rất nhiều vào cac tính toan số nguyên trên ALU.
Rate
FSB cua Pentium 4 có thể truyền bốn lần dữ liêu trong một xung clock
. Công nghê
này là Quad Pumped hay còn gọi là Quad Data Rate (QDR).QDR khiên

cho xung nhip
hiêu dụng tăng lên gấp 4 lần so với xung thực. Nhờ đó cac CPU
Pentium 4 có thể
đạt đên 400Mhz
System
bus, tốc độ Tranfer
truyền nhận dữ liêu vào-ra
Real Clock
Performanc
CPU là 3.2GBps
e
Rate
9
so với tốc độ tương ứng là 1.06GBps cua Pentium III (133Mhz system
bus).


100MHz

400MHz

3.2GB/s

133MHz

533MHz

4.2GB/s

200MHz


800MHz

6.4GB/s

266MHz

1066MHz

8.5GB/s

9. Enhanced Floating Point &
Multimedia
Unit 4 mở rộng cac thanh ghi dấu chấm động lên tới
Bộ xư ly Pentium
128bit và tạo thêm
một thanh ghi mở rộng nhằm phục vụ viêc di
chuyển dữ liêu.
Do vậy, kha năng xư ly cac ứng dụng dấu chấm động (tính toan
kêt cấu, số
liêu tài chính, số liêu khoa học…) và truyền thông đa phương tiên
(dựng và xư ly
phim
video, xư SIMD
ly hình
anh đồ họa…)
được tăng cường rất nhiều.
10. Streaming
Extension
2 (SSE2)

Instructions

tập lênh hỗ trợ đồ họa mở rộng được thiêt kê cho Pentium 4. Vi kiên
trúc Netburst
mở rộng kha năng xư ly theo kiểu cấu trúc SIMD cua cac cơng nghê
Intel® MMX™
và SSE bằng cach thêm vào 144 lênh mới. Cac lênh này bao gồm cac
tac vụ số nguyên
SIMD 128-bit và cac tac vụ dấu chấm động . Cac lênh mới này làm
tối ưu hóa kha
11.
(siêu
phân
năngHyper
thực Threading
hiên cac ứng
dụng
như phim video, xư ly âm thanh - hình
luồng)
anh,

hóa, tínhlà cơng nghê cho phép một CPU vật ly hoạt động trên
Hyper
threading

điều
hành
toan
khoa
học ...

như là hai CPU logic hoạt động song song. Nó dựa trên nguyên
tắc là vào một
thời điểm chỉ có một phần tài nguyên cua CPU được sư dụng để thực
thi lênh cua
một tiên trình, những phần chưa được sư dụng có thể được dùng để
thực thi cac tiên
trình khac.Trong cac CPU sư dụng công nghê Hyper-Threading, mỗi
CPU logic sở
hữu một tập cac thanh ghi, kể ca thanh ghi đêm chương trình PC riêng
, CPU vật ly sẽ
luân phiên cac giai đoạn tìm/giai mã giữa hai CPU logic và chỉ cố gắng
thực thi những
10

thao tac tư hai chuỗi lênh đồng thời theo cach hướng tới những đơn vi
thực thi ít được
sư dụng.


II. CÂU TRUC, CHỨC NĂNG CAC BÔ
PHÂN
*Một số điểm đang chú
y
yyy Công nghê Hyper Pipelined với pipeline lên tới

20 stage.
FSB cua Pentium IV có mức xung tối thiểu là 400MHz nhờ ky
thuật QDR
(Quad Data Rate), cho phép truyền bốn lần dữ liêu trong một
xung clock, nhanh


gấp rưỡi system bus 266MHz sư dụng công nghê Double Data
cua AMD.
 Rate
Execution
Trace Cache: cache lênh (L1 instruction cache) được
chuyển

trước
Nhờ vậy, băng thông lên đên 3.2GB/s.


Fetch Unit ra phía sau Decode Unit và có tên là “Trace Cache”.

Có tới 128 thanh ghi, trong khi CPU cua Intel thuộc thê hê thứ 6
(như Pentium II ,
 Advanced
Execution,
Pentium III)Dynamic
chỉ có 40
thanh ghi.nâng cao kha năng phong đoan
nhanh và thực hiên


lênh không theo thứ tự (out-of-order execution).
Rapid Execute Engine, theo đó ALU cua Pentium IV làm viêc với
xung nhip gấp
đôi xung clock cua CPU.

1.Hyper

Pipeline
11


Trong CPU Pentium III thì pipeline có 10 stage (giai đoạn). Pentium IV
có 20 stage.
Pentium IV với tên mã “Prescott” 90nm thậm chí cịn có tới 31 stage.
Intel gọi đây là
công nghê siêu ống lênh (Hyper Pipelined Technology).Viêc tăng độ dài
pipeline
hướng đên mục tiêu tăng xung nhip. Có nhiều giai đoạn hơn đồng
nghĩa với cac đơn vi
chức
có thể của
được
cấu thành
20năng
tầng Pipeline
Pentium
IV: với số lượng transitor ít hơn. Và với ít
transistor thì
sẽ dễ dàng nâng cao xung nhip , về cơ ban là như vậy.

 Stage 1 & 2 - Trace cache next instruction pointer: tìm vi lênh tiêp
theo sẽ được thực hiên trong BTB (Branch Target Buffer).
 Stage 3 & 4 - Trace cache fetch: nạp vi lênh tư Trace Cache.
 Stage 5 - Drive: gưi vi lênh đên resource allocator và mạch
 RAT.
Stage 6 - Allocate: kiểm tra tài nguyên CPU cần thiêt cho viêc
thực hiên

7 & 8 - Rename: nêu chương trình sư dụng một trong tam
 Stages
lênh.

thanh dụ bộ nhớ được dùng làm bộ đêm.
ghi chuẩn x86 nó sẽ được đổi tên thành một trong 128 thành ghi
 cua
Pentium IV.
Stage 9 - Queue: cac vi lênh được đưa vào cac hàng đợi dành riêng
cho tưng
(ví10,
dụ:
cập bộ nhớ,
xư ly sốsắp
nguyên
chấm
 loại
Stages
11, truy
12 - Schedule:
scheduler
xêp lạihay
cacdấu
lênh
nhằm giữ
động
…).
Lênh
cho mọi
nằm

yên trong
hànghoạt
đợi động.
cho đên
một
chỗ
trống
tương ứng
execution
unit đều
Ví khi
dụ,có
nêu
đơn
vi xư
ly dấu
xuất
hiên
trong
chấm động ranh
scheduler.
rỗi, scheduler lấy ra một lênh xư ly dấu chấm động để gưi
cho đơn vi đó,
măc dù lênh tiêp theo trong chương
trình có thể là một
12
lênh xư ly số
nguyên.



Stages 13 & 14 - Dispatch: gưi vi lênh tới Execution Unit
tương ứng.
Stages 15 & 16 - Register Files: đọc register file.
17 - Flags:
Execute:
lênh
được được
thực cập
hiên.
Stage 18
cờvi
cua
vi lênh
nhật.
Stage 19 - Branch Check: kiểm tra nhanh cua chương trình có
cùng với
 suy đoan cua mạch dự đoan rẽ nhanh hay không.
Stage 20 - Drive: gưi kêt qua cua viêc kiểm tra này tới Branch
Target Buffer
(BTB).
Măc dù về ly thuyêt, pipeline dài có thể làm tăng hiêu năng, tuy
nhiên, bất chấp






điều này có qua nhiều stage sẽ khiên cho thời gian thực hiên một
lênh dài hơn.

Thứ hai, là một pipeline dài sẽ trở nên rất kém hiêu qua trong
những trường hợp
phong đoan nhanh sai (branch prediction error). Sẽ mất nhiều
thời gian để lấp
đầy pipeline một lần nữa. Intel đã triển khai một vài biên phap
để bù lại sự mất
Thực tê là Pentium IV chỉ nhanh hơn Pentium III nhờ hoạt động
mat
hiêu
năng trong những trường hợp này, đó là Execution

mức
xung
Trace Cache và
nhip cao hơn. Với cùng mức xung nhip, một CPU Pentium III sẽ
Dynamic
Execution Engine.
nhanh hơn
CPU Pentium IV nhờ kích thước pipeline cua nó.
Bởi vì sự kém hiêu qua cua pipeline trong kiên trúc Netburst, thê
hê vi xư ly thứ
8 cua Intel (vi kiên trúc Core) quay trở lại với kiên trúc cua
Pentium M, một
kiên trúc dựa trên nền tang cua kiên trúc thê hê thứ 6 thay vì tiêp
tục phat triển
thê hê thứ 7 (Netburst).
2.Bộ Nhớ
Đêm
a. Advanced transfer
cache

Cache L2 cua Pentium 4 kêt nối với cache dữ liêu L1 qua bus có độ
rộng là 256bit. Trong cac thê hê vi xư lí trước cua Intel độ rộng này là 64-bit. Với
m ột vài phép
toan đơn gian ta sẽ thấy băng thông giữa cache L2 và nhân là
44.8GB/s với Pentium 4
ở mức
xung 1.4
GHz và 48GB/s với Pentium 4 ở mức xung 1.5 GHz,
b.
Execution
trace
nhanh
gấp
4
cache
Cache lênh được chuyển tư trước Fetch Unit ra phía sau Decode
lầnUnit
so với
và thê
có hê
têntrước
gọi với cùng một xung nhip .
mới là "Trace Cache ". Do đó thay vì lưu trữ vi lênh để chuẩn bi nạp
13
bằng Fetch Unit


thì Trace Cache sẽ lưu trữ những vi lênh đã được giai mã nhờ Decode
Unit. Trace
Cache lưu trữ được 12K vi lênh, mỗi vi lênh trong Pentium IV có

độ rộng 100bit nên trong Trace Cache có dung lượng 150KB (12288 x 100 /8).Ý
tưởng đằng sau
cach kiên trúc này là để tối ưu vịng lăp bên trong cac chương trình. Khi
một lênh được
thực thi nhiều lần , thì vi lênh đã được giai mã sẵn và lưu trong Trace
Cache, và không
cần giai mã lại nhiều lần như cac VXL thê hê trước.Giống như Fetch
Unit, Trace
3.Bộ giai mã Cache cũng có Branch Target Buffer (BTB) lên tới 4K vi lênh. Trong CPU
Decoder
Tư thê hê thứ 6, CPU cua Intel dùng kiên trúc tập lênh lai
cua Intel
CISC/RISC. Bộ vi

phai
nhận
cac lênh
(Complex
Set và trong
thêlíhê
thứchấp
6, như
Pentium
III, CISC
bộ đêm
này chỉ Instruction
có 512 vi lênh
Computer),
thê hê thứ 5,được
như biêt

như
làlytập
lênh cua
Ngày
bộ xư
Pentium
chỉx86.
có 256
vi nay
lênh.hầu hêt phần mềm sư dụng tập lênh
này. Những bộ
vi xư lí chỉ sư dụng tập lênh RISC (Reduced Instruction Set Computer)
không thể
chạy được những chương trình thơng dụng như: Windows, Office...Do
đó cac CPU
hiên nay trên thi trường cua ca Intel, AMD đều sư dụng một bộ giai mã
CISC / RISC.
Bên trong CPU xư lí lênh kiểu RISC nhưng lại chỉ chấp nhận những
lênh CISC ở đầu
vào. Những lênh CISC x86 được gọi chung là lênh , còn những lênh
RISC bên trong
được gọi là cac vi lênh . Những vi lênh RISC này không thể sư dụng
Tuy do
theo
trực tiêp
đó tính phức tạp cua lênh x86 mà nó sẽ được decode
thành một
những chương trình sẽ phai sư dụng tập lênh CISC và được giai mã qua
số
RISC nào đó. Bộ giai mã cua Pentium IV có thể giai mã

mộtlênh
bộ giai
một lênh
mã . Mỗi một CPU sư dụng tập lênh RISC riêng không công bố rộng rãi
x86
xung clock thông thường một lênh x86 giai mã cần 4 vi
và nómỗi
khơng
lênh.
Nêu
một
lênh cịn được gọi là MIS (Microcode Instruction
“Microcode
ROM”
tương
thích
với
vi lênh cua CPU khac. Ví dụ vi lênh cua Pentium III
Sequencer)
lưu
x86
phức
tạp

hơn 4
vi ta
lênh,
nólênh
được
đinhứng

hướng
danh
sach
tất
ca
cac nhiều
lênh cùng

cac vi
tương
sẽ trong
khac với vi lênh thể
bộ
nhớ
ROM
.
được dich ra.
cua Pentium IV , khac với vi lênh cua Athlon 64.
4.Allocator và Register
Renamer
Trong giai đoạn alloc,
allocator sẽ:
14


Dành ra một trong 126 reorder buffers (ROB) cho vi lênh hiên thời.
Nó cho phép
thực hiên vi lênh khơng theo thứ tự , CPU có thể đăt chúng trở lại
thứ tự cũ sư dụng
bang này. Dành ra một trong 128 register files để lưu trữ kêt qua dữ

liêu
lí vilà nạp (LOAD) hoăc ghi (STORE), có nghĩa là nó sẽ đọc
Nêutưvixư
lênh
hoăc viêt dữ
lênh.
liêu trên bộ nhớ RAM, nó sẽ dành một trong số 48 bộ đêm nạp (Load
Buffers -LB)
hoăc một trong 24 bộ đêm lưu trữ (Store Buffers - SB)tương ứng . Dành
ra một đầu
vào trên bộ nhớ hoăc hàng đợi, tuy thuộc vào tưng vi lênh . Tập lênh
CISC x86 chỉ
có 08 thanh ghi 32-bit (EAX, EBX, ECX, EDX, EBP, ESI, EDI và ESP).
Số này
đơn gian là qua ít, đăc biêt là khi CPU có thể thực thi theo kiểu out-oforder. Do đó,
CPU phai đổi tên và nội dung cua những thanh ghi được sư dụng trong
chương trình
thành một trong 128 thanh ghi cua CPU , điều này cho phép những
lênh sư dụng cùng
thanh ghi có thể chạy đồng thời. Thậm trí out -of-order, có nghĩa là
cho phép lênh thứ
5.Schedule
hai chạy trước lênh thứ nhất ngay ca khi chúng sư dụng cùng một thanh
rghi.
Scheduler là trai tim cua hê thống out-of-order Pentium IV. Mục đính
cua Scheduler là
Chúng ta cần chú y rằng Pentium IV thực sự có tới 256 thanh
giữ
execution unit trong CPU luôn luôn làm viêc. Cac vi lênh
ghi:cho

128mọi
cho
tới scheduler sẽ
những lênh số nguyên và 128 thanh ghi cho lênh dấu chấm động và
được
nó phân tích và đăt vào một trong bốn scheduler unit tùy theo
lênh SSE.
kiểu cua vi lênh:
Renamer cua Pentium IV có kha năng xư lí ba vi lênh trong một xung
Memory
unit: cho những vi lênh liên quan đên bộ nhớ.
clock.
Sauscheduler
đó tư
Những vi lênh này
Slow / General
scheduler
unit: cho những vi lênh khac và những vi
renamer
vi lênh FP
đi tới
hàng đợi.
đên
tưxư
hàng
đợi cua cac vi lênh bộ nhớ (memory microinstruction
lênh
ly dấu
queue).
chấm động phức tạp.

Simple
FP scheduler
unit:những
cho những
lênhgian.
dấu chấm động đơn
Fast scheduler
unit: cho
vi lênhviđơn
gian.Scheduler sắp
xêp những vi lênh theo kiểu cua chúng. Sau đó nó có thể gưi mỗi vi
lênh trực tiêp tới
Execution Unit tương ứng để xư lí.
15


6.Execution
Unit
Như đã đề cập, Pentium IV có bốn cổng gưi đi đanh số tư 0 tới 3. Mỗi
cổng được nối
tới một, hai hoăc ba đơn vi thực thi (execution unit). Pentium IV có 05
execution unit
02
đọcsong
và ghi
liêucho
vào
nhớ
làmAGU
viêcđể

song
(02dữ
FPU
sốbộ
dấu
chấm động , 03 ALU cho số
RAM.
nguyên)
và cua
thêm
Phần
chính
Rapid Execution Engine là cac rapid execution unit,
bao gồm hai
ALU và hai AGU . Cac vi lênh đơn gian có thể được thực thi bằng
những đơn vi này
và chỉ mất một nưa xung clock , những lênh dich và xoay không thể
được thực thi
được bằng cac rapid execution unit sẽ được gưi đên “Slow ALU”.
Cổng 0 và 1 có thể gưi hai vi lênh trong một xung clock tới 2 rapid
execution ALU,
Hai vi lênh cho
do
đó số
cổng
1 lượng tối đa cac vi lênh có thể được chuyển đi trong một
Một vi
lênhlàcho
xung
clock

6:
cổng 2
Một
vi lênh
lênh cho
cho cổng 0
Hai vi
cổng 3
Một điều chúng ta cần nhớ là những lênh phức tạp có thể cần đên vài
xung clock để xư
lí. Ví dụ ở cổng số 1, có một đơn vi xư ly dấu chấm động. Trong khi
đơn vi này
đang xư ly một lênh rất phức tạp mất vài xung clock, cổng 1 sẽ vân
tiêp tục nhận cac
lênh đơn gian nó và chuyển đên ALU trong khi FPU còn bận. Nêu để y
một chút, ta
thấy Intel đăt vào cùng một cổng một fast unit và một complex (slow)
Nên,
măc dù tối đa chỉ có 6 lênh được chuyển, thực sự CPU có thể
unit. Khi
có đên 7 lênh
complex unit cịn đang bận tính toan, đơn vi cịn lại có thể tiêp tục
cùng
xưtư
ly một lúc.
nhận được
vi lênh
cổng tương ứng.

16



III. Tập Lênh
Khn dạng lênh
P4

 Các nhóm lệnh:
1. General Pupose (Nhóm lênh
chung)
2
. System Instructions (Cac lênh hê
thống)
3
. x87 FPU
4. x87 FPU và
SIMD
5. Công nghê
MMX

6. SSE
7. SSE2
8. SSE3

9. IA-32e: 64-Bit Mode (chê độ 64
bit)

C. KẾT LUẬN
Intel đã đưa ra Pentium 4 nhằm tập trung vào tốc độ xung nhip
cao với thiêt
kê pipeline rất dài. Tuy đúng là cach làm này sẽ tạo ra tốc độ rất cao

nhưng nó cũng
17


đồng nghĩa với hiêu suất làm viêc lại giam đi vì viêc thực hiên một
lênh cần qua
nhiều giai đoạn. CPU pentium 4 thường có xung nhip cao hơn những
CPU cua
AMD, nhưng lại không nhanh hơn khi kiểm nghiêm Benchmark. Điều
này khiên
người
dùng
có cơng
khuynh
hướng
lựa chọn những
bộđược
vi xưgiới
lí Penti
um
4 vì
Trong
khi đó
nghê
HyperThreading
(HT)
thiêu
vào
theo
bộ vi

giaihọ
đoạn
giữa

nào có tốc
độ chỉ
caothành
hơn sẽcơng
chạyvề
hiêu
qua
hơn,…măc
dù điều Lợi
đó là
cualí Pentium
4 lại
khía
cạnh
marketing.
ích
khơng
phai.
mà HT đem lại
thấp (và đơi khi cịn kém hơn khơng dùng HT). Trên thực tê, nêu
người dùng phổ
thơng kích hoạt tính năng “siêu luồng” trên may tính desktop cua
mình , họ có thể ch
ng được gì ngoại trư phai tra gia bằng viêc giam tốc độ tới 10%.Tuy
nhiên Pentium 4
khơng chỉ có những nhược điểm. Với tập lênh SSE2 và SSE3 cùng

những công nghê
hàng
đầucàng
như trở
Quad
Rate,
Cache,
Execution
3D ngày
nênData
mạnh
mẽ,Trace
một chip
P4 Rapid
sẽ đem
đên nền Engine,
tang
Dual
Channel
tuyêt vời cho cac
Memory,
to overclock
ra rất xuất
cacnhân
ứng Northwood
dụng tư
game thu.Pentium
Đăc biêt4 giới
rất sắc
quantrong

tâm tới
2
văn
tới
phat phịng
hành năm
overclock

đạt chu
tới
khi

giaingay
phap
tannhững
nhiêt
multimedia.
Người
dùng
cac1GHz
ứngRAM
dụng
tính
toan
phức
tạp
(kiểu
002. Với cũng
một
bo thể

mạch

đudụng
mạnh,
ca
thơng
thường.
như
rendering
người mới tập
cua Maya, 3DS) sẽ được hưởng lợi rất nhiều tư HyperThreading. Và
khi card đồ họa

Mục Lục
Trường đại học công nghiêp Hà
nội...............................................................................1
ĐÊBao cao bài tập lớn mơn
Kiên trúc May
TANhóm
I..........................................................................................................
học:
tính..............................................2
thực hiên: Nhóm 3–Lớp
KTPM3................1
K9..............................................................2
 Giao viên hướng dân: Nguyễn Thanh
Hai.................................................................2
1.
Nhiêm vụ cua
bài..................................................................................................2

2.MởBố
đầu.....................................................................................................
 cục......................................................................................................
Nội
................2
.............2
dung..................................................................................................
18
.................3


A.Lịch sư phat triên cca VXL Pentium
IV......................................................................3
*
B. NôiNhững
dung trođiểm
ng kĩ thuật chính cua Pentium 4 bao
gồm:............................................6
tâm....................................................................................................7
I. 1.
CaH
c ycơng
nghê
per-Pipelined
Technology - Cơng nghê Siêu
mới................................................................................................7
ống..........................................8
2. Execution Trace
Cache......................................................................................8
3. Rapid Execution Engine - Cơ chê thực thi (lênh) nhanh

chóng.........................9
4. Advanced Transfer Cache
(ATC).......................................................................9
5. Out-Of-Order
Execution....................................................................................9
6.
đoan
11.Branch
Hyper Prediction
Threading (ph
(siêoung
phân
nh
anh).............................................................9
II.luồng)................................................................11
CÂU
TRUC, CHỨC NĂNG CAC BÔ
7.
Rapid
Execution
PH*Một
ÂN....................................................11
số điểm
đang chú
y
Engine..................................................................................10
y
yy................................................................................11
8.
1.HQuad

yper Data
Rate................................................................................................1
Pipeline.............................................................................................
0
......12
9.
Enhanced
Floating Point & Multimedia
2.Bộ
Nhớ
Unit..................................................10
Đêm..................................................................................................
....14
III.10.
TậpStreaming SIMD Extension 2 (SSE2)
Instructions........................................10
3.Bộ giai mã Lênh....................................................................................................
Decoder.........................................................................................1
........17
4
Khuôn
dạng lênh
4.Allocator
và Register
P4.............................................................................................17
Renamer..........................................................................15
C. KẾT
5.Scheduler.......................................................................................
LUẬN
.......................................................................................................

....................16
......18
6.Execution
Unit...................................................................................................
16

19



×