Tải bản đầy đủ (.docx) (18 trang)

Nghiên cứu tìm hiểu về thế hệ vi xử lý InTel Pentium IV.

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (610.7 KB, 18 trang )

Bộ Công Thương
ĐẠI HỌC CÔNG NGHIỆP HÀ NỘI
Khoa Công Nghệ Thông Tin
-----------------------

Giáo viên hướng dẫn : Nguyễn Thanh Hải
Môn : Kiến Trúc Máy Tính

ĐỀ TÀI: NGHIÊN CỨU TÌM HIỂU
VỀ THẾ HỆ VI XỬ LÝ INTEL
PENTIUM IV.
NHÓM 2:
TRẦN ĐĂNG HUY
ĐÀO DUY THANH
ĐỖ HOÀNG LONG
TRẦN VĂN QUÂN
VŨ CÔNG MINH
1


MỤC LỤC
PHẦN I : HOÀN CẢNH RA ĐỜI VÀ LỊCH SỬ PHÁT TRIỂN ……………….. 3
PHẦN II. NỘI DUNG CHÍNH ……………………………………………………..5
I. ĐẶC ĐIỂM CÔNG NGHỆ CHUNG …………………………………………….5
II. Đặc trưng công nghệ chi tiết của từng loại biến thể của vi xử lý Pentium IV...8
1.1 Pentium 4 Extreme
Edition……………………………………………………….8
1.2 P4 Prescott (năm 2004)
…………………………………………………………..9
1.3 Pentium D (năm 2005)
…………………………………………………………...9


1.4 Pentium Extreme Edition (năm 2005)
…………………………………………...10
PHẦN III. CÔNG NGHỆ MỚI…………………………………………………….11
1.1 Hyper-Pipelined Technology - Công nghệ Siêu ống……………………………..11
1.2.
Execution
………………………………………………………….14
1.3.Rapid
Execution
………………………………………………………….14

TraceCache
Engine

1.4. Out-Of-Order Execution…………………………………………………………14
1.5.Quad Data Rate…………………………………………………………………...15
1.6. Hyper Threading (siêu phân luồng)………………………………………………
16
PHẦN III. KẾT
LUẬN……………………………………………………………...17

2


PHẦN I : HOÀN CẢNH RA ĐỜI VÀ LỊCH SỬ PHÁT TRIỂN.
+) Hoàn cảnh ra đời :
Intel Pentium 4 (P4) là BXL thế hệ thứ 7 dòng x86 phổ thông, được giới thiệu
vào tháng 11 năm 2000. P4 sử dụng vi kiến trúc NetBurst có thiết kế hoàn toàn mới so
với các BXL cũ (PII, PIII và Celeron sử dụng vi kiến trúc P6). Một số công nghệ nổi
bật được áp dụng trong vi kiến trúc NetBurst như Hyper Pipelined Technology mở

rộng số hàng lệnh xử lý, Execution Trace Cache tránh tình trạng lệnh bị chậm trễ khi
chuyển từ bộ nhớ đến CPU, Rapid Execution Engine tăng tốc bộ đồng xử lý toán học,
bus hệ thống (system bus) 400 MHz và 533 MHz; các công nghệ Advanced Transfer
Cache, Advanced Dynamic Execution, Enhanced Floating point và Multimedia Unit,
Streaming SIMD Extensions 2 (SSE2) cũng được cải tiến nhằm tạo ra những BXL tốc
độ cao hơn, khả năng tính toán mạnh hơn, xử lý đa phương tiện tốt hơn.

+) Lịch sử phát triển :

3


Pentium 4 đầu tiên (tên mã Willamette) xuất hiện cuối năm 2000 đặt dấu chấm
hết cho "triều đại" Pentium III. Willamette sản xuất trên công nghệ 0,18 µm, có 42
triệu transistor (nhiều hơn gần 50% so với Pentium III), bus hệ thống (system bus)
400 MHz, bộ nhớ đệm tích hợp L2 256 KB, socket 423 và 478. P4 Willamette có một
số tốc độ như 1,3; 1,4; 1,5; 1,6; 1,7; 1,8; 1,9; 2,0 GHz.
 Socket 423 chỉ xuất hiện trong khoảng thời gian rất ngắn, từ tháng 11 năm

2000 đến tháng 8 năm 2001 và bị thay thế bởi socket 478.

 Xung thực (FSB) của Pentium 4 là 100 MHz nhưng với công nghệ Quad Data

Rate cho phép BXL truyền 4 bit dữ liệu trong 1 chu kỳ, nên bus hệ thống của
BXL là 400 MHz.

- P4 Northwood. Xuất hiện vào tháng 1 năm 2002, được sản xuất trên công nghệ 0,13
µm, có khoảng 55 triệu transistor, bộ nhớ đệm tích hợp L2 512 KB, socket 478.
Northwood có 3 dòng gồm Northwood A (system bus 400 MHz), tốc độ 1,6; 1,8; 2,0;
2,2; 2,4; 2,5; 2,6 và 2,8 GHz. Northwood B (system bus 533 MHz), tốc độ 2,26; 2,4;

2,53; 2,66; 2,8 và 3,06 GHz (riêng 3,06 GHz có hỗ trợ công nghệ siêu phân luồng
Hyper Threading - HT). Northwood C (system bus 800 MHz, tất cả hỗ trợ HT), gồm
2,4; 2,6; 2,8; 3,0; 3,2; 3,4 GHz.
- P4 Prescott (năm 2004). Là BXL đầu tiên Intel sản xuất theo công nghệ 90 nm, kích
thước vi mạch giảm 50% so với P4 Willamette. Điều này cho phép tích hợp nhiều
transistor hơn trên cùng kích thước (125 triệu transistor so với 55 triệu transistor của
P4 Northwood), tốc độ chuyển đổi của transistor nhanh hơn, tăng khả năng xử lý, tính
toán. Dung lượng bộ nhớ đệm tích hợp L2 của P4 Prescott gấp đôi so với P4
Northwood (1MB so với 512 KB). Ngoài tập lệnh MMX, SSE, SSE2, Prescott được
bổ sung tập lệnh SSE3 giúp các ứng dụng xử lý video và game chạy nhanh hơn. Đây
là giai đoạn "giao thời" giữa socket 478 - 775LGA, system bus 533 MHz - 800 MHz
và mỗi sản phẩm được đặt tên riêng khiến người dùng càng bối rối khi chọn mua.
Prescott A (FSB 533 MHz) có các tốc độ 2,26, 2,4, 2,66, 2,8 (socket 4
78), Prescott 505 (2,66
GHz), 505J (2,66 GHz), 506 (2,66 GHz), 511 (2,8 GHz), 515 (2,93 GHz
), 515J (2,93 GHz), 516
(2,93 GHz), 519J (3,06 GHz), 519K (3,06 GHz) sử dụng socket 775LG
A.
Prescott E, F (năm 2004) có bộ nhớ đệm L2 1 MB (các phiên bản sau
được mở rộng 2 MB), bus
hệ thống 800 MHz. Ngoài tập lệnh MMX, SSE, SSE2, SSE3 tích hợp, P
4


rescott E, F còn hỗ trợ
công nghệ siêu phân luồng, một số phiên bản sau có hỗ trợ tính toán
64 bit.
Dòng sử dụng socket 478 gồm Pentium 4 HT 2.8E (2,8 GHz), 3.0E (3,
0 GHz), 3.2E (3,2 GHz),
3.4E (3,4 GHz). Dòng sử dụng socket 775LGA gồm Pentium 4 HT 3.2

F, 3.4F, 3.6F, 3.8F với các
tốc độ tương ứng từ 3,2 GHz đến 3,8 GHz, Pentium 4 HT 517, 520, 5
20J, 521, 524, 530, 530J,
531, 540, 540J, 541, 550, 550J, 551, 560, 560J, 561, 570J, 571 với cá
c tốc độ từ 2,8 GHz đến 3,8 GHz.

PHẦN II : NỘI DUNG CHÍNH
I. Đặc điểm công nghệ chung.
1. Những điểm kỹ thuật chính của Pentium IV bao gồm :
Tốc độ từ 1,3GHz đến 3.8GHz.
Phần mềm tương thích với những bộ xử lý Intel 32bit trước.
Một số phiên bản hỗ trợ EM64T ( các mở rộng 64 bit ) và Bit vô hiệu hóa thực
thi ( bảo vệ vượt dòng bộ nhớ đệm).
Bus bộ xử lý ( front-side) chạy ở 400MHz, 533MHz, SOOMhz hay 1066Mhz.
Những bộ logic số học ( ALUs : Arithmetic logic units ) chạy gấp hai lần tần số
nhân bộ xử lý.
Công nghệ siêu đường dẫn ( 20 – 30 tầng ).
Công nghệ siêu phân luồng hỗ trợ tất cả bộ xử lý 2.4GHz và nhanh hơn chạy
bus 800MHz, tất cả bộ xử lý 3.06GHz và nhanh hơn chạy bus 533MHz.
Thực thi tập lệnh ngoài lệnh chuyên nghiệp.
Bộ dự đoán phụ được mở rộng.
Bộ nhớ đệm LI 8KB ha> 16KB cộng với bộ nhớ đậm theo vết thực thi vi lệnh
12k.
Bộ nhớ đệm L2 56bit trên khuôn tốc độ nhân 256KB, 512KB, 1 MB hoặc 2
MB kết hợp 8 đường.
Bộ nhớ đệm 1,2 có thể tận dụng toàn bộ nhớ vật lý và hỗ trợ ECC.
5


Bộ nhớ đệm L3 tốc dộ nhân 2MB tích hợp trên khuôn.

SSE2 - SSE cộng với 144 tập lệnh mới cho xử lý âm thanh và đồ họa.
SSE3 – SSE2 cộng thêm 13 tập lệnh mới cho xử lý âm thanh và đồ họa.
Bộ dấu chấm động được mở rộng.
Có nhiều trạng thái năng lượng thấp hơn.

Intel bỏ những số La Mã bằng một sự chỉ định 4, số Ả-rập tiêu chuẩn
đối với Pentium 4. Bên trong Pentium 4 có một kiến trúc mới mà
Intel gọi là vi kiến trúc NetBurst (NetBurst microarchitecture), là
thuật ngữ thị trường không phải thuật ngữ kỹ thuật. Intel dùng
NetBurst để thí nghiệm công nghệ siêu đường dẫn, một bộ máy thực
thi nhanh, bus hệ thống tốc độ cao (400MHz, 533MHz, 800Mhz hay
1066MHz) và bộ nhớ đệm theo vết thực thi. Công nghệ siêu đường
dẫn là làm tăng gấp đôi hay gấp ba độ sâu đường dần tập lệnh so
với Pentium Ш (hay Athlon/Athlon 64) nghĩa là nhiều bước nhỏ hơn
được yêu cầu để thực thi tập lệnh. Mặc dù điều này cỏ thể dường
như kém hữu hiệu, nhưng nó cho phép đạt tới những xung cao hơn
nhiều. Bộ máy thực thi nhanh cho phép hai bộ logic số nguyên
(ALUs: arithmetic logic units) chạy gấp đôi tần số nhân bộ xử lý có
nghĩa là những tập lệnh có thể thực thi trong nửa chu kỳ đồng hồ.
Bus hệ thống 400MHz/533MHz/800Mhz/l066Mhz là bus '‘quadpumped” chạy hơn đồng hồ hệ thống
l00Mhz/l33Mhz/200Mhz/266Mhz chuyển giao dữ liệu gấp bốn lần
trong mỗi chu kỳ đồng hồ. Bộ nhớ đệm theo vết thực thi là bộ nhớ
đệm L1 tốc độ cao chứa ước lượng 12K những vi hoạt động giải mã.
Nó di chuyển bộ giải mã tập lệnh từ đường dẫn thực thi chính, làm

6


tăng tốc độ xử lý.
Trong những vấn đề trên thì bus bộ xử lý tốc độ cao là đáng kể nhất,

về mặt kỹ thuật mà nói bus bộ xử lý là bus quad-pumped 100MHz,
l33Mhz, 200Mhz hay 266Mhz chuyển giao dữ liệu gấp bốn lần trong
một chu kỳ (4x), cho tốc độ hiệu dụng 400Mhz, 533Mhz, 800Mhz hay
1066Mhz. Bởi vì bus dung lượng 64 bit (8 byte) cho tốc độ lưu lượng
3200MBps, 4266MBps, 6400MBps, hay 8532MBps.
Trong kiến trúc nội bộ đường dẫn 20 tầng hay 30 tầng của Pentium 4
những tập lệnh đơn bị bẽ thành nhiều tầng nhỏ hơn so với bộ xử lý
trước như Pentium III, làm nó hầu như giống bộ xử lý RISC. Không
may là có thể thêm vào số chu kỳ để thực thi những tập lệnh nếu
chúng không được tối ưu cho bộ xử lý. Một ưu điểm kiến trúc quan
trọng khác là công nghệ siêu phân luồng, có thề được tìm thấy trong
tất cả Pentium 4 2.4GHz và nhanh hơn chạy bus 800MHz hay tất cả
Pentium 4 3.06GHz và nhanh hơn chạy bus 533MHz. Siêu phân
luồng cho phép một bộ xử lý đơn chạy hai luồng cùng thời, hoạt
động như thể nó là hai bộ xử lý thay vì một.
Pentium 4 đời đầu sử dụng socket 423 có 423 chân trong sự sắp xếp
SPGA 39x39. Những phiên bản sau cùng socket 47H; phiên bản hiện
nay dùng socket T (I.GA775) có những chân thêm để hỗ trợ tính
năng mới như EM64T (sự mở rộng 64 bit), bit vô hiệu hóa thực thi
(sự bảo vệ chống những tấn công tràn bộ nhớ đệm), công nghệ ảo
Intel, và những tính năng tiên tiến khác. Celeron không bao giờ được
thiết kế để làm việc trong socket 423, nhưng Celeron và Celeron D
có socket 478 hay socket T (LGA775), cho phép hệ thống hạ giá so
với Pentium 4. Bộ chọn điện áp được tạo ra nhờ vào module điều
chỉnh điện áp tự động được đặt trên bo mạch chủ và được nối đến
socket.
Bảng 3.24 bao gồm một hướng dẫn đối với các tính năng bộ xử lý
Pentium 4 cũng như các bộ xử lý Pentium 4 Extreme Edition, được đi
sâu vào chi tiết trong phần tiếp theo.


7


EE = Extreme Edition
Execute Disable Bit
SSE = Streaming SIMD Instructions (MMX) Technology
Enhanced Intel SpeedStep
HT = Hyper-Threading Technology
Virtualization Technology

NX =
F.IST =
VT =

Hiện nay, rõ ràng là "Pentium 4” có nhiều hơn một họ bộ xử lý, dẫn
đến sự nhầm lẫn vô tận khi người dùng xem xét các nâng cấp hay
mua hệ thống mới. Do có ba dạng (Socket 423, Socket 478 và
Socket 775) và dãy lớn các tính năng có sẵn trong họ Pentium 4, cần
thiết là bạn quyết định chính xác tính năng nào thuộc bộ xử lý cụ thể
trước khi mua nó như một sự nâng cấp từ bộ xử lý đang có hay như
phần tử cùa hệ thống đầy đủ.

8


II. Đặc trưng công nghệ chi tiết của từng loại biến thể của vi xử lý Pentium IV.
1.1 Pentium 4 Extreme Edition.

9



Pentium 4 Extreme Edition (P4EE) xuất hiện vào tháng 9 năm 2
003, là BXL được Intel "ưu ái"
dành cho game thủ và người dùng cao cấp. P4EE được xây dựng từ B
XL Xeon dành cho máy chủ và trạm làm việc. Ngoài công nghệ HT "đ
ình đám" thời bấy giờ, điểm nổi bật của P4EE là bổ sung
bộ nhớ đệm L3 2 MB. Phiên bản đầu tiên của P4 EE (nhân Gallatin) s
ản xuất trên công nghệ
0,13 µm, bộ nhớ đệm L2 512 KB, L3 2 MB, bus hệ thống 800 MHz, sử
dụng socket 478 và
775LGA, gồm P4 EE 3.2 (3,2 GHz), P4 EE 3.4 (3,4 GHz).

* BXL 64 BIT, VI KIẾN TRÚC NETBURST
1.2 P4 Prescott (năm 2004)

Vi kiến trúc NetBurst 64 bit (Extended Memory 64 Technology
EM64T) đầu tiên được Intel sử
dụng trong BXL P4 Prescott (tên mã Prescott 2M). Prescott 2M cũng s
ử dụng công nghệ 90 nm,
bộ nhớ đệm L2 2 MB, bus hệ thống 800 MHz, socket 775LGA. Ngoài
các tập lệnh MX, SSE,
SSE2, SSE3, công nghệ HT và khả năng tính toán 64 bit, Prescott 2M
(trừ BXL 620) có hỗ trợ
công nghệ Enhanced SpeedStep để tối ưu tốc độ làm việc nhằm tiết
kiệm điện năng. Các BXL
6x2 có thêm công nghệ ảo hóa (Virtualization Technology). Prescott
2M có một số tốc độ như P4
HT 620 (2,8 GHz), 630 (3,0 GHz), 640 (3,2 GHz), 650 (3,4 GHz), 660,
662 (3,6 GHz) và 670, 672 (3,8 GHz).
Prescott Cedar Mill (năm 2006) hỗ trợ các tập lệnh và tính năng tươn

g tự Prescott 2M nhưng
không tích hợp Virtualization Technology. Cedar Mill được sản xuất tr
ên công nghệ 65nm nên tiêu
thụ điện năng thấp hơn, tỏa nhiệt ít hơn các dòng trước, gồm 631 (3,
0 GHz), 641 (3,2 GHz), 651 (3,4 GHz) và 661 (3,6 GHz).

10


1.3 Pentium D (năm 2005)

Pentium D (tên mã Smithfield, 8xx) là BXL lõi kép (dual core) đ
ầu tiên của Intel, được cải tiến từ
P4 Prescott nên cũng gặp một số hạn chế như hiện tượng thắt cổ ch
ai do băng thông BXL ở mức
800 MHz (400 MHz cho mỗi lõi), điện năng tiêu thụ cao, tỏa nhiều nh
iệt. Smithfield được sản xuất
trên công nghệ 90nm, có 230 triệu transistor, bộ nhớ đệm L2 2 MB (
2x1 MB, không chia sẻ), bus
hệ thống 533 MHz (805) hoặc 800 MHz, socket 775LGA. Ngoài các tậ
p lệnh MMX, SSE, SSE2,
SSE3, Smithfield được trang bị tập lệnh mở rộng EMT64 hỗ trợ đánh
địa chỉ nhớ 64 bit, công
nghệ Enhanced SpeedStep (830, 840). Một số BXL thuộc dòng này n
hư Pentium D 805 (2,66
GHz), 820 (2,8 GHz), 830 (3,0 GHz), 840 (3,2 GHz).
Cùng sử dụng vi kiến trúc NetBurst, Pentium D (mã Presler, 9xx) đượ
c Intel thiết kế mới trên công
nghệ 65nm, 376 triệu transistor, bộ nhớ đệm L2 4 MB (2x2 MB), hiệu
năng cao hơn, nhiều tính

năng mới và ít tốn điện năng hơn Smithfield. Pentium D 915 và 920 t
ốc độ 2,8 GHz, 925 và 930
(3,0GHz), 935 và 940 (3,2 GHz), 945 và 950 (3,4 GHz), 960 (3,6GHz)
. Presler dòng 9x0 có hỗ trợ Virtualization Technology.

11


1.4 Pentium Extreme Edition (năm 2005)
Extreme Edition là phiên bản cao cấp của Petium D, nhưng với
những khác biệt :
 Công nghệ HT được hỗ trợ, cho phép mỗi nhân giả như hai

nhân bộ xử lý cho tốc độ tốt hơn với những ứng dụng đa luồng.
 Không hỗ trợ công nghệ bước tốc độ Intel được nâng cao
( Enhanced Intel Speed Step Technology).
 Bao gồm các hệ số nhân không khóa, cho phép vượt xung dễ
dàng.

BXL lõi kép dành cho game thủ và người dùng cao cấp. Pentiu
m EE sử dụng nhân Smithfield,
Presler của Pentium D trong đó Smithfield sử dụng công nghệ 90nm,
bộ nhớ đệm L2 được mở
rộng đến 2 MB (2x1 MB), hỗ trợ tập lệnh MMX, SSE, SSE2, SSE3, côn
g nghệ HT, Enhanced
Intel SpeedStep Technology (EIST) và EM64T. Pentium 840 EE (3,20
GHz, bus hệ thống 800
12



MHz, socket 775LGA) là một trong những BXL thuộc dòng này.
Pentium EE Presler sử dụng công nghệ 65 nm, bộ nhớ đệm L2 được
mở rộng đến 4 MB (2x2
MB), hỗ trợ tập lệnh MMX, SSE, SSE2, SSE3, công nghệ HT, Enhance
d Intel SpeedStep
Technology (EIST), EM64T và Virtualization Technology. Một số BXL th
uộc dòng này là Pentium
EE 955 (3,46GHz) và Pentium EE 965 (3,73GHz) có bus hệ thống 106
6 MHz, socket 775.

PHẦN III. CÁC CÔNG NGHỆ MỚI.
Khả năng cung cấp một số công nghệ mới và các tính năng được tăng cườngtrên đây
dựa vào các tiến bộ mới nhất của Intel trong lĩnh vực thiết kế mạch, quản lý
việc tiêu thụ năng lượng và tính toán không thể thực hiện được ở các mô hình vi kiến
trúc của các thế hệ CPU trước.
1.1.HYPER-PIPELINED TECHNOLOGY(Công nghệ Siêu ống)
Là công nghệ mới được giới thiệu trong Vi kiến trúc Netburst™ của Intel. Nó tăng
gấp đôi "độ sâu" của "ống" xử lý lệnh của CPU khi so sánh với mô hình Vi kiến trúc
P6 được sử dụng ở các thế hệ CPU Pentium III. Lệnh được thực hiện trong 20 giai
đoạn (20 stages) trong vi kiến trúc Netburst, so với 10 giai đoạn trong vi kiến trúc P6.
Ống lệnh dài giúp chip Pentium 4 có thể đạt được mức xung nhịp cao hơn. Với các
CPU Pentium 4 sử dụng 400Mhz System bus, tốc độ truyền nhận dữ liệu vào-ra CPU
là 3.2GB mỗi giây so với tốc độ tương ứng là 1.06GB/ Giây với thế hệ Pentium III sử
dụng kênh truyền hệ thống 133Mhz (133Mhz system bus).

Vi kiến trúc Netburst™
13


- Trong CPU Pentium III thì pipeline có 10 stage (giai đoạn). Pentium IV có

20
stage. Pentium IV với tên mã “Prescott” 90nm thậm chí còn có tới 31 stage. Intel gọi
đây là công nghệ siêu ống lệnh (Hyper Pipelined Technology).
Việc tăng độ dài pipeline hướng đến mục tiêu tăng xung nhịp. Có nhiều giai
đoạn hơn đồng nghĩa với các đơn vị chức năng có thể được cấu thành với số lượng
transitor ít hơn. Và với ít transistor thì sẽ dễ dàng nâng cao xung nhịp, về cơ bản là
như vậy.

20 stage (giai đoạn) Pipeline của Pentium IV :


Stage 1 & 2 - Trace cache next instruction pointer: tìm vi lệnh tiếp theo sẽ
được
thực hiện trong BTB (Branch Target Buffer).





Stage 3 & 4 - Trace cache fetch: nạp vi lệnh từ Trace Cache.
Stage 5 - Drive: gửi vi lệnh đến resource allocator và mạch RAT.
Stage 6 - Allocate: kiểm tra tài nguyên CPU cần thiết cho việc thực hiện lệnh.
Ví dụ bộ
nhớ được dùng làm bộ đệm.



Stages 7 & 8 - Rename:
thanh ghi


nếu chương trình sử dụng một trong tám

chuẩn x86 nó sẽ được đổi tên thành một trong 128 thanh ghi của Pentium IV.


Stage 9 - Queue: các vi lệnh được đưa vào các hàng đợi dành riêng cho
từng loại
(ví dụ: truy cập bộ nhớ, xử lý số nguyên hay dấu chấm động …). Lệnh nằm yên

trong
hàng đợi cho đến khi có một chỗ trống tương ứng xuất hiện trong scheduler.


Stages 10, 11, 12 - Schedule: scheduler sắp xếp lại các lệnh nhằm giữ
cho mọi execution unit đều hoạt động. Ví dụ, nếu đơn vị xử lý dấu
chấm độngrảnh rỗi,scheduler lấy ra một lệnh xử lý dấu chấm động để gửi
cho đơn vị đó, mặc dù lệnh tiếp theo trong chương trình có thể là một lệnh xử
lý số nguyên.
14








Stages 13 & 14 - Dispatch: gửi vi lệnh tới Execution Unit tương ứng.
Stages 15 & 16 - Register Files: đọc register file.
Stage 17 - Execute: vi lệnh được thực hiện.

Stage 18 - Flags: cờ của vi lệnh được cập nhật.
Stage 19 - Branch Check: kiểm tra nhánh của chương trình có cùng với

suy đoán của mạch dự đoán rẽ nhánh hay không.
• Stage 20 - Drive: gửi kết quả của việc kiểm tra này tới Branch Target
Buffer(BTB).Mặc dù về lý thuyết, pipeline dài có thể làm tăng hiệu năng, tuy
nhiên, bất chấp điều này, có quá nhiều stage sẽ khiến cho thời gian thực hiện
một lệnh dài hơn. Thứ hai là một pipeline dài sẽ trở nên rất kém hiệu quả
trong những trường hợp phỏng đoán nhánh sai (branch prediction error). Sẽ
mất nhiều thời gian để lấp đầy pipelinemột lần nữa. Intel đã triển khai một
vài biện pháp để bù lại sự mất mát hiệu năng trong những trường hợp này,
đó là Execution Trace Cache và Dynamic Execution Engine.
Thực tế là Pentium IV chỉ nhanh hơn Pentium III nhờ hoạt động ở
mức xung nhịp cao hơn. Với cùng mức xung nhịp, một CPU Pentium III
sẽ nhanh hơn CPU Pentium IV nhờ kích thước pipeline của nó.
Bởi vì sự kém hiệu quả của pipeline trong kiến trúc Netburst, thế hệ vi xử lý
thứ8 của Intel (vi kiến trúc Core) quay trở lại với kiến trúc của Pentium M, một
kiến trúc dựa trên nền tảng của kiến trúc thế hệ thứ 6 thay vì tiếp tục phát triển
thế hệ thứ 7 (Netburst ).
1.2. Execution TraceCache
Là bộ nhớ đệm cấp 1 (Level 1 Execution Trace Cache). Bên cạnh 8KB
bộ nhớ đệm dùng để chứa dữ liệu (data cache), Pentium 4 có khả năng lưu
trữ đến 12K vi lệnh đã được giải mã (decoded micro-ops) nhằm giúp tăng
cường tốc độ thực thi lệnh của CPU
1.3.Rapid Execution Engine - Cơ chế thực thi (lệnh) nhanh chóng
- Điều này được thực hiện dựa trên hai Đơn vị Luận lý Số học (Arithmetic Logical
Unit ALU) được thiết kế bên trong Pentium 4. Nó cho phép Pentium 4 thực hiện các lệnh
số học (cộng, trừ, nhân chia) và luận lý (Và-And, Hoặc-Or...) chính với tốc độ gấp 2

15



lần tần số xử lý cơ bản của bộ xử lý. Như vậy CPU Pentium 4 - 2.0Ghz (bus 400Mhz)
có khả năng thực hiện các lệnh trên với tốc độ 4.0Ghz và CPU Pentium 4 2.53Ghz (bus533Mhz) thực hiện với tốc độ 5.1Ghz.

1.4. Out-Of-Order Execution
Nhân hỗ trợ Out-of-Order Execution có thể sắp xếp lại các vi lệnh, cho phép lệnh
(cùng với đầu vào và các tài nguyên hệ thống cần thiết) để thực thi ngay khi có thể và
tránh lãng phí thời gian. Khi một vi lệnh đang chờ được cấp phát tài nguyên hoặc dữ
liệu, các lệnh khác (thường là trong buffer) có thể chen vào thực thi. Nhờ thực thi các
lệnh song song, những khoảng trễ của pipeline bị loại bỏ. Nhân có thể thực thi nhiều
lệnh trong mỗi giai đoạn của pipeline.
Sau đó in-order retirement unit sẽ tìm các lệnh được thực hiện xong và không còn
phụ thuộc dữ liệu cũng như liên quan đến các lệnh rẽ nhánh chưa hoàn tất để xử lý
và lưu kết quả ra bộ nhớ theo trật tự ban đầu của nó.

1.5.Quad Data Rate
FSB của Pentium 4 có thể truyền bốn lần dữ liệu trong một xung clock. Công
nghệ này là Quad Pumped hay còn gọi là Quad Data Rate (QDR).
QDR khiến cho xung nhịp hiệu dụng tăng lên gấp 4 lần so với xung thực. Nhờ đó
các CPU Pentium 4 có thể đạt đến 400Mhz System bus, tốc độ truyền nhận
dữ
liệu vào-ra CPU là 3.2GBps so với tốc độ tương ứng là 1.06GBps của Pentium
III (133Mhz system bus).

16


Bảng: Tốc độ truyền dẫn dữ liệu
1.6. Hyper Threading (siêu phân luồng)

Hyper lý hoạt động trên hệ điều hành như là hai CPU logic hoạt động song
song. Nó dựa trên nguyên tắc là vào một thời điểm chỉ có một phần tài nguyên
của CPU được sử dụng để thực thi lệnh của một tiến trình, những phần chưa được sử
dụng có thể được dùng để thực thi các tiến trình khác.
Trong các CPU sử dụng công nghệ Hyper-Threading, mỗi CPU logic sởhữu
một tập các thanh ghi, kể cả thanh ghi đếm chương trình PC riêng (separate program
counter), CPU vật lý sẽ luân phiên các giai đoạn tìm/giải mã giữa hai CPU logic và
chỉcố gắng

thực thi những

thao tác từ hai chuỗi lệnh đồng thời theo cách

hướng tới những đơn vị thực thi ít được sử dụng.

PHẦN III : KẾT LUẬN
Intel đã đưa ra Pentium 4 nhằm tập trung vào tốc độ xung nhịp cao với thiết kế
pipeline rất dài. Tuy đúng là cách làm này sẽ tạo ra tốc độ rất cao nhưng nó
cũng đồng nghĩa với hiệu suất làm việc lại giảm đi vì việc thực hiện một lệnh
cần quá nhiều giai đoạn. CPU pentium 4 thường có xung nhịp cao hơn những
CPU của AMD, nhưng lại không nhanh hơn khi kiểm nghiệm Benchmark.
Điều này khiến người dùng có khuynh hướng lựa chọn những bộ vi xử lí Pentium 4
vì theo họ bộ vi xử lí nào có tốc độ cao hơn sẽ chạy hiệu quả hơn, mặc dù điều đó là
không phải.
Trong khi đó công nghệ HyperThreading (HT) được giới thiệu vào giai đoạn giữa
của Pentium 4 lại chỉ thành công về khía cạnh … marketing. Lợi ích mà HT đem lại

17



thấp (và đôi khi còn kém hơn không dùng HT). Trên thực tế, nếu người dùng phổ
thông kích hoạt tính năng “siêu luồng” trên máy tính desktop của mình, họ có
thể chẳnng được gì ngoại trừ phải trả giá bằng việc giảm tốc độ tới 10%.
Tuy nhiên Pentium 4 không chỉ có những nhược điểm. Với tập lệnh SSE2 và
SSE3 cùng những công nghệ hàng đầu như Quad Data Rate, Trace Cache, Rapid
Execution Engine, Dual Channel Memory, Pentium 4 tỏ ra rất xuất sắc trong các ứng
dụng từ văn phòng tới multimedia. Người dùng các ứng dụng tính toán phức
tạp (kiểu như rendering

của Maya, 3DS) sẽ được

hưởng

lợi rất nhiều

từ HyperThreading. Và khi card đồ họa 3D ngày càng trở nên mạnh mẽ, một
chip P4 sẽ đem đến nền tảng tuyệt vời cho các game thủ. Đặc biệt giới overclock
rất quan tâm tới nhân Northwood phát hành năm 2002. Với một bộ mạch chủ
và RAM đủ mạnh, ngay cả những người mới tập overclock cũng có thể đạt
tới 1GHz khi sử dụng giải pháp tản nhiệt thông thường.

18



×