Tải bản đầy đủ (.docx) (19 trang)

Nghiên cứu tìm hiểu về thế hệ vi xử lý intel pentium IV

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.08 MB, 19 trang )

Trường đại học công nghiệp Hà nội
Khoa Công Nghê Thông Tin
----------

BÀI TIỂU LUẬN MÔN HỌC: KIẾN TRÚC MÁY TÍNH
ĐÊ TÀI: Nghiên cứu tìm hiểu về thê hệ vi xư ly InTel Pentium IV
Giáo viên hướng dẫn: Nguyễn Thanh Hải
Lớp: Đại học KTPM3-K9
Nhóm sô: 3

Ha Nội, ngay 1 tháng 11 năm 2015

Trường đại học công nghiêp Hà nội

Khoa Công Nghê Thông Tin


Báo cáo bai tập lớn mơn học:

Kiến trúc Máy tính

ĐÊ TÀI: Nghiên cứu tìm hiểu về thê hệ vi xư ly InTel Pentium IV
Nhóm thực hiện: Nhóm 3–Lớp KTPM3-K9
Thành viên trong nhóm:
1. Leo thị lan Hương
2. Trần hải Linh
3. Nguyễn thị Nga
4. Nguyễn thị Nhã
5. Trần thị Quyên
Giáo viên hướng dẫn: Ngũn Thanh Hải
(GV Kiên Trúc Máy Tính)


Ha Nợi ,ngay 1 tháng 11 năm 2015

 Mở đầu
1. Nhiệm vụ của bài
Nghiên cứu tìm hiểu về thê hê vi xư ly InTel Pentium IV.
2. Bố cục
* Lịch sư phát triển của VXL Pentium IV :
- Hoàn cảnh ra đời của VXL Pentium IV.
- Đặc trưng công nghê chung của VXL Pentium IV.
* Đặc trưng công nghê chi tiêt của từng loại biên thể (version) của VXL
Pentium IV

2


 Nội dung
A.Lịch sư phát triển của VXL Pentium IV
Pentium 4 là bộ vi xư ly kiên trúc x86 thê hê thứ 7 do Intel sản xuất, và là thiêt kê CPU
hoàn toàn mới đầu tiên của họ kể từ Pentium III năm 1995. Thiêt kê mới này được gọi
là kiên trúc NetBurst. Không như Pentium II, Pentium III, và các loại Celeron khác
nhau, kiên trúc này khác được tạo mới hồn tồn và thừa kê rất ít từ thiêt kê Pentium
Pro/P6.
Bộ vi xư ly Pentium 4 đầu tiên, mã hiêu là "Willamette", chạy với tốc độ 1.4 và
1.5 GHz và đã được phát hành vào tháng 11 năm 2000 trên nền Socket 423, và sau đó
đã chạy với tốc độ từ 1.5 GHz tới 2 GHz trên Socket 478. Được ghi nhận cùng với sự
ra đời của Pentium 4 là bus FSB(Front side bus) nhanh với tốc độ 400 MT/s. Khi đó,
chip AMD Athlon đang chạy với tốc độ 266 MT/s.
Pentium 4

Dòng vi xư ly Pentium 4 đã kêt thúc vào

ngày 27 tháng 7 năm 2006, được thay thể bởi
dòng Intel Core 2 - dòng sư dụng nhân

Produced

From 2000 to 2008

Max. 1.30 GHz to 3.80 GHz

"Conroe".
Pentium 4 được sản xuất vào tháng 11 năm 2011

speeds

và được giới thiêu là bộ vi xư ly thê hê mới.

400 MT/s to 1066 MT/s
(), ,
,, ,

Nêu bộ vi xư ly này được đặt số thay vì tên nó
sẽ được gọi là 786 bởi vì nó đại diên cho một
thê hê sau những bộ xư ly 686. Vài hình thức
khác nhau của Pentium 4 được ra mắt công

Transistors

chúng được dựa trên kiên trúc và khuôn bộ xư
ly được dựa trên các nhân Willametter,
Northwood và Prescott.

Socket(s)

3
Predecessor
Successor

42M 180nm
55M 130nm
169M 130nm (P4EE)
125M 90nm
188M 65nm


Một số công nghê nổi bật được áp dụng trong kiên trúc
NetBurst như Hyper Pipelined Technology(Công nghê siêu
ống) mở rộng số hàng lênh xư ly, làm hiêu suất máy có thể
tăng 30%. Execution Trace Cache tránh tình trạng lênh bị
chậm trễ khi chuyển từ bộ nhớ dên CPU, Rapid Execution
Engine tang tốc bộ đồng xư ly toán học, bus hê thống
(system bus) 400 MHz và 533 MHz; các công nghê
Advanced Transfer Cache, Advanced Dynamic Execution,
Enhanced Floating point và Multimedia Unit, Streaming SIMD Extensions 2
(SSE2) cũng được cải tiên nhằm tạo ra những BXL tốc độ cao hơn, khả năng tính
toán mạnh hơn, xư ly đa phương tiên tốt hơn. Ghi nhận cùng với sự ra đời của
Pentium 4 là công nghê Quad Data Rate cho phép FSB (Front Side Bus) đạt đên tốc
độ 400 MHz. Khi đó, chip AMD Athlon đang chạy với tốc độ FSB là 266 MHz
(công nghê Double Data Rate).
Bộ vi xư lí Pentium IV có đên 42 triêu Tranzito,kích thước chêt của nó là 217
mm2,cơng suất tiêu thụ 55 W khi làm viêc ở mức 1,5GHz.Tốc độ bus hê thống 3,2
GB/s , rất cao ở thời diểm bấy giờ.


Bảng: So sánh hiệu suất Pentium 3 và Pentium 4
Bảng trên là sự so sánh hiêu suất của Pentium IV 1,5GHz và Petium III 1,0
GHz.Rõ ràng ta có thể thấy tính vượt trội dành cho Pentium IV.Các ứng dụng số

4


nguyên cao hơn 15-20 %,trong khi Ứng dụng dấu chấm động và multimedia lên
tới 30-70%.
Pentium 4 đầu tiên (tên mã là Willamette) xuất hiên cuối năm 2000 đặt dấu
chấm hêt cho “triều đại” Pentium III. Willamette xuất sản xuất trên cơng nghê 0,18
có 42 triêu transistor(nhiều hơn gần 50% so với Pentium III),bus hê thống (system
bus) 400 MHz,bộ nhớ đêm tích hợp L2 256 KB,socket 423 và 478 , Socket 423 chỉ
xuất hiên trong khoảng thời gian rất ngắn, từ tháng 11 năm 2000 đên tháng 8 năm
2001 và bị thay thê bởi socket 478 .P4 Willamette có tốc độ như 1.3, 1.4, 1.5, 1.6,
1.7, 1.8, 1.9 , 2.0 GHz.
P4 Northwood xuất hiên vào tháng 1 năm 2002,được sản xuất trên cơng nghê
0,13, có khoảng 55 triêu transistor,bộ nhớ đêm tích hợp L2 512 KB,socket
478.Northwood có 3 dịng gồm Northwood A(system bus 400 MHz),tốc độ 1.6,
1.8, 2.0, 2.2, 2.4, 2.5, 2.6, và 2.8 GHz.Northwoood B(system bus 533 MHz) tốc độ
2.26, 2.4, 2.53, 2.66, 2.8, 3.06 GHz(riêng 3.06 GHz có hỗ trợ công nghê siêu phân
luồng Hyper Threading-HT).Northwood C (system bus 800 MHz,tất cả hỗ trợ
HT),gồm 2.4,2.6, 3.0, 3.2, 3.4 GHz.
P4 Prescott (năm 2004).Là BXL đầu tiên sản xuất theo công nghê 90nm,kích
thước vi mạch giảm 50% so với P4 Willamette.Điều này cho phép tích hợp nhiều
transistor hơn trên cùng kích thước (125 triêu transistor so với 55 triêu transistor của
P4 Northwood),tốc độ chuyển đổi của transistor nhanh hơn,tăng khả năng xư ly,tính
toán.Dung lượng bộ nhớ đêm tích hợp L2 của P4 Prescott gấp đơi so với P4
Northwood(1MB so với 512KB).Ngồi tập lênh MMX,SSE,SSE2,Prescott được bổ

sung tập lênh SSE3 giúp các ứng dụng xư ly video và game
chạy nhanh hơn.Đây là giai đoạn “giao thời ” giữa socket 478775LGA,system bus 533 MHz-800MHz và mỗi sản phẩm
được đặt tên khiên người dùng càng bối rối khi chọn mua.
Prescott A(FSB 533MHz)có các tốc độ 2.4, 2.26, 2.8
(socket 478),Prescott 505 (2,66GHz), 505J(2.66 GHz),506
(2,66 GHz), 511 (2,8GHz), 515J (2,93GHz), 516 (2,93GHz) , 519J (3,06GHz), 519
J(3,06GHz) sư dụng socket 775LGA.


Prescott E,F (năm 2004) có bộ nhớ đêm L2 1MB(các phiên bản sau được mở
rộng 2MB),bus hê thống 800 MHz.Ngoài

tập lênh

MMX,SSE2,SSE3

tích

hợp, Prescott E,F cịn hỗ trợ cơng nghê siêu phân luồng,một số phiên bản sau có hỗ
trợ tính toán 64 bit.
Dòng sư dụng socket 478 gồm Pentium 4 HT 2.8E (2,8GHz), 3.0E (3,0 GHz),
3.2E (3,2 GHz), 3.4E(3,4 GHz).Dòng sư dụng socket 775LGA gồm Pentium
4HT 3.2F, 3.4F, 3.6F, 3.8F, với các tốc độ tương ứng từ 3,2 GHz.Pentium 4 HT
517,520,520J,521,524,530,530J,531,540,540J,541,550,560,560J,561,570J,571
với các tốc độ từ 2.8 GHz đên 3,8 GHz.
*Những điểm kĩ thuật chính của Pentium 4 bao gồm:
 Tốc độ từ 1.3GHz đên 3.8GHz
 phần mềm tương thích với những bộ xư ly Intel 32 bit trước.
 Một số phiên bản hỗ trợ EM64T
 Bus bộ xư ly (font-side) chạy ở 400MHz, 533Mhz, SOOMHz hay 1066MHz.

 Những bộ logic số học (ALUs) chạy gấp hai lần tần số nhân bộ xư ly
 Công nghê siêu dẫn đường (20-30 tầng)
 Công nghê siêu phân luồng hỗ trợ tất cả bộ xư ly 2.4GHz và nhanh hơn chạy
Bus 800MHz, tất cả bộ xư ly 3.06GHz và nhanh hơn chạy Bus 533MHz.
 Thực thi tập lênh ngoài lênh chuyên nghiêp
 Bộ dự đoán phụ được mở rộng
 Bộ nhớ đêm LI 8KB ha>16KB cộng với bộ nhớ đêm theo vêt thực thi vi lênh 12k
 Bộ nhớ đêm L2 56bit trên khuôn tốc độ nhân 256KB, 512KB, 1MB hoặc 2MB kêt
hợp 8 đường
 Bộ nhớ đêm L3 tốc độ nhân 2MB tích hợp trên khuôn.
 SSE2-SSE cộng với 144 tập lênh mới chưa xư ly âm thanh và đồ họa

B. Nội dung trọng tâm
I. Các công nghê mới
Khả năng cung cấp một số công nghê mới và các tính năng được tăng cường trên
đây dựa vào các tiên bộ mới nhất của Intel trong lĩnh vực thiêt kê mạch, quản ly
viêc tiêu thụ năng lượng và tính toán khơng thể thực hiên được ở các mơ hình vi


kiên trúc của các thê hê CPU trước. Bộ dấu chấm động được mở rộng. Có nhiều
trạng thái năng lượng thấp hơn. Intel bỏ những số La Mã bằng một sự chỉ định 4, số
Ả-rập tiêu chuẩn đối với Pentium 4. Bên trong pentium 4 có một kiên trúc mới mà
Intel gọi là vi kiên trúc NetBurst, là thuật ngữ thị trường không phải thuật ngữ kĩ
thuật. Intel dùng NetBurst để thí nghiêm cơng nghê siêu đường dẫn, một bộ máy thực
thi nhanh, bus hê thống tốc độ cao (400MHz, 533MHz, 800MHz và 1066MHz) và bộ
nhớ đêm theo vêt thực thi. Công nghê siêu đường dẫn là làm tăng gấp đôi hay gấp ba
lần độ sâu đường dẫn tập lênh so với Pentium III ( hay Athlon/Athlon 64) nghĩa là
nhiều bước nhỏ hơn được yêu cầu để thực thi tập lênh. Mặc dù điều này có thể dường
như kém hữu hiêu, nhưng nó cho phét đạt tới những xung cao hơn nhiều. Bộ máy
thực thi nhanh cho phép hai bộ logic số nguyên ( ALUs) chạy gấp đôi tần số nhanh

bộ xư ly có nghĩa là có những tập lênh có thể thực thi trong nữa chu kỳ đồng hổ.Bus
hê thống 400MHz/533MHz/800Mhz/1066Mhz là bus quad-pumped chạy hơn đồng
hồ hê thống 100Mhz/133Mhz/200Mhz/266Mhz chuyển giao dữ liêu gấp bốn lần
trong mỗi chu kì đồng hồ. Bộ nhớ đêm theo vêt thực thi là bộ nhớ đêm L1 tốc độ cao
chưa được lượng 12K những vi hoạt động giải mã. Nó di chuyển bộ giải mã tập lênh
từ đường dẫn thực thi chính, làm tăng tốc độ xư ly.
Trong những vấn đề trên thì Bus bộ xư ly tốc độ cao là đắng kể nhất, về mặt kỹ thuật
mà nói bus bộ xư ly là bus quad-pumped 100MHz, 133MHz, 200MHz hay 266MHz
chuyển giao dữ liêu gấp bốn lần trong một chu kỳ (4x) cho tốc độ hiêu dụng 400Mhz,
533Mhz,800Mhz hay 1066Mhz bởi vì bus dung lượng 64bit (8byte) cho tốc độ lưu
lượng 3200MBps, 4266MBps, 6400MBps hay 8532MBps.
Trong kiên trúc nội bộ đường dẫn 20 tầng hay 30 tầng của pentium 4 những tập lênh
đơn bị bả thành nhiều tầng nhỏ hơn so với bộ xư ly trước như pentium III, làm cho nó
hầu như giống bộ xư ly RISC. Khơng may là có thể thêm vào số chu kỳ thực thi
những tập lênh nêu chúng không được tối ưu chô bộ xư ly. Một ưu điểm kiên trúc
quan trọng khác là công nghê siêu phân luồng, có thể được tìm thấy trong tất cả
Pentium 4 2.4GHz và nhanh hơn chạy bus 800MHz hay tất cả Pentium 4 3.06GHz và
nhanh hơn chạy bus 533Mhz. Siêu phân luồng cho phép một bộ xư ly đơn chạy hai
luồng cùng thời, hoạt động như thê nó là hai bộ xư ly thay vì một.


Pentium 4 đời đầu sư dụng socket 423 có 423 chân trong sự sắp xêp SPGA 39x39.
Nhưng phiên bản sau cùng socket 47H, phiên bản hiên nay dùng socket T (I.GA775)
có những chân thêm để hỗ trợ tính năng mới như EM64T ( sự mở rộng 64 bit), bit vô
hiêu hóa thực thi ( sự bảo vê chống những tán công của tràn bộ nhớ đêm), công nghê
ảo Intel, và những tính năng tiên tieean khác. Celeron khơng bao giờ được thiêt kê để
làm viêc trong socket 423, nhưng celeron và celeron D có socket 478 hay socket T
( LGA775), cho phép hê thống hạ giá so với Pentium 4. Bộ chọn điên áp được tạo ra
nhờ vào Module điều chỉnh điên áp tự động được đặt trên bo mạch chỉ và được nối
đên socket.

1. Hyper-Pipelined Technology - Công nghê Siêu ống
Là công nghê mới được giới thiêu trong Vi kiên trúc Netburst™ của Intel. Nó
tăng gấp đơi "độ sâu" của "ống" xư ly lênh của CPU khi so sánh với mơ hình Vi kiên
trúc P6 được sư dụng ở các thê hê CPU Pentium III. Lênh được thực hiên trong
20 giai đoạn (20 stages) trong vi kiên trúc Netburst, so với 10 giai đoạn trong vi kiên
trúc P6. Ống lênh dài giúp chip Pentium 4 có thể đạt được mức xung nhịp cao hơn.
2. Execution Trace Cache
Là bộ nhớ đêm cấp 1 . Bên cạnh 8KB bộ nhớ đêm dùng để chứa dữ liêu ,
Pentium 4 có khả năng lưu trữ đên 12K vi lênh đã được giải mã nhằm giúp tăng
cường tốc độ thực thi lênh của CPU.
3. Rapid Execution Engine - Cơ chê thực thi (lênh) nhanh chóng
Điều này được thực hiên dựa trên hai Đơn vị Luận ly Số Học được thiêt kê bên
trong Pentium 4. Nó cho phép Pentium 4 thực hiên các lênh số học (cộng, trừ, nhân
chia) và luận ly (And, Or...) chính với tốc độ gấp 2 lần tần số xư ly cơ bản của bộ xư
ly. Như vậy CPU Pentium 4 - 2.0Ghz có khả năng thực hiên các lênh trên với tốc
độ 4.0Ghz và CPU Pentium 4 - 2.53Ghz thực hiên với tốc độ 5.1Ghz.
4. Advanced Transfer Cache (ATC)
Là bộ nhớ đêm cấp 2 (L2 Cache) được thiêt kê bên trong Pentium 4. ATC có
hai loại: 512 KB L2 ATC với các tốc độ CPU 2.8Ghz - 2.53Ghz - 2.40Ghz 2.40(B)Ghz -2.26Ghz - 2.20Ghz - 2.0(A)Ghz và 1.6(A)Ghz; 256 KB L2 ATC với các
tốc độ từ 1.2Ghz - 2.0Ghz. ATC cung cấp kênh truyền có thơng lượng rất cao
với nhân của CPU . ATC bao gồm một giao diên 256-bit (32 byte) để truyền dữ liêu


trên mỗi xung clock. Điều này cho phép ATC (L2 Cache) hỗ trợ tốc độ cao gấp 4 lần
tốc độ truyền dữ liêu của L2 Cache sư dụng trong các CPU Pentium III.
Ví dụ: CPU Pentium 4 - 2.53Ghz có tốc độ truyền dữ liêu lên tới 81GB/giây,
so với tốc độ truyền dữ liêu 16GB/giây của Pentium III - 1.0 Ghz.
5. Out-Of-Order Execution
Nhân hỗ trợ Out-of-Order Execution có thể sắp xêp lại các vi lênh, cho phép
lênh (cùng với đầu vào và các tài nguyên hê thống cần thiêt) để thực thi ngay khi có

thể và tránh lãng phí thời gian. Khi một vi lênh đang chờ được cấp phát tài nguyên
hoặc dữ liêu, các lênh khác (thường là trong buffer) có thể chen vào thực thi. Nhờ
thực thi các
lênh song song, những khoảng trễ của pipeline bị loại bỏ. Nhân có thể thực thi nhiều
lênh trong mỗi giai đoạn của pipeline. Sau đó in-order retirement unit sẽ tìm các lênh
được hiên xong và khơng cịn phụ thuộc dữ liêu cũng như liên quan đên các lênh rẽ
nhánh chưa hoàn thất để xư ly và lưu kêt quả ra bộ nhớ theo trật tự ban đầu của nó.
6. Branch Prediction (phỏng đoán nhánh)
Kiên trúc NetBurst có thể nhớ được các nhánh trong chương trình chạy, giúp làm
giảm độ trễ trong quá trình nhảy và nạp đầy ống lênh , Các nhánh được lưu giữ trên cơ
sở địa chỉ lênh bên trong Branch Target Buffer (BTB). Bộ vi xư ly có thể dự đoán
được các nhánh sắp tới trước cả khi lênh rẽ nhánh được thực hiên.
7. Rapid Execution Engine
Trong Pentium 4, có 2 ALU và hai AGU chạy với mức xung gấp đôi xung clock.
Rapid execution engine được giới thiêu là làm giảm độ trễ của viêc thực hiên các
phép toán đơn giản . Điều này thực sự có y nghĩa vì hiêu năng và tốc độ của
vi xư ly phụ thuộc rất nhiều vào các tính toán số nguyên trên ALU.
8. Quad Data Rate
FSB của Pentium 4 có thể truyền bốn lần dữ liêu trong một xung clock . Cơng nghê
này là Quad Pumped hay cịn gọi là Quad Data Rate (QDR).QDR khiên cho xung nhịp
hiêu dụng tăng lên gấp 4 lần so với xung thực. Nhờ đó các CPU Pentium 4 có thể
đạt đên 400Mhz System bus, tốc độ truyền nhận dữ liêu vào-ra CPU là 3.2GBps
so với tốc độ tương ứng là 1.06GBps của Pentium III (133Mhz system bus).
Real Clock

Performance

Tranfer Rate



100MHz

400MHz

3.2GB/s

133MHz

533MHz

4.2GB/s

200MHz

800MHz

6.4GB/s

266MHz

1066MHz

8.5GB/s

9. Enhanced Floating Point & Multimedia Unit
Bộ xư ly Pentium 4 mở rộng các thanh ghi dấu chấm động lên tới 128bit và tạo thêm
một thanh ghi mở rộng nhằm phục vụ viêc di chuyển dữ liêu.
Do vậy, khả năng xư ly các ứng dụng dấu chấm động (tính toán kêt cấu, số
liêu tài chính, số liêu khoa học…) và truyền thông đa phương tiên (dựng và xư ly
phim video, xư ly hình ảnh đồ họa…) được tăng cường rất nhiều.

10. Streaming SIMD Extension 2 (SSE2) Instructions
Là tập lênh hỗ trợ đồ họa mở rộng được thiêt kê cho Pentium 4. Vi kiên trúc Netburst
mở rộng khả năng xư ly theo kiểu cấu trúc SIMD của các cơng nghê Intel® MMX™
và SSE bằng cách thêm vào 144 lênh mới. Các lênh này bao gồm các tác vụ số nguyên
SIMD 128-bit và các tác vụ dấu chấm động . Các lênh mới này làm tối ưu hóa khả
năng thực hịên các ứng dụng như phim video, xư ly âm thanh - hình ảnh, mã hóa, tính
toán khoa học ...
11. Hyper Threading (siêu phân luồng)
Hyper threading là công nghê cho phép một CPU vật ly hoạt động trên hê điều hành
như là hai CPU logic hoạt động song song. Nó dựa trên nguyên tắc là vào một
thời điểm chỉ có một phần tài nguyên của CPU được sư dụng để thực thi lênh của
một tiên trình, những phần chưa được sư dụng có thể được dùng để thực thi các tiên
trình khác.Trong các CPU sư dụng công nghê Hyper-Threading, mỗi CPU logic sở
hữu một tập các thanh ghi, kể cả thanh ghi đêm chương trình PC riêng , CPU vật ly sẽ
luân phiên các giai đoạn tìm/giải mã giữa hai CPU logic và chỉ cố gắng thực thi những
thao tác từ hai chuỗi lênh đồng thời theo cách hướng tới những đơn vị thực thi ít được
sư dụng.


II. CẤU TRÚC, CHỨC NĂNG CÁC BÔ PHẬN
*Một số điểm đáng chú y!!!!
 Công nghê Hyper Pipelined với pipeline lên tới 20 stage.
FSB của Pentium IV có mức xung tối thiểu là 400MHz nhờ kỹ thuật QDR
(Quad Data Rate), cho phép truyền bốn lần dữ liêu trong một xung clock, nhanh
gấp rưỡi system bus 266MHz sư dụng công nghê Double Data Rate của AMD.
Nhờ vậy, băng thông lên đên 3.2GB/s.


Execution Trace Cache: cache lênh (L1 instruction cache) được chuyển từ
trước Fetch Unit ra phía sau Decode Unit và có tên là “Trace Cache”.


 Có tới 128 thanh ghi, trong khi CPU của Intel thuộc thê hê thứ 6 (như Pentium II ,
Pentium III) chỉ có 40 thanh ghi.
 Advanced Dynamic Execution, nâng cao khả năng phỏng đoán nhánh và thực hiên
lênh không theo thứ tự (out-of-order execution).


Rapid Execute Engine, theo đó ALU của Pentium IV làm viêc với xung nhịp
gấp đôi xung clock của CPU.

1. Hyper Pipeline


Trong CPU Pentium III thì pipeline có 10 stage (giai đoạn). Pentium IV có 20 stage.
Pentium IV với tên mã “Prescott” 90nm thậm chí cịn có tới 31 stage. Intel gọi đây là
công nghê siêu ống lênh (Hyper Pipelined Technology).Viêc tăng độ dài pipeline
hướng đên mục tiêu tăng xung nhịp. Có nhiều giai đoạn hơn đồng nghĩa với các đơn
vị chức năng có thể được cấu thành với số lượng transitor ít hơn. Và với ít transistor
thì sẽ dễ dàng nâng cao xung nhịp , về cơ bản là như vậy.
20 tầng Pipeline của Pentium IV:

 Stage 1 & 2 - Trace cache next instruction pointer: tìm vi lênh tiêp
theo sẽ được thực hiên trong BTB (Branch Target Buffer).
 Stage 3 & 4 - Trace cache fetch: nạp vi lênh từ Trace Cache.
 Stage 5 - Drive: gưi vi lênh đên resource allocator và mạch RAT.
 Stage 6 - Allocate: kiểm tra tài nguyên CPU cần thiêt cho viêc thực hiên
lênh. Ví dụ bộ nhớ được dùng làm bộ đêm.
 Stages 7 & 8 - Rename: nêu chương trình sư dụng một trong tám thanh
ghi chuẩn x86 nó sẽ được đổi tên thành một trong 128 thành ghi của
Pentium IV.

 Stage 9 - Queue: các vi lênh được đưa vào các hàng đợi dành riêng cho từng
loại (ví dụ: truy cập bộ nhớ, xư ly số nguyên hay dấu chấm động …). Lênh
nằm yên trong hàng đợi cho đên khi có một chỗ trống tương ứng xuất hiên trong
scheduler.
 Stages 10, 11, 12 - Schedule: scheduler sắp xêp lại các lênh nhằm giữ cho mọi
execution unit đều hoạt động. Ví dụ, nêu đơn vị xư ly dấu chấm động rảnh
rỗi, scheduler lấy ra một lênh xư ly dấu chấm động để gưi cho đơn vị đó,
mặc dù lênh tiêp theo trong chương trình có thể là một lênh xư ly số
nguyên.
12


Stages 13 & 14 - Dispatch: gưi vi lênh tới Execution Unit tương ứng.
Stages 15 & 16 - Register Files: đọc register file.
Stage 17 - Execute: vi lênh được thực hiên.
Stage 18 - Flags: cờ của vi lênh được cập nhật.
Stage 19 - Branch Check: kiểm tra nhánh của chương trình có cùng với
suy đoán của mạch dự đoán rẽ nhánh hay không.
 Stage 20 - Drive: gưi kêt quả của viêc kiểm tra này tới Branch Target Buffer
(BTB).






Mặc dù về ly thuyêt, pipeline dài có thể làm tăng hiêu năng, tuy nhiên, bất chấp
điều này có quá nhiều stage sẽ khiên cho thời gian thực hiên một lênh dài hơn.
Thứ hai, là một pipeline dài sẽ trở nên rất kém hiêu quả trong những trường hợp
phỏng đoán nhánh sai (branch prediction error). Sẽ mất nhiều thời gian để lấp

đầy pipeline một lần nữa. Intel đã triển khai một vài biên pháp để bù lại sự mất
mát hiêu năng trong những trường hợp này, đó là Execution Trace Cache và
Dynamic Execution Engine.
Thực tê là Pentium IV chỉ nhanh hơn Pentium III nhờ hoạt động ở mức xung
nhịp cao hơn. Với cùng mức xung nhịp, một CPU Pentium III sẽ nhanh hơn
CPU Pentium IV nhờ kích thước pipeline của nó.
Bởi vì sự kém hiêu quả của pipeline trong kiên trúc Netburst, thê hê vi xư ly thứ
8 của Intel (vi kiên trúc Core) quay trở lại với kiên trúc của Pentium M, một
kiên trúc dựa trên nền tảng của kiên trúc thê hê thứ 6 thay vì tiêp tục phát triển
thê hê thứ 7 (Netburst).
2. Bộ Nhớ Đêm

a. Advanced transfer cache
Cache L2 của Pentium 4 kêt nối với cache dữ liêu L1 qua bus có độ rộng là 256bit. Trong các thê hê vi xư lí trước của Intel độ rộng này là 64-bit. Với m ột vài phép
toán đơn giản ta sẽ thấy băng thông giữa cache L2 và nhân là 44.8GB/s với Pentium
4 ở mức xung 1.4 GHz và 48GB/s với Pentium 4 ở mức xung 1.5 GHz, nhanh gấp 4
lần so với thê hê trước với cùng một xung nhịp .
b. Execution trace cache
Cache lênh được chuyển từ trước Fetch Unit ra phía sau Decode Unit và có tên gọi
mới là "Trace Cache ". Do đó thay vì lưu trữ vi lênh để chuẩn bị nạp bằng Fetch Unit


thì Trace Cache sẽ lưu trữ những vi lênh đã được giải mã nhờ Decode Unit. Trace
Cache lưu trữ được 12K vi lênh, mỗi vi lênh trong Pentium IV có độ rộng 100bit nên trong Trace Cache có dung lượng 150KB (12288 x 100 /8).Ý tưởng đằng sau
cách kiên trúc này là để tối ưu vòng lặp bên trong các chương trình. Khi một lênh được
thực thi nhiều lần , thì vi lênh đã được giải mã sẵn và lưu trong Trace Cache, và không
cần giải mã lại nhiều lần như các VXL thê hê trước.Giống như Fetch Unit, Trace
Cache cũng có Branch Target Buffer (BTB) lên tới 4K vi lênh. Trong CPU của Intel
thê hê thứ 6, như Pentium III, bộ đêm này chỉ có 512 vi lênh và trong thê hê thứ 5, như
bộ xư ly Pentium chỉ có 256 vi lênh.

3. Bộ giải mã - Decoder

Từ thê hê thứ 6, CPU của Intel dùng kiên trúc tập lênh lai CISC/RISC. Bộ vi
xư lí phải chấp nhận các lênh CISC (Complex Instruction Set Computer), được biêt
như là tập lênh của x86. Ngày nay hầu hêt phần mềm sư dụng tập lênh này. Những bộ
vi xư lí chỉ sư dụng tập lênh RISC (Reduced Instruction Set Computer) không thể
chạy được những chương trình thơng dụng như: Windows, Office...Do đó các CPU
hiên nay trên thị trường của cả Intel, AMD đều sư dụng một bộ giải mã CISC / RISC.
Bên trong CPU xư lí lênh kiểu RISC nhưng lại chỉ chấp nhận những lênh CISC ở đầu
vào. Những lênh CISC x86 được gọi chung là lênh , còn những lênh RISC bên trong
được gọi là các vi lênh . Những vi lênh RISC này không thể sư dụng trực tiêp do đó
những chương trình sẽ phải sư dụng tập lênh CISC và được giải mã qua một bộ giải
mã . Mỗi một CPU sư dụng tập lênh RISC riêng không cơng bố rộng rãi và nó khơng
tương thích với vi lênh của CPU khác. Ví dụ vi lênh của Pentium III khác với vi lênh
của Pentium IV , khác với vi lênh của Athlon 64.
Tuỳ theo tính phức tạp của lênh x86 mà nó sẽ được decode thành một
số lênh RISC nào đó. Bộ giải mã của Pentium IV có thể giải mã một lênh
x86 mỗi xung clock thông thường một lênh x86 giải mã cần 4 vi lênh. Nêu một lênh
x86 phức tạp có thể nhiều hơn 4 vi lênh, nó được định hướng trong bộ nhớ ROM .
“Microcode ROM” còn được gọi là MIS (Microcode Instruction Sequencer) lưu
danh sách tất cả các lênh cùng mô tả các vi lênh tương ứng sẽ được dịch ra.
4. Allocator và Register Renamer

Trong giai đoạn alloc, allocator sẽ:


Dành ra một trong 126 reorder buffers (ROB) cho vi lênh hiên thời. Nó cho phép
thực hiên vi lênh khơng theo thứ tự , CPU có thể đặt chúng trở lại thứ tự cũ sư dụng
bảng này. Dành ra một trong 128 register files để lưu trữ kêt quả dữ liêu từ xư lí vi
lênh.

Nêu vi lênh là nạp (LOAD) hoặc ghi (STORE), có nghĩa là nó sẽ đọc hoặc viêt dữ
liêu trên bộ nhớ RAM, nó sẽ dành một trong số 48 bộ đêm nạp (Load Buffers -LB)
hoặc một trong 24 bộ đêm lưu trữ (Store Buffers - SB)tương ứng . Dành ra một đầu
vào trên bộ nhớ hoặc hàng đợi, tuỳ thuộc vào từng vi lênh . Tập lênh CISC x86 chỉ
có 08 thanh ghi 32-bit (EAX, EBX, ECX, EDX, EBP, ESI, EDI và ESP). Số này
đơn giản là quá ít, đặc biêt là khi CPU có thể thực thi theo kiểu out-of-order. Do đó,
CPU phải đổi tên và nội dung của những thanh ghi được sư dụng trong chương trình
thành một trong 128 thanh ghi của CPU , điều này cho phép những lênh sư dụng cùng
thanh ghi có thể chạy đồng thời. Thậm trí out -of-order, có nghĩa là cho phép lênh thứ
hai chạy trước lênh thứ nhất ngay cả khi chúng sư dụng cùng một thanh ghi.
Chúng ta cần chú y rằng Pentium IV thực sự có tới 256 thanh ghi: 128 cho
những lênh số nguyên và 128 thanh ghi cho lênh dấu chấm động và lênh SSE.
Renamer của Pentium IV có khả năng xư lí ba vi lênh trong một xung clock. Sau đó
từ renamer vi lênh đi tới hàng đợi.
5. Scheduler

Scheduler là trái tim của hê thống out-of-order Pentium IV. Mục đính của Scheduler là
giữ cho mọi execution unit trong CPU luôn luôn làm viêc. Các vi lênh tới scheduler sẽ
được nó phân tích và đặt vào một trong bốn scheduler unit tùy theo kiểu của vi lênh:
Memory scheduler unit: cho những vi lênh liên quan đên bộ nhớ. Những vi lênh này
đên từ hàng đợi của các vi lênh bộ nhớ (memory microinstruction queue).
Fast scheduler unit: cho những vi lênh đơn giản.
Slow / General FP scheduler unit: cho những vi lênh khác và những vi lênh xư ly
dấu chấm động phức tạp.
Simple FP scheduler unit: cho những vi lênh dấu chấm động đơn giản.Scheduler
sắp xêp những vi lênh theo kiểu của chúng. Sau đó nó có thể gưi mỗi vi lênh trực tiêp
tới Execution Unit tương ứng để xư lí.


6. Execution Unit


Như đã đề cập, Pentium IV có bốn cổng gưi đi đánh số từ 0 tới 3. Mỗi cổng được nối
tới một, hai hoặc ba đơn vị thực thi (execution unit). Pentium IV có 05 execution unit
làm viêc song song (02 FPU cho số dấu chấm động , 03 ALU cho số nguyên) và thêm
02 AGU để đọc và ghi dữ liêu vào bộ nhớ RAM.
Phần chính của Rapid Execution Engine là các rapid execution unit, bao gồm hai
ALU và hai AGU . Các vi lênh đơn giản có thể được thực thi bằng những đơn vị này
và chỉ mất một nưa xung clock , những lênh dịch và xoay không thể được thực thi
được bằng các rapid execution unit sẽ được gưi đên “Slow ALU”.
Cổng 0 và 1 có thể gưi hai vi lênh trong một xung clock tới 2 rapid execution ALU,
do đó số lượng tối đa các vi lênh có thể được chuyển đi trong một xung clock là 6:
Hai vi lênh cho cổng 0
Hai vi lênh cho cổng 1
Một vi lênh cho cổng 2
Một vi lênh cho cổng 3
Một điều chúng ta cần nhớ là những lênh phức tạp có thể cần đên vài xung clock để
xư lí. Ví dụ ở cổng số 1, có một đơn vị xư ly dấu chấm động. Trong khi đơn vị này
đang xư ly một lênh rất phức tạp mất vài xung clock, cổng 1 sẽ vẫn tiêp tục nhận các
lênh đơn giản nó và chuyển đên ALU trong khi FPU còn bận. Nêu để y một chút, ta
thấy Intel đặt vào cùng một cổng một fast unit và một complex (slow) unit. Khi
complex unit còn đang bận tính toán, đơn vị cịn lại có thể tiêp tục nhận vi lênh từ
cổng tương ứng.
Nên, mặc dù tối đa chỉ có 6 lênh được chuyển, thực sự CPU có thể có đên 7 lênh
cùng được xư ly một lúc.


III. Tập Lênh
Khn dạng lênh P4

 Các nhóm lệnh:

1. General Pupose (Nhóm lênh chung)
2. System Instructions (Các lênh hê thống)
3. x87 FPU
4. x87 FPU và SIMD
5. Công nghê MMX
6. SSE
7. SSE2
8. SSE3

9. IA-32e: 64-Bit Mode (chê độ 64 bit)

C. KẾT LUẬN
Intel đã đưa ra Pentium 4 nhằm tập trung vào tốc độ xung nhịp cao với thiêt
kê pipeline rất dài. Tuy đúng là cách làm này sẽ tạo ra tốc độ rất cao nhưng nó cũng


đồng nghĩa với hiêu suất làm viêc lại giảm đi vì viêc thực hiên một lênh cần quá
nhiều giai đoạn. CPU pentium 4 thường có xung nhịp cao hơn những CPU của
AMD, nhưng lại không nhanh hơn khi kiểm nghiêm Benchmark. Điều này khiên
người dùng có khuynh hướng lựa chọn những bộ vi xư lí Penti um 4 vì theo họ bộ vi
xư lí nào có tốc độ cao hơn sẽ chạy hiêu quả hơn, mặc dù điều đó là khơng phải.
Trong khi đó cơng nghê HyperThreading (HT) được giới thiêu vào giai đoạn giữa
của Pentium 4 lại chỉ thành cơng về khía cạnh … marketing. Lợi ích mà HT đem lại
thấp (và đơi khi cịn kém hơn khơng dùng HT). Trên thực tê, nêu người dùng phổ
thơng kích hoạt tính năng “siêu luồng” trên máy tính desktop của mình , họ có thể ch
ng được gì ngoại trừ phải trả giá bằng viêc giảm tốc độ tới 10%.Tuy nhiên Pentium 4
khơng chỉ có những nhược điểm. Với tập lênh SSE2 và SSE3 cùng những công nghê
hàng đầu như Quad Data Rate, Trace Cache, Rapid Execution Engine, Dual Channel
Memory, Pentium 4 tỏ ra rất xuất sắc trong các ứng dụng từ văn phịng tới
multimedia. Người dùng các ứng dụng tính toán phức tạp (kiểu như rendering

của Maya, 3DS) sẽ được hưởng lợi rất nhiều từ HyperThreading. Và khi card đồ họa
3D ngày càng trở nên mạnh mẽ, một chip P4 sẽ đem đên nền tảng tuyêt vời cho các
game thủ. Đặc biêt giới overclock rất quan tâm tới nhân Northwood phát hành năm
2002. Với một bo mạch chủ và RAM đủ mạnh, ngay cả những người mới tập
overclock cũng có thể đạt tới 1GHz khi sư dụng giải pháp tản nhiêt thông thường.

Mục Lục
Trường đại học công nghiêp Hà nội................................................................................ 1
ĐÊ TÀI............................................................................................................................ 1
Báo cáo bài tập lớn môn học:
Kiên trúc Máy tính.............................................. 2
Nhóm thực hiên: Nhóm 3–Lớp KTPM3-K9.............................................................. 2
Giáo viên hướng dẫn: Nguyễn Thanh Hải................................................................. 2
 Mở đầu..................................................................................................................... 2
1. Nhiêm vụ của bài.................................................................................................. 2
2. Bố cục................................................................................................................... 2
 Nội dung................................................................................................................... 3


A.Lịch sư phát triển của VXL Pentium IV...................................................................... 3
*Những điểm kĩ thuật chính của Pentium 4 bao gồm:............................................ 6
B. Nợi dung trọng tâm.................................................................................................... 7
I. Các công nghê mới................................................................................................ 7
1. Hyper-Pipelined Technology - Công nghê Siêu ống.......................................... 8
2. Execution Trace Cache...................................................................................... 8
3. Rapid Execution Engine - Cơ chê thực thi (lênh) nhanh chóng.........................9
4. Advanced Transfer Cache (ATC)....................................................................... 9
5. Out-Of-Order Execution.................................................................................... 9
6. Branch Prediction (phỏng đoán nhánh)............................................................. 9
7. Rapid Execution Engine.................................................................................. 10

8. Quad Data Rate................................................................................................ 10
9. Enhanced Floating Point & Multimedia Unit.................................................. 10
10. Streaming SIMD Extension 2 (SSE2) Instructions........................................ 10
11. Hyper Threading (siêu phân luồng)............................................................... 11
II. CẤU TRÚC, CHỨC NĂNG CÁC BÔ PHẬN.................................................... 11
*Một số điểm đáng chú y!!!!................................................................................ 11
1.Hyper Pipeline................................................................................................... 12
2.Bộ Nhớ Đêm...................................................................................................... 14
3.Bộ giải mã - Decoder......................................................................................... 14
4.Allocator và Register Renamer.......................................................................... 15
5.Scheduler........................................................................................................... 16
6.Execution Unit................................................................................................... 16
III. Tập Lênh............................................................................................................ 17
Khuôn dạng lênh P4............................................................................................. 17
C. KẾT LUẬN............................................................................................................. 18



×