Tải bản đầy đủ (.docx) (24 trang)

NGHIÊN CỨU TÌM HIỂU VỀ THẾ HỆ VI XỬ LÝ INTEL PENTIUM IV

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (717.59 KB, 24 trang )

TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP
HÀ NỘI
KHOA CÔNG NGHỆ THÔNG TIN

ĐỀ TÀI:
NGHIÊN CỨU TÌM HIỂU VỀ THẾ
HỆ VI XỬ LÝ INTEL PENTIUM IV


GIÁO VIÊN:
NGUYỄN THANH HẢI

NHÓM 7:
NGUYỄN XUÂN DŨNG
TRẦN THẾ DUY
NGUYỄN BÁ HOÀNG
HỒ MẠNH NAM
AN THỊ NGỌC MAI

2


MỤC LỤC
HOÀN CẢNH RA ĐỜI VÀ LỊCH SỬ PHÁT TRIỂN
1. Công ty Intel
Trang 4
2. Intel Pentium IV
Trang 4
II.
NỘI DUNG
1. Giới thiệu Intel Pentium IV


Trang 8
2. Các loại biến thể của Intel Pentium IV
I.

a.
b.
c.
d.
III.

I.

Trang 13
Trang 14
Trang 14
Trang 15

CÔNG NGHỆ MỚI
1.
2.
3.
4.
5.
6.
7.
8.
9.

IV.
V.


Intel Pentium 4 Extreme Edition
Intel Pentium 4 Prescott (2004)
Intel Pentium D (2005)
Intel Pentium Extreme Edition (2005)
Hyper-Pipelined Technology - Công nghệ Siêu ống
Execution TraceCache
Rapid Execution Engine
Advanced Transfer Cache (ATC)
Out-Of-Order Execution
Branch Prediction (phỏng đoán nhánh)
Rapid Execution Engine
Quad Data Rate
Enhanced Floating Point & Multimedia Unit

Trang 16
Trang 19
Trang 19
Trang 19
Trang 20
Trang 20
Trang 20
Trang 21
Trang 21

10. Streaming SIMD Extension 2 (SSE2) Instructions

Trang 21

11. Hyper Threading (siêu phân luồng)


Trang 22

TỔNG KẾT
NGUỒN TÀI LIỆU

Trang 22
Trang 25

HOÀN CẢNH RA ĐỜI VÀ LỊCH SỬ PHÁT TRIỂN.
1. Công ty Intel.

3


Tập đoàn Intel (Intergrated Electronics) thành lập năm 1968 tại Santa
Clara, California, Hoa Kỳ. Intel là nhà sản xuất các sản phẩm như chip vi xử
lý cho máy tính, bo mạch chủ, USB, Card mạng ...
Năm 1971, bộ vi xử lý đầu tiên của Intel là 4004 được phát hành cho
máy tính Busicom và dọn đường cho khả năng nhúng trí thơng minh của con
người vào trong các thiết bị vơ tri cũng như các hệ thống máy tính cá nhân.
2.

Intel Pentium IV.
a, Hoàn cảnh ra đời:
Pentium IV được sản xuất vào tháng 11 năm 2000 là bộ vi xử lý kiến
trúc x86 thế hệ thứ 7 do Intel sản xuất và thiết kế CPU hoàn toàn mới đầu
tiên của họ kể từ Pentium III năm 1995. Nếu bộ xử lý này được đặt số
thay vì tên nó sẽ được gọi là 786 bởi vì nó đại diện cho một thế hệ sau, hệ
sau của những bộ xử lý 686.


Intel
Pentium 4

4


Thiết kế mới này được gọi là kiến trúc NetBurst. Không như Pentium
II, Pentium III, và các loại Celeron khác nhau, kiến trúc này khác được
tạo mới hoàn toàn và thừa kế rất ít từ thiết kế Pentium Pro/ P6.
Một số công nghệ nổi bật được áp dụng trong vi kiến trúc NetBurst
như Hyper Pipelined Technology mở rộng số hàng lệnh xử lý, Execution
Trace Cache tránh tình trạng lệnh bị chậm trễ khi chuyển từ bộ nhớ đến
CPU, Rapid Execution Engine tăng tốc độ xử lý toán học, bus hệ thống
(system bus) 400 MHz và 533 MHz; các công nghệ Advanced Transfer
Canche, Advanced Dynamic Execution, Enhanced Floating Point và
Multimedia Unit, Streaming SIMD Extensions 2 (SSE2) cũng được cải
tiến nhằm tạo ra những bộ xử lý tốc độ cao hơn, khả năng tính tốn mạnh
hơn, xử lý đa phương tiện tốt hơn.

Vi kiến trúc NetBurst

b, Lịch sử phát triển:
Bộ vi xử lý Pentium IV đầu tiên, mã hiệu “Willamette” chạy
với tốc độ 1.4 và 1.5 GHz và đã được phát hành vào tháng 11 năm
5


2000 trên nền Socket 423, sản xuất trên công nghệ 0.18 μm, có 42
triệu transistor (nhiều hơn gần 50% so với Pentium III), bus hệ

thống (system bus) 400 MHz, bộ nhớ đệm tích hợp L2 256 KB,
socket 423 và 478. P4 Willamette có một số tốc độ như 1.3, 1.4,
1.5, 1.6, 1.7, 1.8, 1.9, 2.0 GHz.
So sánh hiệu năng Pentium 3 và Pentium 4

Socket 423 chỉ xuất hiện trong khoảng thời gian rất ngắn, từ
tháng 11 năm 2000 đến tháng 8 năm 2001 và bị thay thế bởi socket

478. Xung thực (FSB) của Pentium 4 là 100 MHz nhưng với công
nghệ Quad Data Rate cho phép BXL truyền 4 bit dữ liệu trong 1
chu kỳ, nên bus hệ thống của BXL là 400 MHz.P4 Northwood.
Xuất hiện vào tháng 1 năm 2002, được sản xuất trên cơng nghệ
0,13 μm, có khoảng 55 triệu transistor, bộ nhớ đệm tích hợp L2
512 KB, socket 478. Northwood có 3 dịng gồm Northwood A
(system bus 400 MHz), tốc độ 1,6, 1,8, 2,0, 2,2, 2,4, 2,5, 2,6 và 2,8
GHz. Northwood B (system bus 533 MHz), tốc độ 2,26, 2,4, 2,53,
2,66, 2,8 và 3,06 GHz (riêng 3,06 GHz có hỗ trợ cơng nghệ siêu
phân luồng Hyper Threading - HT). Northwood C (system bus 800
MHz, tất cả hỗ trợ HT), gồm 2,4, 2,6, 2,8, 3,0, 3,2, 3,4 GHz.
P4 Prescott (năm 2004). Là BXL đầu tiên Intel sản xuất theo
cơng nghệ 90 nm, kích thước vi mạch giảm 50% so với P4
6


Willamette. Điều này cho phép tích hợp nhiều transistor hơn trên
cùng kích thước (125 triệu transistor so với 55 triệu transistor của
P4 Northwood), tốc độ chuyển đổi của transistor nhanh hơn, tăng
khả năng xử lý, tính tốn. Dung lượng bộ nhớ đệm tích hợp L2
củaP4 Prescott gấp đơi so với P4 Northwood (1MB so với 512
KB). Ngoài tập lệnh MMX, SSE, SSE2, Prescott được bổ sung tập

lệnh SSE3 giúp các ứng dụng xử lý video và game chạy nhanh
hơn. Đây là giai đoạn “giao thời” giữa socket 478 - 775LGA,
system bus 533 MHz - 800 MHz và mỗi sản phẩm được đặt tên
riêng khiến người dùng càng bối rối khi chọn mua.Prescott A (FSB
533 MHz) có các tốc độ 2,26, 2,4, 2,66, 2,8 (socket 478), Prescott
505 (2,66 GHz), 505J (2,66 GHz), 506 (2,66 GHz), 511 (2,8 GHz),
515 (2,93 GHz), 515J (2,93 GHz), 516 (2,93 GHz), 519J (3,06
GHz), 519K (3,06 GHz) sử dụng socket 775LGA.Prescott E, F
(năm 2004) có bộ nhớ đệm L2 1 MB (các phiên bản sau được mở
rộng 2 MB), bus hệ thống 800 MHz. Ngoài tập lệnh MMX, SSE,
SSE2, SSE3 tích hợp, Prescott E, F cịn hỗ trợ công nghệ siêu phân
luồng, một số phiên bản sau có hỗ trợ tính tốn 64 bit.Dịng sử
dụng socket 478 gồm Pentium 4 HT 2.8E (2,8 GHz), 3.0E (3,0
GHz), 3.2E (3,2 GHz), 3.4E (3,4 GHz). Dòng sử dụng socket
775LGA gồm Pentium 4 HT 3.2F, 3.4F, 3.6F, 3.8F với các tốc độ
tương ứng từ 3,2 GHz đến 3,8 GHz, Pentium 4 HT 517, 520, 520J,
521, 524, 530, 530J, 531, 540, 540J, 541, 550, 550J, 551, 560,
560J, 561, 570J, 571 với các tốc độ từ 2,8 GHz đến 3,8 GHz.
Pentium® 4 processor microarchitecture

II.

NỘI DUNG.
1. Giới thiệu Intel Pentium IV:
7


a. Các chi tiết kỹ thuật chính của Pentium 4 bao gồm:

+ Tốc độ từ 1.3 GHz đến 3.8 GHz.

+ 42 triệu bóng bán dẫn, quy trình 0,18 micron, khn 217 mm
vng (Willamette).
+ 55 triệu bóng bán dẫn, quy trình 0,13 micron, khn khổ 131
mm vng (Northwood).
+ 125 triệu bóng bán dẫn, quy trình 0,09 micron, đường kính 112
mm vng (Prescott).
+ Phần mềm tương thích với bộ vi xử lý Intel 32-bit trước đó.
+ Một số phiên bản Prescott hỗ trợ EM64T (phần mở rộng 64-bit)
và Bit vơ hiệu hóa thực thi (bảo vệ chống tràn bộ đệm).
+ Bus của bộ xử lý (phía trước) chạy ở 400MHz, 533MHz,
800MHz hoặc 1066MHz.
+ Đơn vị logic số học (ALU) chạy với tần số gấp đôi tần số lõi của
bộ xử lý.
+ Công nghệ siêu đường ống (20 giai đoạn hoặc 31 giai đoạn).
+ Hỗ trợ công nghệ siêu phân luồng trong tất cả các bộ xử lý 2,4
GHz và nhanh hơn chạy bus 800MHz và tất cả các bộ xử lý 3.06
GHz và nhanh hơn chạy bus 533 MHz.
+ Thực hiện lệnh khơng theo thứ tự rất sâu.
+ Dự đốn nâng cao.
+ Bộ nhớ đệm 8KB hoặc 16KB L1 cộng với bộ nhớ đệm theo dõi
thực thi vi-op 12K.
+ 256KB, 512KB hoặc 1MB bộ nhớ đệm L2 tốc độ đầy đủ, tốc độ
toàn lõi 256KB với khả năng kết hợp tám chiều.
+ Bộ nhớ đệm L2 có thể xử lý đến 4GB RAM và hỗ trợ ECC.
+ 2MB bộ nhớ đệm L3 tốc độ đầy đủ, sẵn sàng (Extreme Edition).
+ SSE2 – SSE cộng với 144 hướng dẫn mới về xử lý đồ họa và âm
thanh (Williamette và Northwood).
+ SSE3 – SSE2 cộng với 13 hướng dẫn mới về xử lý đồ họa và âm
thanh (Prescott).
+ Đơn vị dấu phẩy động nâng cao.

+ Nhiều trạng thái công suất thấp.
8


b. Công nghệ trong Intel Pentium IV:

+ Intel đã bỏ các chữ số La Mã cho ký hiệu 4 số Ả Rập tiêu chuẩn
để xác định Pentium 4. Bên trong, Pentium 4 giới thiệu một kiến
trúc mới mà Intel gọi là vi kiến trúc NetBurst, là một thuật ngữ tiếp
thị chứ không phải là một thuật ngữ kỹ thuật. Intel sử dụng
NetBurst để mô tả công nghệ siêu phân luồng, một cơng cụ thực
thi nhanh chóng, một bus hệ thống tốc độ cao (400MHz, 533MHz,
800MHz hoặc 1066MHz) và một bộ nhớ đệm theo dõi thực thi.
Công nghệ siêu đường ống dẫn tăng gấp đôi hoặc gấp ba độ sâu
của đường ống dẫn lệnh so với Pentium III (hoặc Athlon / Athlon
64), có nghĩa là cần có nhiều bước hơn và nhỏ hơn để thực hiện
lệnh. Mặc dù điều này có vẻ kém hiệu quả hơn, nhưng nó cho phép
dễ dàng đạt được tốc độ xung nhịp cao hơn nhiều. Công cụ thực thi
nhanh chóng cho phép hai đơn vị logic số nguyên (ALU) chạy với
tần số gấp đôi tần số lõi của bộ xử lý, có nghĩa là các lệnh có thể
thực thi trong nửa chu kỳ đồng hồ. Bus hệ thống 400MHz /
533MHz / 800MHz / 1066MHz là bus bốn bơm chạy trên đồng hồ
hệ thống 100MHz / 133MHz / 200MHz / 266MHz truyền dữ liệu
bốn lần mỗi chu kỳ xung nhịp. Bộ nhớ đệm theo dõi thực thi là bộ
đệm cấp 1 hiệu suất cao lưu trữ khoảng 12K hoạt động vi mô được
9


giải mã. Điều này loại bỏ bộ giải mã lệnh khỏi đường dẫn thực thi
chính, tăng hiệu suất. Bộ nhớ đệm theo dõi thực thi là bộ đệm cấp

1 hiệu suất cao lưu trữ khoảng 12K hoạt động vi mô được giải mã.
Điều này loại bỏ bộ giải mã lệnh khỏi đường dẫn thực thi chính,
tăng hiệu suất. Bộ nhớ đệm theo dõi thực thi là bộ đệm cấp 1 hiệu
suất cao lưu trữ khoảng 12K hoạt động vi mô được giải mã. Điều
này loại bỏ bộ giải mã lệnh khỏi đường dẫn thực thi chính, tăng
hiệu suất.
+ Trong những vấn đề trên đáng chú ý nhất là bus bộ xử lý tốc độ
cao. Về mặt kỹ thuật, bus bộ xử lý là bus được bơm bốn lần
100MHz, 133MHz, 200MHz hoặc 266MHz, truyền bốn lần mỗi
chu kỳ (4x), cho tốc độ hiệu dụng 400MHz, 533MHz, 800MHz
hoặc 1066MHz. Bởi vì bus rộng 64 bit (8 byte), điều này dẫn đến
tốc độ thông lượng là 3200MBps, 4266MBps, 6400MBps hoặc
8532MBps.
+ Trong kiến trúc nội bộ đường ống 20 giai đoạn hoặc 31 giai đoạn
của Pentium 4, các lệnh riêng lẻ được chia thành nhiều phần con
hơn so với các bộ vi xử lý trước đó như Pentium III, làm cho điều
này gần giống như một bộ xử lý RISC. Thật không may, điều này
có thể thêm vào số chu kỳ được thực hiện để thực hiện các lệnh
nếu chúng không được tối ưu hóa cho bộ xử lý này. Các điểm
chuẩn ban đầu khi chạy phần mềm hiện có cho thấy các bộ vi xử lý
Pentium III hoặc AMD Athlon hiện có có thể dễ dàng bắt kịp hoặc
thậm chí vượt Pentium 4 trong các tác vụ cụ thể; tuy nhiên, điều
này hiện đang thay đổi khi các ứng dụng đang được biên dịch lại
để hoạt động trơn tru với kiến trúc đường ống sâu của Pentium 4.

10


+ Một lợi thế kiến trúc quan trọng khác là cơng nghệ siêu phân
luồng, có thể được tìm thấy trong tất cả các bộ vi xử lý Pentium 4

2,4GHz và nhanh hơn chạy bus 800MHz và tất cả các bộ xử lý
3.06GHz và nhanh hơn chạy bus 533MHz. Siêu phân luồng cho
phép một bộ xử lý chạy đồng thời hai luồng, do đó hoạt động như
thể nó là hai bộ xử lý thay vì một.
+ Pentium 4 ban đầu sử dụng Socket 423, có 423 chân theo cách
sắp xếp SPGA 39x39. Các phiên bản sau này sử dụng Socket 478;
các phiên bản gần đây sử dụng Socket T (LGA775), có thêm các
chân để hỗ trợ các tính năng mới như EM64T (phần mở rộng 64bit), Execute Disable Bit (bảo vệ chống lại các cuộc tấn công tràn
bộ đệm), Công nghệ ảo hóa Intel và các tính năng nâng cao khác.
Celeron chưa bao giờ được thiết kế để hoạt động trong Socket 423,
nhưng các phiên bản Celeron và Celeron D có sẵn cho Socket 478
và Socket T (LGA775), cho phép các hệ thống chi phí thấp hơn
tương thích với Pentium 4. Việc lựa chọn điện áp được thực hiện
thông qua bộ điều chỉnh điện áp tự động được cài đặt trên bo mạch
chủ và có dây vào ổ cắm.

11


Thông tin bộ xử lý Intel Pentium 4

2.

Các loại biến thể của Intel Pentium IV:
a. Intel Pentium 4 Extreme Edition

12


Được giới thiệu lần đầu vào


tháng 10 năm

2003, Pentium 4 extreme edition

được ghi

nhận là bộ xử lý máy để bàn có

bộ nhớ đệm

L3. Đây cơ bản là phiên bản

được tân

trang lại của bộ xử lý
sever/workstation Xeon nhân Prestonia đã sử dụng bộ nhớ đệm L3
từ tháng 10 năm 2002. Pentium 4EE có bộ nhớ đệm L2 512Kb và
bộ nhớ đệm L3 2MB, tăng số lượng bóng bán dẫn lên đến 178
triệu bóng. Thơng số Bus speed 800MHz FSB (200MHz) hoặc
1066 MHz FSB (266MHz). Khn rộng được làm trên quy trình
130 nanometer (0.13 mcron) hoặc 90 nanometer (0.09 micron).
Loại chip này tốn chi phí cao để sản xuất và với giá bán cao
ngất ngưởng ở thời đó là minh chứng rõ ràng nhất. P4EE được tạo
ra nhằm mục đích hướng tới thị trường người tiêu dùng sẵn sàng
chi những khoản tiền thừa cho tốc độ cộng thêm ở phiên bản này.
Bộ nhớ đệm bổ sung này không hỗ trợ những ứng dụng kinh doanh
tiêu chuẩn hay các trò chơi với mức đồ họa yêu cầu tiêu hao nhiều
năng lượng.
b. Intel Pentium 4 Prescott (2004)

Chỉ sau 1 năm ra mắt P4EE, intel tung ra thị trường phiên bản
Pentium 4 prescott. Được ví là một sự sửa đổi bổ sung của P4EE.
Những bộ vi xử lý này được tạo ra dựa trên quy trình 90 nanometer
(0.09 micron) Pentium 4 sử dụng nhân Prescott với bộ nhớ đệm L2
từ 1 - 2 MB và nó khơng cịn hỗ trợ bộ nhớ đệm L3 như cũ, số
lượng bóng bán dẫn là 125 triệu bóng. Bus speed 533MHz FSB
(133MHz). Có hai dạng socket 478 và T với tốc độ xung nhịp từ
3.2GHz đến 3.4GHz đối với socket 478 và từ 3.4GHz đến
3.73GHz đối với socket T (LGA 775).
13


c. Intel Pentium D (2005)

Nhãn hiệu Pentium D dùng để chỉ hai dòng chip xử lý hai nhân
64bit x86 với vi kiến trúc NetBurst. Mỗi CPU bao gồm 2 khuôn,
mỗi khuôn chứa một nhân đơn (CPU) – hai khuôn nằm kế bên
nhau – được đóng gói trong một bộ đa xử lý. Bộ xử lý đầu tiên
mang nhãn hiệu này, có tên mã Smithfield, được Intel phát hành
vào ngày 25 tháng 5 năm 2005. Chín tháng sau, Intel giới thiệu thế
hệ cận, có tên mã Presler, nhưng khơng đưa ra những nâng cấp
đáng kể nào về mặt thiết kế, do đó vẫn hao tốn khá nhiều điện
năng. Đến năm 2005, các bộ xử lý NetBurst đạt đến ngưỡng xung
đồng hồ 4 GHz do giới hạn về độ nóng (và năng lượng) do TPD
130 W của Presler’s (TDP cao cần giải nhiệt nhiều hơn do đó có
thể ồn ào hơn và đắt tiền hơn. Tương lai phụ thuộc vào những CPU
hai nhân hoặc nhiều hơn, có tốc độ xung đồng hồ chậm hơn nhưng
lại hiệu quả hơn đặt trên một khuôn thay vì hai. Khn đơi
Presler’s phát hành lần cuối cùng vào ngày 8 tháng 8 năm 2008 sẽ
đánh dấu sự kết thúc của nhãn Pentium D và cũng là vi xử lý

NetBurst.
d. Intel Pentium Extreme Edition (2005)
Pentium Extreme Edition là phiên bản cao cấp của Pentium D,
nhưng với những khác biệt. Công nghệ HT được hỗ trợ, cho phép
mỗi nhân giả như hai nhân bộ xử lý cho tốc độ tốt hơn với những
14


ứng dụng đa luồng. Không hỗ trợ công nghệ bước tốc độ Intel
được nâng cao (Enhanced Intel Speed Step Technology). Bao gồm
các hệ số nhân khơng khóa, cho phép vượt xung dễ dàng.

Kết quả thử nghiệm phần mền đồ họa 3D Alias WaveFront Maya 6.5.

III.

CÔNG NGHỆ MỚI
1. Hyper-Pipelined Technology - Công nghệ Siêu ống

Là công nghệ mới được giới thiệu trong Vi kiến trúc Netburst™
của Intel. Nó tăng gấp đơi "độ sâu" của "ống" xử lý lệnh của CPU khi
so sánh với mơ hình Vi kiến trúc P6 được sử dụng ở các thế hệ CPU
Pentium III. Lệnh được thực hiện trong 20 giai đoạn (20 stages) trong
vi kiến trúc Netburst, so với 10 giai đoạn trong vi kiến trúc P6. Ống
lệnh dài giúp chip Pentium 4 có thể đạt được mức xung nhịp cao hơn.
Với các CPU Pentium 4 sử dụng 400Mhz System bus, tốc độ truyền
nhận dữ liệu vào-ra CPU là 3.2GB mỗi giây so với tốc độ tương ứng
là 1.06GB/ Giây với thế hệ Pentium III sử dụng kênh truyền hệ thống
133Mhz (133Mhz system bus).


15


Trong CPU Pentium III thì pipeline có 10 stage (giai đoạn).
Pentium IV có 20 stages. Pentium IV với tên mã “Prescott” 90nm
thậm chí cịn có tới 31 stage. Intel gọi đây là công nghệ siêu ống lệnh
(Hyper Pipelined Technology).
Việc tăng độ dài pipeline hướng đến mục tiêu tăng xung nhịp.
Có nhiều giai đoạn hơn đồng nghĩa với các đơn vị chức năng có thể
được cấu thành với số lượng transitor ít hơn. Và với ít transistor thì sẽ
dễ dàng nâng cao xung nhịp.
20 stage (giai đoạn) Pipeline của Pentium IV:
• Stage 1 & 2 - Trace cache next instruction pointer: tìm vi lệnh
tiếp theo sẽ được thực hiện trong BTB (Branch Target Buffer).
• Stage 3 & 4 - Trace cache fetch: nạp vi lệnh từ Trace Cache.
• Stage 5 - Drive: gửi vi lệnh đến resource allocator và mạch
RAT.

• Stage 6 - Allocate: kiểm tra tài nguyên CPU cần thiết cho việc

thực hiện lệnh. Ví dụ bộ nhớ được dùng làm bộ đệm.
• Stages 7 & 8 - Rename: nếu chương trình sử dụng một trong
tám thanh ghi chuẩn x86 nó sẽ được đổi tên thành một trong 128
thanh ghi của Pentium IV.
• Stage 9 - Queue: các vi lệnh được đưa vào các hàng đợi dành
riêng cho từng loại (ví dụ: truy cập bộ nhớ, xử lý số nguyên hay dấu
16


chấm động …). Lệnh nằm yên trong hàng đợi cho đến khi có một chỗ

trống tương ứng xuất hiện trong scheduler.
• Stages 10, 11, 12 - Schedule: scheduler sắp xếp lại các lệnh
nhằm giữ cho mọi execution unit đều hoạt động. Ví dụ, nếu đơn vị xử
lý dấu chấm động rảnh rỗi, scheduler lấy ra một lệnh xử lý dấu chấm
động để gửi cho đơn vị đó, mặc dù lệnh tiếp theo trong chương trình
có thể là một lệnh xử lý số nguyên.
• Stages 13 & 14 - Dispatch: gửi vi lệnh tới Execution Unit
tương ứng.
• Stages 15 & 16 - Register Files: đọc register file.
• Stage 17 - Execute: vi lệnh được thực hiện.
• Stage 18 - Flags: cờ của vi lệnh được cập nhật.
• Stage 19 - Branch Check: kiểm tra nhánh của chương trình có
cùng với suy đốn của mạch dự đốn rẽ nhánh hay khơng.
• Stage 20 - Drive: gửi kết quả của việc kiểm tra này tới Branch
Target Buffer (BTB).
Mặc dù về lý thuyết, pipeline dài có thể làm tăng hiệu năng,
tuy nhiên, bất chấp điều này, có quá nhiều stage sẽ khiến cho thời gian
thực hiện một lệnh dài hơn. Thứ hai là một pipeline dài sẽ trở nên rất
kém hiệu quả trong những trường hợp phỏng đoán nhánh sai (branch
prediction error). Sẽ mất nhiều thời gian để lấp đầy pipeline một lần
nữa. Intel đã triển khai một vài biện pháp để bù lại sự mất mát hiệu
năng trong những trường hợp này, đó là Execution Trace Cache và
Dynamic Execution Engine.
Thực tế là Pentium IV chỉ nhanh hơn Pentium III nhờ hoạt động
ở mức xung nhịp cao hơn. Với cùng mức xung nhịp, một CPU
Pentium III sẽ nhanh hơn CPU Pentium IV nhờ kích thước pipeline
của nó. Bởi vì sự kém hiệu quả của pipeline trong kiến trúc Netburst,
thế hệ vi xử lý thứ 6 8 của Intel (vi kiến trúc Core) quay trở lại với
17



kiến trúc của Pentium M, một kiến trúc dựa trên nền tảng của kiến
trúc thế hệ thứ 6 thay vì tiếp tục phát triển thế hệ thứ 7 (Netburst).
2. Execution TraceCache
Là bộ nhớ đệm cấp 1 (Level 1 Execution Trace Cache). Bên
cạnh 8KB bộ nhớ đệm dùng để chứa dữ liệu (data cache), Pentium 4
có khả năng lưu trữ đến 12K vi lệnh đã được giải mã (decoded microops) nhằm giúp tăng cường tốc độ thực thi lệnh của CPU.
3. Rapid Execution Engine - Cơ chế thực thi (lệnh) nhanh chóng
Điều này được thực hiện dựa trên hai Đơn vị Luận lý Số học
(Arithmetic Logical Unit - ALU) được thiết kế bên trong Pentium 4.
Nó cho phép Pentium 4 thực hiện các lệnh số học (cộng, trừ, nhân
chia) và luận lý (Và-And, Hoặc-Or...) chính với tốc độ gấp 2 lần tần
số xử lý cơ bản của bộ xử lý. Như vậy CPU Pentium 4 - 2.0Ghz (bus
400Mhz) có khả năng thực hiện các lệnh trên với tốc độ 4.0Ghz và
CPU Pentium 4 - 2.53Ghz (bus533Mhz) thực hiện với tốc độ 5.1Ghz.
4. Advanced Transfer Cache (ATC)
Là bộ nhớ nội cấp 2 (L2 Cache) được thiết kế bên trong
Pentium 4. ATC có hai loại: 512 KB L2 ATC với các tốc độ CPU
2.8Ghz - 2.53Ghz - 2.40Ghz - 2.40(B)Ghz - 2.26Ghz - 2.20Ghz 2.0(A)Ghz và 1.6(A)Ghz; 256 KB L2 ATC với các tốc độ từ 1.2Ghz 2.0Ghz. ATC cung cấp kênh truyền có thơng lượng rất cao (high data
throughput channel) với "nhân CPU" (CPU core). ATC bao gồm một
giao diện 256-bit (32 byte) để truyền dữ liệu trên mỗi đồng hồ nhân
(core clock). Điều này cho phép ATC (L2 Cache) hỗ trợ tốc độ cao
gấp 4 lần tốc độ truyền dữ liệu của L2 Cache sử dụng trong các CPU
Pentium III. Ví dụ: CPU Pentium 4 - 2.53Ghz có tốc độ truyền dữ liệu
lên tới 81GB/giây, so với tốc độ truyền dữ liệu 16GB/giây của
Pentium III - 1.0 Ghz.
5. Out-Of-Order Execution
18



Nhân hỗ trợ Out-of-Order Execution có thể sắp xếp lại các vi
lệnh, cho phép lệnh (cùng với đầu vào và các tài nguyên hệ thống cần
thiết) để thực thi ngay khi có thể và tránh lãng phí thời gian. Khi một
vi lệnh đang chờ được cấp phát tài nguyên hoặc dữ liệu, các lệnh khác
(thường là trong buffer) có thể chen vào thực thi. Nhờ thực thi các
lệnh song song, những khoảng trễ của pipeline bị loại bỏ. Nhân có thể
thực thi nhiều lệnh trong mỗi giai đoạn của pipeline. Sau đó in-order
retirement unit sẽ tìm các lệnh được thực hiện xong và khơng cịn phụ
thuộc dữ liệu cũng như liên quan đến các lệnh rẽ nhánh chưa hoàn tất
để xử lý và lưu kết quả ra bộ nhớ theo trật tự ban đầu của nó.
6. Branch Prediction (phỏng đốn nhánh)
Kiến trúc NetBurst có thể nhớ được các nhánh trong chương
trình chạy, giúp làm giảm độ trễ trong quá trình nhảy và nạp đầy ống
lệnh, Các nhánh được lưu giữ trên cơ sở địa chỉ lệnh bên trong Branch
Target Buffer (BTB). Bộ vi xử lý có thể dự đốn được các nhánh sắp
tới trước cả khi lệnh rẽ nhánh được thực hiện.
7. Rapid Execution Engine
Trong Pentium 4, có 2 ALU (Arithmetic Logic Unit) và hai
AGU (Address Generation Unit) chạy với mức xung gấp đôi xung
clock. Rapid execution engine được giới thiệu là làm giảm độ trễ của
việc thực hiện các phép tốn đơn giản. Điều này thực sự có ý nghĩa vì
hiệu năng và tốc độ của vi xử lý phụ thuộc rất nhiều vào các tính tốn
số ngun trên ALU.
8. Quad Data Rate
FSB của Pentium 4 có thể truyền bốn lần dữ liệu trong một
xung clock. Công nghệ này là Quad Pumped hay còn gọi là Quad
Data Rate (QDR). QDR khiến cho xung nhịp hiệu dụng tăng lên gấp 4
lần so với xung thực. Nhờ đó các CPU Pentium 4 có thể đạt đến
400Mhz System bus, tốc độ truyền nhận dữ liệu vào-ra CPU là
19



3.2GBps so với tốc độ tương ứng là 1.06GBps của Pentium III
(133Mhz system bus).
9. Enhanced Floating Point & Multimedia Unit
Bộ xử lý Pentium 4 mở rộng các thanh ghi dấu chấm động
(floating-point register) lên tới 128-bit và tạo thêm một thanh ghi mở
rộng nhằm phục vụ việc di chuyển dữ liệu. Do vậy, khả năng xử lý các
ứng dụng dấu chấm động (tính tốn kết cấu, số liệu tài chính, số liệu
khoa học…) và truyền thông đa phương tiện (dựng và xử lý phim
video, xử lý hình ảnh đồ họa…) được tăng cường rất nhiều.
10. Streaming SIMD Extension 2 (SSE2) Instructions
Là tập lệnh hỗ trợ đồ họa mở rộng được thiết kế cho Pentium 4.
Vi kiến trúc Netburst (Netburst™ Microarchitecture) mở rộng khả
năng xử lý theo kiểu cấu trúc SIMD của 8 các cơng nghệ Intel®
MMX™ và SSE bằng cách thêm vào 144 lệnh mới. Các lệnh này bao
gồm các tác vụ số nguyên SIMD 128-bit (128-bit SIMD integer
arithmetic operations) và các tác vụ dấu chấm động (128-bit SIMD
double-precision floating point operations). Các lệnh mới này làm tối
ưu hóa khả năng thực hịên các ứng dụng như phim video, xử lý âm
thanh - hình ảnh, mã hóa, tính tốn khoa học, kết nối mạng trực
tuyến...
11. Hyper Threading (siêu phân luồng)

20


Hyper threading là công nghệ cho phép một CPU vật lý hoạt
động trên hệ điều hành như là hai CPU logic hoạt động song song. Nó
dựa trên nguyên tắc là vào một thời điểm chỉ có một phần tài nguyên

của CPU được sử dụng để thực thi lệnh của một tiến trình, những
phần chưa được sử dụng có thể được dùng để thực thi các tiến trình
khác. Trong các CPU sử dụng công nghệ Hyper-Threading, mỗi CPU
logic sở hữu một tập các thanh ghi, kể cả thanh ghi đếm chương trình
PC riêng (separate program counter), CPU vật lý sẽ luân phiên các
giai đoạn tìm/giải mã giữa hai CPU logic và chỉ cố gắng thực thi
những thao tác từ hai chuỗi lệnh đồng thời theo cách hướng tới những
đơn vị thực thi ít được sử dụng.

TỔNG KẾT

IV.

Q trình phát triển của các phiên bản CPU Intel Pentium trải qua 8 giai
đoạn chính sau:






CPU Intel Pentium I (1993-1997; 60-200 MHz).
CPU Intel Pentium II (1997-1999; 233-450 MHz).
CPU Intel Pentium III (1999-2001; 500 MHz-1,13 GHz).
CPU Intel Pentium 4 - được giới thiệu vào năm 2000 (1,4-3,4 GHz).
CPU Intel Pentium 4 Extreme Edition - được Intel giới thiệu vào năm

2003 dành cho game thủ và người dùng cao cấp.
• CPU Intel Pentium D - được Intel giới thiệu vào năm 2005, đây là chip
Pentium lõi kép đầu tiên của Intel.

• Năm 2006, Intel cho ra mắt dòng CPU Intel Core làm chủ lực thay thế
dòng CPU Intel Pentium. Từ năm 2007 đến 2017, Intel cho nâng cấp các
phiên bản Intel Pentium đã có để phục vụ tệp khách hàng có nhu cầu sử
dụng máy tính cơ bản.
• Từ năm 2017 đến 2021, định hướng của Intel dành cho CPU Intel
Pentium sẽ là tập trung phát triển và cung cấp tới thị trường 2 dòng chip
Pentium Gold và Pentium Silver. Pentium Silver nhắm đến các thiết bị
21


năng lượng thấp và chia sẻ kiến trúc với dòng CPU Atom và Celeron.
Trong khi Pentium Gold nhắm đến máy tính có câus hình tầm trung và sử
dụng kiến trúc hiện có, như dịng CPU Kaby Lake hoặc Coffee Lake.
• Trong năm 2021, nếu bạn có nhu cầu sử dụng máy tính trang bị chip Intel
Pentinum, bạn có thể tìm mua các sản phẩm thuộc dòng Intel Pentium
Gold hoặc Intel Pentium Silver - đây là hiện hai dòng duy nhất thuộc
Intel Pentium còn được Intel phát triển và hỗ trợ trên thị trường.
Ưu điểm : CPU Intel Pentium có giá thành rẻ nhưng hiệu năng ổn
định, có khả năng tương thích với rất nhiều board mạch chủ từ các hãng
khác nhau. Tuy nhiên Pentium vì giá thành khá rẻ nên dịng CPU này
khơng được hỗ trợ một số cơng nghệ hiện đại như Turbo Boost hay Hype
Threading. CPU Intel đang từng bước tăng tốc hiệu năng nhưng vẫn giữ
một mức giá phù hợp với việc nâng cấp Pentium lên thế hệ Haswell và
được sản xuất ở quy trình 22 nm cho khả năng siêu tiết kiệm pin TDP 15
W và hiệu năng xử lí tốt hơn CPU Core i thế hệ cũ.Các phiên bản của
CPU Intel Pentium có hiệu năng ổn định như Intel Pentium I (1993), Intel
Pentium II (1997), Intel Pentium III (1999), Intel Pentium IV
(2000),...Pentium MMX (năm 1996) là phiên bản cải tiến của Pentium I
với công nghệ MMX được Intel phát triển để đáp ứng nhu cầu về ứng
dụng đa phương tiện và truyền thông. MMX kết hợp với SIMD (Single

Instruction Multiple Data) cho phép xử lý nhiều dữ liệu trong cùng chỉ
lệnh, làm tăng khả năng xử lý trong các tác vụ đồ họa, đa phương
tiện.Pentium II (năm 1997), phiên bản cải tiến từ Pentium Pro được sử
dụng trong những dịng máy tính cao cấp, máy trạm (workstation) hoặc
máy chủ (server). Pentium II có bộ nhớ đệm L1 32KB, L2 512KB, tích
hợp cơng nghệ MMX được cải tiến giúp việc xử lý dữ liệu video, audio
và đồ họa hiệu quả hơn. Pentium III (năm 1999) bổ sung 70 lệnh mới
22


(Streaming SIMD Extensions - SSE) giúp tăng hiệu suất hoạt động của
BXL trong các tác vụ xử lý hình ảnh, audio, video và nhận dạng giọng
nói. Ngồi ra Intel Pentium 4 Extreme Edition với hiệu năng mạnh mẽ
từng được trang bị trên các laptop cao cấp và các laptop gaming giúp
người dùng yên tâm về hiệu năng của dòng CPU này. Hiện nay, phiên
bản Intel Pentium Gold và Intel Pentium Silver là 2 phiên bản phổ biến
của dòng CPU này.
Nhược điểm: Giá so với hiệu suất bộ vi xử lý Pentium 4 đắt tiền. P4s
có tốc độ xung nhịp từ 1,3 GHz đến 1,8 GHz và giá của chúng từ $188
USD đến $562 USD. Máy tính sử dụng bộ vi xử lý P4 yêu cầu bộ nhớ
RAMBUS RDRAM có giá cao hơn so với SDRAM thông thường (được
sử dụng bởi Pentium II, Pentium III, Celeron, Duron và Athlon). Bộ vi xử
lý Pentium 4 tiêu thụ nhiều điện năng hơn các bộ vi xử lý khác có hiệu
năng tương tự. Điều này có nghĩa là phải thực hiện các biện pháp đặc biệt
để loại bỏ nhiệu do bộ xử lý tạo ra từ chip và khỏi vỏ. Ngoài ra, các hệ
thống máy tính sử dụng bộ vi xử lý P4 yêu cầu bộ nguồn lớn hơn. Các bộ
nguồn lớn hơn làm tăng thêm chi phí cho hệ thống cơ sở P4. Khi nhiệt
tích tụ và nhiệt độ của khn tăng lên, các cảm biến nhiệt độ sẽ giảm tốc
độ xung nhịp để bảo vệ vi xử lý. Trong một hệ thống mà bộ xử lý khơng
được làm mát thích hợp, bộ xử lý không chạy ở xung nhịp được thiết kế

cao nhất. Để giữ cho bộ xử lý mát mẻ, các tản nhiệt lớn với quạt tích hợp
thường được sử dụng. Trong các ứng dụng nhỏ gọn hơn như máy tính di
động hoặc điều khiển nhúng, quạt và tản nhiệt lớn có thể khơng phù hợp
do khơng gian hạn chế và cần có vỏ kín. Trong những trường hợp này, có
thể cần đến ống dẫn nhiệt hoặc thậm chí làm mát bằng nén hơi. Cả hai
đều có giá cao hơn tản nhiệt. Yêu cầu nguồn của bộ vi xử lý Pentium 4
cũng có thể gây ra sự cố ở phía nguồn cung cấp. Khi nguồn điện không
23


thể đáp ứng nhu cầu của bộ vi xử lý, mức điện áp sẽ giảm xuống. Điều
này có thể gây ra lỗi hoặc máy tính có thể bị khóa. Trong máy tính xách
tay, pin sẽ khơng sử dụng được lâu. Các hệ thống máy tính có nguồn điện
liên tục có thể khơng có thời gian để hồn tất q trình tắt trước khi hết
pin.
V.






NGUỒN TÀI LIỆU
Những bộ xử lý Intel Pentium 4 (tranlegroup.com)
Pentium 4 – Wikipedia tiếng Việt
Prescott trước đây của các sản phẩm (intel.com)
Intel Pentium 4 (Seventh-Generation) Processors | Microprocessor Types and
Specifications | InformIT

• The Microarchitecture of the Pentium 4 Processor - Intel Corp


24



×