Tải bản đầy đủ (.pptx) (32 trang)

Silde Tìm hiểu kiến trúc pentium 4

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (3.42 MB, 32 trang )

LỚP :
BỘ MÔN: KĨ THUẬT VI XỬ LÝ
GIÁO VIÊN:HOÀNG XUÂN DẬU
HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
BÁO CÁO : TÌM HIỂU VI KIẾN TRÚC PENTIUM
4
BÁO CÁO : TÌM HIỂU VI KIẾN TRÚC PENTIUM
4
)
)
LOGO
NỘI DUNG BÁO CÁO
I.GIỚI THIỆU VỀ PETIUM 4
II.SƠ ĐỒ KHỐI,CẤU TRÚC,CHỨC NĂNG CỦA CÁC BỘ PHẬN
III.TẬP LỆNH.
V.KẾT LUẬN.
IV.CÔNG NGHỆ MỚI VÀ TÍNH NĂNG NỔI BẬT
LOGO
I.GIỚI THIỆU VỀ PETIUM 4.
Pentium 4 là một dòng chíp đơn lõi được giới thiệu bởi Intel vào 20 tháng 11 năm
2000 . Nó có một vi kiến trúc x86 thế hệ thứ 7 , được gọi là NetBurst, đó là thiết kế
hoàn toàn mới đầu tiên của công ty kể từ khi giới thiệu vi kiến trúc
P6 CPU Pentium Pro vào năm 1995. NetBurst khác kiến trúc P6 (Pentium III , II ,
) bởi tính năng hướng dẫn đường ống rất sâu để đạt được tốc độ xung nhịp rất
cao. Intel tuyên bố rằng NetBurst sẽ cho phép tốc độ đồng hồ lên đến 10 GHz, tuy
nhiên, vấn đề nghiêm trọng với tản nhiệt (đặc biệt là với Prescott Pentium 4) hạn
chế tốc độ đồng hồ CPU 3,8 GHz thấp hơn nhiều.
LOGO
II. SƠ ĐỒ KHỐI,CẤU TRÚC,CHỨC NĂNG CỦA CÁC BỘ PHẬN
1. Vi kiến trúc NETBURST
Công nghệ vi kiến trúc Netburst của intel được ứng dụng rộng rãi trong các dòng chip của Intel.Vi xử lý Pentium 4 dựa trên kiến trúc Netburst có thiết kế


cải thiện hơn rất nhiều so với các bộ xử lý cũ(Pentium 2,Pentium 3 và Caleron sử dụng vi kiến trúc P6).
Đặc điểm đáng kể nhất của vi kiến trúc Netburst là được áp dụng một số công nghệ nổi bật như:
* Hyper Pipelined Technology(HPT):mở rộng số hàng lệnh xử lý.
* Execution Trace Cache(ETC):tránh tình trạng lệnh bị chậm chễ khi chuyển từ bộ nhớ đến CPU
* Rapid Execution Engine(REE):tăng tốc độ đồng xử lý toán học,bus hệ thống
LOGO
In-Order Front End
Out-Of-Order Execution Engine
Integer and Floating-Point Execution Units
Memmory Subsystem
II. SƠ ĐỒ KHỐI,CẤU TRÚC,CHỨC NĂNG CỦA CÁC BỘ PHẬN
1. Vi kiến trúc NETBURST
Vi kiến trúc Netbust được tạo thành từ 4 phần chính:
Sơ đồ khối của vi kiến trúc Netburst
LOGO
II. SƠ ĐỒ KHỐI,CẤU TRÚC,CHỨC NĂNG CỦA CÁC BỘ PHẬN
1. Vi kiến trúc NETBURST
b. Out-Of-Order Execution Engine
Là nơi các lệnh chuẩn bị thực hiện. khối logic Out-of-order có một số bộ đệm sắp xếp lại trật tự thực hiện các lệnh khi chúng được đưa vào ống lệnh và được
lập lịch thực hiện.Khi 1 vi lệnh đang chờ được cấp phát tài nguyên hoặc dữ liệu ,các lệnh khác có thể chen vào thực thi miễn là các lệnh khác này không phụ
thuộc vào lệnh đang chờ kia.
a. In-Order Front End
Có nhiệm vụ nạp và giải mã lệnh.Nó có khả năng dự đoán rẽ nhánh chính xác cao nhờ lưu trữ lịch sử thực hiện chương trình và suy đoán nhánh mà chương
trình thực hiện tiếp.
c. Integer and Floating-Point Execution Units
Excution Units là nơi lệnh thực sự được thực hiện.Phần này bao gồm các register files lưu trữ các giá trị toán tử số nguyên và dấu phẩy động của các lệnh
cần thực hiện.
d. Memmory Subsystem
Bao gồm cache L2 và system bus.Lưu trữ các lệnh và dữ liệu mà Execution Trace Cache và cache dữ liệu L1 không thể lưu trữ được.Bus hệ thống bên ngoài
(external) kết nối với mặt sau của cache L2,để truy nhập bộ nhớ chính khi Cache L2 bị miss và truy nhập thiết bị vào ra


Nhận xét: So với những thiết kế về sau như Core,K8 thì kiến trúc Netburst chạy kém và tiêu thụ nhiều điện năng hơn mặc dù những thiết kế
Netburst về sau đã được cải thiện đôi chú.
LOGO
II.SƠ ĐỒ KHỐI,CẤU TRÚC,CHỨC NĂNG CỦA CÁC BỘ PHẬN
2. Sơ đồ khối bộ vi xử lí pentium IV
Out-of-oder Eexcution Logic
Out-of-oder Eexcution Logic
Gồm 4 phần chính :
Front End
Front End
Integer and Floating-Point Execution Units
Integer and Floating-Point Execution Units
Memory Subsystem
Memory Subsystem
LOGO
II.SƠ ĐỒ KHỐI,CẤU TRÚC,CHỨC NĂNG CỦA CÁC BỘ PHẬN
2. Sơ đồ khối bộ vi xử lí pentium IV
a .Out-of-oder Eexcution Logic

Khối logic thực thi này có một số bộ đệm để sắp xếp lại trật tự thực hiện các lệnh khi chúng được đưa vào ống lệnh và được lập lịch thực hiện để có thể
thực hiện chương trình nhanh hơn.

Một thành phần quan trọng của Out- Of – Order Excution Engine là scheduling functions. Nó là trái tim của hệ thống out-of-order Pentium IV. Mục đính của
Scheduler là giữ cho mọi execution unit trong CPU luôn luôn làm việc
LOGO
II.SƠ ĐỒ KHỐI,CẤU TRÚC,CHỨC NĂNG CỦA CÁC BỘ PHẬN
2. Sơ đồ khối bộ vi xử lí pentium IV
b. Front End


Trace cache

Trace Cache là cache chính hay cache lệnh level 1(L1) đảm nhiệm vận chuyển 3 vi
lệnh mỗi xung nhịp đồng hồ tới khối logic Out-Of-Order Execution.

Trace Cache có khả năng nắm giữ tới 12 vi lệnh

Trace Cache cũng có riêng 1 cơ chế dự đoán nhánh để chỉ dẫn vị trí tiếp
theo trong Trace Cache cho các lệnh đang được nạp.
LOGO
II.SƠ ĐỒ KHỐI,CẤU TRÚC,CHỨC NĂNG CỦA CÁC BỘ PHẬN
2. Sơ đồ khối bộ vi xử lí pentium IV
b. Front End

Microcode ROM
Nằm ở gần vị trí Trace Cache là đơn vị Micocode Rom.Rom này được sử dụng cho các lệnh IA 32 phức tạp như là string move,xử lí lỗi và gián đoạn.Khi gặp
phải một lệnh phức tạp,Trace Cache sẽ chuyển lệnh sang Microcode Rom ,Microcode Rom sẽ cung cấp các vi lệnh cần thiết có trong nó để hoàn thành hoạt
động.Sau khi kết thúc,khối front end sẽ tiếp tục nạp các các vi lệnh từ Trace Cache.

ITLB and Front-End BTB
ITLB = Instruction Translation Look-aside Buffer. Nó là một bảng có chứa thông tin về các trang trong bộ nhớ mà bộ xử lý đã truy cập gần đây.nó Dịch các
địa chỉ lệnh tuyến tính để được các địa chỉ vật lý cần thiết để truy cập vào bộ nhớ cache L2.ITLB cũng thực hiên kiểm tra page-level protection . Instruction
TLB and front-end BTB sẽ chỉđạo các hoạt động của Fron End khi máy bị missTrace Cache.
BTB = Branch Target Buffer,nó lưu trữ lịch sử của các nhánh lệnh đã thực hiện trước đó và mục tiêu thực hiện của chúng để tiết kiệm thời gian tính toán cho
ra các mục tiêu này.
LOGO
II.SƠ ĐỒ KHỐI,CẤU TRÚC,CHỨC NĂNG CỦA CÁC BỘ PHẬN
2. Sơ đồ khối bộ vi xử lí pentium IV
b. Front End


IA-32 Instruction Decoder.
The Istruction Decoder nhận các byte lệnh 32 bit từ Cache L2 64 bit,và giải mã chúng thành các vi lệnh mà máy có thể hiểu và thực hiện được.Một bộ
giải mã đơn instruction decoder chỉ có thể giải mã được tối đa là 1 lệnh IA 32 trong 1 chu kì đồng hồ mà thôi.Một số lệnh IA 32,mỗi lệnh có thể
chuyển đổi được thành 1 vi lệnh đơn,nhưng cũng có nhiều lệnh thì lại mỗi lệnh chuyển đổi được thành nhiều hơn 1 vi lệnh .Trong trường hợp cần
nhiều hơn 4 vi lệnh để hoàn thành giải mã 1 lệnh IA 32 thì lúc này bộ giải mã sẽ gửi tín hiệu vào trong microcode ROM để lấy các vi lệnh tương ứng.

Execution Unit
Execution Unit là nơi mà các lệnh thực sự được thực hiên.Nó được thiết kế ra để tối ưu hoá hiệu suất tổng thể bằng cách xử lí các trường hợp phổ biến nhất
càng nhanh càng tốt.
LOGO
II.SƠ ĐỒ KHỐI,CẤU TRÚC,CHỨC NĂNG CỦA CÁC BỘ PHẬN
2. Sơ đồ khối bộ vi xử lí pentium IV
c. Integer and Floating-Point Execution Units

L1 cache
Cache dữ liệu Level 1(L1) là một loại cache 8K-byte sử dụng cho cả các
lệnh load,store số nguyên ,dấu phẩy động/SSE.Nó được tổ chức thành 4
đường tập kết hợp với 64 byte cho mỗi dòng cache (cache line).Nó là cache
kiểu write-through,nghĩa là cái gì mà được ghi vào nó thì sẽ luôn luôn được
copy vào L2.Nó có thể thực hiện được 1 lênh load và 1 lệnh store trong mỗi
chu kì đồng hồ.
LOGO
II.SƠ ĐỒ KHỐI,CẤU TRÚC,CHỨC NĂNG CỦA CÁC BỘ PHẬN
2. Sơ đồ khối bộ vi xử lí pentium IV
d.Memory Subsystem
Vi xử lí Pentium 4 có một memory subsystem với khả năng nổi bật cho phép ứng dụng mới, các ứng dụng luồng định hướng bang thong cao như 3D, video, và
content creation. Memory subsystem bao gồm bộ nhớ cache mức 2 và bus hệ thống. Cache level 2 lưu trữ các dữ liệu không lưu trữ được trong cache L1.
Bus hệ thống ngoài được sử dụng để truy cập main memory khi xảy ra miss ở cache mức 2 hay cũng để truy cập hệ thống thiết bị I/O.

Bus hệ thống

Bộ vi xử lí Pentium IV có bus hệ thống với băng thông 3,2 Gbytes mỗi giây.Băng thông cao là một tạo khả năng quan trọng cho các ứng dụng dòng dữ
liệu từ bộ nhớ.Băng thông này đạt được như vậy là nhờ một bus rộng 64 bit có khả năng truyền dữ liệu với tốc độ 400MHz.
LOGO
II.SƠ ĐỒ KHỐI,CẤU TRÚC,CHỨC NĂNG CỦA CÁC BỘ PHẬN
2. Sơ đồ khối bộ vi xử lí pentium IV
d.Memory Subsystem

Cache mức 2 hay còn gọi là Advanced Transfer Cache

Bộ nhớ cache mức 2 là bộ nhớ cache 256K-byte mà giữ cả các lệnh bị
miss trong Trace Cache và dữ liệu bị miss trong cache dữ liệu mức 1.

Nó tổ chức như một bộ 8 đường liên kết với 128 bytes trên một dòng
cache. Những đường cache 128-byte bao gồm 2 phần 64-byte sectors.
LOGO
III.TẬP LỆNH

Có 9 nhóm lệnh cơ bản :

Có 9 nhóm lệnh cơ bản :
LOGO
III.TẬP LỆNH

SSE instructions

Là mở rộng của kiến trúc đơn dòng lệnh đa dữ liệu(SIMD) với công nghệ MMX, SSE chỉ có thể thực thi trên các VXL Intel 64 và IA-32 mà hỗ trợ các mở
rộng SSE Thêm 70 lệnh mới giúp cải thiện hình ảnh, âm thanh và video 3D, tiếng nói, và các chức năng Internet.

Streaming SIMD Extension 2 (SSE2) Instructions


SSE2 có 144 lệnh mới. Các lệnh này bao gồm các tác vụ số Nguyên SIMD 128-bit và các tác vụ dấu chấm động với độ chính xác kép SIMD 128-bit.

SSE3 instructions

Được phát triển từ thành công của công nghệ MMX .

SSE3 với 13 lệnh mới sẽ mở rộng các khả năng của SSE2, cải thiện hoạt động của công nghệ siêu phân luồng HT cho hiệu quả hơn, tăng cường các
chức năng multimedia và Internet cho hệ thống.
LOGO
IV.CÔNG NGHỆ MỚI VÀ TÍNH NĂNG NỔI BẬT.
1.Hyper Threading (siêu phân luồng)
Hyper threading là công nghệ cho phép một CPU vật lý hoạt động trên hệ điều hành như là hai CPU logic hoạt động song song. Dựa trên nguyên tắc vào
một thời điểm của một tiến trình chỉ có một phần tài nguyên của CPU được sử dụng để
thực thi lệnh, phần chưa được sử dụng thì được dùng để thực thi các tiến trình khác.
LOGO
IV.CÔNG NGHỆ MỚI VÀ TÍNH NĂNG NỔI BẬT.
2.Execution TraceCache

Là bộ nhớ đệm cấp 1 (Level 1 Execution Trace Cache). Bên cạnh 8KB
bộ nhớ đệm dùng để chứa dữ liệu (data cache), Pentium 4 có khả năng lưu trữ đến 12K vi lệnh đã được giải mã (decoded micro-
ops) nhằm giúp tăng
cường tốc độ thực thi lệnh của CPU.
LOGO
IV.CÔNG NGHỆ MỚI VÀ TÍNH NĂNG NỔI BẬT.
3. Out-Of-Order Execution

Nhân hỗ trợ Out-of-Order Execution có thể sắp xếp lại các vi lệnh, cho phép lệnh
(cùng với đầu vào và các tài nguyên hệ thống cần thiết) để thực thi ngay khi có thể và
tránh lãng phí thời gian. Khi một vi lệnh đang chờ được cấp phát tài nguyên hoặc dữ
liệu, các lệnh khác (thường là trong buffer) có thể chen vào thực thi. Nhờ thực thi các

lệnh song song, những khoảng trễ của pipeline bị loại bỏ. Nhân có thể thực thi nhiều
lệnh trong mỗi giai đoạn của pipeline.
LOGO
IV.CÔNG NGHỆ MỚI VÀ TÍNH NĂNG NỔI BẬT.
4.Rapid Execution Engine - Cơ chế thực thi (lệnh) nhanh chóng

Điều này được thực hiện nhờ trên 2 đơn vị luân lý số học(Arithmetic Logical Unit LU) được thiết kế bên trong Pentium 4.Nó cho phép
Pentium 4 thực hiện các lệnh số học(cộng,trừ,nhân,chia…) và luận lý(And,Not…) với tần số gấp 2 lần tần số xử lý cơ bản của bộ vi xử lý.


Trong Pentium 4,có 2 ALU(Arithmetic Logic Unit) và 2 AGU(Address Generation Unit) chạy với mức xung gấp đôi xung clock.Rapid
Execution Engine được giới thiệu là làm giảm độ trễ của việc thực hiện các phép toán đơn giản.

LOGO
IV.CÔNG NGHỆ MỚI VÀ TÍNH NĂNG NỔI BẬT.
5. Branch Prediction (phỏng đoán nhánh)

Kiến trúc NetBurst có thể nhớ được các nhánh trong chương trình chạy, giúp làm
giảm độ trễ trong quá trình nhảy và nạp đầy ống lệnh, Các nhánh được lưu giữ trên
cơ sở địa chỉ lệnh bên trong Branch Target Buffer (BTB). Bộ vi xử lý có thể dự đoán
được các nhánh sắp tới trước cả khi lệnh rẽ nhánh được thực hiện.
LOGO
IV.CÔNG NGHỆ MỚI VÀ TÍNH NĂNG NỔI BẬT.
6.Quad Data Rate
FBS của Petium 4 có thể truyền bốn lần dữ liệu trong một
xung clok.Công nghệ này là Quad Pumped hay còn gọi là
Quad Data Rate (QDR).QDR khiến cho xung nhịp hiệu dụng
tăng lên gấp 4 lần so với xung thực.
RealClock Performance TransferRate
100MHz

400MHz 3.2GB/s
133MHz
533MHz 4.2GB/s
200MHz
800MHz 6.4GB/s
266MHz
1,066MHz 8.5GB/s
LOGO
IV.CÔNG NGHỆ MỚI VÀ TÍNH NĂNG NỔI BẬT.
7.Enhanced Floating Point & Multimedia Unit

Bộ xử lý Pentium 4 mở rộng các thanh ghi dấu chấm động (floatingpoint register)
lên tới 128 bit và tạo thêm một thanh ghi mở rộng nhằm phục vụ việc di chuyển dữ
liệu. Do vậy, khả năng xử lý các ứng dụng dấu chấm động (tính toán kết cấu, số
liệu tài chính, số liệu khoa học…) và truyền thông đa phương tiện (dựng và xử lý
phim video, xử lý hình ảnh đồ họa…) được tăng cường rất nhiều.
LOGO
IV.CÔNG NGHỆ MỚI VÀ TÍNH NĂNG NỔI BẬT.
8.Streaming SIMD Extension 2 (SSE2) Instructions

Là tập lệnh hỗ trợ đồ họa mở rộng được thiết kế cho Pentium 4. Vi kiến trúc
Netburst(Netburst™ Microarchitecture) mở rộng khả năng xử lý theo kiểu cấu trúc SIMD của
các công nghệ Intel® MMX™ và SSE bằng cách thêm vào 144 lệnh mới.

×