Tải bản đầy đủ (.pdf) (34 trang)

Báo cáo tiểu luận intel xeon 6000

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.17 MB, 34 trang )

BÁO CÁO TIU LUN

K THUT VI X LÝ
GING VIÊN : HOÀNG XUÂN DU

Đề Tài:
TÌM HIU KIN TRÚC
DÒNG VI X LÝ
INTEL XENON 6000



Thành Viên :
Lê anh Tuấn
Nguyễn Đình Thịnh
Nguyễn Xuân Tiến
Vũ Thành Tuân
Vũ Văn Thuẫn


I.GIỚI THIỆU
c duy trì qua nhiu th h ca vi x lý x86 và
x86-64 , tên ca vi x lý này  c thêm vào phn sau tên ca
các vi s ng ( vi x lý dành cho  
hình gng có b nh Cache
u so vi các vi x lý khác và có kh multiprocessing capabilities
 lý ) .
Intel Xeon Processor 6000 c thit k cho các khi công vic b nh hn
ch . Intel Xeon Processor 6000 vi máy ch 64-bit là s la chn hp lý
nht .


m :
- Vi 8 core và 16 threads cho mi Socket và công ngh Intel ® Hyper-
Threading Technology . Intel Xeon u xut x lý vi vic
sn xut trên công ngh 45nm và h tr khong không cho các ng
di x ng .
- Vi vi kiy hiu xut ca b nh
cache trên nhiu ng dng i s dng . Cho phép
trin khai d liu vi m cao .
- B nh u qu truyn d liu cache  to
 core , t nh  x 
- Intel QuickPath Interconnect (Intel QPI) cung cp t n
25,6 GB/s), point  to  point kt ni gi vi x a các
b s lý và trung tâm I/O hub .

II.KIẾN TRÚC VI SỬ LÝ
1-  Khi
CPU Xeon 6000 da theo kin trúc nehalem.
 khi ca các khi thc thi:





 FPU : Floating - Point Unit. Khi này chu trách nhim cho vic thc thi
cácbiu thc toán hc floating- các ch lnh MMX và SSE.
t s kiu ch lnh (
FPmov, FPadd và Fpmul ) ch c th :
o Fpadd : Ch có FPU này mi có th x lý các ch lnh cng floating-
PS.
o FPmul: Ch có FPU này mi có th x lý các ch lnh nhân floating-


o FPmov:Các ch lnh cho vic np hoc copy m
 truyn ti d liu n thanh ghi SSE 128-bit
XMM). Kiu chlnh này có th c th
trên các FPU thhai và th ba nu các ch lnh Fpadd hay Fpmul
không có trongReservation Station.
 FP ADD: thc thi mt ch lnh SSE có tên gi PFADD (Packed FP Add) và
các ch lnh COMPARE, SUBTRACT, MIN/MAX và CONVERT. Khi này
c cung cp riêng, chính vì vy nó có th bu vic thc thi mt ch lnh
gii mã mi mi chu kì clock dù là nó không hoàn tc s thc thi ca ch
lc. Khi này có m tr 
gi chm 3 chu kì cloi vi mi ch lc x lí.
 AGU : nhng ln s n b nh c thc
hin  
 Store Data: Khi này x lý các ch lnh yêu cu d liu c ghi vào b nh
RAM.






2  m Phn Cng
m cache :
H tht mng
ln (18MB) và dùng chung cho tt c các nhân. Mi nhân còn s hu riêng hai
cache L1 ( tr th ng liên kt).
B nh m L3 trong vi x lí xeon 6000 hong vi tn s c lp và có h
thng cp ngun riêng bit v m b nh và gim xác sut
lm ca thit k cache L3 này là giúp vii d liu gia các nhân

hiu qu n thông qua các cache bên trong ca mi nhân. Tuy
n hong ca cache riêng trong mi nhân.
Mi dòng lnh trong cache L3 chu nhân nào có cha bn sao ca
dòng lng cache riêng ca mình. C th, khi mt nhân truy vn L3
u mang giá tr 0 thì s 
có bn sao dòng lc li, nu mang giá tr 1 thì có kh
n sao ca dòng la, giao thc truy
xut d liu trong cache c chuyn bin thành giao thc
MESIF (Modified, Exclusive, Shared, Invalid and Forward). S phi hp ca
nhng u và MESIF giúp gim bt tn sut truy cp cache ca các nhân
nên s gii phóng nhing d liu tht s cn thit trong
các cache.
B phu khin b nh và Bus ngoài
  giao tip vi RAM trong b c tích hp mu khin
b nhu khin này s ch h tr cho b nh hi
phép chc ch  b nh kênh ba (triple channel) thay vì ch ch
i b nh, tuyc
s d BXL giao tip vi chipset (gi có tên là Intel QuickPath
Interconnect - Intel QPI) s tr thành tuyc quyi
gia BXL và các thit b khác trong h thng. Intel QPI s gm hai tuyn truyn
nhn d liu hoàn toàn riêng bit vng rt cao. Tuy nhiên,
vic m rng tuy ng chân (pin) giao tip
c s dng socket LGA775 vi 775 chân không còn phù hp.
Vì vy, trên các bo mch ch h tr các BXL nc trang b
socket FCLGA1567.

B vi x lí Intel Xeon X6550 - AT80604001797AB:
 Microarchitecture: Nehalem
 Platform: Boxboro-EX
 Core Stepping D0 (SLBRB)

 CPUID 206E6 (SLBRB)
 Công ngh vi x lí 45nm
  liu 64 bit
 S nhân 8
 Cache mc 1
o 8 x 32 KB instruction caches
o 8 x 32 KB data caches
 Cache mc 2 8 x 256 KB
 Cache mc 3 18MB
  lí n 2 vi x lí
 
o MMX intruction set
o SSE
o SSE2
o SSE3
o Suppelemental SSE3
o SSE4.1
o SSE4.2
o EM64T technology
o Virtualization technology (VT-x and VT-d)
o Execute Disable bit (giúp chng li mt s c).
o RAS with machine check Architechture recovery (phát hin và báo li
phn cng )
o Hyper-Threading technology ( siêu phân lung)
o Turbo Boost Technology
 t kin Enhanced SpeedStep technology
 u khin thit b ngoi vi
o 2 b u khin b nh DDR3 SDRAM tích hp v rng
giao tip b nh trên mi b u khin
o Quick Path Interconnect (4 tuyn)

o Giao tip PCI Express 2.0
III.KIẾN TRÚC TẬP LỆNH
Tp lnh ca Intel Xeon 6000
-
-
-
-

-

sau:

- MOVE Copy d liu t ngu
- LOAD Np d liu t b nh n BXL
- STORE Ct d liu t b x n b nh
- CLEAR Chuyn các bit 0 và toán h
- SET Chuyn các bit 1 vào toán hh
- INPUT Copy d liu t mt c
- OUTPUT Copy d liu t ngun mt cnh

- ADD Cng hai toán hng
- SUBTRACT Tr hai toán hng
- MULTIPLY Nhân hai toán hng
- DIVIDE Chia hai toán hng
- ABSOLUTE Ly tr tuyi toán hng

- JUMP (BRANCH) Lnh nhu kin: np vào PC ma ch xác
nh
- JUMP CONDITIONAL Lnh nhu kiu kip vào PC
ma ch u kin sai không làm gì c

- CALL Lnh g
- RETURN Lnh tr v t 

- AND Thc hin phép AND hai toán hng
- OR Thc hin phép OR hai toán hng
- XOR Thc hin phép XOR hai toán hng
- NOT o bit ca toán hng (ly bù 1)

- HALT Dng thc hi
- WAIT Tm dng thc hip kiu kin
khi tho mãn thì tip tc thc hin
- NO OPERATION Không thc hin gì c
- LOCK Cm không cho xin chuyng bus
- UNLOCK Cho phép xin chuyng bus


- CMP So sánh 2 byte hay 2 t
- TEST Phép và 2 toán h to c
Xeon bu s nghip ca nó khi còn là lp con ca Pentium II. Ngày nay, Intel
p Xeon vào lp Pentium Ic thit k dành
cho server và các trm làm vic trung và cao cp.
Các tp ln ca VXL này là MMX, SSE(1,2,3,3S,4.1,4.2), EM64T, VT-x
p lc tích hp trong b vi x lý. Mi tp lnh s chu trách
nhim x lý nhng yu t chuyên bit. CPU nào h tr càng nhiu tp lnh thì tc
 x lý lnh càng nhanh ( tc là t x lý càng nhanh ).

SIMD (Single Instruction, Multiple Data). SIMD mô t bt k phn m rng b vi
x lý cho phép nó hong trên d liu song song. Mt s phn m rng SIMD
ph bin vmx). Có rt nhi
 bin nhc tìm thy trong máy tính thông



c gi là 3DNow Professional hoc 3DNow!
c gi là Katmai New instructions ho
c gi Willamette New instructions hoc ch c
gi là Prescott New instructions hoc ch n là PNI), và tp lnh SSE4 (còn
c gi là Tejas New instructions hon là TNI).
MMX (Multimedia Extensions)
 nn 8086, tp lnh bao gm 57 lnh multimedia do Intel phát
tri MMX bao gm 8 thanh ghi t n MM7, tích hp
4 kiu d liu kiu bye kiu word, kiu doubleword và quadword, và các tp lnh
MMX.

-


Ma MMX là nâng cao hiu qu x lý các lnh lp v âm thanh,
hình  hu này phn nào do mt dòng l
x ng thi mt s mc d liu.
c thit k sn trong các dòng CPU Intel . Tp lnh MMX cho phép các
tác v c thc hing thi trên nhi d liu khác nhau. i th
cnh ca Intel (  n các b x 
thích MMX ca h (MMX-compliant chips) vi các b lnh riêng chuyên x lý các
tác v tính tóan hình hc và du chng cn thit khi di chuyn các hình nh 3D
( 3 Dimension - 3 chiu ) trên màn hình .







MMX h tr kh hc mc gi là ch  bão hòa s hc. Có
t qu ct trong mt phm vi gii hn gia giá tr ti
 ti thiu. Ví d vi mt phép tính khi kt qu tr v t quá giá tr
kiu nó s c mnh v 127 vi giá tr l7 hoc
-128 vi kt qu nh  tính toán nó có v c phù hp cho
lm tuy vy nó li có ng dng quan trng x lí lân cn ví d x lí nh tính toán
báo hòa làm mt vt gi nguyên màu sc trng hoo
c.
SSE (Streaming SIMD Extension)

Không gi , m không gian gi
 sung thêm mt không gian riêng bi
b vi x lý. Bu này, SSE ch có th c s dng trên h u hành h tr
nó. May mn thay, hu ht các h u hành g
t c các phiên bn ca Windows k t Windows98 h tr t
nhân Linux t
Mt nhóm gm 70 lc thit k thêm trên B x lý Pentium III nh
ng chng thc thi các tác v  ha 3 chiu (3D graphics).
Nó h tr kh c hin tính toán du chng và hình hc - 
cn thi hin th và di chuyn hình nh 3 chip hp
các lng th 2 ca Intel nhm ci tin kh  ha ca các b vi x
lý (tp hc gi là KNI ( Katmai New
Instruction) do tên 
--



-


SSE 2
Là tp lnh h tr  ha m rc thit k cho Pentium 4. Vi kin trúc
 rng kh  lý theo kiu cu
trúc SIMD mà các công ngh ng cách thêm vào 144 lnh
mi. Các lnh này bao gm các tác v s Nguyên SIMD 128-bit (128-bit SIMD
integer arithmetic operations) và các tác v du chng v chính xác gp
-bit (128-bit SIMD double-precision floating-point operations). Các
lnh mi này làm t c hên các ng d
lý âm thanh - hình nh, mã hóa, tài chính, thit k và nghiên cu khoa hc, kt ni
mng trc tuyn.

Là mô hình vi kin trúc (micro architecture) ca Intel. Nó cung cp mt s
 mi rt cao c siêu ng (hyper-pipelined
technology), kênh truyn h thng 400Mhz và 533 Mhz (400Mhz - 533Mhz system
bus), B nh ni cho phép truy cp lnh th
ch thc thi lnh nhanh chóng (Rapid Execution Engine). Mt s công ngh và tính
 B nh ni truy cp nhanh cao cp (Advanced Transfer
 x lý du chng và truyc ci tin
(enhanced floating point and multimedia unit) và B lnh h tr  ha và truyn
n cp 2 (Streaming SIMD SSE 2).
Kh p mt s công ngh mng trên
a vào các tin b mi nht cc thit k mch, x lý vic
tiêu th ng và các công c tính toán không th thc hic  các mô
hình vi kin trúc  các th h c.
->SSE2 m rng tp l hong trên thanh ghi XMM, cho phép
i s dng hoàn toàn tránh khi vic các thanh ghi MMX 64-bit b chng trong
các thanh ghi stack du chng chính thc IA-u này cho phép trn phn
nguyên SIMD vm nng mà không có ch  chuyi gia
u này là over-shadowed giá tr ca vic có th thc
hin các hong MMX trên các thanh ghi SSE l

Nhng s b sung khác trong SSE2 bao gm mt b các lu khin b nh
cache nhm m y gim thiu cache pollution khi x lý dòng thông
tin vô hnh, và mt s b sung phc tp ca các lnh chuynh dng s.
SSE 3

-


Opcode list


SSE 4
Các b x lý Intel th h mi h tr tp lnh SSE4.1 bao gm 47 tp lnh mi. Tuy
nhiên, dù s hu mng khá ln các tp lnh mi, hu ht trong s này không
kt hp thành mt ti b sung cho các tp lnh SIMD
có sn. Các tp lnh mng s gúp ci thin hiu sut hong ca các
b x lý mi khi làm vic vi các d  ha 3D, truy
trong các ng dng tính toán khoa hc phc tp.


Tuy vy, chúng ta s sm cm nhc tác dng tích cc ca vic h tr các tp
lnh SSE4 mi khi nó tr nên ph bin rng rãi trong phn mm máy tính. Cho ti
gi, ch có hai ng dng s dn tp l gii mã video: DivX
6.7 và TMPEG Xpress 4.4.
a các tp lnh SSE4 bao gm các tính toán nhân s nguyên
32-bit vector hóa; các tính toán ci/cc tiu 8-bit không du; cùng các phiên
bn 16-bit và 32-bit có du và không di thin kh a
trình biên dch trong vic vector hóa s nguyên và mã dng single-precision hiu
qu c mã hóa phim; tính toán tích vô
m trôi và các tp lnh truyn ti s dc thù ca kin trúc b nh

m trong b x lý.




EM64T ( Extended Memory 64 Technology )
 ng công ngh  cnh tranh vi công ngh 64 bit ca
AMD . Công ngh này gc
s dtrêb Celeron

B vi x lí s dng công ngh EM64T có mt kiu hong mi gi là IA32E mà
i có hai kiu :
Ki u hành 64bit chy nhng
phn mm 32 bit và 16 bit . H u hành 64 bit có th ch
trình ng dng 32 bit , 16 bit cùng mi v
truy cy 16 bit s ch truy cc 1MB
RAM.
Kiu 64 bit ( 64-bit mode ) : cho phép h thng ho
ngh này có th a ch .
Công ngh EM64T có th s dng h 
dùng h  chy kiu IA32 thông
ng và truy ca ch - 4GB RAM .
Nhm ca kiu 64-bit
64-a ch ng dng có th s dng 16EB ( Exabytes ) b nh (2^64)
 vi x lí Celeron D , Pentium 4 và Xeon h tr EM64T ch có 36
a ch à ch có th s dc 65GB RAM ( 2^36) . Xeon DP h
tr EM64T ch a ch tc là có th truy cp b nh 1TB ( 2^40) . Gii
hn này s  phát hành
b vi x lí có th truy cp b nh ti 16EB .
Thêm 8 thanh ghi : trong kiu 64 bit , CPU có tt c 16 thanh ghi 64 bit . Nhng

thanh ghi mi này có tên là R8 tc hii
n có th xem thanh ghi 64 bit
Thêm 8 thanh ghi s dng cho tp lnh SIMD ( MMX, SSE, SSE2, SSE3 ) . Trong
kiu EM64T b vi x lí có tt c 
dài 128 bit , s ca thành ghi XMM t 8 lên 16 thanh ghi . Nhng thanh ghi XMM
c s dng trong nhng phép tính du phng SSE.
Tt c  rng 64 bit . Thanh ghi trong
 rng 80 bit .
Tt c c chia thành nhng thanh ghi nh 
 -
S dng k thut Fast interrupt-priorization .
Có Instruction Pointer mi liên quan ti EM64T ga ch RIP-relative .
VT-x


-

Intel® VT cho phép mt h th có th hong nu h
thi vi các doanh nghip, Intel® VT cung cp kh i
tin công tác qun lý, hn ch thi gian chng
bng cách chia tách các hong riêng bit thành nhng khu vc
lp.
Kt Lun
ng ti h u hành 64 bit , lúc này nu mun bn mua Celeron D
64bit , hoc Pentium 4 64 bit . Nu bn có Celeron D 64 bit hoc Pentium 4 64 bit ,
n mm 32 bit s chy t chy
kiu n s thy b vi x 
Nu bn s d có nhi
4GB RAM sn có thì v ca bc gii quyt . Mu bn nên nh
ra ch ngoài ca b vi x lí EM64T không pha

Intel s dng công ngh này không th truy cn
Tng s ng b nh RAM mà CPU có th truy cc là ph thuc
vào CPU . Celeron D 64 bit , Pentium 4 64 bit và Xeon có th truy cc b nh
c b nh ng 1TB . Mt
u bn cn nh là kiu 32 bit hoc kiu 64bit b vi x lí ch có th truy cc
nhiu nht là 4GB thm trí c trong CPU 64bit.

IV.CÁC ĐẶC ĐIỂM CÔNG NGHỆ MỚI
B vi x lý mi c ch to vi công ngh 45nm, b nh m 18MB L2,
và có kh  h tr tn s khác nhau, t 1,8 GHz n ln GHz. . Vi tính
 Hyper-Threading ni bt có kh  ng và mt s ác
 :
-x)




1. HyperThreading

Internet 
 
   -
Intel 
 ph 

 logic ) 

   
 
 -

Threading ( - ).



 

 . Công n
 
 
 , cô
 
 



-

  

 ) 
 
,Compaq, Dell, SuperMicro,



   

 .




GHz).





 -Threading (Smt)



ISMT

-




tro
























 




 


 
      









l






1+1
10+1
Store Previous Result





-


×