Tải bản đầy đủ (.doc) (52 trang)

Báo cáo thực tập: nghiên cứu tìm hiểu về CPU

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (832.41 KB, 52 trang )

Lời nói đầu
Ngày nay khoa học kỹ thuật trên thế giới nói chung, ở Việt Nam nói riêng
đang trên đà phát triển mạnh mẽ và không ngừng nâng cao phát triển về mọi
mặt. Đặc biệt là ngành công nghệ thông tin.
Để đáp ứng nhu cầu ngày càng cao của con người thì hàng loạt các công ty về
máy tính được ra đời và các ứng dụng công nghệ thông tin đang được áp dụng
ngày một nhiều hơn.Với công nghệ máy tính hiện đại như ngày nay thì con
người dần dần được giải phóng bởi những công việc nặng nhọc và thay vào đó
là những ứng dụng của công nghệ thông tin ngày một hiện đại và kỹ xảo như
các robot, máy tự động, các phần mềm quản lý và rất nhiều các ứng dụng đang
được áp dụng ngoài thực tiễn.
Trong đó, phải kể tới bộ não của máy tính đơn vị xử lí trung tâm CPU là bộ
phận tính toán chính của máy tính. Nhận thấy tầm quan trọng của nó, em chọn
đề tài thực tập “nghiên cứu tìm hiểu về CPU”

1


I.

Lịch sử ra đời và phát triển CPU

CPU là từ viết tắt của cụm Central Processing Unit (Đơn Vị Xử Lý Trung Tâm),
là một bộ phận tính toán chính của máy tính. Nó được cấu thành bởi đơn vị số họclôgic (ALU) và đơn vị điều khiển. Ngày nay, CPU trong hầu hết các máy tính được
chứa trọn vẹn trên một chip đơn.
Cpu là một linh kiện rất phổ biến, là "bộ não" của những máy tính ngày nay.
Nhưng ít ai biết rằng con CPU đầu tiên của thế giới đã ra đời từ cách đây hơn 40
năm.
1. BXL 4bit
4004 là BXL đầu tiên được Intel giới thiệu vào tháng 11 năm 1971, sử dụng trong
máy tính (calculator) của Busicom. 4004 có tốc độ 740KHz, khả năng xử lý 0,06


triệu lệnh mỗi giây (milion instructions per second - MIPS); được sản xuất trên
công nghệ 10 µm, có 2.300 transistor (bóng bán dẫn), bộ nhớ mở rộng đến 640
byte.
4040 phiên bản cải tiến của 4004 được giới thiệu vào năm 1974, có 3.000 transistor,
tốc độ từ 500 KHz đến 740KHz.
2. BXL 8bit
8008 (năm 1972) được sử dụng trong thiết bị đầu cuối Datapoint 2200 của
Computer Terminal Corporation (CTC). 8008 có tốc độ 200kHz, sản xuất trên công
nghệ 10 µm, với 3.500 transistor, bộ nhớ mở rộng đến 16KB.
8080 (năm 1974) sử dụng trong máy tính Altair 8800, có tốc độ gấp 10 lần 8008
(2MHz), sản xuất trên công nghệ 6 µm, khả năng xử lý 0,64 MIPS với 6.000
transistor, có 8 bit bus dữ liệu và 16 bit bus địa chỉ, bộ nhớ mở rộng tới 64KB.
8085 (năm 1976) sử dụng trong Toledo scale và những thiết bị điều khiển ngoại vi.
8085 có tốc độ 2MHz, sản xuất trên công nghệ 3 µm, với 6.500 transistor, có 8 bit
bus dữ liệu và 16 bit bus địa chỉ, bộ nhớ mở rộng 64KB
3. BXL 16bit
8086 xuất hiện tháng 6 năm 1978, sử dụng trong những thiết bị tính toán di động.
8086 được sản xuất trên công nghệ 3 µm, với 29.000 transistor, có 16 bit bus dữ
liệu và 20 bit bus địa chỉ, bộ nhớ mở rộng 1MB. Các phiên bản của 8086 gồm 5, 8
và 10 MHz.
8088 trình làng vào tháng 6 năm 1979, là BXL được IBM chọn đưa vào chiếc máy
tính (PC) đầu tiên của mình; điều này cũng giúp Intel trở thành nhà sản xuất BXL
máy tính lớn nhất trên thế giới. 8088 giống hệt 8086 nhưng có khả năng quản lý địa
chỉ dòng lệnh. 8088 cũng sử dụng công nghệ 3 µm, 29.000 transistor, kiến trúc 16
2


bit bên trong và 8 bit bus dữ liệu ngoài, 20 bit bus địa chỉ, bộ nhớ mở rộng tới 1MB.
Các phiên bản của 8088 gồm 5 MHz và 8 MHz.
80186 (năm 1982) còn gọi là iAPX 186. Sử dụng chủ yếu trong những ứng dụng

nhúng, bộ điều khiển thiết bị đầu cuối. Các phiên bản của 80186 gồm 10 và 12
MHz.
80286 (năm 1982) được biết đến với tên gọi 286, là BXL đầu tiên của Intel có thể
chạy được tất cả ứng dụng viết cho các BXL trước đó, được dùng trong PC của
IBM và các PC tương thích. 286 có 2 chế độ hoạt động: chế độ thực (real mode) với
chương trình DOS theo chế độ mô phỏng 8086 và không thể sử dụng quá 1 MB
RAM; chế độ bảo vệ (protect mode) gia tăng tính năng của bộ vi xử lý, có thể truy
xuất đến 16 MB bộ nhớ.
286 sử dụng công nghệ 1,5 µm, 134.000 transistor, bộ nhớ mở rộng tới 16 MB. Các
phiên bản của 286 gồm 6, 8, 10, 12,5, 16, 20 và 25MHz.
4. BXL 32bit vi kiến trúc NetBurst (NetBurst MICRO-ARCHITECTURE)
Intel386 gồm các họ 386DX, 386SX và 386SL. Intel386DX là BXL 32 bit đầu tiên
Intel giới thiệu vào năm 1985, được dùng trong các PC của IBM và PC tương thích.
Intel386 là một bước nhảy vọt so với các BXL trước đó. Đây là BXL 32 bit có khả
năng xử lý đa nhiệm, nó có thể chạy nhiều chương trình khác nhau cùng một thời
điểm. 386 sử dụng các thanh ghi 32 bit, có thể truyền 32 bit dữ liệu cùng lúc trên
bus dữ liệu và dùng 32 bit để xác định địa chỉ. Cũng như BXL 80286, 80386 hoạt
động ở 2 chế độ: real mode và protect mode.
386DX sử dụng công nghệ 1,5 µm, 275.000 transistor, bộ nhớ mở rộng tới 4GB.
Các phiên bản của 386DX gồm 16, 20, 25 và 33 MHz (công nghệ 1 µm). 386SX
(năm1988) sử dụng công nghệ 1,5 µm, 275.000 transistor, kiến trúc 32 bit bên
trong, 16 bit bus dữ liệu ngoài, 24 bit bus địa chỉ, bộ nhớ mở rộng 16MB; gồm các
phiên bản 16, 20, 25 và 33 MHz.
386SL (năm1990) được thiết kế cho thiết bị di động, sử dụng công nghệ 1 µm,
855.000 transistor, bộ nhớ mở rộng 4GB; gồm các phiên bản 16, 20, 25 MHz.
486DX ra đời năm 1989 với cấu trúc bus dữ liệu 32 bit. 486DX có bộ nhớ sơ cấp
(L1 cache) 8 KB để giảm thời gian chờ dữ liệu từ bộ nhớ đưa đến, bộ đồng xử lý
toán học được tích hợp bên trong. Ngoài ra, 486DX được thiết kế hàng lệnh
(pipeline), có thể xử lý một chỉ lệnh trong một xung nhịp.
486DX sử dụng công nghệ 1 µm, 1,2 triệu transistor, bộ nhớ mở rộng 4GB; gồm

các phiên bản 25 MHz, 35 MHz và 50 MHz (0,8 µm). 486SX (năm 1991) dùng
trong dòng máy tính cấp thấp, có thiết kế giống hệ 486DX nhưng không tích hợp bộ
đồng xử lý toán học. 486DX sử dụng công nghệ 1 µm (1,2 triệu transistor) và 0,8
µm (0,9triệu transistor), bộ nhớ mở rộng 4GB; gồm các phiên bản 16, 20, 25, 33

3


MHz.
486SL (năm 1992) là BXL đầu tiên dành cho máy tính xách tay (MTXT), sử dụng
công nghệ 0,8 µm, 1,4 triệu transistor, bộ nhớ mở rộng 4GB; gồm các phiên bản 20,
25 và 33 MHz. Intel Pentium, BXL thế hệ kế tiếp 486 ra đời năm 1993. Cải tiến lớn
nhất của Pentium là thiết kế hai hàng lệnh (pipeline), dữ liệu bên trong có khả năng
thực hiện hai chỉ lệnh trong một chu kỳ, do đó Pentium có thể xử lý chỉ lệnh nhiều
gấp đôi so với 80486 DX trong cùng thời gian. Bộ nhớ sơ cấp 16KB gồm 8 KB
chứa dữ liệu và 8 KB khác để chứa lệnh. Bộ đồng xử lý toán học được cải tiến giúp
tăng khả năng tính toán đối với các trình ứng dụng.
Pentium sử dụng công nghệ 0,8 µm chứa 3,1 triệu transistor, có các tốc độ 60, 66
MHz (socket 4 273 chân, PGA). Các phiên bản 75, 90, 100, 120 MHz sử dụng công
nghệ 0,6 µm chứa 3,3 triệu transistor (socket 7, PGA). Phiên bản 133, 150, 166, 200
sử dụng công nghệ 0,35 µm chứa 3,3 triệu transistor (socket 7, PGA)
Pentium MMX (năm 1996), phiên bản cải tiến của Pentium với công nghệ MMX
được Intel phát triển để đáp ứng nhu cầu về ứng dụng đa phương tiện và truyền
thông. MMX kết hợp với SIMD (Single Instruction Multiple Data) cho phép xử lý
nhiều dữ liệu trong cùng chỉ lệnh, làm tăng khả năng xử lý trong các tác vụ đồ họa,
đa phương tiện.
Pentium MMX sử dụng công nghệ 0,35 µm chứa 4,5 triệu transistor, có các tốc độ
166, 200, 233 MHz (Socket 7, PGA).
Pentium Pro. Nối tiếp sự thành công của dòng Pentium, Pentium Pro được Intel
giới thiệu vào tháng 9 năm 1995, sử dụng công nghệ 0,6 và 0,35 µm chứa 5,5 triệu

transistor, socket 8 387 chân, Dual SPGA, hỗ trợ bộ nhớ RAM tối đa 4GB. Điểm
nổi bật của Pentium Pro là bus hệ thống 60 hoặc 66MHz, bộ nhớ đệm L2 (cache
L2) 256KB hoặc 512KB (trong một số phiên bản). Pentium Pro có các tốc độ 150,
166, 180, 200 MHz. Pentium II (năm 1997), phiên bản cải tiến từ Pentium Pro được
sử dụng trong những dòng máy tính cao cấp, máy trạm (workstation) hoặc máy chủ
(server). Pentium II có bộ nhớ đệm L1 32KB, L2 512KB, tích hợp công nghệ MMX
được cải tiến giúp việc xử lý dữ liệu video, audio và đồ họa hiệu quả hơn. Pentium
II có đế cắm dạng khe - Single-Edge contact (SEC) 242 chân, còn gọi là Slot 1.
5. BXL Pentium II
BXL Pentium II đầu tiên, tên mã Klamath, sản xuất trên công nghệ 0,35 µm, có 7,5
triệu transistor, bus hệ thống 66 MHz, gồm các phiên bản 233, 266, 300MHz.
Pentium II, tên mã Deschutes, sử dụng công nghệ 0,25 µm, 7,5 triệu transistor, gồm
các phiên bản 333MHz (bus hệ thống 66MHz), 350, 400, 450 MHz (bus hệ thống
100MHz). Celeron (năm 1998) được “rút gọn” từ kiến trúc BXL Pentium II, dành
cho dòng máy cấp thấp. Phiên bản đầu tiên, tên mã Covington không có bộ nhớ
đệm L2 nên tốc độ xử lý khá chậm, không gây được ấn tượng với người dùng.

4


Phiên bản sau, tên mã Mendocino, đã khắc phục khuyết điểm này với bộ nhớ đệm
L2 128KB.
Covington sử dụng công nghệ 0,25 µm, 7,5 triệu transistor, bộ nhớ đệm L1 32KB,
bus hệ thống 66MHz, đế cắm 242 chân Slot 1 SEPP (Single Edge Processor
Package), tốc độ 266, 300 MHz.
Mendocino cũng sử dụng công nghệ 0,25 µm có đến 19 triệu transistor, bộ nhớ đệm
L1 32KB, L2 128KB, bus hệ thống 66 MHz, đế cắm Slot 1 SEPP hoặc socket 370
PPGA, tốc độ 300, 333, 366, 400, 433, 466, 500, 533 MHz.
6. BXL Pentium III
Pentium III (năm 1999) bổ sung 70 lệnh mới (Streaming SIMD Extensions - SSE)

giúp tăng hiệu suất hoạt động của BXL trong các tác vụ xử lý hình ảnh, audio, video
và nhận dạng giọng nói. Pentium III gồm các tên mã Katmai, Coppermine và
Tualatin.
Katmai sử dụng công nghệ 0,25 µm, 9,5 triệu transistor, bộ nhớ đệm L1 32KB, L2
512KB, đế cắm Slot 1 SECC2 (Single Edge Contact cartridge 2), tốc độ 450, 500,
550, 533 và 600 MHz (bus 100 MHz), 533, 600 MHz (bus 133 MHz).
Coppermine sử dụng công nghệ 0,18 µm, 28,1 triệu transistor, bộ nhớ đệm L2 256
KB được tích hợp bên trong nhằm tăng tốc độ xử lý. Đế cắm Slot 1 SECC2 hoặc
socket 370 FC-PGA (Flip-chip pin grid array), có các tốc độ như 500, 550, 600,
650, 700, 750, 800, 850 MHz (bus 100MHz), 533, 600, 667, 733, 800, 866, 933,
1000, 1100 và 1133 MHz (bus 133MHz).
Tualatin áp dụng công nghệ 0,13 µm có 28,1 triệu transistor, bộ nhớ đệm L1
32KB, L2 256 KB hoặc 512 KB tích hợp bên trong BXL, socket 370 FC-PGA
(Flip-chip pin grid array), bus hệ thống 133 MHz. Có các tốc độ như 1133, 1200,
1266, 1333, 1400 MHz.
Celeron Coppermine (năm 2000) được “rút gọn” từ kiến trúc BXL Pentium III
Coppermine, còn gọi là Celeron II, được bổ sung 70 lệnh SSE. Sử dụng công nghệ
0,18 µm có 28,1 triệu transistor, bộ nhớ đệm L1 32KB, L2 256 KB tích hợp bên
trong BXL, socket 370 FC-PGA, Có các tốc độ như 533, 566, 600, 633, 667, 700,
733, 766, 800 MHz (bus 66 MHz), 850, 900, 950, 1000, 1100, 1200, 1300 MHz
(bus 100 MHz).
Tualatin Celeron (Celeron S) (năm 2000) được “rút gọn” từ kiến trúc BXL
Pentium III Tualatin, áp dụng công nghệ 0,13 µm, bộ nhớ đệm L1 32KB, L2 256
KB tích hợp, socket 370 FC-PGA, bus hệ thống 100 MHz, gồm các tốc độ 1,0, 1,1,
1,2, 1,3 và 1,4 GHz.
7. BXL Pentium IV
Intel Pentium 4 (P4) là BXL thế hệ thứ 7 dòng x86 phổ thông, được giới thiệu vào
tháng 11 năm 2000. P4 sử dụng vi kiến trúc NetBurst có thiết kế hoàn toàn mới so
5



với các BXL cũ (PII, PIII và Celeron sử dụng vi kiến trúc P6). Một số công nghệ
nổi bật được áp dụng trong vi kiến trúc NetBurst như Hyper Pipelined Technology
mở rộng số hàng lệnh xử lý, Execution Trace Cache tránh tình trạng lệnh bị chậm
trễ khi chuyển từ bộ nhớ đến CPU, Rapid Execution Engine tăng tốc bộ đồng xử lý
toán học, bus hệ thống (system bus) 400 MHz và 533 MHz; các công nghệ
Advanced Transfer Cache, Advanced Dynamic Execution, Enhanced Floating point
và Multimedia Unit, Streaming SIMD Extensions 2 (SSE2) cũng được cải tiến
nhằm tạo ra những BXL tốc độ cao hơn, khả năng tính toán mạnh hơn, xử lý đa
phương tiện tốt hơn. Tham khảo thêm thông tin trong bài viết "Pentium 4 trên
đường định hình" (TGVT A, số 1/2001, Tr.54)
Pentium 4 đầu tiên (tên mã Willamette) xuất hiện cuối năm 2000 đặt dấu chấm hết
cho "triều đại" Pentium III. Willamette sản xuất trên công nghệ 0,18 µm, có 42 triệu
transistor (nhiều hơn gần 50% so với Pentium III), bus hệ thống (system bus) 400
MHz, bộ nhớ đệm tích hợp L2 256 KB, socket 423 và 478. P4 Willamette có một số
tốc độ như 1,3, 1,4, 1,5, 1,6, 1,7, 1,8, 1,9, 2,0 GHz.
8. BXL Celeron
BXL Celeron được thiết kế với mục tiêu dung hòa giữa công nghệ và giá cả, đáp
ứng các yêu cầu phổ thông như truy cập Internet, Email, chat, xử lý các ứng dụng
văn phòng. Điểm khác biệt giữa Celeron và Petium là về công nghệ chế tạo và số
lượng Transistor trên một đơn vị.
Celeron Willamette 128 (2002), bản "rút gọn" từ P4 Willamette, sản xuất trên công
nghệ 0,18 µm, bộ nhớ đệm L2 128 KB, bus hệ thống 400 MHz, socket 478. Celeron
Willamette 128 hỗ trợ tập lệnh MMX, SSE, SSE2. Một số BXL thuộc dòng này như
Celeron 1.7 (1,7 GHz) và Celeron 1.8 (1,8 GHz).
Celeron NorthWood 128, "rút gọn" từ P4 Northwood, công nghệ 0,13 µm, bộ nhớ
đệm tích hợp L2 128 KB, bus hệ thống 400 MHz, socket 478. Celeron NorthWood
128 cũng hỗ trợ các tập lệnh MMX, SSE, SSE2, gồm Celeron 1.8A, 2.0, 2.1, 2.2,
2.3, 2.4, 2.5, 2.6, 2.7, 2.8 tương ứng với các tốc độ từ 1,8 GHz đến 2,8 GHz.
Celeron D (Presscott 256), được xây dựng từ nền tảng P4 Prescott, sản xuất trên

công nghệ 90nm, bộ nhớ đệm tích hợp L2 256 KB (gấp đôi dòng Celeron
NorthWood), bus hệ thống 533 MHz, socket 478 và 775LGA. Ngoài các tập lệnh
MMX, SSE, SSE2, Celeron D hỗ trợ tập lệnh SSE3, một số phiên bản sau có hỗ trợ
tính toán 64 bit. Celeron D gồm 310, 315, 320, 325, 325J, 326, 330, 330J, 331, 335,
335J, 336, 340, 340J, 341, 345, 345J, 346, 350, 351, 355 với các tốc độ tương ứng
từ 2,13 GHz đến 3,33 GHz.[1]
Pentium 4 Extreme Edition
Pentium 4 Extreme Edition (P4EE) xuất hiện vào tháng 9 năm 2003, là BXL được
Intel "ưu ái" dành cho game thủ và người dùng cao cấp. P4EE được xây dựng từ
6


BXL Xeon dành cho máy chủ và trạm làm việc. Ngoài công nghệ HT "đình đám"
thời bấy giờ, điểm nổi bật của P4EE là bổ sung bộ nhớ đệm L3 2 MB. Phiên bản
đầu tiên của P4 EE (nhân Gallatin) sản xuất trên công nghệ 0,13 µm, bộ nhớ đệm
L2 512 KB, L3 2 MB, bus hệ thống 800 MHz, sử dụng socket 478 và 775LGA,
gồm P4 EE 3.2 (3,2 GHz), P4 EE 3.4 (3,4 GHz).
9. BXL 64 BIT, Vi kiến trúc NETBURST
P4 Prescott (năm 2004)
Vi kiến trúc NetBurst 64 bit (Extended Memory 64 Technology - EM64T) đầu tiên
được Intel sử dụng trong BXL P4 Prescott (tên mã Prescott 2M). Prescott 2M cũng
sử dụng công nghệ 90 nm, bộ nhớ đệm L2 2 MB, bus hệ thống 800 MHz, socket
775LGA. Ngoài các tập lệnh MX, SSE, SSE2, SSE3, công nghệ HT và khả năng
tính toán 64 bit, Prescott 2M (trừ BXL 620) có hỗ trợ công nghệ Enhanced
SpeedStep để tối ưu tốc độ làm việc nhằm tiết kiệm điện năng. Các BXL 6x2 có
thêm công nghệ ảo hóa (Virtualization Technology). Prescott 2M có một số tốc độ
như P4 HT 620 (2,8 GHz), 630 (3,0 GHz), 640 (3,2 GHz), 650 (3,4 GHz), 660, 662
(3,6 GHz) và 670, 672 (3,8 GHz).
Prescott Cedar Mill (năm 2006) hỗ trợ các tập lệnh và tính năng tương tự Prescott
2M nhưng không tích hợp Virtualization Technology. Cedar Mill được sản xuất trên

công nghệ 65nm nên tiêu thụ điện năng thấp hơn, tỏa nhiệt ít hơn các dòng trước,
gồm 631 (3,0 GHz), 641 (3,2 GHz), 651 (3,4 GHz) và 661 (3,6 GHz).
Pentium D (năm 2005)
Pentium D (tên mã Smithfield, 8xx) là BXL lõi kép (dual core) đầu tiên của Intel,
được cải tiến từ P4 Prescott nên cũng gặp một số hạn chế như hiện tượng thắt cổ
chai do băng thông BXL ở mức 800 MHz (400 MHz cho mỗi lõi), điện năng tiêu
thụ cao, tỏa nhiều nhiệt. Smithfield được sản xuất trên công nghệ 90nm, có 230
triệu transistor, bộ nhớ đệm L2 2 MB (2x1 MB, không chia sẻ), bus hệ thống 533
MHz (805) hoặc 800 MHz, socket 775LGA. Ngoài các tập lệnh MMX, SSE, SSE2,
SSE3, Smithfield được trang bị tập lệnh mở rộng EMT64 hỗ trợ đánh địa chỉ nhớ
64 bit, công nghệ Enhanced SpeedStep (830, 840). Một số BXL thuộc dòng này như
Pentium D 805 (2,66 GHz), 820 (2,8 GHz), 830 (3,0 GHz), 840 (3,2 GHz).
Cùng sử dụng vi kiến trúc NetBurst, Pentium D (mã Presler, 9xx) được Intel thiết
kế mới trên công nghệ 65nm, 376 triệu transistor, bộ nhớ đệm L2 4 MB (2x2 MB),
hiệu năng cao hơn, nhiều tính năng mới và ít tốn điện năng hơn Smithfield. Pentium
D 915 và 920 tốc độ 2,8 GHz, 925 và 930 (3,0GHz), 935 và 940 (3,2 GHz), 945 và
950 (3,4 GHz), 960 (3,6GHz). Presler dòng 9x0 có hỗ trợ Virtualization
Technology.
Pentium Extreme Edition (năm 2005)

7


BXL lõi kép dành cho game thủ và người dùng cao cấp. Pentium EE sử dụng nhân
Smithfield, Presler của Pentium D trong đó Smithfield sử dụng công nghệ 90nm, bộ
nhớ đệm L2 được mở rộng đến 2 MB (2x1 MB), hỗ trợ tập lệnh MMX, SSE, SSE2,
SSE3, công nghệ HT, Enhanced Intel SpeedStep Technology (EIST) và EM64T.
Pentium 840 EE (3,20 GHz, bus hệ thống 800 MHz, socket 775LGA) là một trong
những BXL thuộc dòng này.
Pentium EE Presler sử dụng công nghệ 65 nm, bộ nhớ đệm L2 được mở rộng đến 4

MB (2x2 MB), hỗ trợ tập lệnh MMX, SSE, SSE2, SSE3, công nghệ HT, Enhanced
Intel SpeedStep Technology (EIST), EM64T và Virtualization Technology. Một số
BXL thuộc dòng này là Pentium EE 955 (3,46GHz) và Pentium EE 965 (3,73GHz)
có bus hệ thống 1066 MHz, socket 775.
10. BXL 64bit, kiến trúc Core
Tại diễn đàn IDF đầu năm 2006, Intel đã giới thiệu kiến trúc Intel Core với năm cải
tiến quan trọng là khả năng mở rộng thực thi động (Wide Dynamic Execution), tính
năng quản lý điện năng thông minh (Intelligent Power Capability), chia sẻ bộ nhớ
đệm linh hoạt (Advanced Smart Cache), truy xuất bộ nhớ thông minh (Smart
Memory Access) và tăng tốc phương tiện số tiên tiến (Advanced Digital Media
Boost). Những cải tiến này sẽ tạo ra những BXL mạnh hơn, khả năng tính toán
nhanh hơn và giảm mức tiêu thụ điện năng, tỏa nhiệt ít hơn so với kiến trúc
NetBurst. Tham khảo chi tiết kiến trúc Core trong bài viết "Intel Core vi kiến trúc
hai nhân chung đệm", ID: A0605_124.
Intel Core 2 Duo
BXL lõi kép sản xuất trên công nghệ 65 nm, hỗ trợ SIMD instructions, công nghệ
Virtualization Technology cho phép chạy cùng lúc nhiều HĐH, tăng cường bảo vệ
hệ thống trước sự tấn công của virus (Execute Disable Bit), tối ưu tốc độ BXL nhằm
tiết kiệm điện năng (Enhanced Intel SpeedStep Technology), quản lý máy tính từ xa
(Intel Active Management Technology). Ngoài ra, còn hỗ trợ các tập lệnh MMX,
SSE, SSE2, SSE3, SSSE3.
Core 2 Duo (tên mã Conroe) có 291 triệu transistor, bộ nhớ đệm L2 4 MB, bus hệ
thống 1066 MHz, socket 775LGA. Một số BXL thuộc dòng này: E6600 (2,4 GHz),
E6700 (2,66 GHz). Core 2 Duo (tên mã Allendale) E6300 (1,86 GHz), E6400 (2,13
GHz) có 167 triệu transistor, bộ nhớ đệm L2 2MB, bus hệ thống 1066 MHz, socket
775LGA. E4300 (1,8 GHz) xuất hiện năm 2007 có bộ nhớ đệm L2 2 MB, bus 800
MHz, không hỗ trợ Virtualization Technology.
Core 2 Extreme
BXL lõi kép dành cho game thủ sử dụng kiến trúc Core, có nhiều đặc điểm giống
với BXL Core 2 như công nghệ sản xuất 65 nm, hỗ trợ các công nghệ mới

Enhanced Intel SpeedStep Technology, Intel x86-64, Execute Disable Bit, Intel
8


Active Management, Virtualization Technology, Intel Trusted Execution
Technology... các tập lệnh MMX, SSE, SSE2, SSE3, SSSE3.
Core 2 Extreme (tên mã Conroe XE) (tháng 7 năm 2006) với đại diện X6800 2,93
Ghz, bộ nhớ đệm L2 đến 4 MB, bus hệ thống 1066 MHz, socket 775LGA. Cuối
năm 2006, con đường phía trước của BXL tiếp tục rộng mở khi Intel giới thiệu BXL
4 nhân (Quad Core) như Core 2 Extreme QX6700, Core 2 Quad Q6300, Q6400,
Q6600 và BXL 8 nhân trong vài năm tới. Chắc chắn những BXL này sẽ thỏa mãn
nhu cầu người dùng đam mê công nghệ và tốc độ
Tiếp cho đến nay là các thế hệ core i3, core i5, corei7 ra đời
Core i3: Ra đời theo từng bộ vi xử lý (BVXL) ứng với chủng loại của máy tính và
theo từng kiến trung khác nhau. Khả năng xử lý thông minh rõ ràng. Core i3 được
ứng dụng trong những máy tính cá nhân sử dụng đồ họa, xử lý công việc thông
dụng và hỗ trợ trên công nghệ windows 64 bit với những chương trình đồ họa:
photoshop CS4, Corel X4, Plash FX … loại này phù hợp cho những người dùng
phổ thông: học sinh, sinh viên, nhân viên văn phòng.
Core i5: Khả năng xử lý thông minh rõ ràng bằng một cú tăng vọt tốc độ. Core
i5 thì được dùng nhiều hơn khi máy tính cần phải xử lý công việc nhiều và hiệu quả
hơn về thiết kế đồ họa và trong việc xây dựng lên hệ thống ảo hóa phục vụ công
việc nghiên cứu và học tập nâng cao dùng cho những người dùng tầm trung: học
sinh, sinh viên học chuyên ngành công nghệ thông tin, nhân viên văn phòng cao cấp
cần xử lý nhiều công việc và đồ họa cao cấp.
Core i7: Khả năng xử lý thông minh rõ ràng cao nhất. Core i7 với kiến trúc 4 nhân
8 luồn dữ liệu nên thường được dùng vào trong các công việc đồ họa dưới giao diện
64 bit cần độ xử lý tốc độ cực nhanh: thiết kế hình vẽ 3D, 4D dựng phim 4D….xây
dựng hệ thống ảo hóa với quy mô lớn phục vụ công việc nghiên cứu công nghệ.
Dùng cho người dùng cao cấp, người dùng chuyên nghiệp: chuyên thiết kế đồ họa,

chế bản âm thanh hình ảnh, sản xuất phim ảnh, sinh viên học chuyên ngành đồ họa
máy tính, chế bản phim hoạt hình…

9


I. Cấu tạo và nguyên lí hoạt động của CPU
ĐẶC TRƯNG CỦA CPU
1. Tốc độ làm việc:
Tốc độ xử lý của CPU được quyết định bởi các yếu tố :
- Độ rộng Bus dữ liệu và Bus địa chỉ ( Data Bus và Add Bus )
- Tốc độ xử lý và tốc độ Bus ( tốc độ dữ liệu ra vào chân ) còn
gọi là FSB
- Dung lượng bộ nhớ đệm Cache
(Ngoài ra ngày nay tốc độ của CPU còn phụ thuộc vào số lượng nhân của CPU thật ra mỗi nhân được xem như 1 CPU)
Độ rộng của bus dữ liệu và bus địa chỉ (data
bus and address bus) :
- Độ rộng Bus dữ liệu là nói tới số lượng đường
truyền dữ liệu
bên trong và bên ngoài CPU
- Như ví dụ hình dưới đây thì CPU có 12 đường
truyền dữ liệu
( ta gọi độ rộng Data Bus là 12 bit )
Minh họa bên trong CPU có 12 đường truyền
dữ liệu gọi là Data Bus có 12 bit
Tương tự như vậy thì độ rộng Bus địa chỉ ( Add Bus ) cũng là số đường dây truyền
các thông tin về địa chỉ .
Địa chỉ ở đây có thể là các địa chỉ của bộ nhớ RAM, địa chỉ các cổng vào ra và các
thiết bị ngoại vi v v .. để có thể gửi hoặc nhận dữ liệu từ các thiết bị này thì CPU
phải có địa chỉ của nó và địa chỉ này được truyền đi qua các Bus địa chỉ.

Giả sử : Nếu số đường địa chỉ là 8 đường thì CPU sẽ quản lý được 28 = 256 địa chỉ
Hiện nay trong các CPU Pentium 4 có 64 bít địa chỉ và như vậy chúng quản lý được
264 địa chỉ nhớ. Ngoài ra còn có nhiều công nghệ làm tăng tốc độ xử lý của CPU.
Ví dụ công nghệ Core hay Nehalem.:
2. Tốc độ xử lý CPU
- Là tốc độ chạy bên trong của CPU, tốc độ này được tính MHz hoặc GHz
- Thí dụ một CPU Pentium 3 có tốc độ 800MHz tức là nó dao động ở tần số
800.000.000 Hz , CPU pentium 4 có tốc độ 2,4GHz tức là nó dao động ở tần số
2.400.000.000 Hz

10


3. Tốc độ Bus của CPU ( FSB ) :

- Là tốc độ dữ liệu ra vào các chân của CPU - còn gọi là Bus phía trước : Front Site
Bus ( FSB )
Thông thường tốc độ xử lý của CPU thường nhanh gấp nhiều lần tốc độ Bus của nó,
dưới đây là thí dụ minh hoạ về hai tốc độ này :

Minh họa về tốc độ xử lý (CPU speed) và
tốc độ Bus (FSB) của CPU
Tốc độ CPU có liên hệ với tần số đồng hồ
làm việc của nó (tính bằng các đơn vị như
MHz, GHz, ...). Đối với các CPU cùng
loại tần số này càng cao thì tốc độ xử lý
càng tăng. Đối với CPU khác loại, thì điều
này chưa chắc đã đúng; ví dụ CPU Core 2
Duo có tần số 2,6GHz có thể xử lý dữ liệu nhanh hơn CPU 3,4GHz một nhân. Tốc
độ CPU còn phụ thuộc vào bộ nhớ đệm của nó, ví như Intel Core 2 Duo sử dụng

chung cache L2 (shared cache) giúp cho tốc độ xử lý của hệ thống 2 nhân mới này
nhanh hơn so với hệ thống 2 nhân thế hệ 1 (Intel Pentium D) với mỗi core từng
cache L2 riêng biệt. (Bộ nhớ đệm dùng để lưu các lệnh hay dùng, giúp cho việc
nhập dữ liệu xử lý nhanh hơn). Hiện nay công nghệ sản xuất CPU mới nhất là
32nm.
Hiện nay CPU phổ biến là Duo-Core (2 nhân), Quad-Core (4 nhân). Quý 2 năm
2010 Intel và AMD ra mắt CPU Six-Core (6 nhân).
4. Đơn vị giao tiếp (BUS):
a. Hàng đợi lệnh (Instruction Queue)
Trong khi EU đang giải mã hay thi hành một lệnh không cần sử dụng các hệ thống
BUS, BIU sẽ đưa vào sáu bytes lệnh tiếp theo. BIU chứa các byte này trong một
thanh ghi FIFO (First - In - First - Out) gọi là hàng đợi. Khi EU đã sẵn sàng cho
lệnh tiếp theo, nó sẽ chỉ cần đọc các byte lệnh trong hàng đợi của BIU. Việc này
làm tăng tốc độ của hệ thống, và kỹ thuật này được gọi là pipelining.
b. Các thanh ghi đoạn (Segment Register)

11


Gồm bốn thanh ghi CS, DS, ES, SS, dùng để chứa địa chỉ đoạn. Bộ nhớ trong 1MB
của CPU 8088 được chia thành các đoạn, mỗi đoạn chứa tối đa 64 KB, ở mỗi thời
điểm CPU chỉ có thể truy xuất tối đa 4 đoạn được xác định bởi 4 thanh ghi CS, DS,
ES và SS. Cụ thể:


Thanh ghi CS (Code Segment): dùng để chứa địa chỉ đoạn của đoạn chứa mã
lệnh.




Thanh ghi DS (Data Segment): dùng để chứa địa chỉ đoạn của đoạn chứa dữ
liệu.



Thanh ghi ES (Extra Segment): dùng để chứa địa chỉ đoạn của đoạn chứa dữ
liệu bổ sung.



Thanh ghi đoạn SS (Stack Segment): dùng để chứa địa chỉ đoạn của đoạn
chứa Stack.

c. Con trỏ lệnh IP (Instruction Pointer)
Dùng để xác định địa chỉ offset của ô nhớ chứa mã lệnh của lệnh kế tiếp sẽ được
CPU thi hành (ô nhớ này nằm trong đoạn được xác định bởi thanh ghi CS).
Khi CPU thực hiện một lệnh, thanh ghi IP sẽ tự động thay đổi để chỉ đến địa chỉ
offset của ô nhớ chứa lệnh sẽ được CPU thi hành kế tiếp.
5. BUS địa chỉ (Address BUS):
BUS địa chỉ là dụng cụ để CPU có thể xác định và nhận ra vị trí của các thiết bị
trong hệ thống. Các thiết bị này có thể là các ô nhớ, các cổng giao tiếp. Số lượng
đường dây trên BUS địa chỉ phụ thuộc vào từng loại VXL, có thể là 16, 20 hay
nhiều hơn. Với bộ VXL 8086/8088 thì BUS địa chỉ có 20 đường dây ký hiệu từ A 0
-> A19 , như vậy có 220 vị trí địa chỉ có thể phân biệt được.
6. BUS dữ liệu (Data BUS):
BUS dữ liệu (Data BUS) dùng để chuyển thông tin (gồm cả dữ liệu và lệnh) giữa bộ
VXL với các thiết bị khác trong hệ thống.
Quá trình chuyển thông tin từ bộ VXL đến các thiết bị khác trong hệ thống (có thể
là bộ nhớ hay các thiết bị ngoại vi) được gọi là thao tác ghi (Write Operation),
ngược lại quá trình nhận số liệu vào bộ VXL từ các thiết bị ngoại vi được gọi là

thao tác đọc (Read Operation). Như vậy BUS dữ liệu vừa phải thu và phát thông tin
nên nó là BUS hai chiều (Bidirectional BUS). Tất nhiên không thể thu phát đồng
thời cùng một lúc được.
Bộ VXL Intel 8088 có điểm khác nhau quan trọng với 8086 là nó chỉ có BUS dữ
liệu 8 bít thay vì 16 bít. Ðặc biệt trong họ VXL Intel (80X86), đều sử dụng

12


kỹthuật Multiplex các đường dây của BUS địa chỉ và dữ liệu. Cụ thể đó là quá trình
dùng chung các đường dây (các chân ra) nhưng lúc thì làm việc này, lúc thì làm
việc khác, tức là thực hiện các công việc khác nhau trong các thời gian khác nhau.
Khi đóng vai trò BUS dữ liệu các đường dây sẽ truyền thông tin cho các thiết bị của
hệ thống, ngược lại khi đóng vai trò BUS địa chỉ, cũng chính các đường dây này
được dùng để gửi ra các tín hiệu địa chỉ.
7. BUS điều khiển (Control BUS):
BUS điều khiển (Control BUS) là tập hợp các đường dây điều khiển dùng để điều
khiển các tác vụ của hệ thống. BUS điều khiển có từ 4 đến 10 đường tín hiệu, được
sinh ra từ CPU, các tín hiệu điều khiển điển hình là: MEMR (MEMory Read),
MEMW (MEMory Write), IOR (I/O Read) và IOW (I/O Write).
Ví dụ: khi muốn đọc một byte từ một vùng nhớ, CPU trước hết gửi địa chỉ vùng
nhớ đó ra BUS địa chỉ, sau đó đưa ra tín hiệu Memory Read ra BUS dữ liệu. Tín
hiệu Memory Read sẽ kích hoạt thiết bị nhớ để thiết bị này gửi số liệu ra BUS dữ
liệu. Số liệu này theo BUS dữ liệu về CPU.
Định thời chu kỳ bus
Mỗi chu kỳ bus bắt đầu bằng việc xuất địa chỉ bộ nhớ hoặc I/O port (chu kỳ
xung nhịp T1). Với 8086 thì địa chỉ này có thể là địa chỉ bộ nhớ 20 bit, địa chỉ I/O
gián
tiếp 16 bit (thanh ghi DX) hay địa chỉ I/O trực tiếp 8 bit. Bus điều khiển có 4 tín
hiệu

tác động mức thấp là MEMR, MEMW, IOR và IOW.
Các chuỗi sự kiện xảy ra trong một chu kỳ bus đọc bộ nhớ:
T1: CPU xuất địa chỉ bộ nhớ. Các đường dữ liệu không hoạt động và các đường
điều khiển bị cấm
T2: Đường điều khiển MEMR xuống mức thấp. Đơn vị bộ nhớ ghi nhận chu
kỳ bus này là quá trình đọc bộ nhớ và đặt byte hay word có địa chỉ đó lên bus dữ
liệu.
T3: CPU đặt cấu hình để các đường bus dữ liệu là nhập. Trạng thái này chủ yếu
để bộ nhớ có thời gian tìm kiếm byte hay word dữ liệu
T4: CPU đợi dữ liệu trên bus dữ liệu. Do đó, nó thực hiện chốt bus dữ liệu và
giải phóng các đường điều khiển đọc bộ nhớ. Quá trình này sẽ kết thúc chu kỳ bus.
Trong một chu kỳ bus, CPU có thể thực hiện đọc I/O, ghi I/O, đọc bộ nhớ hay

13


ghi bộ nhớ. Các đường bus địa chỉ và bus điều khiển dùng để xác định địa chỉ bộ
nhớ hay I/O và hướng truyền dữ liệu trên bus dữ liệu.
Chú ý rằng CPU điều khiển tất cả các quá trình trên nên bộ nhớ bắt buộc phải
cung cấp được dữ liệu vào lúc MEMR lên mức cao trong trạng thái T4. Nếu không,
CPU sẽ đọc dữ liệu ngẫu nhiên không mong muốn trên bus dữ liệu. Để giải quyết
vấn đề này, ta có thể dùng thêm các trạng thái chờ (wait state).
8. Kiến trúc nội:
CPU có khả năng thực hiện các tác vụ dữ liệu theo tập lệnh bên trong. Một lệnhđược
ghi nhận bằng mã đã được định nghĩa trước, gọi là mã lệnh (opcode). Trước khithực thi
một lệnh, CPU phải nhận được mã lệnh từ bộ nhớ chương trình của nó. Quátrình xử lý này
gọi là chu kỳ nhận lệnh (fetch cycle). Một khi các mã được nhận vàđược giải mã thì mạch
bên trong CPU có thể tiến hành thực thi (execute) mã lệnh.

BIU (Bus Interface Unit – đơn vị giao tiếp bus) nhận các mã lệnh từ bộ nhớ và

đặt chúng vào hàng chờ lệnh. EU (Execute Unit – đơn vị thực thi) sẽ giải mã và
thựchiện các lệnh trong hàng. Chú ý rằng các đơn vị EU và BIU làm việc độc lập
vớinhaunên BIU có khả năng đang nhận một lệnh mới trong khi EU dang thực thi
lệnh trướcđó. Khi EU đã thực hiện xong lệnh, nó sẽ lấy mã lệnh kế tiếp trong hàng
lệnh(instruction queue).
9. Bộ nhớ đệm Cache
Thời L2 Cache còn phải nằm trên mainboard .Khi nghe giới thiệu về CPU, bạn
ắt biết tới các thuật ngữ L1 Cache, L2 Cache, L3 Cache.
Cache (đọc là kets, hay còn gọi là cạc) là tên gọi của bộ nhớ đệm – nơi lưu trữ các
dữ liệu nằm chờ các ứng dụng hay phần cứng xử lý. Mục đích của nó là để tăng tốc
độ xử lý (có sẵn xài liền không cần tốn thời gian đi lùng sục tìm kéo về).
Nói một cách bài bản, cache là một cơ chế lưu trữ tốc độ cao đặc biệt. Nó có thể là
một vùng lưu trữ của bộ nhớ chính hay một thiết bị lưu trữ tốc độ cao độc lập.
Có hai dạng lưu trữ cache được dùng phổ biến trong máy tính cá nhân là memory
caching (bộ nhớ cache hay bộ nhớ truy xuất nhanh) và disk caching (bộ nhớ đệm
đĩa).
a/ Memory cache:
Đây là một khu vực bộ nhớ được tạo bằng bộ nhớ tĩnh (SRAM) có tốc độ cao
nhưng đắt tiền thay vì bộ nhớ động (DRAM) có tốc độ thấp hơn và rẻ hơn, được
dùng cho bộ nhớ chính. Cơ chế lưu trữ bộ nhớ cahce này rất có hiệu quả. Bởi lẽ,
hầu hết các chương trình thực tế truy xuất lặp đi lặp lại cùng một dữ liệu hay các
lệnh y chang nhau. Nhờ lưu trữ các thông tin này trong SRAM, máy tính sẽ khỏi
14


phải truy xuất vào DRAM vốn chậm chạp hơn.
Một số bộ nhớ cache được tích hợp vào trong kiến trúc của các bộ vi xử lý. Chẳng
hạn, CPU Intel đời 80486 có bộ nhớ cache 8 KB, trong khi lên đời Pentium là 16
KB. Các bộ nhớ cache nội (internal cache) như thế gọi là Level 1 (L1) Cache (bộ
nhớ đệm cấp 1). Các máy tính hiện đại hơn thì có thêm bộ nhớ cache ngoại

(external cache) gọi là Level 2 (L2) Cache (bộ nhớ đệm cấp 2). Các cache này nằm
giữa CPU và bộ nhớ hệ thống DRAM. Sau này, do nhu cầu xử lý nặng hơn và với
tốc độ nhanh hơn, các máy chủ (server), máy trạm (workstation) và mới đây là CPU
Pentium 4 Extreme Edition được tăng cường thêm bộ nhớ đệm L3 Cache.
CPU Slot 1 dạng cartridge với L2 Cache nằm cạnh nhân CPU.
b/ Disk cache:
Bộ nhớ đệm đĩa cũng hoạt động cùng nguyên tắc với bộ nhớ cache, nhưng thay
vì dùng SRAM tốc độ cao, nó lại sử dụng ngay bộ nhớ chính. Các dữ liệu được truy
xuất gần đây nhất từ đĩa cứng sẽ được lưu trữ trong một buffer (phần đệm) của bộ
nhớ. Khi chương trình nào cần truy xuất dữ liệu từ ổ đĩa, nó sẽ kiểm tra trước tiên
trong bộ nhớ đệm đĩa xem dữ liệu mình cần đang có sẵn không. Cơ chế bộ nhớ đệm
đĩa này có công dụng cải thiện một cách đáng ngạc nhiên sức mạnh và tốc độ của hệ
thống. Bởi lẽ, việc truy xuất 1 byte dữ liệu trong bộ nhớ RAM có thể nhanh hơn
hàng ngàn lần nếu truy xuất từ một ổ đĩa cứng.
xin nói thêm, người ta dùng thuật ngữ cache hit để chỉ việc dữ liệu được tìm thấy
trong cache. Và hiệu năng của một cache được tính bằng hit rate (tốc độ tìm thấy dữ
liệu trong cache).
Trở lại chuyện bộ nhớ cache. Hồi thời Pentium đổ về trước, bộ nhớ cache nằm trên
mainboard và một số mainboard có chừa sẵn socket để người dùng có thể gắn thêm
cache khi có nhu cầu. Tới thế hệ Pentium II, Intel phát triển được công nghệ đưa bộ
nhớ cache vào khối CPU. Nhờ nằm chung như vậy, tốc độ truy xuất cache tăng lên
rõ rệt so với khi nó nằm trên mainboard. Nhưng do L2 Cache vẫn phải ở ngoài nhân
CPU nên Intel phải chế ra một bo mạch gắn cả nhân CPU lẫn L2 Cache. Và thế là
CPU có hình dạng to đùng như một cái hộp (gọi là cartridge) và được gắn vào
mainboard qua giao diện slot (khe cắm), Slot 1. Tốc độ truy xuất cache lúc đó chỉ
bằng phân nửa tốc độ CPU. Thí dụ, CPU 266 MHz chỉ có tốc độ L2 Cache là 133
MHz. Sang Pentium III cũng vậy. Mãi cho tới thế hệ Pentium III Coppermine (công
nghệ 0.18-micron), Intel mới thành công trong việc tích hợp ngay L2 Cache vào
nhân chip (gọi là on-die cache). Lúc đó, tốc độ L2 Cache bằng với tốc độ CPU và
con CPU được thu gọn lại, đóng gói với giao diện Socket 370.

15


CPU Socket 370 với L2 Cache nằm ngay trên nhân CPU. Như đã nói, dung lượng
của Cache CPU lợi hại lắm nghen. Phổ biến nhất là L2 Cache là một chip nhớ nằm
giữa L1 Cache ngay trên nhân CPU và bộ nhớ hệ thống. Khi CPU xử lý, L1 Cache
sẽ tiến hành kiểm tra L2 Cache xem có dữ liệu mình cần không trước khi truy cập
vào bộ nhớ hệ thống. Vì thế, bộ nhớ đệm càng lớn, CPU càng xử lý nhanh hơn. Đó
là lý do mà Intel bên cạnh việc tăng xung nhịp cho nhân chíp, còn chú ý tới việc
tăng dung lượng bộ nhớ Cache. Do giá rất đắt, nên dung lượng Cache không thể
tăng ồ ạt được. Bộ nhớ cache chính L1 Cache vẫn chỉ ở mức từ 8 tới 32 KB. Trong
khi, L2 Cache thì được đẩy lên dần tới hiện nay cao nhất là Pentium M Dothan 2
MB (cho máy tính xách tay) và Pentium 4 Prescott 1 MB (máy để bàn). Riêng dòng
CPU dành cho dân chơi game và dân multimedia “pro” là Pentium 4 Extreme
Edition còn được bổ sung L3 Cache với dung lượng 2 MB. Đây cũng là CPU để bàn
có tổng bộ nhớ cache lớn nhất (L1: 8 KB, L2: 512 KB, L3: 2 MB).
10. Tập lệnh(intrucsion set):
Theo nguyên tắc làm việc của máy tính thì để thực hiện chương trình, CPU lần lượt
đọc các lệnh, giải mã lệnh và thực hiện lệnh. Đối với một hệ
máy tính, một lệnh được chia thành các mức độ khác nhau, mức thứ nhất đó là mức
lệnh của người sử dụng. Đây là những câu lệnh dạng gần gũi với ngôn ngự tự nhiên
của con người và máy tính không thể hiểu được.
Để máy tính có thể hiểu được, lệnh của người sử
dụng được HĐH hay trình dịch ngôn ngữ phiên dịnh
thành lệnh ở dạng ngôn ngữ máy và CPU có thể đọc
và hiểu được.
Khi CPU đọc lệnh dạng mã máy, nó thực hiện việc
phiên dịch lệnh này thành các vi lệnh để các thành
phần của CPU có thể hiểu và thực hiện được. Quá
trình này gọi là giải mã lệnh.

Tập các vi lệnh của CPU cũng là một yếu tố đánh giá
khả năng làm việc của CPU, khi trang bị một CPU vào hệ thống người ta thường
quan tâm đến vấn đế kiến trúc của CPU, có hai loại kiến trúc CPU, đó là:
CISC: (Complex Instruction Set Computer) máy tính với tập lệnh đầy đủ. Trong
kiến trúc CISC, máy tính cần sử dụng rất ít thanh ghi.
RISC: (Reduced Instruction Set Computer) máy tính với tập lệnh rút gọn. Trong
kiến trúc RISC, máy tính cần sử dụng nhiều thanh ghi. Đây là kiến trúc được các bộ
vi xử lý Intel ngày nay sử dụng.
Chúng ta có thể lấy một ví dụ để phân biệt giữa SISC và RISC như sau: Cộng 1 vào
một vùng địa chỉ. Trong CISC, lệnh tương ứng phải thực hiện ba chức năng sau:
đọc vùng bộ nhớ, cộng thêm 1, ghi trả lại kết quả. Trong RISC, mỗi chức năng trên
là một lệnh. Điều khác biệt là trong CISC không cần tới nhiều thanh ghi, với lệnh

16


trên CISC có thể đọc giá trị tại vùng nhớ vào ALU, thực hiện tăng lên 1 và trả kết
quả vào vùng nhớ. Còn đối với CPU RISC, nếu giá trị cần đọc đã có sẵn ở thanh ghi
thi không cần phải đọc nó từ bộ nhớ, giá trị sau khi tăng lên 1 có thể chứa ở thanh
ghi mà không cần phải ghi kết quả vào bộ nhớ.
11. CPU đa lõi:
Lý do lớn nhất việc đặt nhiều lõi lên cùng một vi mạch là sẽ giúp giảm không gian
trên bản mạch chính khi có nhu cầu muốn sử dụng với số lượng CPU lõi đơn tương
đương. Thêm nữa, lợi thế của việc sử dụng đa lõi trên cùng một vi mạch đương
nhiên sẽ làm việc kết hợp cùng nhau chặt chẽ và nâng cao được hiệu quả hơn.
Khả năng tiết kiệm năng lượng cũng được phát huy thấy rõ đối với thiết kế này. Khi
nhiều lõi cùng nằm trên một chip, xung tín hiệu truyền giữa các lõi sẽ ngắn hơn.
Ngoài ra, đặc trưng của CPU đa lõi là chạy với điện năng thấp hơn vì công suất tiêu
tốn để tín hiệu truyền trên dây bằng với bình phương điện áp chia cho điện trở trong
dây, do đó điện năng thấp hơn sẽ dẫn đến kết quả là nguồn điện sử dụng đi.

Một lý do khác đối với việc tiết kiệm nguồn điện là tốc độ đồng hồ. CPU đa lõi có
thể thực thi các hoạt động nhiều lần hơn trong một giây trong khi tần số thấp hơn.
Ví dụ bộ xử lý MIT RAW 16 lõi hoạt động ở tần số 425MHz có thể thực thi gấp
100 lần các hoạt động trong một giây đối với Intel Pentium 3 đang chạy ở tần số
600 MHz. Có một quy tắc đơn giản là mỗi một phần trăm tăng thêm tốc độ đồng hồ
sẽ tăng 3% điện năng tiêu thụ. Và tất nhiên là điều đó còn chưa tính tới tác động của
các nhân tố khác có ảnh hưởng tới sự tiêu thụ điện năng.
CPU đa lõi còn có thể chia sẻ một mạch ghép nối bus tốt như mạch lưu trữ. Hình
bên dưới là lược đồ của chip Core 2 dual của Intel – có tính năng là một L2 cache
được chia sẻ. Kết quả là tiết kiệm được lượng không gian đáng kể. Theo Intel, CPU
Core 2 dual có thể lên tới 4MB được chia sẻ L2 Cache.
Sơ đồ Bộ xử lý Core 2 Dual của Intel
Một nhân tố khác giới hạn lợi ích thực thi của CPU đa lõi là phần mềm chạy trên
nó. Đối với người dùng bình thường, hiệu suất lớn nhất mà họ đạt được khi lựa
chọn một CPU đa lõi là tính đa nhiệm được cải thiện. Ví dụ, với một CPU đa lõi ta
sẽ thấy sự cải thiện lớn khi xem DVD trong lúc máy vẫn đang được quét virus mà
tốc độ không bị ảnh hưởng, bởi vì từng ứng dụng sẽ được gán trên các lõi khác
nhau.
Nếu người dùng đang chạy một ứng dụng đơn trên máy tính đa lõi thì sẽ không thấy
rõ được việc tăng hiệu suất đáng kể lắm. Bởi hầu hết các ứng dụng không được xử
lý đa luồng. Chính vì vậy các ứng dụng cũng cần phải thay đổi trong thiết kế. Ví dụ
một chương trình quét virus chạy trên một tuyến mới trong khi GUI lại chạy trên
một tuyến khác. Việc xử lý đa luồng đúng cách là khi khối lượng công việc được
phân chia thành nhiều luồng khác nhau. Việc quét virus là một ví dụ, luồng GUI
làm việc rất ít, trong khi luồng quét virus thực hiện một nhiệm vụ rất nặng và không

17


có khả năng chia nhỏ ra và gửi đến các lõi khác.

Việc phát triển một ứng dụng đa luồng đích thực yêu cầu rất nhiều công việc phức
tạp. Điều này rõ ràng cũng tốn khá nhiều chi phí vào một chu trình thiết kế phần
mềm. Đó là lý do tại sao phần lớn các ứng dụng phần mềm sẽ không được phát triển
như các ứng dụng thực sự đa luồng cho đến khi số lượng lõi đủ cao để thực hiện
nhiều tác vụ mà không làm ảnh hưởng tới hiệu suất. Và điều này sẽ đạt được khi
người dùng có nhu cầu.
12. Các thuộc tính kỹ thuật của CPU
Word Size: kích thước từ nhớ là số bit lớn nhất mà CPU có thể xử lý ở một thời
điểm.
Kích thước đường dữ liệu là số bit dữ liệu có thể vào ra CPU ở một thời điểm từ bus
dữ liệu (data bus).
Kích thước địa chỉ cực đại là không gian địa chỉ vật lý cực đại mà CPU có thể điều
khiển.
Tốc độ xử lý tính bằng megahertz (MHz) hoặc gigahertz (GHz). Con số đứng trước
MHz hay Ghz chỉ cho biết có bao nhiêu dao độ trong một giây. Ví dụ, CPU
600MHz sẽ dao động 600 triệu lần/giây.
Level 1 Execution Trace Cache: là bộ nhớ đệm bổ sung 8 KB, CPU Pentium 4
bao gồm bộ nhớ dò tìm thi hành lệnh mà dung lượng lên đến 12KB để đọc/giải mã
theo thứ tự sự thực hiện của chương trình. Hiệu suất tăng dần này được gở bỏ việc
đọc/giải mã theo mỗi vòng lặp và làm hiệu quả hơn không gian lưu trữ đệm cho đến
khi những tập lệnh không được lưu nữa. Kết quả là nó chuyển một khối lượng lớn
những lệ
.

Level 2 Advanced Transfer Cache (ATC):
Bộ nhớ đệm Level 2 có trong bộ xử lý từ
2,4Ghz trở lên. Level 2 ATC giúp thông
lượng truyền dữ liệu nhiều hơn giữa hai kênh
là bộ đệm Level 2 và bộ xử lý. Bộ đệm Level
2 có một mạch ghép nối 256bit (32 byte) mà

nó truyền dữ liệu trong mỗi xung.
Level 3 cache: chỉ có Pentium 4 Extreme
Edition 3,2GHz trở lên mới có bộ nhớ đệm
Level 3. Đây là bộ nhớ thứ ba được thêm vào
trên CPU. Nó được thiết kế đặc biệt để đáp
ứng những nhu cầu cho những ai đòi hỏi cao
về năng xuất. CPU có bộ nhớ Level 3 cung cấp một đường truyền rộng đến bộ nhớ.
Thiết kế của cache L3 giúp cho những dữ liệu xử lý chứa đựng ở CPU được nhiều
hơn và nhanh hơn.

18


HT Technology (Hyper-Threading
Technology – Công nghệ siêu phân
luồng):
Các CPU có tốc độ truyền dữ liệu với
Mainboard Bus 800MHz trở lên hỗ trợ HT Technology. Công nghệ HT Technology
là một bước đột phá, nó làm thay đổi kỹ
thuật thiết kế bộ xử lý mà tốc độ vượt
qua GHz cải thiện hiệu quả làm việc. Nó
cho phép những chương trình phần mềm
“thấy 2 CPU” và làm việc hiệu quả hơn.
Kỹ thuật này cho phép CPU chạy hai
loạt chuỗi, hoặc luồng của lệnh trong
cùng một thời điểm. Theo cách ấy, hệ
thống đã được cải tiến hiệu quả, nâng
dần hiệu suất xử lý trong môi trường khi
thực hiện cùng lúc nhiều ứng dụng.


19


II/ CẤU TẠO :

1. Các thành phần cơ bản của cpu:
CU (Control Unit): Đơn vị điều khiển : Điểu khiển hoạt
động của hệ thống theo chương trình đã dựng sẵn. Có
chức năng điều khiển toàn bộ tiến trình chuyển giao dữ
liệu từ chổ này sang chổ khác trong khi quá trình tính
toán đang tiếp tục thực hiện
ALU (Arithmetic and Logic Unit): Đơn vị số học và
luận lý. Thực hiện tất cả các tính toán số học và lôgic.
Đơn vị số học và luận lý chỉ thực hiện các phép toán số học đơn giản như phép
cộng, trừ, nhân, chia. Để CPU có thể xử lý dữ liệu với các số thực với độ chính xác
cao và các phép toán phức tạp như sin, cos, tính tích phân…, các CPU thường được
trang bị thêm bộ đồng xử lý toán học (FPU: Floatting Point Unit ) còn được gọi là
bộ xử lý dấu chấm động.
Tập các thanh ghi (Registry)-Dùng để chứa thông tin tạm thời phục vụ cho các hoạt
động hiện tại của CPU
2. Các chức năng cơ bản của cpu:
Thực hiện các lệnh về xử lý dữ liệu & các lệnh nhập xuất dữ liệu, các lệnh đọc, ghi,
xóa dữ liệu trên các thiết bị lưu trữ, các lệnh về quản lý bộ nhớ bao gồm cấp phát và
giải phóng tài nguyên bộ nhớ.
3. Các thành phần chính vật lý:
a. CPU INTEL :
Bộ vi xử lý là trái tim của máy tính hiện đại; đây là một loại chip được tạo thành từ
hàng triệu transistor và những thành phần khác được tổ chức thành những khối chức
năng chuyên biệt, bao gồm đơn vị xử lý số học, khối quản lý bộ nhớ và bộ nhớ đệm,
khối luân chuyển dữ liệu và phép toán luận lý suy đoán.

Transistor gồm ba lớp bán dẫn ghép với nhau hình thành hai mối tiếp giáp P-N , nếu
ghép theo thứ tự PNP ta được Transistor thuận , nếu ghép theo thứ tự NPN ta được
Transistor ngược. về phương diện cấu tạo Transistor tương đương với hai Diode
đấu ngược chiều nhau .

20


Cấu tạo Transistor


Ba lớp bán dẫn
được nối ra thành
ba cực , lớp giữa
gọi là cực gốc ký
hiệu là B
( Base ), lớp bán
dẫn B rất mỏng và
có nồng độ

tạp chất thấp.


Hai lớp bán dẫn bên ngoài được nối ra thành cực phát (Emitter ) viết tắt là E,
và cực thu hay cực góp ( Collector )viết tắt là C, vùng bán dẫn E và C có
cùng loại bán dẫn (loại N hay P )nhưng có kích thước và nồng độ tạp chất
khác nhau nên không hoán vị chonhau được.

Bộ vi xử lý của máy tính hiện nay đã phát triển cực mạnh về khả năng, tốc độ và
tính phức tạp so với thập niên trước đây. Tốc độ cao, kích thước nhỏ, số lượng

transistor khổng lồ. Nếu bộ xử lý năm 1983 chỉ có 30.000 transistor thì hiện nay với
một số bộ xử lý con số này là trên 40 triệu.
Bất kỳ chương trình máy tính nào cũng bao gồm rất nhiều lệnh để thao tác với dữ
liệu. Bộ xử lý sẽ thực hiện chương trình qua bốn giai đoạn xử lý: nạp, giải mã, thực
thi và hoàn tất.
Giai đoạn nạp (lấy lệnh và dữ liệu) đọc các lệnh của chương trình và dữ liệu cần
thiết vào bộ xử lý.
Giai đoạn giải mã xác định mục đích của lệnh và chuyển nó đến phần cứng tương
ứng.
Giai đoạn thực thi là lúc có sự tham gia của phần cứng, với lệnh và dữ liệu đã được
nạp sẵn, các lệnh sẽ được thực hiện.
Quá trình này có thể gồm các tác vụ như cộng, chuyển bít hay nhân thập phân động.
Giai đoạn hoàn tất sẽ lấy kết quả của giai đoạn thực thi và đưa vào thanh ghi của bộ
xử lý hay bộ nhớ chính.
Một bộ phận quan trọng của bộ vi xử lý là đồng hồ xung nhịp được thiết kế sẵn, xác
định tốc độ làm việc tối đa của những bộ phận khác và giúp đồng bộ hoá những
hoạt động liên quan. Hiện nay tốc độ nhanh nhất của bộ xử lý có trên thị trường là
trên 2 GHz hay hơn hai tỷ xung nhịp mỗi giây. Một số người thích sử dụng thủ
21


thuật "ép" xung để chạy ở tốc độ cao hơn, nhưng nên nhớ là khi đó nhiệt độ làm
việc của chip sẽ cao hơn và có thể gây trục trặc.
b. CPU AMD
Chất liệu chủ yếu chế tạo cpu AMD là ceramic (gốm) và organic ( hữu cơ) từ dòng
Thoroughbred trở đi đều làm bằng organic.Hiện tại, công nghệ được áp dụng cho
các CPU là MOS (Metal Oxide Semi-Conductor - bán dẫn ôxít kim loại), dựa vào
một lớp ôxít kim loại nằm trên tấm silicon kết nối bởi các đường hợp chất dẫn
điện.Người ta đã cải tiến MOS thành CMOS (Complimentary MOS - MOS bổ trợ)
hoạt động ở điện thế thấp.

Để đáp ứng nhu cầu làm cho CPU ngày càng nhanh hơn, ít tiêu hao năng lượng hơn
các công nghệ 0,25 -> 0,18 -> 0,13 micron lần lượt ra đời. Nhưng chính sự thu nhỏ
các cầu nối trong CPU này khiến việc áp dụng MOS và CMOS trở nên ngày càng
khó khăn hơn, do các cầu nối này nằm quá sát nhau nên dễ dẫn đến hiện tượng đóng
điện chéo lên các cầu bên cạnh. Một nhược điểm quan trọng khác của công nghệ
MOS là phần silicon ở giữa các cầu nối (có vai trò như một tụ điện) phải nạp được
điện dung tối đa để có thể đóng - và lại phải thoát hết điện dung để có thể mở. Việc
này tốn thời gian xử lý, và lãng phí thời gian xử lý trên CPU.
Các nhà sản xuất CPU đã cải tiến MOS hiện có như việc thay oxit nhôm bằng oxit
đồng làm tăng xung nhịp lên đáng kể. Nhưng để CPU có thể đạt tới tốc độ 5-10
GHz phải có một giải pháp khắc phục triệt để hơn nữa 2 nhược điểm nêu trên. Đó
chính là công nghệ SOI (Silicon On Insulator).
Cải tiến SOI là điện dung của tụ silicon giữa các cầu được cực tiểu hoá làm giảm
thời gian cần thiết để thoát/nạp, để mở và đóng cầu nối. Điều này giúp tăng xung
nhịp lên rất nhiều. Sở dĩ SOI làm được điều đó là nhờ việc chèn vào giữa tấm
silicon một lớp vật liệu cách điện và để lại một phần silicon nhỏ ở giữa các cầu nối.
Lớp vật liệu cách điện này là một dạng của ôxít silicon được tạo ra bằng kĩ thuật
SIMOX (Seperation by Implantation of Oxygen) - khí ôxi được ép lên bề mặt của
silicon wafer ở áp suất và nhiệt độ cao, khi đó silicon phản ứng với ôxi tạo nên 1
lớp ôxít silicon bám vào silicon wafer bên dưới.
SOI sẽ không thay thế hoàn toàn MOS/CMOS mà chỉ tối ưu hoá cho hai công nghệ
này:
- CPU dùng SOI sẽ nhanh hơn đến 30% so với CPU dùng MOS/CMOS nếu có cùng
một xung đồng hồ như nhau.
- Yêu cầu về điện năng thấp hơn nhiều so với MOS/CMOS (ít hơn khoảng 50%),
CPU sẽ chạy mát hơn - vượt qua một trở ngại lớn của việc nâng tốc độ các bộ xử lý.
- Cho phép thu nhỏ công nghệ sản xuất CPU xuống 0.09 micron hay thấp hơn cùng
với SOI có nghĩa rằng các bộ vi xử lý sẽ được tăng tốc rất nhanh và tốc độ 5-10GHz

22



sẽ sớm đạt được. Thế nhưng SOI cần có silicon đạt độ nguyên chất 100% - thứ mà
công nghệ hiện nay chưa sản xuất được. Isonics là 1 công ty đang nghiên cứu sản
xuất loại silicon wafer này. AMD thực sự trông đợi vào SOI để khắc phục những
nhược điểm của CPU như tiêu tốn nhiều điện năng và chạy nóng hơn. Cả thế giới
đang mong đợi bộ xử lý K8 của họ, hay còn gọi là Hammer dùng công nghệ SOI.
4. Thành phần chính luận lý:
Mạch của bộ xử lý được thiết kế thành những phần luận lý riêng biệt - khoảng hơn
một chục bộ phận - được gọi là những đơn vị thực thi. Chúng có nhiệm vụ thực hiện
bốn giai đoạn trên và có khả năng xử lý gối đầu. Dưới đây là một số đơn vị thực thi
phổ biến nhất.
a/ Bộ luận lý số học: Xử lý tất cả những phép toán số học. Đôi lúc đơn vị này được
chia thành những phân hệ, một chuyên xử lý các lệnh cộng và trừ số nguyên, phân
hệ khác chuyên tính toán các phép nhân và chia số phức.
b/ Bộ xử lý dấu chấm động (FPU): Thực hiện tất cả các lệnh liên quan đến dấu
chấm động (không phải là số nguyên). Ban đầu FPU là bộ đồng xử lý gần ngoài
nhưng hiện nay nó được tích hợp ngay trên bộ xử lý để tăng tốc độ xử lý.
c/ Bộ phận nạp/lưu: Quản lý tất cả lệnh đọc hay ghi bộ nhớ.
d/ Bộ phận quản lý bộ nhớ (MMU): Chuyển đổi địa chỉ của ứng dụng thành địa chỉ
bộ nhớ vật lý. Điều này cho phép hệ điều hành ánh xạ mã và dữ liệu của ứng dụng
vào những khoảng địa chỉ ảo để MMU có thể thực hiện các dịch vụ theo chế độ bảo
vệ bộ nhớ.
e/ Bộ phận xử lý rẽ nhánh (BPU): Dự đoán hướng đi của lệnh rẽ nhánh nhằm giảm
sự ngắt quãng của dòng chuyển dữ liệu và lệnh vào bộ xử lý khi có một luồng xử lý
nhảy đến một địa chỉ bộ nhớ mới, thường gặp trong các phép toán so sánh hay kết
thúc vòng lặp.
f/ Bộ phận xử lý vector (VPU): Xử lý các lệnh đơn, đa dữ liệu (single instruction
multiple data-SIMD) để tăng tốc các tác vụ đồ hoạ. Những lệnh theo kiểu vector
này gồm các tập lệnh mở rộng cho multimedia của Intel, 3DNow của AMD,

AltiVec của Motorola. Trong một vài trường hợp không có bộ phận VPU riêng,
chẳng hạn Intel và AMD tích hợp những tính năng này vào trong FPU của Pentium
4 và Athlon.

23


Không phải tất cả các bộ phận này đều thực thi lệnh. Người ta đã có những nỗ lực
to lớn để bảo đảm cho bộ xử lý lấy lệnh và dữ liệu ở tốc độ nhanh nhất. Tác vụ nạp
truy cập bộ nhớ chính (không nằm ngay trên CPU) sẽ chiếm nhiều chu kỳ xung
nhịp, trong khi đó CPU lại không làm gì cả.
Tuy nhiên, BPU sẽ phải làm việc rất nhiều để lấy sẵn dữ liệu và lệnh.
Một cách giảm thiểu tình trạng không hoạt động của CPU là trữ sẵn mã và dữ liệu
thường được truy cập trong bộ nhớ ngay trên chip, như vậy CPU có thể truy cập mã
và dữ liệu trên bộ nhớ đệm chỉ trong một chu kỳ xung nhịp. Bộ nhớ đệm chính ngay
trên CPU (còn gọi là Level1 hay L1) thường chỉ có dung lượng khoảng 32KB và
chỉ có thể lưu được một phần chương trình hay dữ liệu. Thủ thuật để thiết kế bộ nhớ
đệm là tìm giải thuật để lấy thông tin quan trọng vào L1 khi cần đến. Điều này có ý
nghĩa hết sức quan trọng đối với tốc độ nên hơn một nửa số lượng transistor của bộ
xử lý có thể dành cho bộ nhớ đệm.
Tuy nhiên, hệ điều hành đa nhiệm và một loạt các ứng dụng chạy đồng thời có thể
làm quá tải ngay cả với bộ nhớ đệm L1 được thiết kế tốt nhất. Để giải quyết vấn đề
này, cách đây nhiều năm, các nhà sản xuất đã bổ sung đường truyền tốc độ cao để
bộ xử lý có thể giao tiếp với bộ nhớ đệm thứ cấp (Level2, L2) với tốc độ khoảng 1/2
hay 1/3 tốc độ của bộ xử lý.
Hiện nay trong những bộ xử lý mới nhất như Pentium 4 hay PowerPC 7450 còn tiến
xa hơn khi đưa bộ nhớ đệm L2 vào ngay trong CPU và hỗ trợ giao tiếp tốc độ cao
với bộ nhớ đệm ngoài L3. Trong tương lai, các nhà sản xuất thậm chí còn tích hợp
bộ điều khiển bộ nhớ ngay trên CPU để tăng tốc độ lên cao hơn nữa
III/ NGUYÊN TẮC HOẠT ĐỘNG:

 CPU hoạt động hoàn toàn phụ thuộc vào các mã lệnh , mã lệnh là tín hiệu số
dạng 0,1 được dịch ra từ các câu lệnh lập trình ,như vậy CPU sẽ không làm
gì cả nếu không có các câu lệnh hướng dẫn
 Khi chúng ta chạy một chương trình thì các chỉ lệnh của chương trình đó
được nạp lên bộ nhớ Ram, các chỉ lệnh này đã được dịch thành ngôn ngữ
máy và thường trú trên các ngăn nhớ của Ram ở dạng 0,1
 CPU sẽ đọc và làm theo các chỉ lệnh một cách lần lượt.
 Trong quá trình đọc và thực hiện các chỉ lệnh, các bộ giải mã sẽ giải mã các
chỉ lệnh này thành các tín hiệu điều khiển .

24


Đối với CPU, do việc xử lý thông tin trong CPU là hoàn toàn tự động theo những
chương trình có sẵn
trong bộ nhớ, CPU cần
phải biết thời điểm đọc
lệnh, đọc lệnh xong thì
mới chuyển đến thời
điểm CPU tiến hành giải mã lệnh, giải mã lệnh xong thì CPU mới tiến hành việc
thực hiện lệnh. Thực hiện xong thì CPU mới tiến hành việc đọc lệnh kế tiếp.
Đây là các công đoạn khi CPU thực hiện và không thể lẫn lộn được mà phải được
thực hiện một cách tuần tự.
Để giải quyết vấn đề này, trong CPU cần phải có một bộ tạo nhịp thời gian làm việc
(CPU Clock). Tại nhịp thời gian này, CPU thực hiện việc đọc lệnh, tại nhịp thời
gian tiếp theo, CPU thực hiện việc giải mã lệnh…
Nhịp thời gian càng ngắn, tốc
độ CPU thực hiện lệnh càng
nhanh. Chẳng hạn với một CPU
pentium MMX 233 MHz, điều

đó có nghĩa là bộ tạo nhịp của
CPU đó tạo ra 233 triệu nhịp
làm việc trong 1 giây.
Ví dụ: việc phân chia thời gian thực hiện lệnh đối với một CPU (đời cũ) có
thể mô tả như sau:

Trong đó: F (Fetch): đọc lệnh
D (Decode): giải mã lệnh
E (Execute) : thực thi lệnh.
ti: chu kì làm việc thứ i
Với CPU làm việc như vậy chúng ta có thể thấy rằng mỗi lệnh phải thực hiện trong
3 nhịp thời gian. Tại nhịp t2 thì chỉ có bộ phận giải mã là bận rộn còn bộ đọc lệnh
thì nhàn rỗi. Trong thời điểm t3 thì cả hai bộ phận đọc lệnh và giải mã đều rỗi. Do
đó hiệu năng làm việc của CPU thấp.
Một CPU xử lý lệnh theo nhịp thời gian như vậy còn gọi là bộ vi xử lý ở chế độ đơn
dòng lệnh và chỉ gặp ở các CPU đời cũ. Để tăng tốc độ làm việc của CPU hay tăng
hiệu suất làm việc, các CPU thế hệ thứ 3 đều trang bị chế độ xử lý xen kẽ dòng mã
lệnh (pipelining)

25


×