Intel Core vi kiến trúc hai nhân chung đệm
Tại diễn đàn IDF đầu năm 2006, Intel tập trung giới thiệu một vi kiến
trúc hai nhân mới cho nền kiến trúc IA-32 32bit (cùng tồn tại với kiến
trúc EPIC, IXA) với những khẳng định lạc quan về sự cải thiện hiệu
năng, hiệu suất xử lý nhìn trên quan điểm tương quan năng lượng. Vi
kiến trúc mới mang tên giản dị là Intel Core.
Điểm lại các vi kiến trúc hai nhân đang dùng, chúng ta nhận thấy điểm
chung trong cách hiện thực là tích hợp hai nhân vi xử lý đơn nhân trước đây
vào một chip với sự độc lập khá rõ về bộ đệm xử lý và tách biệt quá trình
thực thi vi lệnh. Vi kiến trúc Core đã cải tiến điều này bằng cách thiết kế
một bộ đệm cấp 2 (L2 cache) chung cho cả hai nhân, đồng thời vận dụng có
cải tiến những điểm mạnh của hai vi kiến trúc NetBurst và Mobile để đạt
đồng thời hai yếu tố quan trọng là tăng hiệu năng xử lý và giảm mức tiêu thụ
điện năng. Vi kiến trúc Core chiến lược này sẽ đồng thời được Intel triển
khai trên cả ba dòng điện toán di động, để bàn và máy chủ; nhưng trong lộ
trình giới thiệu sản phẩm, bộ vi xử lý tên mã Merom dành cho máy tính xách
tay sẽ được ưu tiên giới thiệu trước.
So với vi kiến trúc Intel hai nhân hiện tại, năm cải tiến quan trọng trong vi
kiến trúc Core là Mở Rộng Thực Thi Động (Wide Dynamic Execution),
Quản Lý Điện Năng Thông Minh (Intelligent Power Capability), Đệm
Thông Minh Tiên Tiến (Advanced Smart Cache), Truy Xuất Bộ Nhớ Thông
Minh (Smart Memory Access) và Tăng Tốc Phương Tiện Số Tiên Tiến
(Advanced Digital Media Boost).
Wide Dynamic Execution
Thực thi động là sự kết hợp của nhiều kỹ thuật (phân tích luồng dữ liệu, thực
thi suy đoán, thực thi phi thứ tự,...) đã được Intel hiện thực trong vi kiến trúc
P6 gồm bộ xử lý Pentium Pro, Pentium II, Pentium III. Trong vi kiến trúc
NetBurst sau đó, Intel đưa ra cơ chế Thực Thi Động Tiên Tiến (Advanced
Dynamic Execution) thiết kế sâu hơn, tiên đoán xa hơn và cải tiến giải thuật
tiên đoán nhánh lệnh để giảm bớt trường hợp tiên đoán sai. Trong kiến trúc
Core, hàng lệnh thực thi được thiết kế dài hơn (14 khâu) giúp tiên đoán
nhánh lệnh chính xác hơn và có đến 4 hàng lệnh thực thi cùng lúc (Intel
Mobile và NetBurst trước đây chỉ thực thi được cùng lúc ba hàng lệnh).
Một tính năng khác cũng góp phần rút ngắn thời gian thực thi lệnh là
macrofusion. Trong quá trình giải mã lệnh, một số cặp vi lệnh thông dụng
(như lệnh compare (so sánh) đi kèm lệnh jump (nhảy) có điều kiện) sẽ được
macrofusion ghép thành một vi lệnh mới. Bộ Luận Lý Tóan Học (Arithmetic
Logic Unit-ALU) trong vi kiến trúc Core được thiết kế để thực thi các lệnh
kết hợp theo cơ chế macrofusion trong một xung nhịp, giúp rút ngắn đáng kể
thời gian thực thi (so với khi chưa kết hợp) và cũng đồng nghĩa giảm năng
lượng.
Trong Intel Core, bạn cũng bắt gặp lại kỹ thuật tiết kiệm năng lượng thời
gian micro-op fusion từng được dùng trong bộ xử lý Pentium M. Thông
thường, một lệnh thực thi (macro-op) thường được chẻ nhỏ thành nhiều vi
lệnh (micro-op) trước khi chuyển vào hàng lệnh thực thi của bộ vi xử lý. Kỹ
thuật micro-op giúp tối giản một số vi lệnh trong hàng chờ. Trong vi kiến
trúc Core, số trường hợp tinh giản vi lệnh được mở rộng hơn nhờ hàng lệnh
được thiết kế 14 khâu (dài hơn trước).
Mỗi nhân có thể xử lý đồng thời 4 hàng lệnh.
Intelligent Power Capability
Một trong những yếu tố đánh giá hiệu quả hệ thống điện toán hiện tại là chỉ
số hiệu năng/điện năng tiêu thụ. Điều này có nghĩa chúng ta chỉ cần giảm
lượng điện năng tiêu thụ là đã tăng độ hiệu quả hệ thống. Bên cạnh các cải
tiến nâng cao hiệu năng xử lý, Intel Core đồng thời thiết kế Intel Intelligent
Power Capability để tiết kiệm điện năng.
Công nghệ hiện tại đã cho phép Intel thiết kế cơ chế tắt mở cổng luận lý theo
yêu cầu. Nhờ vậy, vi kiến trúc Core có khả năng tắt một hệ thống con trong
bộ vi xử lý khi không cần dùng đến để tiết kiệm điện năng; nhưng vẫn đảm
bảo kích hoạt ngay khi cần để không ảnh hưởng đến tốc độ chung của bộ vi
xử lý. Bên cạnh đó, nhiều tuyến bus và vùng dữ liệu cũng đã được thiết kế
tách biệt để có thể vẫn đảm bảo truyền tải dữ liệu ở mức điện áp thấp trong
một số trạng thái.
Advanced Smart Cache
Khác với cách hiện thực thông thường, Intel thiết kế trong vi kiến trúc Core
một bộ đệm L2 dùng chung cho cả hai nhân vi xử lý để nâng cao hiệu năng,
tăng phần hiệu quả truy xuất dữ liệu. Đơn giản một điều, khi hai nhân thực
thi cần sử dụng một dữ liệu giống nhau thì có thể lưu tại một nơi trong vùng
đệm L2 dùng chung chứ không cần phải lưu thành hai bản tại hai vùng đệm
L2 riêng như trước đây. Điều này giúp tiết kiệm tài nguyên, rút ngắn thời
gian chuyển dữ liệu qua lại hai bộ đệm.
Công nghệ này còn cho phép phân chia động dung lượng vùng đệm theo nhu
cầu từng nhân. Khi nhân thứ nhất không cần dùng đến bộ đệm thì toàn bộ
vùng đệm L2 dùng chung có thể được chia hết cho nhân thứ hai; và ngược