Xung không phải là cách tốt nhất để so sánh chip
Số lần thực thi chỉ lệnh khác nhau (chu kỳ) gây khó khăn cho việc so sánh các hệ thống đơn thuần dựa trên tốc độ đồng hồ hay số chu kỳ cho mỗi giây.
Làm cách nào hai bộ xử lý chạy cùng tốc độ đồng hồ lại hoạt động khác nhau với cái này chạy nhanh hơn cái kia?
Câu trả lời đơn giản: hiệu năng.
Lý do chính mà 486 được xem như nhanh tương đối với 386 là nó thực thi gấp hai lần chỉ lệnh trong cùng số chu kỳ. Điều tương tự này đúng với trường hợp Pentium; nó thực thi khoảng gấp hai lần chỉ lệnh trong số chu kỳ định sẵn giống như 486. Do vậy, cùng tốc độ đồng hồ cho sẵn, Pentium nhanh gấp hai lần 486, bởi vậy bộ xử lý lớp 486 133MHz (như là AMD 5×86-133) không nhanh bằng Pentium 75MHz! Đó là lý do megahertz của Pentium thì “giá trị” gấp đôi megahertz của 486 trong những giới hạn chỉ lệnh được hoàn tất cho mỗi chu kỳ. Pentium II và III nhanh hơn khoảng 50% so với một Pentium tương đương ở tốc độ đồng hồ cho sẵn bởi vì chúng thực thi nhiều chỉ lệnh hơn trong cùng số chu kỳ.
Không may, sau Pentium III, rất khó khăn để so sánh các bộ xử lý trên tốc độ đồng hồ. Đây là bởi vì những cấu trúc nội bộ khác nhau làm một số bộ xử lý nhiều hiệu năng hơn những bộ xử lý khác, nhưng những sự khác biệt cùng hiệu quả này dẫn đến kết cấu mạch có khả năng chạy những tốc độ tối đa khác nhau. Mạch càng ít hiệu quả tốc độ đồng hồ càng cao và ngược lại.
Một trong những yếu tố làm nên hiệu năng là số tầng đường dẫn nội bộ của bộ xử lý.
Bộ xử lý – Chiều sâu đường dẫn
Pentium III – 10-stage
Pentium M/Core – 10-stage
Athlon/XP – 10-stage
Athlon 64/Phenom – 12-stage
Core 2/I5/I7 – 14-stage
Pentium 4 – 20-stage
Pentium 4 Prescott – 31-stage
Pentium D – 31 – stage
Lợi ích của đường dẫn sâu
Một đường dẫn sâu hơn cắt các tập lệnh một cách hữu hiệu thành các bậc nhỏ (microstep) hơn, cho phép toàn bộ xung cao hơn đạt được việc sử dụng công nghệ silic giống nhau. Tuy nhiên, điều này cũng có nghĩa là tất cả các tập lệnh ít hơn được thực thi trong một chu kỳ khi so sánh với các bộ xử lý với các đường dẫn ngắn hơn. Đó là do, nếu một dự đoán hay bước thực thi suy đoán (xảy ra khá thường xuyên bên trong bộ xử lý khi nó thử sắp hàng các tập lệnh trước), toàn bộ đường dẫn phải ngang bằng nhau và được đổ đầy lại. Do vậy, nếu so sánh Intel Core I7 hay AMD Phenom với Pentium 4 đang chạy cùng xung, Core I7 và Phenom sẽ thực thi nhiều tập lệnh trong cùng số chu kỳ.
Mặc dù là sự bất lợi để có một đường dẫn sâu hơn trong các giới hạn hiệu suất tập lệnh, bộ xử lý với những đường dẫn sâu hơn có thể chạy những xung cao hơn trên công nghệ sản xuất có sẵn. Do vậy, mặc dù một đường dẫn sâu hơn có thể kém hữu hiệu, nhưng kết quả là có thể đẩy xung lên cao hơn.
Đường dẫn 20 hay 31 tầng sâu hơn trong kiến trúc P4 cho phép các xung cao hơn đáng kể để đạt đến việc sử dụng cùng quy trình khuôn silic như các chip khác. Như một ví dụ, Pentium 4 quy trình 0.13-micron tốc độ lên tới 3.4GHz trong khi Athlon XP ở đinh 2.2GHz (chế độ 3200+) trong cùng khung thời gian giới thiệu. Cho dù Pentium 4 thực thi các tập lệnh ít hơn trong mỗi chu kỳ thì các tốc độ chu kỳ cao hơn sẽ mất hiệu quả.
Không may là đường dẫn sâu kết hợp với những xung cao đi với sự bất lợi về sự tiêu thụ điện, do đó có sự phát sinh nhiệt. Rốt cuộc là sự bất lợi về điện quá lớn làm Intel trở về một thiết kế khá hiệu quả trong bộ xử lý kiến trúc “Core” mới hơn của họ. Hơn là đơn độc gia tăng các xung, hiệu suất được tăng lên bằng cách kết hợp nhiều bộ xử lý vào một con chip, do vậy cải tiến tập lệnh một cách hữu hiệu. Điều này bắt đầu cho việc hướng đến các bộ xử lý đa nhân.
Một điều rõ ràng trong tất cả việc nhầm lẫn này: xung đơn thuần không phải là cách tốt để so sánh các con chip, ngoại trừ chúng có cùng nhà sản xuất, kiểu và hệ gia đình.