Những cái nhất trên AMD Ryzen Threadripper
Khi mà xung nhịp xử lý là một vấn đề quan trọng với CPU, nó ảnh hưởng đến hiệu năng, đến hiệu quả tản nhiệt cũng như hiệu suất tiêu thụ điện. Xung nhịp càng lớn sẽ thúc đẩy sự gia tăng từ hiệu suất đỉnh thậm chí là mức độ tiêu thụ điện.
Nhưng đối với cuộc chiến về số lượng nhân, lại có những thách thức khác. Khi chỉ có một nhân, lượng dữ liệu đưa đến nhân đó sẽ được thông qua DRAM và bộ nhớ đệm. Nhưng với những bộ xử lý đa nhân từ 6, 8, 10, 12 thậm chí là 16 nhân, lại xuất hiện một vấn đề khác đó là làm sao để các nhân đều nhận được dữ liệu cần để làm việc chứ không phải ngồi đợi trong trạng thái rỗi, việc này sẽ dẫn đến sự lãng phí tài nguyên sẳn có của hệ thống đa nhân xử lý. Đây không phải là một nhiệm vụ có thể giải quyết dễ dàng, mỗi bộ xử lý giờ đây cần có nhưng giải pháp để các lõi có thể giao tiếp một cách nhanh chóng, thông qua bộ nhớ chính. Và trong ngành công nghiệp gọi đây là những con quái vật háu ăn.
60 lanes PCIe vs 44 lanes PCIe
Luôn xuất hiện như là một kẻ chiếu dưới, giờ đây AMD đang sự dụng những đặc tính kỹ thuật nổi bật như là ưu tiên hàng đầu trong chiến lược tiếp thị. Trong khi Ryzen 7 chỉ có 16 lanes PCIe thì ở chiều ngược lại, đối thủ của nó có đến 28 thậm chí 44 lanes PCIe. Và trong Threadripper, AMD trang bị đến 60 lanes PCIe. Chính xác hơn là có tổng cộng 64 lanes PCIe với 4 lanes dành riêng từ CPU đến chipset X399.
Mục đích của việc cung cấp số lượng lớn lanes PCIe nhằm để hỗ trợ một số thị trường tiềm năng đòi hỏi hiệu suất cao. Đối tượng chính là những người dùng vận hành hệ thống đa GPU, nhiều thiết bị lưu trữ, kết nối mạng cao cấp, bộ nhớ cao cấp và những tính năng khác dựa trên giao thức PCIe. Kết quả là chúng ta có thể thấy các bo mạch chủ hiện tại phân bổ riêng 38 đến 44 lanes cho các khe PCIe này (x16/x16, x8/x8/x8/x8, x16/x16/x16, x16/x8/x16/x8) tiếp theo là cho một/hai hay ba bộ lưu trữ PCIe thông qua kết nối M.2 hoặc U.2, sau đó là mạng ethernet tốc độ cao. AMD cho phép mỗi bộ phức hợp PCIe x16 gốc trên CPU có thể được chia thành các thành phần x1 nếu cần, cho phép tối đa đến 7 thiết bị. 4 lanes đến chipset cũng sẽ hỗ trợ một số lanes PCIe 3.0 và PCIe 2.0 dành cho các bộ điều khiển SATA và USB.
Ở chiều ngược lại, với Intel họ có một chiến lược khác, họ dành riêng 32 hoặc 40 lanes cho các khe cắm PCIe, trong khi 4 – 12 lanes còn lại cho bộ điều khiển mạng hoặc các bộ điều khiển Thunderbotl 3. Chipset Skylake-X sau đó có them 24 lanes PCI echo bộ điều khiển SATA, bộ điều khiển mạng và USB.
DRAM và ECC DRAM
Một trong những chiến lược mà Intel đang áp dụng đó là nếu khách hàng cần một bộ xử lý đa nhân và chạy bộ nhớ ECC, họ sẽ phải mua bộ xử lý Xeon. Hiện tại, Xeon hỗ trợ tốc độ bộ nhớ cố định tùy thuộc vào số lượng các kênh được cung cấp (1 khe cắm trên mỗi kênh là DDR4-2666, 2 khe cắm DIMM trên mỗi kênh là DDR4-2400), cũng như các công nghệ ECC và RDIMM. Tuy nhiên, nền tảng HEDT Broadwell-E và Skylake-X dành cho thị trường tiêu dùng sẽ không hỗ trợ ECC và RDIMM.
Nhưng trên Threadripper, AMD đã hỗ trợ cả bộ nhớ ECC lẫn non-ECC trên tất cả các nhân xử lý. Tuy nhiên sẽ chỉ hỗ trợ loại bộ nhớ UDIMM nhưng sẽ không hỗ trợ ép xung bộ nhớ để tăng tốc độ băng thông các cầu kết nối Infinity Fabric. AMD tuyên bố rằng loạt Threadripper có thể hỗ trợ lên đến 1TB bộ nhớ, tức là đòi hỏi phải có các thanh nhớ dung lượng 128GB trong khi hiện tại dung lượng tối đa của mỗi thanh nhớ chỉ 16GB. Intel hiện đang giới hạn dung lượng bộ nhớ hộ trợ đối với Skylake-X là 128GB.
Cả hai bộ vi xử lý này đều hỗ trợ bốn kênh bộ nhớ tại DDR4-2666 (1 DIMM mỗi kênh) và DDR4-2400 (2 DIMM trên mỗi kênh)
Bộ nhớ đệm
Cả AMD lẫn Intel đều sử dụng bộ nhớ đệm L2 riêng biệt cho mỗi nhân, sau đó là bộ nhớ đệm L3 trung chuyển trước khi dữ liệu đi đến bộ nhớ chính. Bộ nhớ trung chuyển là nơi mà các dòng dữ liệu ít được sử dụng cũng như là dữ liệu không được nạp trước. Tuy nhiên, ở AMD và Intel lại có cách thiết lập kích thước của bộ nhớ đệm cũng như phương thức mà các nhân tương tác với chúng cũng khác nhau.
Với AMD, mỗi nhân sẽ có 512KB bộ nhớ đệm L2, và mỗi một cụm lõi chứa 4 nhân sẽ dùng chung một bộ nhớ L3 dung lượng 8MB. Trong một CPU Threadripper 16 nhân, có bốn cụm lõi như thế, kết quả là có đến 32MB bộ nhớ L3, tuy nhiên mỗi nhân chỉ có thể tìm dữ liệu bên trong cache L3 cục bộ. Để có thể truy xuất dữ liệu bên vùng đệm L3 của cụm lõi khác, nó phải tốn thêm một ít thời gian để tìm dữ liệu mà nó cần. Và kết quả là xuất hiện độ trể tùy thuộc vào nơi mà dữ liệu đang lưu trú trên bộ nhớ đệm L3 so với bộ nhớ đệm L3 cục bộ.
Skylake-X của Intel sử dụng 1MB bộ nhớ đệm L2 trên mỗi nhân, do đó hiệu suất truy cập vào bộ nhớ đệm L2 cao hơn và sử dụng 1.375MB bộ nhớ cache L3 trung gian cho mỗi nhân. Các bộ nhợ đệm L3 được gắn thẻ và được liên kết theo một cấu trúc dạng lướng giữa các nhân, vì vậy có gần như là tương đồng với cách mà AMD đang sử dụng và vẫn xuất hiện độ trể liên quan đến việc tìm kếm ở vùng bộ nhớ đệm khác, tuy nhiên độ trể giữa các nhân là đồng nhất trong thiết kế. Trên loạt Broadwell-E, cấu trúc bộ nhớ đệm hơi khác khi mỗi nhân có 256KB L2 và 2,5MB L3 bao gồm cả bộ nhớ đệm.