Các bộ gia tốc dành riêng cho thị trường Trung Quốc của NVIDIA hiện không còn xa lạ, và bộ tăng tốc được điều chỉnh để xuất khẩu gần đây nhất mà công ty chuẩn bị là H20, gần đây đã được cấp phép xuất khẩu. Tuy nhiên, các phòng thí nghiệm AI tại Trung Quốc đang tìm kiếm một thiết kế hiệu suất cao hơn, và NVIDIA đã sẵn sàng đáp ứng. Theo Reuters, NVIDIA đã thiết kế một SKU mới có tên B30A, dựa trên B300 “Blackwell Ultra”. Được thiết kế theo kiểu thiết kế một đế chip, nó sử dụng cùng đế chip cơ bản từ B300 đế kép, và chỉ cần nhúng một đế chip duy nhất vào gói sản phẩm để đạt được hiệu suất bằng một nửa nhằm tuân thủ các quy định xuất khẩu.
Với cấu hình chip kép B300, Blackwell Ultra đạt 15 TeraFLOPS ở FP4, 7,5 TeraFLOPS ở FP6/FP8, 3,75 TeraFLOPS ở FP16/BF16 và 1,88 TeraFLOPS ở độ chính xác TF32, chúng ta có thể kỳ vọng chip đơn B30A sẽ giảm một nửa những con số này. Ngoài ra, NVIDIA sẽ không bỏ qua các tính năng quan trọng như HBM và NVLink, cho phép đào tạo và suy luận AI dễ dàng hơn nhiều. Những con chip này có thể đủ sức cạnh tranh với bất kỳ bộ tăng tốc AI nào hiện do Trung Quốc thiết kế với bộ phần mềm vượt trội và hiệu năng cao hơn. Khi chính quyền Hoa Kỳ quyết định cấp cho NVIDIA quyền tiếp cận giấy phép xuất khẩu, NVIDIA một lần nữa phục vụ thị trường Trung Quốc với một bộ tăng tốc hiệu suất cao phục vụ nhu cầu trong nước và các phòng thí nghiệm AI của họ.
theo: TechPowerUp