NVIDIA Ampere A100 250W TDP GPU บน PCIe 4.0 ที่สร้างขึ้นสำหรับ AI, Data Science และ Supercomputing ที่เปิดตัวด้วยประสิทธิภาพ 90 เปอร์เซ็นต์ของรุ่น 400W

ฮาร์ดแวร์ / NVIDIA Ampere A100 250W TDP GPU บน PCIe 4.0 ที่สร้างขึ้นสำหรับ AI, Data Science และ Supercomputing ที่เปิดตัวด้วยประสิทธิภาพ 90 เปอร์เซ็นต์ของรุ่น 400W อ่าน 2 นาที

Nvidia



NVIDIA ได้เปิดตัว A100 ซึ่งเป็น GPU ที่รองรับ PCIe 4.0 อย่างเป็นทางการโดยใช้สถาปัตยกรรม Ampere รุ่นใหม่ แม้ว่าจะมีโปรไฟล์ TDP 250W ที่ต่ำกว่า แต่ NVIDIA ก็สัญญาว่า GPU PCIe 4.0 Ampere A100 จะสามารถให้ประสิทธิภาพสูงสุดถึง 90 เปอร์เซ็นต์ของประสิทธิภาพของ GPU 400W A100 HGX เต็มรูปแบบ ตัวแปรที่สามของตระกูล Ampere A100 GPU ที่กำลังเติบโต A100 PCIe มีไว้สำหรับเซิร์ฟเวอร์ที่ใช้ Artificial Intelligence (AI), Data Science และ Supercomputing clusters

NVIDIA เปิดตัว A100 GPU รุ่น PCI-Express 4.0 GPU ขึ้นอยู่กับสถาปัตยกรรมขนาดเล็กแอมป์ 7 นาโนเมตร นอกจากนี้ บริษัท ยังได้เปิดตัวระบบขับเคลื่อน A100 หลายรุ่นจากผู้ผลิตเซิร์ฟเวอร์ชั้นนำเช่น Asus, Dell, Cisco, Lenovo และอื่น ๆ ตัวเร่ง GPU 250W A100 PCIe 4.0 นั้นค่อนข้างคล้ายกับตัวแปร 400W TDP เต็มรูปแบบและ NVIDIA ก็มีแนวโน้มที่จะมีประสิทธิภาพใกล้เคียงกันแม้จะมีโปรไฟล์ TDP ลดลงอย่างมาก



NVIDIA A100 Ampere GPU ใน PCIe 4.0 Form-Factor พร้อมการกำหนดค่า GPU 400W A100 HGX เดียวกัน แต่ที่ 250W:

NVIDIA ได้ประกาศตัวเร่งความเร็ว GPU PCIe 4.0 A100 PCIe Ampere GPU มีให้สำหรับกรณีการใช้งานในอุตสาหกรรมที่หลากหลายโดยมีระบบตั้งแต่ A100 PCIe GPU ตัวเดียวไปจนถึงเซิร์ฟเวอร์ที่ใช้การ์ดสองใบพร้อมกันผ่านช่องสัญญาณ NVLINK 12 ช่องที่ให้แบนด์วิดท์การเชื่อมต่อระหว่างกันรวม 600 GB / s ตัวเร่ง GPU 250W TDP A100 PCIe ไม่เปลี่ยนแปลงมากนักในแง่ของการกำหนดค่าหลักเมื่อเทียบกับ GPU 400W A100 HGX



GA100 GPU มีข้อกำหนดของตัวแปร 400W A100 HGX ที่มีแกน 6912 CUDA ซึ่งจัดเรียงใน 108 หน่วย SM, 432 Tensor Cores และหน่วยความจำ HBM2 40 GB ที่ให้แบนด์วิดท์หน่วยความจำเท่ากันที่ 1.55 TB / s (ปัดเป็น 1.6 TB / s). อย่างไรก็ตามการปรับใช้แพ็คเกจ GPU บนไฟล์ มาตรฐาน PCIe 4.0 มีข้อเสียของตัวเองในการลด TDP อย่างมาก ตามรายงานนี้หมายถึงการลงโทษประสิทธิภาพ 10 ถึง 50 เปอร์เซ็นต์ตามปริมาณงาน ยิ่งไปกว่านั้นรุ่น 250W TDP ของ A100 GPU นั้นเหมาะกับการระเบิดระยะสั้นมากกว่าการโหลดแบบต่อเนื่อง

NVIDIA A100 Ampere GPU ใน PCIe 4.0 Form-Factor Performance:

เนื่องจากการลดลงอย่างมากในโปรไฟล์ TDP อาจสันนิษฐานได้ว่าการ์ดจะมีนาฬิกาที่ต่ำกว่าเพื่อชดเชยอินพุต TDP ที่น้อยลง อย่างไรก็ตามเมตริกประสิทธิภาพที่ NVIDIA เปิดตัวออกมานั้นน่าแปลกใจอย่างแท้จริงเนื่องจากมันค่อนข้างใกล้เคียงกับตัวแปร 400W TDP ประสิทธิภาพ FP64 ยังคงได้รับการจัดอันดับที่ 9.7 / 19.5 TFLOPs ประสิทธิภาพ FP32 ได้รับการจัดอันดับที่ 19.5 / 156/312 TFLOPs (Sparsity) ประสิทธิภาพ FP16 ได้รับการจัดอันดับที่ 312/624 TFLOPs (Sparsity) และ INT8 ได้รับการจัดอันดับที่ 624/1248 TOPs ( เบาบาง).



การคำนวณทางคณิตศาสตร์อย่างง่ายและ NVIDIA รับรองว่า GPU แบบ PCIe 4.0 250W A100 ที่ใช้แอมแปร์สามารถให้ประสิทธิภาพ 90 เปอร์เซ็นต์ของการ์ด A100 HGX (400W) ในแอพพลิเคชั่นเซิร์ฟเวอร์ชั้นนำ นี่เป็นเรื่องที่สมเหตุสมผลเนื่องจากใช้เวลาน้อยกว่าสำหรับตัวแปรใหม่ในการทำงานที่กล่าวถึงข้างต้น อย่างไรก็ตามตัวเลขควรใช้ได้สำหรับช่วงเวลาสั้น ๆ เท่านั้น ในสถานการณ์ที่ซับซ้อนและต้องการความสามารถของ GPU อย่างต่อเนื่อง GPU 250W PCIe 4.0 สามารถส่งมอบประสิทธิภาพของ GPU 400W A100 HGX ได้ถึง 90 เปอร์เซ็นต์ถึง 50 เปอร์เซ็นต์

Ampere microarchitecture จะเป็นประโยชน์ต่อ A100 ใหม่อย่างแน่นอน NVIDIA สัญญาว่าจะเพิ่มประสิทธิภาพอย่างน้อย 20 เท่าเมื่อเทียบกับรุ่นก่อนที่ใช้ Volta PCIe 4.0 A100 GPU มีเทคโนโลยี GPU แบบหลายอินสแตนซ์ ซึ่งหมายความว่า A100 ตัวเดียวสามารถแบ่งพาร์ติชันเป็น GPU แยกกันได้มากถึงเจ็ดตัวเพื่อจัดการกับงานคอมพิวเตอร์ที่แตกต่างกัน แม้ว่าสิ่งนี้จะช่วยเพิ่มการแบ่งกลุ่ม แต่ก็มี NVLink รุ่นที่ 3 ซึ่งช่วยให้สามารถรวม GPU หลายตัวเข้ากับ GPU ขนาดยักษ์ตัวเดียวได้

แท็ก nvidia