Radeon Open Compute“ ROCm” Stack v3.1 เปิดตัวพร้อม RAS สำหรับ Vega 7nm รองรับ SLURM เพื่อการจัดการทรัพยากรที่ดีขึ้น แต่ Navi ยังขาดหายไป

ฮาร์ดแวร์ / Radeon Open Compute“ ROCm” Stack v3.1 เปิดตัวพร้อม RAS สำหรับ Vega 7nm รองรับ SLURM เพื่อการจัดการทรัพยากรที่ดีขึ้น แต่ Navi ยังขาดหายไป 2 นาทีอ่าน

AMD Radeon



Radeon Open Compute หรือ“ ROCm” stack เวอร์ชันใหม่ได้แล้ว ใช้ได้ สำหรับการดาวน์โหลด Radeon Open Compute v3.1 มาพร้อมกับคุณสมบัติบางอย่าง แต่น่าแปลกที่การสนับสนุน AMD Navi และ GFX10 ยังขาดหายไป

ROCm ซึ่งเป็นแพลตฟอร์มสากลที่ได้รับการยอมรับมากที่สุดสำหรับการประมวลผลด้วย GPU เร่งอยู่ในเวอร์ชัน 3.1 แล้ว การอัปเดตล่าสุดสำหรับแพลตฟอร์มโมดูลาร์ซึ่งช่วยให้ผู้จำหน่ายฮาร์ดแวร์สามารถสร้างไดรเวอร์ที่รองรับเฟรมเวิร์ก ROCm รวมถึงคุณสมบัติที่คาดหวังไว้มากมายเช่นการรองรับ RAS สำหรับ 7nm Vega และ SLURM ที่รองรับ AMD GPU อย่างไรก็ตามด้วยเหตุผลที่ยังไม่ทราบสาเหตุ ROCm ยังไม่ได้รับการสนับสนุนอย่างสมบูรณ์สำหรับสถาปัตยกรรม AMD Navi รุ่นใหม่



มีอะไรใหม่ใน Radeon ROCm v3.1:

การเปลี่ยนแปลงที่ใหญ่ที่สุดและชัดเจนที่สุดในการติดตั้ง Radeon ROCm v3.1 ใหม่อยู่ในโครงสร้างไดเรกทอรีการติดตั้ง ROCm การติดตั้งชุดเครื่องมือ ROCm ใหม่จะติดตั้งแพ็กเกจในไฟล์ / opt / rocm- โฟลเดอร์ ก่อนหน้านี้แพ็คเกจชุดเครื่องมือ ROCm ถูกติดตั้งในไฟล์ / opt / rocm โฟลเดอร์



ROCm เวอร์ชันใหม่ได้ปรับปรุงการรองรับความน่าเชื่อถือการช่วยการเข้าถึงและความสามารถในการให้บริการ (RAS) สำหรับ Vega 7nm GPUs งาน Vega ขนาด 7 นาโนเมตรนี้น่าจะอยู่ภายใต้กล้องจุลทรรศน์สำหรับ “ Arcturus” ที่ใช้ Vega ตัวเร่งการคำนวณจะมาในปีนี้ การสนับสนุนประกอบด้วย:



  • UMC RAS ​​- HBM ECC (การแทรกข้อผิดพลาดที่ไม่สามารถแก้ไขได้), การลบเพจ, การกู้คืน RAS ผ่าน GPU (BACO) รีเซ็ต
  • GFX RAS - GFX, MMHUB ECC (การแทรกข้อผิดพลาดที่ไม่สามารถแก้ไขได้), การกู้คืน RAS ผ่าน GPU (BACO) รีเซ็ต
  • PCIE RAS - PCIE_BIF ECC (การแทรกข้อผิดพลาดที่ไม่สามารถแก้ไขได้), การกู้คืน RAS ผ่านการรีเซ็ต GPU (BACO)

Radeon ROCm v3.1 ยังได้รับ SLURM Support สำหรับ AMD GPUs SLURM หรือ Simple Linux Utility สำหรับการจัดการทรัพยากรเป็นหนึ่งในระบบการจัดการคลัสเตอร์และการจัดตารางงานที่ต้องการและใช้งานง่ายสำหรับคลัสเตอร์ Linux SLURM เป็นที่ต้องการเนื่องจากเป็นโอเพ่นซอร์สทนต่อข้อผิดพลาดและปรับขนาดได้สูง

ระบบนี้สามารถโต้ตอบกับ AMD GPU ได้เป็นอย่างดี SLURM เวอร์ชันล่าสุด 20.02.0 ประกอบด้วยปลั๊กอินของ AMD ที่ช่วยให้ SLURM ตรวจจับและกำหนดค่า GPU ของ AMD โดยอัตโนมัติ นอกจากนี้ยังรวบรวมและรายงานการใช้พลังงานของชิปกราฟิก การรองรับ SLURM เป็นส่วนเสริมที่มีประโยชน์เนื่องจากจำนวนการปรับใช้ super-computing ที่เพิ่มขึ้นโดยใช้ Radeon GPU และคลัสเตอร์ GPU AMD ขนาดใหญ่อื่น ๆ

แม้จะมีการรวมคุณสมบัติหลายอย่างไว้ด้วยกัน แต่ก็ยังไม่มีสัญญาณของการรองรับ GFX10 / Navi ใน ROCm หน้า GitHub สำหรับ ROCm ได้รับการอัปเดตเพื่อแสดงถึงการเปลี่ยนแปลงบันทึกการติดตั้งและปัญหาที่ทราบทั้งหมด



แท็ก เอเอ็มดี