News

AMD เสนออีโคซิสเต็มสำหรับโซลูชั่นด้าน AI แบบครบวงจร

AMD เสนออีโคซิสเต็มสำหรับโซลูชั่นด้าน AI แบบครบวงจร พร้อมเปิดตัวกลุ่มผลิตภัณฑ์กราฟิกการ์ดซีรีส์ AMD Instinct MI300

—  Dell Technologies, Hewlett Packard Enterprise, Lenovo, Meta, Microsoft, Oracle, Supermicro และแบรนด์ชั้นนำอื่น ๆ ได้นำเสนอการใช้งานฮาร์ดแวร์ AMD สำหรับการประมวลผลประสิทธิภาพสูงและด้าน generative AI

  • โครงสร้างซอฟต์แวร์แบบเปิด ROCm 6 ที่ผสานเข้ากับฮาร์ดแวร์และซอฟต์แวร์รุ่นต่อไปเเพิ่มภาพรวมด้านประสิทธิภาพการทำงานมากกว่า 8 เท่า, ความก้าวหน้าด้านการใช้พลังงานในด้าน AI แบบสร้างสรรค์ และลดความซับซ้อนในการติดตั้งโซลูชัน AMD AI

กรุงเทพฯ, ประเทศไทย — 7 ธันวาคม 2023 — วันนี้ AMD (NASDAQ: AMD) ประกาศวางจำหน่ายผลิตภัณฑ์กราฟิกการ์ด AMD Instinct™ MI300X – มาพร้อมแบนด์วิธหน่วยความจำอุตสาหกรรมระดับชั้นนำสำหรับงานด้าน generative AI[i] และประสิทธิภาพระดับแนวหน้าสำหรับการอนุมานโมเดลภาษาขนาดใหญ่ (LLM) – รวมถึงกราฟิกการ์ด AMD Instinct™ MI300A กลุ่มผลิตภัณฑ์ APU (accelerated processing unit) ที่ผสานระหว่างสถาปัตยกรรมกราฟิก AMD CDNA™ 3 รุ่นล่าสุดและสถาปัตยกรรมโปรเซสเซอร์ “Zen 4” เพื่อมอบประสิทธิภาพการประมวลผลที่ล้ำหน้าสำหรับเวิร์กโหลดงานด้าน HPC และ AI

Victor Peng ประธานบริษัท AMD กล่าวว่า “กลุ่มผลิตภัณฑ์กราฟิกการ์ด AMD Instinct MI300 Series ได้รับการออกแบบบนเทคโนโลยีที่ล้ำสมัยที่สุดของเรา มอบประสิทธิภาพการประมวลผลในระดับแนวหน้า เพื่อใช้งานบนระบบคลาวด์และองค์กรขนาดใหญ่ การใช้ประโยชน์จากฮาร์ดแวร์ ซอฟต์แวร์ชั้นนำ และแนวทางการทำงานร่วมกันแบบเปิดของเรากับผู้ให้บริการคลาวด์ OEM และ ODM นำเสนอเทคโนโลยีที่จะช่วยให้องค์กรต่าง ๆ สามารถนำโซลูชั่นที่ขับเคลื่อนด้วย AI มาปรับและนำไปใช้ได้”

โดยลูกค้าที่ใช้ชุดกราฟิกการ์ด AMD Instinct รุ่นล่าสุด อาทิ Microsoft ที่ประกาศเปิดตัวเครื่องเวอร์ชวลแมชชีนใหม่ (VM) Azure ND MI300x v5 ซึ่งได้รับการพัฒนาให้เหมาะสำหรับเวิร์กโหลดงานด้าน AI และขับเคลื่อนการทำงานบนขุมพลังกราฟิกการ์ด AMD Instinct MI300X นอกจากนี้ยังมี El Capitan ซูเปอร์คอมพิวเตอร์ที่ใช้ APU – AMD Instinct MI300A และติดตั้งอยู่ที่ Lawrence Livermore National Laboratory ซึ่งได้รับการคาดการณ์ว่าจะเป็นซูเปอร์คอมพิวเตอร์ระดับ exaflop เครื่องที่สองที่ใช้ขุมพลัง AMD ที่จะมอบประสิทธิภาพการทำงานแบบความเที่ยงสองเท่า (double precision) มากกว่า 2 exaflops เมื่อใช้งานเต็มรูปแบบ นอกจากนี้ Oracle Cloud Infrastructure มีแผนที่จะเพิ่มกราฟิกการ์ด AMD Insitinct MI300X ลงในอินสแตนซ์แบบ bare metal เพื่อเพิ่มประสิทธิภาพของอินสแตนซ์ในด้านการประมวลผลสำหรับงานด้าน AI โดยอินสแตนซ์ที่ใช้ขุมพลังกราฟิกการ์ด MI300X มีแผนที่จะรองรับ OCI Supercluster ผ่านเครือข่าย RDMA ที่เร็วสุดขั้ว

OEM ชั้นนำหลายรายยังได้นำเสนอระบบประมวลผลแบบเร่งความเร็วควบคู่กับงาน AMD Advancing AI ประกอบด้วย Dell ได้นำเสนอเครื่องเซิร์ฟเวอร์ Dell PowerEdge XE9680 ที่ใช้ขุมพลังกราฟิกการ์ดซีรีย์ AMD Instinct MI300 จำนวนแปดตัวและมาพร้อมการรับรอง Dell Validated Design for Generative AI with AMD ROCm-powered AI frameworks, HPE ประกาศเปิดตัวซูเปอร์คอมพิวเตอร์ HPE Cray Supercomputing EX255a ซูเปอร์คอมพิวเตอร์ที่ใช้ขุมพลังเบลด (Blade) ตัวเร่งความเร็วตัวแรกที่ใช้ APU AMD Instinct MI300A โดยจะพร้อมใช้งานในช่วงต้นปี 2024, Lenovo ประกาศการสนับสนุนด้านการออกแบบกราฟิกการ์ด AMD Instinct MI300 Series ใหม่ โดยมีแผนที่จะวางจำหน่ายในช่วงครึ่งแรกของปี 2024 และ Supermicro ได้ประกาศเพิ่มเติมเกี่ยวกับเซิร์ฟเวอร์แบบเร่งความเร็วรุ่น H13 ที่ใช้ขุมพลังโปรเซสเซอร์ 4th AMD EPYC และกราฟิกการ์ด AMD Instinct MI300 Series

AMD Instinct MI300X

กราฟิกการ์ด AMD Instinct MI300X ขับเคลื่อนประสิทธิภาพผ่านสถาปัตยกรรม AMD CDNA 3 ใหม่ เมื่อเทียบกับตัวเร่งความเร็ว AMD Instinct MI250X รุ่นก่อน MI300X ส่งมอบหน่วยคำนวณเพิ่มขึ้นเกือบ 40%[i], ความจุหน่วยความจำเพิ่มขึ้น 1.5 เท่า, แบนด์วิธหน่วยความจำสูงสุดเพิ่มขึ้น 1.7 เท่า[ii] รวมถึงการรองรับรูปแบบทางคณิตศาสตร์ใหม่ ๆ เช่น FP8 และ sparsity โดยประสิทธิภาพที่เพิ่มขึ้นทั้งหมดนี้จะมุ่งเน้นไปที่เวิร์กโหลดการทำงานด้าน AI และ HPC

ปัจจุบันเทคโนโลยี LLM เพิ่มขึ้นทั้งในด้านขนาดและความซับซ้อน ซึ่งต้องการหน่วยความจำและการประมวลผลมหาศาล กราฟิกการ์ด AMD Instinct MI300X มีความจุหน่วยความจำ HBM3 ที่ดีที่สุดในระดับเดียวกัน 192GB มาพร้อมแบนด์วิธหน่วยความจำสูงสุด 5.3 TB/s2 เพื่อเสนอประสิทธิภาพที่ยอดเยี่ยมสำหรับเวิร์กโหลดงานด้าน AI ที่เป็นที่ต้องการมากขึ้นเรื่อย ๆ โดย AMD Instinct Platform เป็นแพลตฟอร์มด้าน generative AI ชั้นนำที่สร้างขึ้นบนการออกแบบ OCP มาตรฐานอุตสาหกรรมโดยใช้กราฟิกการ์ด MI300X จำนวนแปดตัวเพื่อมอบความจุหน่วยความจำ HBM3 ระดับชั้นนำของอุตสาหกรรมขนาด 1.5TB การออกแบบมาตรฐานอุตสาหกรรมของ AMD Instinct Platform จะช่วยให้พันธมิตร OEM สามารถออกแบบกราฟิกการ์ด MI300X ลงในผลิตภัณฑ์ AI ที่มีอยู่ ลดความซับซ้อนในการติดตั้งและเร่งการนำไปใช้ผ่านเซิร์ฟเวอร์ที่ใช้ขุมพลังกราฟิกการ์ด AMD Instinct

เมื่อเปรียบเทียบกับ Nvidia H100 HGX แพลตฟอร์ม AMD Instinct Platform สามารถเพิ่มปริมาณงานได้สูงสุดถึง 1.6 เท่าเมื่อรันด้านการอนุมานบน LLM เช่น BLOOM 176B[iv] และเป็นตัวเลือกเดียวในตลาดที่มีความสามารถในการรันการอนุมานสำหรับโมเดลพารามิเตอร์ 70B เช่น Llama2 บนกราฟิกการ์ด MI300X ตัวเดียว ซึ่งช่วยลดความซับซ้อนในการติดตั้ง LLM ระดับองค์กรและให้ค่า TCO ที่ยอดเยี่ยม

AMD Instinct MI300A

AMD Instinct MI300A เป็น APU ดาต้าเซ็นเตอร์ตัวแรกของโลกสำหรับงาน HPC และ AI ใช้ในงานด้านบรรจุภัณฑ์ 3D และ 4th AMD Infinity Architecture เพื่อมอบประสิทธิภาพชั้นนำสำหรับการเวิร์กโหลดการทำงานที่มีความสำคัญซึ่งอยู่บรรจบระหว่าง HPC และ AI โดย APU – MI300A ได้ผสานรวมคอร์กราฟิกสถาปัตยกรรม AMD CDNA™ 3 ประสิทธิภาพสูง, คอร์โปรเซสเซอร์สถาปัตยกรรม AMD “Zen 4” x86 ล่าสุด และหน่วยความจำ HBM3 รุ่นต่อไปขนาด 128GB เข้าด้วยกัน เพื่อมอบประสิทธิภาพต่อวัตต์ที่เพิ่มขึ้น ~1.9 เท่าสำหรับเวิร์กโหลดงานด้าน FP32 HPC และ AI เมื่อเทียบกับ AMD Instinct MI250X รุ่นก่อนหน้า[iii]

ประสิทธิภาพด้านการใช้พลังงานมีความสำคัญอย่างยิ่งสำหรับกลุ่มผู้ใช้งานด้าน HPC และ AI เนื่องจากเวิร์กโหลดเหล่านี้ต้องใช้ข้อมูลและทรัพยากรจำนวนมหาศาล โดย AMD Instinct MI300A ได้ประโยชน์จากการผสานรวมคอร์โปรเซสเซอร์และกราฟิกการ์ดในตัวเดียว ซึ่งจะช่วยให้ได้แพลตฟอร์มที่มีประสิทธิภาพการใช้พลังงานสูง ในขณะเดียวกันก็มอบประสิทธิภาพการประมวลผลเพื่อเพิ่มความเร็วการเทรนนิ่งโมเดล AI ล่าสุด โดย AMD ได้กำหนดทิศทางนวัตกรรมด้านประสิทธิภาพการใช้พลังงานผ่านเป้าหมาย 30×25 ของบริษัท ซึ่งมุ่งมั่นที่จะยกระดับประสิทธิภาพการใช้พลังงานให้มีประสิทธิภาพเพิ่มขึ้น 30 เท่าสำหรับโปรเซสเซอร์กลุ่มเซิร์ฟเวอร์และกราฟิกการ์ดสำหรับงานด้านเทรนนิ่ง AI และ HPC ระหว่างปี 2020 ถึง 2025[iv]

ข้อได้เปรียบของ APU AMD Instinct MI300A คือมีหน่วยความจำและแคชแบบรวมศูนย์ ทำให้ลูกค้ามีแพลตฟอร์ม GPU ที่สามารถติดตั้งโปรแกรมได้ง่าย, การคำนวณที่มีประสิทธิภาพสูง, การเทรนนิ่ง AI ที่รวดเร็ว และประสิทธิภาพด้านการใช้พลังงานที่น่าประทับใจ เพื่อรองรับเวิร์กโหลดงานด้าน HPC และ AI ที่เป็นที่ต้องการมากที่สุด

ซอฟต์แวร์ ROCm และพันธมิตรอีโคซิสเต็ม

AMD ประกาศเปิดตัวแพลตฟอร์ม ซอฟต์แวร์แบบเปิด AMD ROCm™ 6 เวอร์ชั่นล่าสุด รวมถึงแสดงความมุ่งมั่นของบริษัทในการสนับสนุนไลบรารีที่ทันสมัยที่สุดให้กับชุมชนด้านโอเพนซอร์ส ซึ่งสอดคล้องกับวิสัยทัศน์ของบริษัทในการพัฒนาซอฟต์แวร์ AI แบบโอเพนซอร์ส โดยซอฟต์แวร์ ROCm 6 แสดงให้เห็นถึงการก้าวกระโดดที่สำคัญในด้านเครื่องมือซอฟต์แวร์ของ AMD โดยสามารถเพิ่มประสิทธิภาพการเร่งความเร็วด้าน AI ประมาณ 8 เท่า เมื่อเทียบกับฮาร์ดแวร์และซอฟต์แวร์รุ่นก่อน[v] เมื่อรันบนกราฟิกการ์ด MI300 Series สำหรับสร้างข้อความบน Llama 2 นอกจากนี้ ROCm 6 ยังเพิ่มการรองรับฟีเจอร์ใหม่ ๆ มากมายสำหรับงานด้าน generative AI เช่น FlashAttention, HIPGraph และ vLLM และอื่น ๆ อีกมากมาย ดังนั้น AMD จึงอยู่ในตำแหน่งที่โดดเด่นสำหรับการใช้ประโยชน์จากซอฟต์แวร์โอเพนซอร์สด้านด้าน AI ทั้งจากโมเดล, อัลกอริทึม และเฟรมเวิร์กที่ใช้กันอย่างแพร่หลาย เช่น Hugging Face, PyTorch, TensorFlow และอื่น ๆ ซึ่งขับเคลื่อนการสร้างสรรค์นวัตกรรม, ลดความซับซ้อนในการปรับใช้โซลูชัน AMD AI และปลดล็อกศักยภาพที่แท้จริงของเทคโนโลยี generative AI

AMD ยังคงลงทุนในความสามารถด้านซอฟต์แวร์ต่าง ๆ ผ่านการเข้าซื้อ Nod.AI และ Mipsology รวมไปถึงความร่วมมือเชิงกลยุทธ์ทั้งกับ Lamini สำหรับการรันโมเดล LLM ให้กับลูกค้าองค์กร – และ MosaicML สำหรับการใช้ประโยชน์จาก AMD ROCm เพื่อเปิดใช้งานการเทรนนิ่งโมเดล LLM บนกราฟิกการ์ด AMD Instinct โดยที่ไม่ต้องเปลี่ยนแปลงโค้ดใด ๆ

Product Specifications

AMD Instinct™ Architecture GPU CUs CPU Cores Memory Memory Bandwidth

(Peak theoretical)

Process Node 3D Packaging w/ 4th Gen AMD Infinity Architecture
MI300A AMD CDNA™ 3 228 24 “Zen 4” 128GB HBM3 5.3 TB/s 5nm / 6nm Yes
MI300X AMD CDNA™ 3 304 N/A 192GB HBM3 5.3 TB/s 5nm / 6nm Yes
Platform AMD CDNA™ 3 2,432 N/A 1.5 TB HMB3 5.3 TB/s per OAM 5nm / 6nm Yes

Supporting Resources

 

ใส่ความเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *

ข้ามไปยังทูลบาร์