Oracle เตรียมติดตั้งกราฟิกการ์ด AMD Instinct MI450 Series จำนวน 50,000 ตัว รองรับ AI Supercluster ยุคใหม่
Oracle และ AMD ได้ประกาศขยายความร่วมมือครั้งสำคัญ เพื่อช่วยให้ลูกค้าสามารถรองรับการทำงานด้าน AI ขนาดใหญ่แห่งยุคถัดไปได้
ประเด็นสำคัญ:
- Oracle Cloud Infrastructure (OCI) จะเป็นพาร์ทเนอร์รายแรกในการเปิดตัว AI Supercluster ที่ขับเคลื่อนด้วยกราฟิกการ์ด (GPU) AMD Instinct MI450 Series ซึ่งจะเปิดให้ใช้งานในวงกว้างเป็นครั้งแรก โดยจะเริ่มติดตั้งล็อตแรกจำนวน 50,000 ตัว ในไตรมาสที่ 3 ของปี 2569 และจะขยายเพิ่มเติมในปี 2570 และหลังจากนั้น นอกจากนี้ OCI AI Supercluster ในอนาคตจะขับเคลื่อนการประมวลผลผ่านแร็ค ‘Helios’ ของ AMD ซึ่งประกอบด้วยกราฟิกการ์ด AMD Instinct MI450 Series, โปรเซสเซอร์ EPYC รุ่นถัดไป (โค้ดเนม Venice) และระบบเครือข่าย Pensando (โค้ดเนม Vulcano) ที่ออกแบบมาโดยเฉพาะสำหรับโครงสร้างพื้นฐาน AI ขนาดใหญ่ที่มีประสิทธิภาพเด่นด้านการใช้พลังงานและเป็นแบบเปิด (Open)
- OCI ยังได้ประกาศการเปิดใช้งานอย่างเป็นทางการของ OCI Compute ที่มาพร้อมกราฟิกการ์ด AMD Instinct MI355X ซึ่งจะพร้อมให้บริการใน OCI Supercluster ระดับเซตตะสเกล (Zettascale) โดยสามารถขยายสเกลกราฟิกการ์ดได้ถึง 131,072 ตัว รูปแบบการให้บริการที่ขับเคลื่อนด้วย AMD Instinct MI355X นี้ ออกแบบมาให้มีความคุ้มค่าสูง, มีความยืดหยุ่นบนระบบคลาวด์ และใช้งานร่วมกันกับซอฟต์แวร์โอเพนซอร์สได้
- นอกจากนี้ Oracle Acceleron ซึ่งเป็นชุดโซลูชันเครือข่ายบนระบบคลาวด์ที่ได้รับการปรับปรุงของ OCI ได้เปิดตัวความสามารถใหม่ ๆ ซึ่งรวมถึง NIC แบบ Converged ที่ขับเคลื่อนด้วย AMD Pensando DPU มอบประสิทธิภาพการประมวลผลที่รวดเร็ว, ปลอดภัย และมีเสถียรภาพสูงสำหรับทุกเวิร์คโหลด
ทำไมเรื่องนี้จึงสำคัญ:
ในขณะที่ความต้องการใช้งาน AI พุ่งสูงขึ้นอย่างรวดเร็ว ลูกค้าต่าง ๆ ต้องการระบบประมวลผลที่เป็นแบบเปิดและมีความยืดหยุ่น เพื่อรองรับการขยายสเกลขนาดใหญ่ ความร่วมมือระหว่าง Oracle และ AMD ครั้งนี้ จะเป็นการส่งมอบโครงสร้างพื้นฐานคลาวด์ที่สามารถฝึกฝนและรันโมเดล AI ที่ใหญ่ที่สุดแห่งอนาคตได้อย่างมีประสิทธิภาพและปลอดภัย
AMD และ Meta เผยโฉม ‘Helios’ — แร็คสเกล AI รุ่นแรกที่สร้างบนมาตรฐาน Open Rack ใหม่ของ Meta
Meta ได้เปิดเผยข้อมูลทางเทคนิคของ Open Rack สำหรับงานด้าน AI ใหม่ ในชื่อ Open Rack Wide (ORW) ภายในงาน Open Compute Project (OCP) Global Summit ณ เมืองซานโฮเซ โดยใช้ ‘Helios’ ซึ่งเป็นระบบการอ้างอิงระดับแร็คที่ล้ำสมัยที่สุดของ AMD ที่สร้างขึ้นตามมาตรฐาน ORW อย่างเต็มรูปแบบ
แร็ค AI AMD Helios เป็นการนำแนวคิดเทคโนโลยี ORW ของ Meta มาใช้จริง ซึ่งเป็นระบบที่เข้ามาเปลี่ยนการออกแบบแบบเปิด (open design) ให้กลายเป็นนวัตกรรมที่ใช้งานได้จริง โดย “Helios” สร้างขึ้นบนขุมพลังกราฟิกการ์ด AMD Instinct™ MI450 Series รุ่นถัดไป เป็นนิยามใหม่ของโครงสร้างพื้นฐาน AI บนแร็คที่เป็นแบบเปิด
ทำไมเรื่องนี้จึงสำคัญ:
- Helios ถูกออกแบบมาสำหรับเวิร์คโหลด AI ระดับ Frontier (AI ที่ล้ำสมัยที่สุด) และ HPC โดยมอบประสิทธิภาพสูงสุดถึง 1.4 ExaFLOPS ในการประมวลผลแบบ FP8 และหน่วยความจำ HBM4 ขนาด 31 TB ภายในแร็คเดียว
- เป็นระบบ Rack-Scale รุ่นแรกของ AMD ที่ได้รับการออกแบบมาเพื่อตอบสนองความต้องการด้านพลังงาน, การระบายความร้อน และการทำงานร่วมกันของดาต้าเซ็นเตอร์ขนาดใหญ่สำหรับงานด้าน AI
- ด้วยการสร้างบนมาตรฐานแบบเปิด Helios ช่วยให้ผู้ให้บริการคลาวด์ขนาดใหญ่ (Hyperscalers) และองค์กรต่าง ๆ สามารถปลดล็อกตนเองให้เป็นอิสระจากโครงสร้างพื้นฐานที่เป็นกรรมสิทธิ์ของผู้ผลิตรายเดียว ซึ่งจะช่วยเร่งสร้างนวัตกรรม AI ทั่วทั้งระบบนิเวศ
ข้อกำหนด ORW ของ Meta ถือเป็นก้าวกระโดดครั้งสำคัญสู่อนาคตของโครงสร้างพื้นฐาน AI ที่เป็นมาตรฐานและทำงานร่วมกันได้ และ Helios ของ AMD ได้เปลี่ยนวิสัยทัศน์นั้นให้กลายเป็นความจริง — ตั้งแต่ระดับซิลิคอน, ระบบ ไปจนถึงระดับแร็ค — ทำให้กลุ่มผู้ผลิต (OEMs/ODMs) และลูกค้ามีแพลตฟอร์มที่พร้อมใช้งานจริง สำหรับการฝึกฝนโมเดล AI ระดับล้านล้านพารามิเตอร์ และ HPC ระดับเอ็กซะสเกล (Exascale)

