## تسخیر ابر توسط AMD Instinct MI300X
AMD Instinct MI300X یک شتاب دهنده هوش مصنوعی فوق العاده قدرتمند است که شرکت های بزرگ ابر از جمله Vultr و Oracle Cloud Infrastructure (OCI) آن را در زیرساخت خود برای پشتیبانی از بار کاری سنگین هوش مصنوعی ادغام کرده اند.
Vultr به تازگی اعلام کرده است که هزاران واحد MI300X سفارش داده است و حال Oracle Cloud Infrastructure (OCI) نیز این سخت افزار AMD را برای سرویس جدید خود، BM.GPU.MI300X.8، انتخاب کرده است.
این ابررایانه جدید برای مدل های عظیم هوش مصنوعی با میلیاردها پارامتر طراحی شده و از حداکثر 16,384 GPU در یک خوشه واحد پشتیبانی می کند. این تنظیم از همان فناوری پرسرعت دیگر شتاب دهنده های OCI استفاده می کند و امکان آموزش و استنباط هوش مصنوعی در مقیاس بزرگ را با ظرفیت حافظه و توان عملیاتی مورد نیاز برای چالش برانگیزترین وظایف فراهم می کند. این پیکربندی آن را به ویژه برای مدل های زبانی بزرگ (LLM) و عملیات پیچیده یادگیری عمیق مناسب می کند.
### آزمایش قبل از تولید
اندی دیکمن، معاون ارشد و مدیر کل بخش GPU مرکز داده AMD، میگوید: “AMD Instinct MI300X و نرم افزار منبع باز ROCm به عنوان راه حل های قابل اعتماد برای تامین انرژی برای حیاتی ترین بار کاری هوش مصنوعی OCI، به طور مداوم محبوبیت پیدا میکنند.” او در ادامه می افزاید: “با گسترش بیشتر این راه حل ها در بازارهای در حال رشد هوش مصنوعی، این ترکیب برای مشتریان OCI مزایایی مانند عملکرد بالا، کارایی و انعطاف پذیری بیشتر در طراحی سیستم به همراه خواهد داشت.”
Oracle میگوید که آزمایشهای MI300X به عنوان بخشی از تلاشهای پیش تولید، عملکرد GPU را در سناریوهای واقعی تایید کرده است. برای مدل 70B Llama 2، MI300X به تأخیر “زمان تا اولین نشانه” 65 میلی ثانیه دست یافت و به طور موثر برای تولید 3،643 نشانه در 256 درخواست همزمان کاربر مقیاس بندی شد. در آزمایش دیگری با 2،048 نشانه ورودی و 128 نشانه خروجی، تأخیر انتها به انتها 1.6 ثانیه را ارائه داد که به طور قابل توجهی با معیارهای AMD مطابقت دارد.
OCI BM.GPU.MI300X.8 دارای 8 شتاب دهنده AMD Instinct MI300X است که 1.5 ترابایت حافظه GPU HBM3 با پهنای باند 5.3 ترابایت بر ثانیه ارائه میدهد، در کنار 2 ترابایت حافظه سیستم و 8 x 3.84 ترابایت حافظه NVMe. Oracle این راه حل Bare-Metal را با قیمت 6 دلار برای هر GPU در ساعت ارائه خواهد داد.
دونالد لو، معاون ارشد توسعه نرم افزار در Oracle Cloud Infrastructure، میگوید: “توانایی های استنباط شتاب دهنده های AMD Instinct MI300X به انتخاب گسترده OCI از نمونه های Bare-Metal با کارایی بالا اضافه می شود تا سر بار محاسبات مجازی شده که معمولاً برای زیرساخت هوش مصنوعی استفاده می شود را حذف کند. ما از ارائه گزینه های بیشتر برای مشتریانی که به دنبال تسریع بار کاری هوش مصنوعی با قیمت رقابتی هستند، هیجان زده هستیم.”