## گوگل ابر تریلیوم، جدیدترین TPU خود را رونمایی کرد
گوگل ابر با رونمایی از TPU جدید خود، تریلیوم، ششمین نسل از تراشههای هوش مصنوعی اختصاصی خود را برای تقویت بار کاری هوش مصنوعی پیشرفته معرفی کرده است.
تریلیوم که در ماه می 2024 معرفی شد، برای مدیریت آموزش، تنظیم و استنباط مقیاس بزرگ با عملکرد و راندمان هزینه بهبود یافته طراحی شده است. این تراشه بخشی از زیرساخت Hypercomputer AI گوگل ابر است که TPUs، GPUs و CPUs را در کنار نرم افزارهای باز برای پاسخگویی به تقاضای رو به رشد هوش مصنوعی مولد ادغام میکند.
### تریلیوم: جهش قابل توجه در عملکرد
تریلیوم نسبت به نسل قبلی خود، TPU v5e، پیشرفت قابل توجهی داشته و 4 برابر افزایش در عملکرد آموزش و تا 3 برابر افزایش در سرعت پردازش استنباط را ارائه میدهد. این تراشه دو برابر ظرفیت HBM و دو برابر پهنای باند Interchip Interconnect (ICI) را ارائه میدهد که آن را به طور خاص برای مدلهای زبان بزرگ مانند Gemma 2 و Llama و همچنین برنامههای استنباط محاسباتی سنگین مانند Stable Diffusion XL مناسب میکند.
گوگل بر تمرکز تریلیوم بر راندمان انرژی نیز تأکید میکند و ادعا میکند که نسبت به نسلهای قبلی 67 درصد افزایش راندمان انرژی را ارائه میدهد.
### عملکرد بالا در تستهای مقایسهای
گوگل میگوید که TPU جدید خود در آزمایشهای مقایسهای عملکرد به طور قابل توجهی بهبود یافته را نشان داده است و 4 برابر افزایش در سرعت آموزش برای مدلهایی مانند Gemma 2-27b و Llama2-70B را ارائه میدهد. برای وظایف استنباط، تریلیوم نسبت به TPU v5e سه برابر سرعت پردازش بالاتری به دست آورد و به طور خاص در مدلهایی که به منابع محاسباتی گسترده نیاز دارند، از جمله مدلهای دیفیوژن مانند Stable Diffusion XL، عملکرد عالی را ارائه میدهد.
### مقیاس پذیری بالا برای کارهای AI گسترده
طبق گفته گوگل، مقیاسپذیری یکی دیگر از نقاط قوت تریلیوم است. این TPU میتواند تا 256 تراشه را در یک pod با پهنای باند بالا متصل کند، که تا هزاران تراشه در شبکه دادههای Jupiter گوگل قابل گسترش است و مقیاسپذیری تقریباً خطی را برای وظایف آموزش هوش مصنوعی گسترده ارائه میدهد. با استفاده از نرم افزار Multislice، تریلیوم عملکرد ثابت در صدها pod را حفظ میکند.
### VM های A3 Ultra با GPUهای Nvidia H200
در کنار رونمایی از تریلیوم، گوگل VMهای A3 Ultra را نیز معرفی کرد که GPU های Nvidia H200 Tensor Core را ارائه می دهند. این VM ها که برای پیش نمایش در ماه جاری برنامه ریزی شده اند، گزینه GPU با عملکرد بالا را برای مشتریان گوگل ابر در زیرساخت هوش مصنوعی این غول فناوری ارائه میدهند.