هوش مصنوعی مولد هاگینگ فیس (HUGS) ابزاری نوین برای استقرار و مقیاسبندی آسانتر برنامههای هوش مصنوعی مولد با استفاده از مدلهای متنباز ارائه میدهد. این پلتفرم با بهرهگیری از تکنولوژیهای پیشرفته هاگینگ فیس از جمله ترانسفورماتورها و سیستم استنتاج تولید متن (TGI)، عملکرد بهینهشدهای را بر روی شتابدهندههای سختافزاری مختلف ارائه میدهد.
دسترسی به این سرویس برای توسعهدهندگان در ابرهای آمازون (AWS) و گوگل (Google Cloud) با هزینه ۱ دلار در ساعت برای هر کانتینر و بههمراه آزمایشی رایگان پنجروزه در AWS فراهم شده است.
یکی از چالشهای اصلی در استقرار مدلهای زبانی بزرگ (LLM)، بهینهسازی آنها برای محیطهای سختافزاری خاص است. هر شتابدهنده، چه پردازنده گرافیکی انویدیا (NVIDIA GPU) و چه AMD، نیازمند تنظیمات دقیقی برای دستیابی به حداکثر کارایی است. اما HUGS این بهینهسازیها را بهطور خودکار انجام داده و بدون نیاز به پیکربندی دستی، سرعت پردازش بالایی را ارائه میدهد. پشتیبانی از پردازندههای انویدیا و AMD در حال حاضر وجود دارد و بهزودی از AWS Inferentia و Google TPUs نیز پشتیبانی خواهد شد.
هاگینگ فیس با هدف تسهیل انتقال از APIهای بسته به راهحلهای متنباز و خود میزبانی شده، از طیف وسیعی از مدلها، از جمله مدلهای زبانی بزرگ شناختهشده مانند Llama و Gemma پشتیبانی میکند. برنامههایی برای اضافه کردن مدلهای چندوجهی مانند Idefics و Llava نیز در آینده نزدیک وجود دارد. در آیندهای نزدیک، مدلهای تعبیه مانند BGE و Jina نیز به این مجموعه اضافه خواهند شد تا توسعهدهندگان گزینههای بیشتری برای شخصیسازی برنامههای هوش مصنوعی خود داشته باشند.
این سرویس از APIهای استاندارد سازگار با رابطهای مدل OpenAI استفاده میکند؛ بنابراین، توسعهدهندگان میتوانند کدهای خود را به راحتی منتقل کنند.
HUGS فرصتی ایدهآل برای استارتآپها برای ساخت برنامههای هوش مصنوعی بدون متحمل شدن هزینههای بالای پلتفرمهای اختصاصی ارائه میدهد. امکان استقرار با یک کلیک در DigitalOcean، آزمایش و استفاده از فناوریهای هوش مصنوعی مولد را برای تیمهای کوچک آسانتر میکند.
در عین حال، شرکتهای بزرگ میتوانند از HUGS برای مقیاسبندی برنامههای خود بدون وابستگی به یک ارائهدهنده ابر یا API اختصاصی استفاده کنند. در DigitalOcean، HUGS بدون هزینه اضافی فراتر از هزینه استاندارد GPU Droplets ارائه میشود. هاگینگ فیس همچنین از طریق Enterprise Hub خود، راهحلهای استقرار سفارشی برای شرکتها ارائه میدهد.