انویدیا تولید انبوه پلتفرم هوش مصنوعی قدرتمند Vera Rubin را آغاز کرد
بازدید 5
0

انویدیا تولید انبوه پلتفرم هوش مصنوعی قدرتمند Vera Rubin را آغاز کرد

انویدیا با ورود پلتفرم قدرتمند Vera Rubin به مرحله تولید انبوه، تمام شایعات مربوط به تأخیر در عرضه این محصول را رد کرد. Vera Rubin که عنوان «قدرتمندترین پلتفرم هوش مصنوعی ایجنت‌محور جهان» را به دوش می‌کشد، اکنون آماده استقرار در کارخانه‌های هوش مصنوعی است.

به گزارش Wccftech، کمتر از دو هفته پیش بود که انویدیا تولید انبوه پردازنده‌های مرکزی (CPU) سری Vera را آغاز کرد؛ اقدامی که پیش‌بینی می‌شود بازاری ۲۰۰ میلیارد دلاری را پیش روی این شرکت قرار دهد. مدیران انویدیا با اطمینان اعلام کرده‌اند که با تکیه بر تراشه‌های Vera، در سال جاری به بزرگ‌ترین تأمین‌کننده CPU در جهان تبدیل خواهند شد. اکنون با ورود کامل پلتفرم Vera Rubin NVL72 به فاز تولید، انویدیا هدف‌گذاری خود را روی تأمین انرژی کارخانه‌های هوش مصنوعی چند میلیارد دلاری و چند گیگاواتی در سراسر جهان متمرکز کرده است.

تولید انبوه پلتفرم هوش مصنوعی Vera Rubin انویدیا

پلتفرم Rubin انویدیا مجموعه‌ای از ۶ تراشه ‌پیشرفته است که همگی از کارخانه‌های تولید نیمه‌رسانا به آزمایشگاه‌های انویدیا برای تست نهایی منتقل شده‌اند. این تراشه‌ها عبارتند از:

  • پردازشگر گرافیکی Rubin GPU: با ۳۳۶ میلیارد ترانزیستور
  • پردازنده مرکزی Vera CPU: با ۲۲۷ میلیارد ترانزیستور
  • سوئیچ NVLINK 6: برای ارتباط داخلی قطعات
  • ماژول‌های CX9 و BF4: برای مدیریت شبکه
  • ماژول نوری Spectrum-X 102.4T CPO: برای فوتونیک سیلیکونی (انتقال داده با نور)
انویدیا تولید انبوه پلتفرم هوش مصنوعی Vera Rubin را آغاز کرد

این تراشه منحصراً برای پردازش‌های سنگین هوش مصنوعی طراحی شده است. Rubin GPU دارای دو قطعه سیلیکونی Reticle Die با تعداد زیادی هسته محاسباتی و هسته تنسور است. قدرت پردازشی این تراشه به شکل چشمگیری افزایش یافته است:

  • ۵۰ پتافلاپس (PFLOPs) عملکرد استنتاج با فرمت NVFP4 (۵ برابر قوی‌تر از نسل قبلی یعنی Blackwell)
  • ۳۵ پتافلاپس عملکرد آموزش مدل با فرمت NVFP4 (۳.۵ برابر قوی‌تر از Blackwell)
  • پهنای باند حافظه HBM4 تا ۲۲ ترابایت‌برثانیه (۲.۸ برابر سریع‌تر از Blackwell)
  • پهنای باند ارتباطی NVLink تا ۳.۶ ترابایت‌برثانیه به ازای هر CPU (۲ برابر سریع‌تر از Blackwell)
انویدیا تولید انبوه پلتفرم هوش مصنوعی Vera Rubin را آغاز کرد

برای بخش CPU، انویدیا از معماری سفارشی و نسل بعدی آرم با اسم رمز Olympus استفاده کرده است. مشخصات این غول پردازشی عبارتند از:

  • ۸۸ هسته فیزیکی و ۱۷۶ رشته با پشتیبانی از فناوری Spatial Multi-Threading
  • ۱.۸ ترابایت‌برثانیه پهنای باند حافظه یکپارچه (NVLink-C2C)
  • ۱.۵ ترابایت حافظه سیستم (۳ برابر بیشتر از پردازنده Grace)
  • ۱.۲ ترابایت‌برثانیه پهنای باند حافظه با استفاده از فناوری SOCAMM LPDDR5X
  • پشتیبانی از محاسبات محرمانه در سطح رک
انویدیا تولید انبوه پلتفرم هوش مصنوعی Vera Rubin را آغاز کرد

ترکیب این ویژگی‌ها باعث شده تا پردازنده Vera در پردازش داده‌ها، فشرده‌سازی و فرایندهای CI/CD عملکردی دو برابر بهتر از پردازنده نسل قبل (Grace) ارائه دهد.

ارتباطات درون‌سیستمی در پلتفرم Rubin برعهده سوئیچ‌های نسل ششم NVLink 6 است. این سوئیچ‌ها با طراحی مبتنی‌بر خنک‌کننده مایع، پهنای باند مجموعاً ۲۸.۸ ترابایت‌برثانیه و توان محاسباتی درون‌شبکه‌ای ۱۴.۴ ترافلاپس (با فرمت FP8) را فراهم می‌کنند.

انویدیا تولید انبوه پلتفرم هوش مصنوعی قدرتمند Vera Rubin را آغاز کرد

برای ارتباطات خارجی شبکه نیز از ماژول‌های ConnectX-9 و BlueField-4 استفاده می‌شود: ConnectX-9 SuperNIC پهنای باند ۱.۶ ترابایت‌برثانیه را با پروتکل RDMA ارائه می‌دهد و برای مقیاس‌های بزرگ هوش مصنوعی بهینه‌سازی شده است. BlueField-4 DPU نیز یک پردازنده ۸۰۰ گیگابیتی است که در واقع یک پردازنده ۶۴ هسته‌ای Grace را با ConnectX-9 ترکیب کرده و ظرفیت شبکه را نسبت به نسل قبل دو برابر می‌کند.

انویدیا تولید انبوه پلتفرم هوش مصنوعی قدرتمند Vera Rubin را آغاز کرد

علاوه‌براین، انویدیا از سیستم ارتباطی نوری جدید خود با نام Spectrum-X Ethernet Co-Packaged Optics رونمایی کرد. این فناوری از فوتونیک سیلیکونی ۲۰۰ گیگابیتی استفاده می‌کند. سیستم جدید ۵ برابر کارآمدتر، ۱۰ برابر قابل‌اعتمادتر و دارای ۵ برابر زمان اجرای برنامه بالاتر است.

انویدیا تولید انبوه پلتفرم هوش مصنوعی قدرتمند Vera Rubin را آغاز کرد

هنگامی که تمام این قطعات پیشرفته در قالب یک رک به نام NVIDIA Vera Rubin NVL72 فراهم می‌شوند، شاهد جهش خارق‌العاده‌ای نسبت به معماری نسل قبل (Blackwell) هستیم:

  • ۵ برابر عملکرد بهتر در استنتاج (۳.۶ اگزافلاپس)
  • ۳.۵ برابر عملکرد بهتر در آموزش مدل (۲.۵ اگزافلاپس)
  • ۲.۵ برابر ظرفیت بیشتر حافظه LPDDR5x (مجموعاً ۵۴ ترابایت)
  • ۱.۵ برابر ظرفیت بیشتر حافظه HBM4 (مجموعاً ۲۰.۷ ترابایت)
  • ۲.۸ برابر پهنای باند بیشتر حافظه (۱.۶ پتابایت بر ثانیه)
  • ۲ برابر پهنای باند ارتباطی Scale-Up بیشتر (۲۶۰ ترابایت بر ثانیه)

برای دیتاسنترهای بزرگ، انویدیا پلتفرم DGX SuperPOD را با ترکیب ۸ رک از مدل NVL72 ارائه می‌دهد. برای دیتاسنترهای متداول‌تر نیز مدل DGX Rubin NVL8 در نظر گرفته شده است. همچنین، پلتفرم ذخیره‌سازی Inference Context Memory Storage نیز برای مقیاس‌های گیگابایتی استنتاج معرفی شده که به‌طور کامل با نرم‌افزارهای انویدیا یکپارچه است.

درکل پلتفرم Vera Rubin به معنای واقعی کلمه هزینه‌ها را کاهش و سرعت را افزایش می‌دهد. به گفته انویدیا، استفاده از معماری Rubin در مقایسه با مدل قبلی (Blackwell GB200) باعث کاهش ۱۰ برابری هزینه تولید هر توکن در استنتاج و کاهش ۴ برابری در تعداد GPUهای مورد نیاز برای آموزش مدل‌های MoE می‌شود. هم‌اکنون بزرگ‌ترین سازندگان سرور جهان از جمله لنوو، دل، HPE، ایسوس، گیگابایت و فاکسکان درحال تولید انبوه این سیستم‌ها هستند و انتظار می‌رود اولین تراشه‌ها اواخر سال جاری میلادی به دست مشتریان برسند.

اشتراک گذاری

نظرات کاربران

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *