شرکت AMD با معرفی کارت شبکه جدید خود به نام Pensando Pollara، اولین کارت شبکه ۴۰۰ گیگابیتی سازگار با استاندارد Ultra Ethernet را برای استفاده در خوشههای هوش مصنوعی با مقیاس زتابایتی معرفی کرد. این کارت شبکه قادر است سرعت انتقال داده را تا ۴۰ برابر سریعتر از کارتهای شبکه معمولی ارائه دهد.
چرا AMD به طراحی کارت شبکه ۴۰۰ گیگابیتی پرداخت؟
با گسترش سریع کاربردهای هوش مصنوعی و پردازشهای محاسباتی پیچیده، حجم دادههایی که بین شتابدهندههای گرافیکی در مراکز داده جابهجا میشود به حدی رسیده است که زیرساختهای شبکه سنتی قادر به پاسخگویی به آن نیستند. در این شرایط، برای رسیدن به عملکرد مطلوب، نیاز به پهنای باند بالا، تأخیر کم و مدیریت هوشمند ترافیک شبکه است.
بنابر گزارش Toms Hardware، AMD با استفاده از فناوری شرکت تابعه خود، Pensando، کارت شبکهای با سرعت انتقال ۴۰۰ گیگابیت بر ثانیه را توسعه داده است. این کارت که با نام Pensando Pollara 400GbE شناخته میشود، اولین کارت شبکهای است که به طور کامل با استاندارد Ultra Ethernet سازگار است. طراحی این کارت برای خوشههای محاسباتی عظیم در زمینههای AI و HPC (محاسبات با عملکرد بالا) انجام شده است.
این کارت شبکه (NIC) با استفاده از معماری پردازنده اختصاصی AMD Pensando، بهعنوان یک بخش کلیدی در استقرار خوشههای هوش مصنوعی و محاسبات پیچیده در مقیاس زتابایت معرفی شده و توانایی انتقال داده با سرعت ۴۰ برابر سریعتر از کارتهای مصرفی را در شبکههای اترنت ارائه میدهد.
این نوآوری نشاندهنده اهمیت AMD در پاسخ به چالشهای فنی شبکههای دادهمحور در عصر هوش مصنوعی و پردازشهای مقیاسپذیر است.
طراحی پیشرفته برای شبکههای مقیاس میلیونواحدی
کارت شبکه Pollara 400GbE که توسط AMD توسعه داده شده، با استفاده از یک پردازنده اختصاصی و معماری بومی طراحی شده که توانایی پردازش وظایف حیاتی شبکهای را در سطح سختافزار فراهم میآورد. این ویژگیها باعث میشود که عملکرد این کارت در خوشههای هوش مصنوعی با مقیاس بزرگ بهویژه در پردازشهای موازی، بهینه و موثر باشد. از جمله ویژگیهای برجسته این کارت میتوان به موارد زیر اشاره کرد:
-
دسترسی مستقیم به حافظه از راه دور (RDMA): این ویژگی اجازه میدهد که دادهها مستقیماً بین دستگاهها و حافظهها بدون نیاز به پردازش اضافی از طریق CPU انتقال یابند، که نتیجه آن کاهش تأخیر و افزایش کارایی است.
-
پشتیبانی از پروتکلهای حمل سفارشیشونده: این امکان به کاربران اجازه میدهد که پروتکلهای ارتباطی را بر اساس نیازهای خاص خود تنظیم کنند، که این امر در محیطهای پیچیده و نیازمند بهینهسازی عملکرد بسیار اهمیت دارد.
-
برونسپاری عملکرد کتابخانههای ارتباطی (Communication Offloading): با این قابلیت، بخشی از پردازشهای شبکهای به سختافزار انتقال مییابد، که موجب کاهش بار پردازشی روی CPU و افزایش کارایی سیستمهای هوش مصنوعی میشود.
علاوه بر این، طراحی انعطافپذیر این کارت شبکه به آن اجازه میدهد تا بهطور مؤثری در خوشههای هوش مصنوعی متشکل از صدها هزار GPU نصب و استفاده شود. این ویژگی باعث میشود که کارت Pollara 400GbE برای پروژههای محاسباتی عظیم و کاربردهای هوش مصنوعی در مقیاس بزرگ گزینهای مناسب باشد.
بهینهسازی مسیریابی و مدیریت ترافیک در مقیاس ابر
کارت شبکه Pollara 400GbE با بهرهگیری از فناوریهای پیشرفته، امکان بهینهسازی مسیریابی و مدیریت ترافیک را در مقیاس ابر فراهم میکند. یکی از ویژگیهای برجسته این کارت، توزیع هوشمند جریان داده (Flow Splitting) است. این قابلیت به کارت اجازه میدهد که دادهها را بهصورت پویا و بهطور همزمان از چندین مسیر انتقال دهد تا از ایجاد گلوگاههای پهنای باند جلوگیری کند. این روش بهویژه در محیطهای مقیاسپذیر مانند خوشههای هوش مصنوعی و HPC اهمیت زیادی دارد، زیرا میتواند تضمین کند که نرخ انتقال دادهها در شرایط مختلف شبکه ثابت بماند.
علاوه بر این، فناوری مسیریابی مجدد پویای ترافیک این کارت قادر است مسیرهای اشباعشده را شناسایی کرده و ترافیک را به مسیرهای کمبارتر هدایت کند. این ویژگی به حفظ نرخ انتقال پایدار و کاهش تأخیر در ارتباطات بین GPUها کمک میکند، که در محیطهای پردازشی پیچیده و با نیازهای بالای پهنای باند بسیار حائز اهمیت است.
در ضمن، یکی دیگر از ویژگیهای حیاتی این کارت، فناوری Failover با تأخیر بسیار کم است. این فناوری بهگونهای طراحی شده که در صورت بروز خطا یا مشکلات در اتصال، بتواند ارتباط بین GPUها را بدون اختلال محسوس و با تأخیر حداقلی حفظ کند. این ویژگی برای محیطهای با تعداد زیادی شتابدهنده، که نیاز به اطمینان از پایداری و اتصال بدون وقفه دارند، ضروری است.
برتری عددی نسبت به رقبا: مقایسه با CX7 و Thor2
AMD همچنین به عملکرد بالای کارت Pollara 400GbE در مقایسه با رقبا اشاره کرده است. طبق ادعای شرکت، عملکرد RDMA این کارت حدود ۱۰ درصد بهتر از کارت CX7 انویدیا و ۲۰ درصد برتر از کارت Thor2 برادکام است. RDMA یا «دسترسی مستقیم به حافظه از راه دور» فناوریای است که امکان انتقال دادهها با کمترین تأخیر و بدون استفاده از پردازنده را فراهم میآورد. این ویژگی باعث میشود که کارت Pollara 400GbE نسبت به سایر کارتهای مشابه در بازار، عملکرد بهتری در محیطهای نیازمند به سرعت بالا و تأخیر کم از خود نشان دهد.
افزایش عملکرد با پشتیبانی از ویژگیهای استاندارد Ultra Ethernet 1.0
عملکرد فوقالعاده کارت Pollara 400GbE بهواسطه پشتیبانی کامل از مشخصههای استاندارد Ultra Ethernet 1.0 تحقق یافته است. این ویژگیها شامل تکنیکهای نوآورانهای هستند که بهطور قابل توجهی عملکرد شبکه را در مقیاسهای بزرگ و پیچیده بهبود میبخشند. از جمله این ویژگیها میتوان به موارد زیر اشاره کرد:
-
تعادل بار تطبیقی (Load-Aware Balancing): این فناوری باعث میشود که ترافیک دادهها بهطور هوشمندانه بین مسیرهای مختلف توزیع شود تا از اشباع منابع جلوگیری کرده و عملکرد کلی شبکه بهینه گردد.
-
بازارسال انتخابی بستهها (Selective Retransmission): این ویژگی اجازه میدهد که فقط بستههای از دست رفته یا آسیب دیده دوباره ارسال شوند، که موجب کاهش ترافیک اضافی و بهبود سرعت انتقال دادهها میشود.
-
کنترل تراکم مبتنی بر آگاهی از مسیر (Path-Aware Congestion Control): این فناوری قادر است مسیرهای با ترافیک زیاد را شناسایی کرده و بهطور پویا ترافیک را به مسیرهای کمبارتر هدایت کند، که در نهایت به کاهش تأخیر و بهبود کارایی کلی شبکه کمک میکند.
مجموع این ویژگیها باعث شدهاند که کارت Pollara 400GbE بهویژه در توپولوژیهای چندمسیره، عملکرد RDMA را تا ۲۵ درصد بهبود دهد. در مقایسه با فناوری سنتی RoCEv2، این بهبود عملکرد در برنامههای پیچیده و نیازمند سرعت بالا، تفاوت چشمگیری را ایجاد میکند.
اولین مشتری: اوراکل
در رویداد Advancing AI، شرکت AMD اعلام کرد که زیرساخت ابری Oracle Cloud Infrastructure (OCI) نخستین شرکت ابری خواهد بود که از این کارت شبکه و همچنین نسل جدید شتابدهندههای گرافیکی Instinct MI350X بهرهبرداری خواهد کرد. بهویژه، این زیرساخت قرار است میزبان بزرگترین خوشه GPU محور AMD تا امروز باشد که شامل ۱۳۱,۰۷۲ عدد MI355X خواهد بود و برای استقرار مدلهای عظیم هوش مصنوعی طراحی شده است.
آماده برای نسل جدید مدلهای AI در مقیاس عظیم
امروزه مدلهایی مانند GPT-5 و Gemini برای عملکرد بهینه نیاز به منابع پردازشی عظیم و زیرساخت شبکهای با تأخیر پایین دارند. در این راستا، AMD با معرفی Pollara 400GbE و پشتیبانی کامل از استاندارد Ultra Ethernet گامی استراتژیک در رقابت با شرکتهای بزرگی همچون انویدیا و برادکام برداشته است. این کارت شبکه بهویژه در پروژههای هوش مصنوعی مقیاسپذیر، که نیاز به زیرساختهای قدرتمند و با تأخیر کم دارند، از اهمیت ویژهای برخوردار است.
با استقرار این کارت در پلتفرم اوراکل و سایر شرکتهای بزرگ، به نظر میرسد که تجهیزات شبکه مبتنی بر Ultra Ethernet بهسرعت در مراکز دادههای AI و HPC رواج خواهند یافت. طبق اعلام رسمی، ارسال این کارتها به شرکای منتخب آغاز شده و پیشبینی میشود که این فناوری بهزودی در مقیاس وسیعتر در مراکز داده جهانی گسترش یابد.






