NVIDIA Rilis Protokol MRC untuk Optimalkan Pelatihan AI Skala Besar

Sedang Trending 1 jam yang lalu

NVIDIA resmi memperkenalkan protokol Multipath Reliable Connection (MRC) yang disematkan pada Spectrum-X Ethernet. Langkah ini menjadi standar baru untuk mendukung pelatihan model kecerdasan buatan (AI) berskala raksasa dengan mengutamakan aspek kecepatan dan ketahanan.

Dilansir dari Medcom, MRC merupakan protokol transport RDMA yang bertugas mendistribusikan lalu lintas data melalui berbagai jalur secara bersamaan. Pendekatan multipath ini memungkinkan sistem mempertahankan throughput tinggi sekaligus menyeimbangkan beban jaringan secara optimal.

Efisiensi menjadi keunggulan utama karena MRC mampu melakukan retransmisi cerdas apabila terjadi kehilangan data. Mekanisme ini meminimalkan waktu henti (downtime) dan memastikan sinkronisasi antar GPU tetap terjaga selama proses komputasi berat berlangsung.

Teknologi MRC telah melewati tahap pengujian dan kini diimplementasikan pada perangkat keras Spectrum-X Ethernet. NVIDIA juga membuka teknologi ini secara luas melalui Open Compute Project untuk mendorong standarisasi di ekosistem global.

Sejumlah raksasa teknologi seperti OpenAI, Microsoft, dan Oracle dilaporkan telah mulai mengadopsi MRC pada pusat data AI mereka. Penggunaan protokol ini terlihat di fasilitas Fairwater milik Microsoft serta fasilitas Abilene milik Oracle sebagai solusi kebutuhan komputasi yang kian kompleks.

Infrastruktur Spectrum-X juga menawarkan kemampuan bypass kegagalan pada level perangkat keras dalam hitungan mikrodetik. Hal ini memastikan lalu lintas data segera dialihkan tanpa mengganggu proses pelatihan model AI yang sedang berjalan.

Fleksibilitas dan Kolaborasi Ekosistem

Sistem ini dirancang dengan desain multiplane network yang mendukung fabric independen. Arsitektur tersebut memungkinkan skalabilitas jaringan hingga mencapai ratusan ribu GPU, yang disiapkan untuk menghadapi era AI generasi berikutnya.

Dukungan fleksibilitas tersedia melalui NVIDIA ConnectX SuperNICs dan switch Spectrum-X. Perusahaan dapat menyesuaikan kebutuhan jaringan mereka menggunakan berbagai model transport RDMA, mulai dari Adaptive RDMA hingga protokol kustom sesuai skenario masing-masing.

Pengembangan protokol MRC bukan merupakan proyek eksklusif NVIDIA, melainkan hasil kolaborasi dengan sejumlah mitra strategis. Nama-nama besar seperti AMD, Broadcom, Intel, Microsoft, dan OpenAI turut terlibat dalam pengembangan teknologi transport data tersebut.