Costruire una rete ottica flessibile per cluster di potenza di elaborazione AI

Apr 08, 2026

Lasciate un messaggio

Routing fisicamente resiliente basato su Shuffle deterministico

Man mano che i cluster AI continuano a crescere e i data center si espandono a un ritmo accelerato, l’architettura di rete è naturalmente andata oltre i progetti tradizionali. Le topologie Leaf-Spine e Dragonfly stanno diventando la norma. Sulla carta sembrano efficienti e moderni. In pratica, tuttavia, i team operativi spesso affrontano una realtà diversa-ciò che realmente causa problemi non è la topologia in sé, ma l'enorme volume dei cavi di connessione. Una volta che si hanno a che fare con migliaia di connessioni, la gestione diventa rapidamente ingombrante. E quando un singolo punto fallisce, può far crollare un intero collegamento. Questo tipo di rischio è difficile da ignorare.

 

È qui che l’idea alla base di Infinity Shuffle OXC inizia ad avere senso. Invece di seguire il modello convenzionale-a-punto-in cui un singolo percorso trasporta tutto-, suddivide i canali ad alta-velocità e li distribuisce su più percorsi Spine a livello fisico. In termini semplici, evita di mettere tutte le uova nello stesso paniere. Quando si verifica un guasto, il sistema non collassa del tutto; funziona semplicemente con una capacità leggermente ridotta e i servizi continuano a funzionare.

 

Prendiamo come esempio una connessione 1.6T. È diviso in otto canali 200G indipendenti, ciascuno instradato attraverso un percorso diverso. Se un modulo o una fibra si guasta, viene interessata solo una frazione della larghezza di banda-circa il 12,5%-. Per i carichi di lavoro di addestramento dell'intelligenza artificiale, questo tipo di degrado è generalmente gestibile. Un leggero rallentamento è di gran lunga preferibile a un’interruzione completa.

 

Dal punto di vista operativo, ciò cambia anche il ritmo della manutenzione. I componenti difettosi non richiedono più un intervento urgente durante la notte. Possono essere gestiti durante le finestre di manutenzione programmata, il che è molto più sostenibile in ambienti su larga-scala. Allo stesso tempo, la riduzione dei moduli ottici semplifica il sistema complessivo, migliorandone la stabilità anziché complicarlo. In molti modi, questo approccio distribuito sembra più vicino alla logica-ingegneria del mondo reale che alla perfezione teorica.

 

A livello fisico, la soluzione utilizza un design shuffle di fibra pre-terminato ad alta-densità, mantenendo la perdita di inserzione a circa 0,05 dB. È progettato per supportare reti 400G, 800G e 1.6T con un budget ottico sufficiente, mantenendo l'inclinazione e l'isolamento dei canali in linea con gli standard IEEE 802.3. Non c'è nulla di eccessivamente appariscente in questo,-ma è pratico, coerente e costruito per resistere su larga scala.

 

Quattro dimensioni principali progettate per i requisiti di intelligenza artificiale su vasta scala

1. Integrazione perfetta dell'ecosistema e topologie di distribuzione flessibili

640 640 1

Infinity Shuffle OXC si integra direttamente con i quadri di distribuzione della serie GPX (GPX51, GPX58, GPX59, GPX61, GPX62, GPX70) senza richiedere scatole adattatrici di terze-parti. Supporta nativamente i connettori MPO/MTP®, MMC, SN-MT, nonché la connettività diretta in fibra nuda.

Sono disponibili due topologie di distribuzione:

Riproduzione casuale in linea: le connessioni del dorso entrano dalla parte posteriore (tipicamente allineate con gli interruttori del dorso del-del-rack), mentre le connessioni Leaf escono dalla parte anteriore. Questa configurazione supporta sia design basati su cassette modulari-che formati di pannelli completi 1RU/2RU. Consente una chiara separazione dei corridoi caldo/freddo e garantisce un instradamento deterministico dei cavi dalla parte posteriore-a-anteriore.

Mescolamento laterale-a-laterale: Tutti i collegamenti degli interruttori Spine sono consolidati sul lato sinistro del telaio o del pannello, mentre i collegamenti degli interruttori Leaf escono da destra. Questo layout è particolarmente adatto per i frame di distribuzione della fibra (FDF) centralizzati, dove la gestione dei cavi orizzontali tra le zone Spine e Leaf deve essere ridotta al minimo.

Entrambe le topologie supportano connessioni seriali ad accesso posteriore-e interconnessioni parallele ad accesso-frontale, migliorando significativamente l'utilizzo dello spazio rack e adattandosi alle diverse architetture di cablaggio dei data center.

 

2. Ottimizzazione dei costi e mitigazione del rischio

Da un punto di vista economico, l’integrazione ai livelli 400G, 800G e 1.6T riduce il numero di switch richiesti da 24 a 8 e i moduli ottici da 1280 a 320. Ciò riduce direttamente il consumo energetico e le spese in conto capitale, con un risparmio sui costi totali che arriva fino al 40%.

Dal punto di vista del rischio, i tradizionali sistemi in fibra in bundle introducono singoli punti di guasto-ad esempio, il danno a un singolo trunk MPO-16 può comportare immediatamente la perdita di un collegamento completo da 1,6 T. Al contrario, l'architettura Shuffle distribuisce la stessa capacità di 1,6 T su otto percorsi fisici indipendenti. Statisticamente, i guasti sono isolati ai singoli canali, limitando l'impatto a 1/8 della larghezza di banda totale. I cluster di addestramento AI possono continuare a funzionare a circa l’87,5% della capacità mantenendo la connettività RDMA, evitando eventi di riconvergenza di rete su larga scala.

 

3. Produzione-di precisione di livello industriale

Ogni unità OXC viene prodotta su linee di produzione automatizzate, che incorporano il taglio del substrato (±0,5 mm), l'instradamento della fibra bionica (±0,1 mm) e l'erogazione di precisione (±0,5 mm).

Il design del routing bionico garantisce un rigoroso isolamento fisico dei canali-prevenendo la diafonia tra gli otto canali 200G all'interno di un collegamento 1.6T-mantenendo allo stesso tempo la stessa lunghezza delle fibre per eliminare la distorsione del segnale. Tutte le unità sono sottoposte a una convalida ottica completa prima della consegna, eliminando il rischio di errori di terminazione sul campo ed evitando problemi di squilibrio del canale associati alla segnalazione PAM4 ad alta-velocità.

 

4. Conformità agli standard internazionali

Infinity Shuffle OXC è conforme ai principali standard internazionali, tra cui Telcordia GR-63, GR-1435 (MPO), IEC 61300, IEC 61753-1 e IEC 61754-7 / TIA-604-5.

Il circuito ottico flessibile utilizza un substrato di pellicola di poliimmide con rivestimento protettivo conforme, supportando dimensioni massime fino a 1000 mm × 800 mm. Un design a-livello singolo può ospitare più di 1200 core in fibra, soddisfacendo i requisiti di densità delle implementazioni su vasta scala.

 

5. Integrità del segnale multicanale-

Il substrato supporta fibra a nastro da 250 μm, fibra monomodale-da 200 μm (G657.A1/A2) e fibra da 180 μm di prossima-generazione.

Le prestazioni ottiche sono strettamente controllate, con una perdita di inserzione tipica inferiore o uguale a 0,12 dB (alta-qualità UPC/APC), corrispondenza casuale del 97% inferiore o uguale a 0,25 dB e perdita di ritorno maggiore o uguale a 65 dB (APC) e maggiore o uguale a 60 dB (UPC). Ciò garantisce una distribuzione uniforme delle perdite su tutti gli otto canali in un collegamento da 1,6 T, soddisfacendo i requisiti di calibrazione FEC KP4 e mantenendo l'efficienza energetica su larga scala.

Non ti sono rimaste abbastanza parole sull'Umanizzatore. Aggiorna il tuo piano Surfer.

 

Perfettamente allineato con tre scenari applicativi principali

640

1. Ottimizzazione del dorso della foglia-con una maggiore affidabilità del dorso

Nei cluster di addestramento AI, Infinity Shuffle OXC consente il cross-routing deterministico tra i livelli Spine e Leaf. Quando distribuito in una configurazione Inline Shuffle seriale-connessioni Spine che entrano dalla parte posteriore e connessioni Leaf che escono dalla parte anteriore-crea una struttura pulita di corridoi caldo/freddo e un layout di cablaggio prevedibile.

Questo design si allinea naturalmente con le architetture snelle della Spine. Un collegamento 1.6T è fisicamente distribuito su otto switch Spine. Se uno switch Spine-ad esempio, Spine #3 richiede manutenzione, solo un singolo canale da 200G (12,5% della larghezza di banda totale) viene reindirizzato tramite ECMP a un percorso equivalente. La capacità rimanente continua a funzionare, consentendo ai carichi di lavoro di formazione di sostenere un throughput di circa 1,4 tonnellate senza interruzioni. La manutenzione può procedere senza incidere sui servizi principali.

 

2. Semplificazione delle topologie Dragonfly attraverso la distribuzione dei livelli-fisici

Negli ambienti-di calcolo ad alte prestazioni (HPC) con decine di migliaia di nodi, le tradizionali topologie full-mesh di Dragonfly richiedono complessi cablaggi intra-gruppo. Con Infinity Shuffle OXC, il mescolamento ottico tra i gruppi viene completato a livello di fabbrica, riducendo significativamente la complessità in loco.

Quando implementate in un frame di distribuzione in fibra centralizzato utilizzando una topologia Shuffle parallela, le connessioni Spine vengono consolidate sul lato sinistro mentre le connessioni Leaf vengono instradate da destra. Ciò crea una chiara separazione fisica tra i livelli di rete. Il routing deterministico garantisce che all'interno di un singolo collegamento 1.6T, tutti gli otto canali 200G seguano percorsi fisici indipendenti-tra diversi switch, fibre e connettori-eliminando di fatto i rischi di guasto correlati associati ai collegamenti trunk in bundle.

 

3. Futuro-Pronto per 800G e oltre

Man mano che la larghezza di banda della rete evolve verso 1,6 T e 3,2 T (8 × 200 G o 8 × 400 G), il valore di resilienza delle architetture Shuffle diventa ancora più pronunciato. In un'implementazione 3.2T distribuita su switch Spine (16 × 200G), un guasto di un singolo canale comporta solo una riduzione della larghezza di banda del 6,25%.

Una volta implementata l'infrastruttura ottica Shuffle, gli aggiornamenti futuri richiedono solo la sostituzione del modulo ottico, senza modifiche al livello fisico. Il substrato supporta nativamente le fibre ultrafini da 180 μm di prossima-generazione-, garantendo la compatibilità con tutte le future tecnologie-ottiche. Con l'-aumento della velocità dei dati per canale-insieme al consumo energetico e alla probabilità di guasto-questa architettura fornisce una base stabile, assorbendo efficacemente il rischio più elevato associato a 800G e oltre, mantenendo al tempo stesso un servizio ininterrotto.

 

Dalla complessità manuale all’affidabilità deterministica

Il concetto di "Shuffle" non riguarda la casualità. Si tratta di una distribuzione deterministica di canali ad alta-velocità attraverso connessioni Spine fisicamente indipendenti. Le operazioni tradizionali si basano sulla gestione manuale di migliaia di collegamenti in fibra-un approccio inefficiente e soggetto a errori-. Al contrario, questa architettura ristruttura la connettività a livello fisico, migliorando sia la chiarezza operativa che l’affidabilità del sistema.

Distribuendo uniformemente otto canali da 200G su otto switch Spine, il sistema garantisce che i guasti-sia nei moduli ottici, nelle fibre o negli switch-rimangano eventi isolati anziché interruzioni sistemiche. Ciò impedisce sostanzialmente interruzioni su larga scala-nelle reti ottiche-guidate dall'intelligenza artificiale.

 

Che si tratti di ottimizzare le architetture Leaf-Spine con un livello Spine più snello, di semplificare le implementazioni Dragonfly tramite cablaggio strutturato o di prepararsi per la futura scalabilità 1.6T/3.2T con-tolleranza agli errori incorporata, Infinity Shuffle OXC fornisce una base di cablaggio ad alta-efficienza, alta-affidabilità e costi-economici per data center iperscalabili-garantendo che i carichi di lavoro di elaborazione rimanere ininterrotto dai vincoli dell'infrastruttura ottica.

 

Invia la tua richiesta