La red en la era de la IA: demanda, innovación y oportunidades de inversión
En los últimos años, con el surgimiento de grandes modelos, la red se ha convertido en un elemento clave de la era de la IA. Este artículo partirá de los principios para explorar por qué la red se ha convertido en la nueva "posición C" de la era de la IA, y discutirá las oportunidades de innovación e inversión en el lado de la red en el futuro.
1. ¿De dónde proviene la demanda de la red?
Entrando en la era de los grandes modelos, la brecha entre el tamaño del modelo y el límite de una sola tarjeta se ha ampliado rápidamente, y la industria se ha dirigido a clústeres de múltiples servidores para resolver los problemas de entrenamiento de modelos, lo que constituye la base de la "superioridad" de la red en la era de la IA. A diferencia del pasado, cuando la red se utilizaba únicamente para la transmisión de datos, hoy en día la red se utiliza más para sincronizar los parámetros del modelo entre las tarjetas gráficas, lo que plantea mayores exigencias en términos de densidad y capacidad de la red.
Bajo el creciente tamaño del modelo, el número de dispositivos y la eficiencia de paralelismo determinan directamente el tiempo necesario para el entrenamiento. En el proceso de sincronización de múltiples tarjetas, después de cada cálculo, es necesario alinear entre las tarjetas individuales, lo que plantea mayores exigencias para la transmisión y el intercambio de la red.
Al mismo tiempo, el entrenamiento de modelos grandes a menudo dura más de varios meses; una falla o alta latencia en un enlace de la red puede causar interrupciones, lo que genera altos costos. Las redes de IA modernas se han desarrollado hasta convertirse en un cristal de capacidades de ingeniería de sistemas humanos comparables a aviones, portaaviones y demás.
2. ¿Hacia dónde se dirigirá la innovación en la red?
A medida que la inversión en potencia de cálculo a nivel mundial se expande a cientos de miles de millones de dólares, el equilibrio entre la reducción de costos, la apertura y la escala de potencia de cálculo será el tema principal de la innovación en la red.
2.1 La evolución de los medios de comunicación
La luz, el cobre y el silicio son los tres grandes medios de transmisión de la humanidad. En la era de la IA, los módulos ópticos, al buscar tasas de velocidad más altas, también han comenzado el camino de reducción de costos como LPO, LRO y silicio fotónico. Los cables de cobre han dominado la conexión interna del armario gracias a su relación calidad-precio y baja tasa de fallos. Nuevas tecnologías semiconductoras como Chiplet y Wafer-scaling están acelerando la exploración de los límites de la interconexión basada en silicio.
2.2 Competencia de protocolos de red
Los protocolos de comunicación entre placas y su fuerte vinculación con las tarjetas gráficas, como NV-LINK de NVIDIA e Infinity Fabric de AMD, determinan el límite de capacidad de un solo servidor o nodo de cómputo. La competencia entre IB y Ethernet es el tema principal de la comunicación entre nodos.
2.3 Cambios en la arquitectura de la red
La arquitectura de red entre nodos en la actualidad generalmente adopta una arquitectura de hoja y espina, que tiene características de conveniencia, simplicidad y estabilidad. Sin embargo, a medida que aumenta el número de nodos en un solo clúster, la arquitectura de hoja y espina puede generar un alto costo de red para clústeres extremadamente grandes. Arquitecturas nuevas como Dragonfly y rail-only tienen el potencial de convertirse en la dirección de evolución para la próxima generación de clústeres extremadamente grandes.
3. Sugerencias de inversión
Componentes clave del sistema de comunicación: Zhongjixuchuang, Xinyisheng, Tianfu Communication, Hudian Co., Ltd.
Innovaciones en los sistemas de comunicación: Fiberhome, Zhongtian Technology, Hengtong Optic-Electric, Shengke Communication.
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
13 me gusta
Recompensa
13
7
Compartir
Comentar
0/400
OptionWhisperer
· 07-15 21:38
Esto realmente tiene un sabor auténtico.
Ver originalesResponder0
GigaBrainAnon
· 07-15 19:57
¡Fríelo!!!
Ver originalesResponder0
GasFeeCrier
· 07-12 22:14
¿No se puede ganar un poco de dinero?
Ver originalesResponder0
DancingCandles
· 07-12 22:13
El tráfico cuesta dinero, realmente es frustrante.
La demanda de redes en la era de la IA se dispara, surgen oportunidades de inversión en innovaciones de comunicación.
La red en la era de la IA: demanda, innovación y oportunidades de inversión
En los últimos años, con el surgimiento de grandes modelos, la red se ha convertido en un elemento clave de la era de la IA. Este artículo partirá de los principios para explorar por qué la red se ha convertido en la nueva "posición C" de la era de la IA, y discutirá las oportunidades de innovación e inversión en el lado de la red en el futuro.
1. ¿De dónde proviene la demanda de la red?
Entrando en la era de los grandes modelos, la brecha entre el tamaño del modelo y el límite de una sola tarjeta se ha ampliado rápidamente, y la industria se ha dirigido a clústeres de múltiples servidores para resolver los problemas de entrenamiento de modelos, lo que constituye la base de la "superioridad" de la red en la era de la IA. A diferencia del pasado, cuando la red se utilizaba únicamente para la transmisión de datos, hoy en día la red se utiliza más para sincronizar los parámetros del modelo entre las tarjetas gráficas, lo que plantea mayores exigencias en términos de densidad y capacidad de la red.
Bajo el creciente tamaño del modelo, el número de dispositivos y la eficiencia de paralelismo determinan directamente el tiempo necesario para el entrenamiento. En el proceso de sincronización de múltiples tarjetas, después de cada cálculo, es necesario alinear entre las tarjetas individuales, lo que plantea mayores exigencias para la transmisión y el intercambio de la red.
Al mismo tiempo, el entrenamiento de modelos grandes a menudo dura más de varios meses; una falla o alta latencia en un enlace de la red puede causar interrupciones, lo que genera altos costos. Las redes de IA modernas se han desarrollado hasta convertirse en un cristal de capacidades de ingeniería de sistemas humanos comparables a aviones, portaaviones y demás.
2. ¿Hacia dónde se dirigirá la innovación en la red?
A medida que la inversión en potencia de cálculo a nivel mundial se expande a cientos de miles de millones de dólares, el equilibrio entre la reducción de costos, la apertura y la escala de potencia de cálculo será el tema principal de la innovación en la red.
2.1 La evolución de los medios de comunicación
La luz, el cobre y el silicio son los tres grandes medios de transmisión de la humanidad. En la era de la IA, los módulos ópticos, al buscar tasas de velocidad más altas, también han comenzado el camino de reducción de costos como LPO, LRO y silicio fotónico. Los cables de cobre han dominado la conexión interna del armario gracias a su relación calidad-precio y baja tasa de fallos. Nuevas tecnologías semiconductoras como Chiplet y Wafer-scaling están acelerando la exploración de los límites de la interconexión basada en silicio.
2.2 Competencia de protocolos de red
Los protocolos de comunicación entre placas y su fuerte vinculación con las tarjetas gráficas, como NV-LINK de NVIDIA e Infinity Fabric de AMD, determinan el límite de capacidad de un solo servidor o nodo de cómputo. La competencia entre IB y Ethernet es el tema principal de la comunicación entre nodos.
2.3 Cambios en la arquitectura de la red
La arquitectura de red entre nodos en la actualidad generalmente adopta una arquitectura de hoja y espina, que tiene características de conveniencia, simplicidad y estabilidad. Sin embargo, a medida que aumenta el número de nodos en un solo clúster, la arquitectura de hoja y espina puede generar un alto costo de red para clústeres extremadamente grandes. Arquitecturas nuevas como Dragonfly y rail-only tienen el potencial de convertirse en la dirección de evolución para la próxima generación de clústeres extremadamente grandes.
3. Sugerencias de inversión
Componentes clave del sistema de comunicación: Zhongjixuchuang, Xinyisheng, Tianfu Communication, Hudian Co., Ltd.
Innovaciones en los sistemas de comunicación: Fiberhome, Zhongtian Technology, Hengtong Optic-Electric, Shengke Communication.
4. Advertencia de riesgos