Oportunidades y desafíos de la fusión de la IA y Web3: una innovación de pila completa desde los datos hasta la Potencia computacional

AI+Web3: Torres y plazas

TL;DR

  1. Los proyectos Web3 con conceptos de IA se han convertido en objetivos de captación de capital en los mercados primario y secundario.

  2. Las oportunidades de Web3 en la industria de la IA se reflejan en: el uso de incentivos distribuidos para coordinar el suministro potencial en la larga cola, a través de datos, almacenamiento y computación; al mismo tiempo que se construyen modelos de código abierto y un mercado descentralizado para Agentes de IA.

  3. La IA se utiliza principalmente en la industria Web3 para finanzas en cadena (pagos en criptomonedas, transacciones, análisis de datos) y para ayudar en el desarrollo.

  4. La utilidad de AI+Web3 se refleja en la complementariedad de ambos: Web3 espera contrarrestar la centralización de AI, y AI espera ayudar a Web3 a romper barreras.

AI+Web3: Torres y Plazas

Introducción

En los últimos dos años, el desarrollo de la IA ha parecido presionar un botón de aceleración. Esta ola iniciada por Chatgpt no solo ha abierto un nuevo mundo de inteligencia artificial generativa, sino que también ha causado un gran revuelo en el ámbito de Web3.

Con el respaldo del concepto de IA, la financiación en el mercado de criptomonedas, que se había desacelerado, claramente se ha revitalizado. Solo en la primera mitad de 2024, 64 proyectos de Web3+IA completaron financiamiento, y el sistema operativo basado en inteligencia artificial Zyber365 logró un monto de financiamiento récord de 100 millones de dólares en su ronda A.

El mercado secundario es más próspero. Según los datos de Coingecko, en poco más de un año, la capitalización total del mercado de la pista de IA ha alcanzado los 48.5 mil millones de dólares, con un volumen de negociación en 24 horas cercano a los 8.6 mil millones de dólares. Los beneficios traídos por los avances en las tecnologías de IA son evidentes; después del lanzamiento del modelo de OpenAI Sora para convertir texto en video, el precio promedio del sector de IA aumentó un 151%. El efecto de la IA también se ha extendido a uno de los segmentos más lucrativos de las criptomonedas, los Memes: el primer concepto de MemeCoin de Agente de IA —GOAT— se volvió popular rápidamente y alcanzó una valoración de 1.4 mil millones de dólares, logrando encender la fiebre de los Memes de IA.

La investigación y los temas sobre AI+Web3 también están en auge, desde AI+Depin hasta AI Memecoin y ahora los AI Agent y AI DAO; la emoción de FOMO ya no puede seguir el ritmo de la rotación de nuevas narrativas.

AI+Web3, esta combinación de términos llena de dinero caliente, oportunidades y fantasías futuras, inevitablemente se ve como un matrimonio arreglado por el capital. Parece que es difícil distinguir, bajo esta lujosa túnica, si es el terreno de los especuladores o la víspera de una explosión al amanecer.

Para responder a esta pregunta, una reflexión clave para ambas partes es: ¿se volverá mejor con la otra parte? ¿Se puede beneficiar de los patrones del otro? En este artículo, intentamos examinar este patrón desde la perspectiva de quienes nos precedieron: ¿cómo puede Web3 desempeñar un papel en cada etapa de la pila de tecnología de IA, y qué nueva vitalidad puede aportar la IA a Web3?

Parte 1 ¿Qué oportunidades hay en Web3 bajo la pila de IA?

Antes de abordar este tema, necesitamos entender la pila tecnológica de los modelos de IA a gran escala:

Usando un lenguaje más accesible para describir el proceso completo: el "gran modelo" es como el cerebro humano. En las etapas tempranas, este cerebro pertenece a un bebé recién llegado al mundo, que necesita observar e introducir una gran cantidad de información del entorno para entender este mundo; esta es la fase de "recolección" de datos. Dado que las computadoras no tienen múltiples sentidos como la visión y la audición humanas, antes del entrenamiento, la gran cantidad de información no etiquetada del exterior debe ser transformada a través de "preprocesamiento" en un formato de información que la computadora pueda entender y utilizar.

Después de ingresar los datos, la IA construyó un modelo con capacidad de comprensión y predicción a través del "entrenamiento", lo que se puede ver como el proceso en el que un bebé gradualmente entiende y aprende sobre el mundo exterior. Los parámetros del modelo son como la capacidad lingüística que el bebé ajusta constantemente a lo largo de su aprendizaje. Cuando el contenido de aprendizaje comienza a dividirse en disciplinas, o se recibe retroalimentación al comunicarse con otros y se realizan correcciones, se entra en la etapa de "ajuste fino" del gran modelo.

A medida que los niños crecen y aprenden a hablar, pueden entender el significado y expresar sus sentimientos e ideas en nuevas conversaciones. Esta etapa es similar a la "razonamiento" de los grandes modelos de IA, donde el modelo puede predecir y analizar nuevas entradas de lenguaje y texto. Los bebés expresan sus sentimientos, describen objetos y resuelven diversos problemas a través de sus habilidades lingüísticas, lo cual también es similar a cómo los grandes modelos de IA se aplican en la etapa de razonamiento a diversas tareas específicas, como la clasificación de imágenes y el reconocimiento de voz, después de completar su entrenamiento.

Y el Agente de IA se acerca más a la próxima forma de los grandes modelos: capaz de ejecutar tareas de manera independiente y perseguir objetivos complejos, no solo tiene capacidad de pensamiento, sino que también puede recordar, planificar y utilizar herramientas para interactuar con el mundo.

Actualmente, en respuesta a los puntos críticos de la IA en diferentes pilas, Web3 ha comenzado a formar un ecosistema interconectado y de múltiples niveles que abarca todas las etapas del proceso de modelos de IA.

AI+Web3: Torres y Plaza

Uno, Capa Básica: Airbnb de Poder de Cálculo y Datos

Potencia de cálculo

Actualmente, uno de los costos más altos de la IA es la potencia de cálculo y la energía necesarias para entrenar y razonar modelos.

Un ejemplo es que el LLAMA3 de Meta necesita 16,000 GPU H100 producidas por NVIDIA (una unidad de procesamiento gráfico de primer nivel diseñada específicamente para cargas de trabajo de inteligencia artificial y computación de alto rendimiento) durante 30 días para completar el entrenamiento. El precio por unidad de la versión de 80 GB está entre 30,000 y 40,000 dólares, lo que requiere una inversión en hardware de computación de entre 400 y 700 millones de dólares (GPU + chips de red), al mismo tiempo que el entrenamiento mensual consume 1,600 millones de kilovatios hora, con un gasto energético mensual cercano a 20 millones de dólares.

La descompresión de la potencia de cálculo de la IA es también uno de los primeros campos donde Web3 se cruza con la IA: DePin (red de infraestructura física descentralizada). Actualmente, el sitio de datos DePin Ninja ha presentado más de 1400 proyectos, entre los cuales los proyectos representativos de compartición de potencia de GPU incluyen io.net, Aethir, Akash, Render Network, entre otros.

Su lógica principal radica en que la plataforma permite a personas o entidades que poseen recursos de GPU ociosos contribuir con su capacidad de cálculo de manera descentralizada y sin necesidad de permiso. A través de un mercado en línea similar al de Uber o Airbnb, se mejora la utilización de los recursos de GPU que no se están utilizando plenamente, y los usuarios finales también obtienen recursos de cálculo eficientes a un costo más bajo. Al mismo tiempo, el mecanismo de staking asegura que si se produce una violación de los mecanismos de control de calidad o interrupciones en la red, los proveedores de recursos enfrentan las correspondientes sanciones.

Sus características son:

  • Reunir recursos GPU ociosos: los proveedores son principalmente centros de datos independientes pequeños y medianos de terceros, operadores de granjas mineras de criptomonedas y otros recursos de potencia de cálculo excedente, utilizando hardware de minería con mecanismo de consenso PoS, como FileCoin y máquinas mineras de ETH. Actualmente, también hay proyectos dedicados a iniciar dispositivos con un umbral de entrada más bajo, como exolab, que utiliza MacBook, iPhone, iPad y otros dispositivos locales para establecer una red de potencia de cálculo que ejecute inferencias de grandes modelos.

  • Enfrentando el mercado de cola larga del poder de cálculo de IA:

a. "Desde el punto de vista técnico", el mercado de potencia de cálculo descentralizada es más adecuado para los pasos de inferencia. El entrenamiento depende más de la capacidad de procesamiento de datos proporcionada por los GPU de gran escala, mientras que la inferencia requiere un rendimiento de cálculo de GPU relativamente bajo, como Aethir, que se centra en trabajos de renderizado de baja latencia y aplicaciones de inferencia de IA.

b. Desde la perspectiva de la demanda, los demandantes de potencia de cálculo media y baja no entrenarán sus propios grandes modelos de forma independiente, sino que solo elegirán optimizar y ajustar finamente en torno a unos pocos grandes modelos líderes, y estos escenarios son naturalmente adecuados para los recursos de potencia de cálculo distribuida en desuso.

  • Propiedad descentralizada: El significado técnico de la blockchain radica en que los propietarios de recursos siempre mantienen el control sobre sus recursos, ajustándose de manera flexible según la demanda, al mismo tiempo que obtienen beneficios.

Datos

Los datos son la base de la IA. Sin datos, el cálculo sería tan inútil como una hoja flotante, y la relación entre los datos y el modelo es como el dicho "Basura entra, basura sale". La cantidad de datos y la calidad de entrada determinan la calidad de salida del modelo final. En la actualidad, la formación de los modelos de IA depende de los datos, que determinan la capacidad lingüística, la capacidad de comprensión, e incluso los valores y la humanidad del modelo. Actualmente, las dificultades en la demanda de datos de la IA se centran principalmente en los siguientes cuatro aspectos:

  • Hambre de datos: El entrenamiento de modelos de IA depende de una gran cantidad de datos de entrada. Los datos públicos muestran que OpenAI ha entrenado a GPT-4 con un número de parámetros que alcanza el nivel de billones.

  • Calidad de los datos: Con la integración de la IA en diversas industrias, la actualidad de los datos, la diversidad de los datos, la especialización de los datos verticales y la incorporación de nuevas fuentes de datos, como las emociones en las redes sociales, también han planteado nuevos requisitos para su calidad.

  • Problemas de privacidad y cumplimiento: Actualmente, los diferentes países y empresas están prestando cada vez más atención a la importancia de los conjuntos de datos de calidad y están imponiendo restricciones sobre la recopilación de conjuntos de datos.

  • Altos costos de procesamiento de datos: gran volumen de datos, proceso de manejo complejo. La información pública muestra que más del 30% de los costos de I+D de las empresas de IA se destinan a la recolección y procesamiento de datos básicos.

Actualmente, las soluciones de web3 se manifiestan en los siguientes cuatro aspectos:

  1. Recolección de datos: La disponibilidad de datos del mundo real que se pueden capturar de forma gratuita se está agotando rápidamente, y los gastos de las empresas de IA por datos están aumentando año tras año. Sin embargo, al mismo tiempo, estos gastos no se están reinvirtiendo en los verdaderos contribuyentes de los datos; las plataformas disfrutan por completo del valor creado por los datos.

Permitir que los usuarios que realmente contribuyen también participen en la creación de valor que trae la data, así como obtener datos más privados y valiosos de los usuarios de manera económica a través de redes distribuidas e incentivos, es la visión de Web3.

  • Grass es una capa de datos y una red descentralizada, donde los usuarios pueden contribuir con ancho de banda ocioso y tráfico de retransmisión al ejecutar nodos de Grass para capturar datos en tiempo real de toda la internet y obtener recompensas en tokens;

  • Vana ha introducido un concepto único de piscina de liquidez de datos (DLP), donde los usuarios pueden subir sus datos privados (como registros de compras, hábitos de navegación, actividades en redes sociales, etc.) a un DLP específico y elegir de manera flexible si autorizan a terceros específicos a utilizar estos datos;

  • En PublicAI, los usuarios pueden usar #AI或#Web3 como etiqueta de clasificación en X y @PublicAI para realizar la recolección de datos.

  1. Preprocesamiento de datos: En el proceso de tratamiento de datos de la IA, debido a que los datos recopilados suelen ser ruidosos y contener errores, deben limpiarse y transformarse en un formato utilizable antes de entrenar el modelo, lo que implica tareas repetitivas de normalización, filtrado y tratamiento de valores faltantes. Esta etapa es una de las pocas que aún requieren intervención humana en la industria de la IA, y ha dado lugar a la industria de los etiquetadores de datos. A medida que las exigencias del modelo sobre la calidad de los datos aumentan, también lo hace la barrera de entrada para los etiquetadores de datos, y esta tarea es naturalmente adecuada para el mecanismo de incentivos descentralizados de Web3.
  • Actualmente, Grass y OpenLayer están considerando unirse a esta etapa clave de la anotación de datos.

  • Synesis ha propuesto el concepto de "Train2earn", enfatizando la calidad de los datos. Los usuarios pueden obtener recompensas al proporcionar datos etiquetados, comentarios u otras formas de entrada.

  • El proyecto de etiquetado de datos Sapien gamifica las tareas de etiquetado y permite a los usuarios apostar puntos para ganar más puntos.

  1. Privacidad y seguridad de los datos: Es importante aclarar que la privacidad y la seguridad de los datos son dos conceptos diferentes. La privacidad de los datos se refiere al manejo de datos sensibles, mientras que la seguridad de los datos protege la información de datos contra el acceso no autorizado, la destrucción y el robo. Así, las ventajas de la tecnología de privacidad en Web3 y sus posibles escenarios de aplicación se reflejan en dos aspectos: (1) Entrenamiento de datos sensibles; (2) Colaboración de datos: múltiples propietarios de datos pueden participar conjuntamente en el entrenamiento de IA sin necesidad de compartir sus datos originales.

Las tecnologías de privacidad más comunes en Web3 actualmente incluyen:

  • Entorno de ejecución confiable ( TEE ), como Super Protocol;

  • Criptografía homomórfica completa (FHE), por ejemplo, BasedAI, Fhenix.io o Inco Network;

  • La tecnología de conocimiento cero (zk), como el Protocolo Reclaim que utiliza la tecnología zkTLS, genera pruebas de conocimiento cero del tráfico HTTPS, lo que permite a los usuarios importar de manera segura actividades, reputación y datos de identidad desde sitios web externos sin exponer información sensible.

Sin embargo, actualmente este campo aún se encuentra en una etapa temprana, la mayoría de los proyectos todavía están en exploración, y un dilema actual es que el costo de cálculo es demasiado alto, algunos ejemplos son:

  • El marco zkML EZKL necesita aproximadamente 80 minutos para generar una prueba de un modelo 1M-nanoGPT.

  • Según los datos de Modulus Labs, el costo de zkML es más de 1000 veces mayor que el de los cálculos puros.

  1. Almacenamiento de datos: Una vez que se dispone de los datos, también se necesita un lugar para almacenar los datos en la cadena, así como el LLM generado a partir de esos datos. Con la disponibilidad de datos (DA) como problema central, antes de la actualización de Danksharding de Ethereum, su capacidad de procesamiento era de 0.08 MB. Al mismo tiempo, el entrenamiento de modelos de IA y la inferencia en tiempo real suelen requerir un rendimiento de datos de entre 50 y 100 GB por segundo. Esta diferencia de magnitud deja a las soluciones existentes en la cadena incapaces de enfrentar "aplicaciones de IA que consumen muchos recursos."
  • 0g.AI es un proyecto representativo en esta categoría. Es una solución de almacenamiento centralizado diseñada para satisfacer las altas demandas de rendimiento de la IA, su preocupación
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • 5
  • Republicar
  • Compartir
Comentar
0/400
RektCoastervip
· hace8h
Deja de hablar de conceptos... primero crea una aplicación que funcione.
Ver originalesResponder0
degenonymousvip
· hace8h
tomar a la gente por tonta los tontos pueden hablar de ideales.
Ver originalesResponder0
not_your_keysvip
· hace8h
Otra vez están calentando el arroz y tomando a la gente por tonta.
Ver originalesResponder0
MidsommarWalletvip
· hace8h
Espero ver cómo la IA impulsa Web3.
Ver originalesResponder0
ConfusedWhalevip
· hace8h
No entiendo, no sé de qué están hablando.
Ver originalesResponder0
  • Anclado
Opere con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)