En la Lección 1, vimos por qué la IA se está consolidando como la nueva infraestructura para el trading cripto. La cuestión clave es: por muy potente que sea la IA, solo puede operar dentro de los límites de los datos que le proporciones.
Muchas estrategias fracasan no porque el modelo sea demasiado simple, sino por errores direccionales en la capa de datos: ya sea por insuficiencia en la calidad de los datos, distorsión en el diseño de las características o sesgo en los métodos de validación.
Por eso, el trading con IA en la práctica no parte de “elegir un modelo”, sino de “construir la base de datos”. Lo que alimentas al modelo determina lo que puede percibir; lo que puede percibir condiciona los juicios que puede tomar.
Los traders que se inician en IA suelen caer en la mentalidad de “acumulación de datos”: recopilar todo lo posible, creyendo que más características facilitan encontrar alpha.
En realidad, los datos de baja calidad, ruidosos y poco correlacionados reducen la estabilidad del modelo. La razón es clara:
Por tanto, el primer principio para construir un sistema de datos es:
Selecciona datos en torno a los problemas de trading, no busques problemas en los propios datos.
Si tu objetivo es la “predicción de dirección a corto plazo”, prioriza la microestructura y los shocks de sentimiento; si trabajas en la “gestión de posiciones a medio plazo”, enfócate en liquidez, estructura de volatilidad y factores macro.

En los mercados cripto, los datos más valiosos suelen proceder de cuatro capas: datos de mercado, derivados, on-chain e información externa.
Esta es la base de todas las estrategias, incluyendo:
Responde a: cómo varían los precios, cómo evoluciona la liquidez y cómo cambia el comportamiento de trading.
Muchas estrategias básicas pueden construirse solo con datos de mercado, pero su limitación es que actúan como “variable de resultado”, con poco poder explicativo sobre “por qué cambian las cosas”.
Especialmente relevantes en los mercados cripto, incluyendo:
Estos datos reflejan la concentración de apalancamiento y la vulnerabilidad de las posiciones en el mercado.
Por ejemplo, “subida de precio + aumento de OI + tasa de financiación alta” frente a “subida de precio + caída de OI” representan escenarios completamente distintos. El primero puede indicar fortalecimiento de la tendencia o concentración de apalancamiento; el segundo suele deberse a cierre de posiciones cortas.
Sin la dimensión de derivados, resulta difícil interpretar la estructura de posiciones tras los movimientos del mercado.
Una ventaja clave que diferencia los mercados cripto de los tradicionales, incluyendo:
El valor de los datos on-chain está en observar “trayectorias de capital y comportamiento”, aunque el reto es la interpretación retardada y el filtrado del ruido.
Por ejemplo, un aumento de entradas a exchanges puede significar intención de venta o de cobertura. Los datos on-chain deben interpretarse junto con la estructura de precios y los datos de derivados; usarlos de forma aislada puede llevar a errores de juicio.
Incluye noticias, nivel de discusión en redes sociales, eventos regulatorios y fechas de publicación de datos macroeconómicos.
Este tipo de datos actúa como “fuente de shocks”: explica por qué la volatilidad se dispara o las tendencias cambian de forma repentina.
Sin embargo, presentan problemas evidentes: son subjetivos, ruidosos y mezclan información verdadera y falsa.
Por eso, el texto externo es más adecuado como “factor de alerta de riesgo” y “filtro de eventos”, no como señal de entrada principal.
La IA no comprende directamente las “narrativas de mercado”; solo reconoce patrones en las características.
Por eso, el segundo paso no es entrenar modelos apresuradamente, sino transformar los datos en bruto en características aprendibles, verificables y operables.
Las características útiles habituales se agrupan en cuatro categorías:
La clave no reside en “características llamativas”, sino en tres criterios:
Mucha gente configura el modelo para predecir “la subida o bajada de la siguiente vela”, pero esto no siempre es lo óptimo.
Los objetivos de trading pueden adoptar distintas formas de etiquetas:
Si tu objetivo es “evitar grandes caídas” pero usas “dirección de precio a corto plazo” como etiqueta, por muy preciso que sea el modelo, puede no servirte de nada.
Por tanto, las etiquetas deben alinearse con los objetivos de la estrategia: aquello que busques como ganancia en el trading, haz que el modelo aprenda ese objetivo.
En machine learning tradicional, es habitual mezclar aleatoriamente los conjuntos de entrenamiento y prueba; en trading, esto genera distorsiones graves.
Los mercados presentan estructura dependiente del tiempo; la información futura nunca debe “contaminar” el pasado.
El trading con IA debe cumplir al menos tres reglas de validación:
Muchas “estrategias milagro en backtest” colapsan no porque el mercado empeore, sino porque el método de prueba era excesivamente optimista desde el inicio.
Utilizar datos no disponibles en el momento genera resultados inflados.
Entrenar solo con monedas o plataformas que han sobrevivido—ignorando muestras que han fallado.
Eliminar ruido real como si fuera dato erróneo—el modelo pierde capacidad de adaptación a mercados extremos.
Las características contienen implícitamente información de la etiqueta—el modelo parece excesivamente preciso.
Forzar características on-chain de baja frecuencia en tareas de trading de alta frecuencia produce señales falsas.
Estos problemas no generan alertas durante el backtesting, pero se amplifican rápidamente en el trading real.
Para los estudiantes del curso, el enfoque más seguro no es partir de un “mega-modelo con todos los factores del mercado”, sino empezar con un marco de datos mínimo viable:
Este enfoque permite localizar los problemas con claridad, mantener bajos los costes de iteración y acortar el camino hacia el despliegue.
Los sistemas complejos no se construyen de golpe; se expanden capa a capa a partir de sistemas pequeños e interpretables.
En la práctica, la fase de datos suele ser la más laboriosa: recopilación de múltiples fuentes, limpieza de formatos, alineación temporal, desarrollo de pipelines de características e integración de estrategias.
Por eso, las herramientas de IA basadas en plataforma son cada vez más relevantes. Tomando Gate for AI como ejemplo de esta infraestructura, el valor no reside en “generar una estrategia universal para ti”, sino en ayudar a los traders a completar de forma eficiente el ciclo de ingeniería de datos a estrategia y reducir la fricción entre investigación y ejecución. Los traders siguen definiendo problemas, estableciendo restricciones y gestionando riesgos, pero los flujos de trabajo subyacentes pueden ser más estandarizados y reutilizables.