Nuevos Nodos de Inteligencia Artificial

Saludos. Acerca de los nuevos nodos de IA, me surge la duda de cuáles guardan el entrenamiento o cómo entrenarlos.

Me explico. El Strategy Agent IA se entrena y guarda un QTable, de esta manera podemos entrenar en demo y luego llevarlo a real.

¿Cuáles otros nodos tienen esta funcionalidad de aprender y guardar lo aprendido para pasarlo de demo a real? Pues en lo que he leído de varios nodos, hablan de un entrenamiento, pero no me queda claro esa parte.

Entonces en caso de que los otros nodos que aprenden no tienen un QTable para entrenar en demo y pasar a real, ¿cuál sería la recomendación para hacer el entrenamiento y cuidar el dinero en real?

Saludos cordiales,

1 me gusta

El nodo principal que tiene la funcionalidad de aprender y guardar lo aprendido para su uso en diferentes entornos (demo a real) es:

  • ai.strategicAgent:

    • Es un agente de trading con IA que aprende de sus propias operaciones usando un motor Q-Learning.

    • Detecta regímenes de mercado y adapta su comportamiento.

    • Calcula dinámicamente SL, TP y tamaño de posición.

    • Su aprendizaje progresivo se optimiza con el tiempo, requiriendo fases de entrenamiento (ej: ~500 operaciones para cobertura inicial, ~2000 para especialización).

Para gestionar este proceso de aprendizaje y transición de forma segura, se utiliza el nodo ai.trainingMode(lo tienes en la pestaña Agentes IA, abajo del todo en Herramientas IA):

  • Este nodo actúa como un “simulador de vuelo” para tus nodos IA.

  • Permite que nodos como ai.strategicAgent aprendan y practiquen en 3 modos:

    • TRAINING: El bot observa y los nodos IA recopilan datos y aprenden sin operar.

    • PAPER TRADING: El bot “opera” virtualmente, registrando P&L virtual, permitiendo que los nodos IA aprendan del rendimiento simulado.

    • LIVE: Las señales pasan al broker para operaciones reales, usando el aprendizaje adquirido.

  • Facilita el cambio automático a LIVE después de un número determinado de trades virtuales (autoSwitchAfter).

En resumen: El ai.strategicAgent es el nodo que aprende, y el ai.trainingMode es la herramienta que te permite gestionar ese aprendizaje y su transición segura a operaciones reales.

Luego, para entrenar tu bot de IA y proteger tu capital en real, la recomendación es seguir el flujo de trabajo del nodo ai.trainingMode:

  1. Paso 1: TRAINING (2-4 semanas)

    • Configuración: Establece el parámetro mode = TRAINING.

    • Función: El bot observa el mercado y los nodos IA (como ai.strategicAgent) recopilan datos y entrenan sus modelos sin ejecutar ninguna operación real o virtual.

    • Seguridad: No hay riesgo de capital, ya que las señales están bloqueadas.

    • Monitoreo: Verifica que los modelos de IA convergen y mejoran su precisión.

  2. Paso 2: PAPER_TRADING (2-4 semanas)

    • Configuración: Cambia el parámetro mode = PAPER_TRADING.

    • Función: El bot simula operaciones virtuales con un virtualBalance. Registra P&L virtual y los nodos IA pueden aprender de este rendimiento simulado.

    • Seguridad: No se arriesga dinero real. Puedes ver cuánto habrías ganado o perdido.

    • Monitoreo: Observa el virtualPnL y ajusta parámetros si las señales no son razonables.

  3. Paso 3: LIVE (Cuando estés satisfecho)

    • Configuración: Si el paper trading fue positivo y estable, cambia mode = LIVE.

    • Automático: Puedes configurar autoSwitchAfter = N (ej: 100) para que el bot cambie automáticamente a LIVE después de N trades virtuales exitosos.

    • Función: Las señales de tu bot pasan directamente al broker para operaciones con dinero real.

    • Seguridad: Monitorea las primeras semanas con cuidado y usa nodos de gestión de riesgo (ej: risk.stopLoss, risk.takeProfit) para proteger tu capital.

Este proceso gradual te permite validar el aprendizaje y el rendimiento de tu IA en entornos controlados antes de exponer tu dinero real.

2 Me gusta

Hola Rafa,

Sobre lo de qué nodos guardan el entrenamiento y cómo entrenarlos, el que tiene esa idea de “entrenar en demo y llevarlo a real” con algo que se guarda es el Strategic Agent IA. Ese sí usa una Q-Table que se guarda sola en un archivo (en Common/Files/, algo tipo AI_QTable_888888_XAUUSD.bin). Entrenas en demo, el agente va aprendiendo y al pasar a real puede cargar esa misma Q-Table, así que no empieza de cero.

Los otros nodos de IA no funcionan igual en ese sentido:

  • Strategy Generation IA no “aprende” de tus operaciones: hace un análisis del mercado (prueba 8 estrategias sobre datos del gráfico) y te genera un reporte. No guarda un “cerebro” para reutilizar; es más bien un laboratorio que te da analisis del mercado.

  • Free Signal AI no aprende ni guarda nada, es un auxiliar para que el Strategic Agent opere en modo autónomo.

  • El DQN y el Actor-Critic (solo MT5) sí tienen persistencia de pesos/modelo, pero el flujo “demo → real” pero no es una Q-Table del Strategic Agent. En la práctica podrías entrenar en demo y, si usas el mismo archivo de pesos en real, estarías llevando ese aprendizaje.

Simplificando, todos estos nodos sí aprenden, lo que cambia es la técnica. El Strategic Agent usa Q-Learning tabular (una tabla de valores que se va actualizando con cada trade), y por eso hablamos de “Q-Table” y de un archivo que guardas y cargas. El DQN y el Actor-Critic también aprenden, pero con redes neuronales, en lugar de una tabla, ajustan los pesos de la red con cada experiencia, y esos pesos se pueden guardar y cargar de forma similar. Es decir, no es que solo el de la Q-Table entrene y el resto no, todos entrenan, cada uno con su método (tabla vs red), y en todos tiene sentido entrenar primero en demo y luego, si quieres, llevar ese aprendizaje a real usando el archivo que cada uno guarde.

Si usas nodos que aprenden, lo razonable es, entrenar primero en demo (o backtest cuando aplique), usar el Modo Entrenamiento (TRAINING → PAPER → LIVE) como intermediario y, al pasar a real, empezar con poco riesgo.

Un saludo,
Ignacio

1 me gusta

Excelente. Muchas gracias! Esa información de esos nodos que no generan QTable dónde se almacenan y cómo podría llevarlos de demo a real? ¿Hay alguna especie de instructivo?

Saludos

Excelente. Muchas gracias. Me queda claro con el Strategy Agent IA. ¿Pero y los otros nodos que tambien aprenden, por ejemplo, Agente DQN, Agente Actor-Critic, Filtro de Señales IA, SL/TP Dinámico IA. Estos nodos entiendo que adquieren cierto aprendizaje, pero no me queda claro si el aprendizaje o el entrenamiento debe hacerse en real o no, y en caso de que no, cómo esos nodos pueden pasar su información de demo a real. Y si no se hace entrenamiento en demo con estos nodos, cuál sería la recomendación.

1 me gusta

¡Buena pregunta!

Te lo explico al detalle nodo por nodo, ya que cada uno tiene su particularidad.

Lo primero que debes saber: todos estos nodos que mencionas SÍ aprenden, y todos guardan su aprendizaje a disco de forma automática. El mecanismo es el mismo que ya conoces del Strategic Agent con su Q-Table, se genera un archivo binario en la carpeta Common/Files/ de MetaTrader, que es compartida entre todas las terminales de tu computadora. Eso significa que lo que entrenas en demo lo puedes usar en real sin hacer nada especial, siempre que uses el mismo Magic Number y el mismo símbolo. Igualmente, tienes todo ya actualizado desde ahora mismo en la formación Techain profundizando más en el tema para abarcar y resolver más dudas.


Agente DQN IA (solo MT5)

Este nodo usa una red neuronal profunda (Deep Q-Network) en vez de una tabla Q. Pero el concepto es el mismo: aprende qué acciones tomar en cada situación del mercado.

  • Archivo: AI_DQN__<Símbolo>.bin

Ejemplo: AI_DQN_777777_EURUSD.bin

  • Qué guarda: Los pesos de la red principal (3 capas: 15→128→64→4), los pesos de la red Target, el epsilon (exploración), pasos, episodios, recompensa acumulada, trades, wins, profit y drawdown máximo.

  • Cuándo guarda: Cada 100 pasos de entrenamiento + al cerrar el EA.

  • Demo → Real: Entrena en demo (se recomiendan 3000+ trades para que la red converja bien), y cuando pases a real con el mismo Magic Number y símbolo, el EA carga los pesos automáticamente y sigue desde donde lo dejó.


Agente Actor-Critic IA (solo MT5)

Usa dos redes neuronales: el Actor (decide qué hacer) y el Critic (evalúa si la decisión fue buena). Es una arquitectura más sofisticada que el DQN.

  • Archivo: AI_A2C__<Símbolo>.bin

Ejemplo: AI_A2C_888888_GBPUSD.bin

  • Qué guarda: Pesos del Actor (15→64→32→4), pesos del Critic (15→48→24→1), pasos, recompensa, trades, wins y profit.

  • Cuándo guarda: Cada 100 pasos de entrenamiento + al cerrar el EA.

  • Demo → Real: Mismo proceso. Entrena en demo, pasa a real con el mismo Magic y símbolo. Se carga solo.


Filtro de Señales IA (MT4 y MT5)

Este es un perceptrón que aprende a distinguir las señales buenas de las malas analizando el contexto del mercado cuando llega cada señal. No opera por sí solo, filtra las señales de tu estrategia.

  • Archivo: AI_SF__<Símbolo>.bin

Ejemplo: AI_SF_555555_XAUUSD.bin

  • Qué guarda: Los 10 pesos del perceptrón, el bias, y las estadísticas (señales totales, señales pasadas, trades, wins).

  • Cuándo guarda: Cada 10 operaciones cerradas + al cerrar el EA.

  • Demo → Real: Deja que acumule al menos 50-100 operaciones cerradas en demo para que aprenda los patrones de tu estrategia. Luego en real con el mismo Magic y símbolo, carga el modelo entrenado automáticamente.


SL/TP Dinámico IA (MT4 y MT5)

Tiene un micro Q-Learning interno que aprende qué niveles de SL/TP funcionan mejor según el régimen de mercado (tendencia, rango, alta volatilidad, etc.).

  • Archivo: AI_SLTP__<Símbolo>.bin

Ejemplo: AI_SLTP_555555_BTCUSD.bin

  • Qué guarda: La mini Q-Table completa (valores Q por cada combinación régimen × nivel SL × nivel TP), las visitas, trades, wins y recompensa.

  • Cuándo guarda: Cada 10 operaciones cerradas + al cerrar el EA.

  • Demo → Real: Entrena en demo con diferentes condiciones de mercado para que la Q-Table pruebe diversas combinaciones. Luego en real, carga automáticamente.


Procedimiento lógico:

Siempre entrenar primero en demo (o backtesting). Nunca arrancar en real sin experiencia previa en el modelo. El flujo recomendado es:

  1. Backtesting → para validar rápidamente que el nodo funciona con tu estrategia

  2. Demo → para entrenamiento real con datos de mercado en vivo (semanas/meses según el nodo)

  3. Real → con el modelo ya entrenado, usando el mismo Magic Number y símbolo

Todos los archivos se guardan en Common/Files/ que es compartida entre terminales. Si necesitas mover el entrenamiento a otra computadora u otro broker, simplemente copia el archivo .bin correspondiente a la carpeta Common/Files/ de la terminal destino. Si el broker usa un nombre de símbolo distinto (ej: EURUSD vs EURUSDm), copia el archivo y renómbralo con el nuevo nombre del símbolo.

Lo más importante: el Magic Number es lo que identifica cada modelo. Dos EAs con distinto Magic Number tienen aprendizajes completamente separados, así que nunca se mezclan.


Nota adicional: Hay otros nodos de IA como Random Forest, SVM y Neural Predictor que también “aprenden”, pero estos no necesitan archivo de persistencia porque se re-entrenan automáticamente al iniciar usando los datos históricos del gráfico. Su entrenamiento es rápido (segundos) y siempre usan datos frescos, así que no hay nada que transferir de demo a real — simplemente usa la misma configuración en ambas cuentas.

Un saludo,

Ignacio

3 Me gusta

Buenísimo! Muchas gracias!

Acerca del entrenamiento que me explicaron al principio. ¿Este sería un modelado correcto?

¿Dentro del mismo MT5 puedo cambiar del modo entrenamiento al live o debo generar un nuevo bot?

¿Si este modelo es correcto, al cambiar de entrenamiento a LIVE en MT5 (si es permitido) los nodos “compra (bloqueada en entrenamiento)” se debloquean o debo hacer una conexion distina y generar el bot nuevamente?

1 me gusta

Sí, el modelado es correcto. Tienes bien el flujo. Señal Libre IA genera las señales, Modo Entrenamiento IA las recibe y según esté en Entrenamiento, Paper o Live las deja pasar o las bloquea y registra métricas, y el Agente Estratégico IA recibe esas condiciones y aplica la lógica de riesgo y ejecución. La conexión que hiciste (las salidas “Compra/Venta bloqueada en entrenamiento” hacia las entradas del Agente Estratégico) es la adecuada, no hace falta otra para cuando pases a Live.

Sobre cambiar de entrenamiento a live dentro de MT5, puedes hacerlo sin generar un bot nuevo usando el parámetro “Auto-cambio a Live tras…” del nodo Modo Entrenamiento IA. Si le pones un número mayor que cero (por ejemplo 50 o 100), el mismo EA, cuando lleve ese número de operaciones en Paper, pasará solo a modo Live. Si en cambio quieres que el EA arranque ya en Live desde el principio, entonces sí tendrías que poner el nodo en “Live (Real trades)”, generar de nuevo el código y compilar; el Modo no está como input en MT5, se fija al generar.

Cuando el EA esté en modo Live (ya sea por el auto-cambio o porque lo generaste en Live), esas salidas “bloqueada en entrenamiento” se desbloquean solas: en el código son las mismas señales de compra/venta que en Live sí se dejan pasar. No hace falta cambiar conexiones ni generar otro bot, la misma configuración sirve para entrenamiento y para live.

2 Me gusta

Hola. ¿Es posible en un mismo lienzo usar (duplicado) dos nodos de “Selector Adaptativo de Estrategia IA”, para de esta forma en vez de tener 4 estrategias en el lienzo, tener 8 estrategias diferentes, 4 conectadas a un nodo y 4 conectadas al otro?

1 me gusta

Buenos días.

No debería haber problema. Lo único fíjate que no te de errores. Si el bot es muy complejo y con muchas conexiones, cuando lo tengas y antes de crearlo, le das al icono del flotador :ring_buoy: que tienes abajo y que analice si la lógica es buena y no tenga errores de redundancia y/o fallos de conexión.

2 Me gusta

Saludos,

El BOT Modelo Full IA que estoy montando en el canva esta de la siguiente manera:

Se pueden dar cuenta que tengo dos puertas de confianza a mitad del proceso, tengo la siguiente duda, creen necesario colocarle puertas de confianza en el principio en donde se generan las señales.

Gracias y les agradezco su paciencia.

Bendiciones

Saludos,

De ante mano, pido disculpas que tantas dudas y si estan las respuestas en la documentación creanmelo que lo he leido no una, ni dos veces, muchas veces, entonces si esta la respuesta, se me paso por alto. Y recomendacion si pudieran ir incluyendo todo lo que se habla en el foro en la documentación para proximos usuarios, excelente.

Bien los pongo en contexto en esta duda y es con respecto al nodo de Trailing Stop y Break Even, lo tengo en el canva de la siguiente manera:

El incluir estos nodos de TS + BE el Agente Estrategico IA funciona de forma correcta o como seria el proceso de implementación.

No se si podrian incluir en la Gestion de Riesgo IA el TS y BE o funciona solo con colocarlos. Tambien seria interesante como tener un parametros en donde se pueda activar o desactivar si se desea usar TS o BE, porque hay usuarios que no les gusta usar TS y BE si en algun momento lo incluyen en el nodo de Gestion de Riesgo IA.

Me comentan segun su experiencia si funcionan estos dos nodos asi o hay que hacer algo.

Gracias.

1 me gusta

Saludos. Espero estén bien. Estoy creando un modelo o estrategia donde se reciben diferentes señales (sólo BUY) y las estoy orquestando con dos (2) nodos “Selector Adaptativo”, para luego ser filtradas con dos nodos IA de filtrado. Además de conectado al entrenamiento y al Strategy Agent, como se muestra en la foto debajo. Ojo: Le puse ventas por defecto fijas en false a los nodos que lo requerían.

Me surge la duda, además de si el modelado es correcto, veo que en el nodo entrenamiento tiene un Umbral de Cierre (puntos),

  • ¿Esto vendría siendo el TP/SL mínimo o TP/SL máximo o TP/SL fijo?
  • ¿O al estar conectado al Strategy Agent, el Strategy Agent decide el tamaño del SL y TP para las dos etapas de entrenamiento?
  • Si al final es un TP/SL fijo, y el Strategy Agent no infiere en etapa de entrenamiento para el SL y TP, ¿es recomendable o factible dejar un SL/TP fijo, tomando en cuenta que el mercado va variando la volatilidad?

2 Me gusta

Saludos,

Con respecto al nodo de Gestion de Riesgo IA, quisisera saber si esta bien colocado en el flujo del CANVA para empezar adjunto la imagen

ahora tengo una gran duda con respecto a la funciionalidad del nodo de Gestion de Riesgo IA, pueden ver que el nodo de Gestion esta configurado de una forma y el nodo Estrategico de otra, que sucede en ese caso, claro lo importante es configurarlo igual, pero que sucederia si por algun motivo lo configuro diferente. Pregunta, ¿No tendriamos parametros repetidos?

Que me pueden aconsejar de este nodo o como funcionaria porque en el flujo vienen señales de los 5 nodos y los cuales son filtrados y llegan a este nodo de gestion de riesgo para luego operar con el agente estrategico.

Saludos,

Estoy implementando los 5 tipos de señales con los nodos IA y los estoy uniendo para tener una super generacion de señales e ir filtrandolas.

Los pongo en contexto actualmente asi lo tengo en el Canva

Se pueden dar cuenta que de los 5 nodos que generan señales como algunos se sugieren que se unan al final tenemos 3 señales finales.

Mi pregunta es la siguiente, que es mejor colocar un nodo Selector Adaptativo de Estrategia IA o bien un nodo de Votación Ensemble IA, yo para filtrar todas las 5 señales lo hice con un Selector pero no se si es lo correcto y lo mas optimo.

Vi en la documentación que tienen un cuadro comparativo

pero en base a su amplia experiencia con este tema, que me recomiendan.

Gracias.

Saludos,

Tengo una consulta con respecto a la implementación de los dos nodos de señales:

  • Random Forest Classifier IA
  • Predictor Neural IA

Actualmente lo tengo implementado de la siguiente manera como se muestra en la imagen:

Tengo la siguiente duda, los pongo en contexto:

Primero, en la documentación recomiendan que se use el Predictor Neural IA con el Random Forest Classifier usando el Votación Ensemble IA.

Segundo, en la documentación recomiendan tambien que se use el Random Forest Classifier con el SVM Generador de Señales IA, pero no dice con que lo vamos a unir con un Votación Ensemble IA o bien con un Selector.

Entonces se pueden poner todos los nodos hablo de Random, Predictor y SVM conectados todos a un Votación o esta bien como lo configue.

Hago la consulta para evitarle complejidad al BOT, porque cada uno lleva un panel entonces quiero hacerlo lo mas simple pero tambien lo mas productivo.

Gracias.

Hola,

Realmente es un buen intento de construir un pipeline completo, pero hay varios puntos importantes que revisar. Vamos capa por capa:

Capa 1 - Generadores de Señales (5 nodos): Bien planteado

Tienes 5 generadores de señales de IA de diferentes familias:

  • Agente DQN IA (Reinforcement Learning - Deep Q-Network)

  • Agente Actor-Critic IA (Reinforcement Learning - A2C)

  • Random Forest Classifier IA (Machine Learning clásico)

  • Predictor Neural IA (LSTM Reservoir Computing)

  • SVM Generator de Señales IA (Support Vector Machine)

La diversidad es buena: combinar RL, ML clásico y redes neuronales aporta perspectivas diferentes sobre el mercado.

Capa 2 - Tres Votaciones Ensemble: Revisar distribución

Cada nodo de Votación Ensemble IA acepta hasta 3 estrategias (3 pares buy/sell). Tienes 5 generadores repartidos en 3 Ensembles. Aquí hay un punto clave: si alguno de los Ensembles recibe solo 1 estrategia, ese Ensemble no aporta nada - no hay votación posible con 1 sola voz, simplemente pasa la señal sin filtrar.

La distribución más óptima por funcionamiento sería:

  • Ensemble 1: DQN + Actor-Critic (ambos RL, se complementan bien)

  • Ensemble 2: Random Forest + SVM + Predictor Neural (los 3 de ML/clasificación)

Con esa distribución necesitarías solo 2 Ensembles en lugar de 3, y cada uno tendría suficientes estrategias para que la votación sea significativa.

Capa 3 - Señal Libre IA: PROBLEMA

Aquí está el problema principal del modelo. El nodo Señal Libre IA genera señales que siempre son true, y cuando se conecta al Agente Estratégico IA, activa el modo autónomo donde el agente toma decisiones propias y todas las señales externas pasan a ser “hints” suaves (solo ajustan probabilidades un ~10%).

Esto significa que todo tu pipeline elaborado (5 generadores + 3 Ensembles + Selector + Filtro + Puertas de Confianza + Guardián + Gestor de Riesgo + Modo Entrenamiento) quedaría prácticamente anulado porque el Agente Estratégico lo ignoraría en gran medida al estar en modo autónomo.

Si buscas que aplique todo, debes eliminar el nodo Señal Libre IA. Tu pipeline ya tiene suficiente inteligencia sin necesidad de activar el modo autónomo.

Capa 3b - Selector Adaptativo de Estrategia IA: Buena idea

El Selector Adaptativo usa un algoritmo Multi-Armed Bandit (Thompson Sampling/UCB1) para elegir dinámicamente la mejor estrategia. Acepta hasta 4 estrategias. Conectar las salidas de los 2-3 Ensembles al Selector es una idea sólida, el Selector aprenderá cuál Ensemble rinde mejor en cada régimen de mercado y priorizará sus señales.

Capa 4 - Filtro de Señales IA + Puerta de Confianza IA (x2): Correcto

El orden Selector → Filtro → Puertas de Confianza es correcto:

  • El Filtro evalúa el contexto del mercado con su perceptrón

  • Las Puertas de Confianza aplican el umbral final

Asegúrate de conectar:

  • Puerta 1: signalIn = filteredBuy / confidenceIn = buyConfidence

  • Puerta 2: signalIn = filteredSell / confidenceIn = sellConfidence

Capa 5 - Guardián de Anomalías IA: Buena ubicación

El Guardián detecta flash crashes, gaps extremos, spikes de volatilidad y spreads anormales. Colocarlo después de las Puertas de Confianza y antes del Gestor de Riesgo es correcto, actúa como red de seguridad final antes de la ejecución.

Capa 6 - Gestor de Riesgo IA + Modo Entrenamiento IA: Correcto

  • El Gestor de Riesgo calcula el tamaño de lote dinámico con Kelly Criterion y protección de drawdown

  • El Modo Entrenamiento te permite pasar por fases: Training (solo observación) → Paper Trading (virtual) → Live

El orden Gestor de Riesgo → Modo Entrenamiento → Agente Estratégico es correcto.

Capa 7 - Agente Estratégico IA + Trailing Stop + Punto de Equilibrio: Correcto

El Agente Estratégico recibe las señales finales y ejecuta. El Trailing Stop y Punto de Equilibrio son nodos independientes que gestionan las órdenes abiertas automáticamente. Están bien colocados.

PROBLEMA PRINCIPAL: Pipeline demasiado largo

Tu modelo tiene 8-9 capas de procesamiento entre la señal original y la ejecución:

Generadores → Ensembles → Selector → Filtro → Puertas → Guardián → Gestor Riesgo → Modo Entrenamiento → Agente Estratégico

Cada capa filtra señales, lo que significa que muy pocas operaciones llegarán al final. Esto puede resultar en un bot que casi nunca opera.

Cambios clave:

  1. Eliminar Señal Libre IA (conflicto con el pipeline)

  2. 2 Ensembles en lugar de 3 (evitar Ensemble con 1 sola estrategia)

  3. Guardián de Anomalías puede quedarse si quieres la capa de seguridad extra

  4. Gestor de Riesgo ya está integrado dentro del Agente Estratégico (calcula SL/TP/lotaje dinámicamente), así que es redundante como nodo separado a menos que quieras una capa adicional de control de drawdown

  5. Modo Entrenamiento es útil si vas a pasar por fases de aprendizaje, pero no es necesario en producción

Con esto reduces el pipeline a 5 capas, que sigue siendo robusto pero permitirá que más operaciones de calidad se ejecuten. La idea es excelente y se nota el esfuerzo, pero el modelo tiene demasiadas capas de filtrado que pueden ahogar las señales. Elimina el Señal Libre, consolida los Ensembles, y tendrás un sistema muy potente.

Un saludo,

Ignacio

Un saludo,

Ignacio

2 Me gusta

Hola,

Buena pregunta. Vamos a aclarar cómo funcionan exactamente estos nodos:

Los nodos Trailing Stop y Punto de Equilibrio son 100% independientes - solo con colocarlos en el canvas es suficiente.

Estos dos nodos no requieren conexiones con ningún otro nodo. No tienen entradas ni salidas. Simplemente al estar presentes en tu modelo, su código se genera automáticamente dentro del EA y se ejecutan en cada tick sobre las posiciones abiertas.

Tu configuración actual (Gestor de Riesgo → Modo Entrenamiento → Agente Estratégico, con TS y BE colocados aparte) es correcta. Así como los tienes funciona.

Cómo funcionan internamente:

  • Trailing Stop: En cada tick, recorre todas las posiciones abiertas del símbolo. Si una posición tiene ganancia >= minProfit (por defecto 15 puntos), mueve el SL detrás del precio a una distancia configurable (modo FIXED en puntos o modo ATR dinámico). Solo mueve el SL a favor, nunca en contra.

  • Punto de Equilibrio: En cada tick, recorre las posiciones. Si una posición alcanza profitPoints (por defecto 20 puntos de ganancia), mueve el SL al precio de apertura + un pequeño buffer (por defecto 1 punto). Opcionalmente puede hacer cierre parcial al activarse.

Punto importante: Posible conflicto con el Agente Estratégico IA

El Agente Estratégico IA tiene un breakeven integrado propio (parámetros useBreakeven y breakevenTrigger). Si tienes activado el breakeven del Agente Estratégico y además colocas el nodo Punto de Equilibrio en el canvas, ambos intentarán modificar el SL en el mismo tick. El último en ejecutarse tendrá prioridad.

Si usas el nodo independiente de Punto de Equilibrio, desactiva el breakeven interno del Agente Estratégico (useBreakeven = false) para evitar conflictos. O viceversa, si prefieres el breakeven del Agente (que se basa en múltiplos de ATR y es más adaptativo), no coloques el nodo de Punto de Equilibrio.

Sobre el Magic Number:

Ambos nodos usan magicNumber = 0 por defecto, lo que significa que aplican a todas las posiciones del símbolo. Si tu Agente Estratégico usa un Magic Number específico y quieres que el TS/BE solo afecte a sus órdenes, configura el mismo Magic Number en los nodos de TS y BE.

Sobre incluirlos en el Gestor de Riesgo IA:

Actualmente el Gestor de Riesgo IA se enfoca en el sizing de posición (Kelly Criterion) y protección de drawdown. No incluye TS ni BE. Son funcionalidades diferentes:

  • Gestor de Riesgo: decide cuánto arriesgar (tamaño de lote) y cuándo parar (drawdown)

  • TS y BE: gestionan cómo proteger las posiciones ya abiertas

Dicho esto, la sugerencia de integrarlos como parámetros opcionales dentro del Gestor de Riesgo es buena y la tendremos en cuenta para futuras actualizaciones. Un toggle de activar/desactivar sería muy útil.

Resumen de tu configuración:

Elemento Estado Nota
Gestor de Riesgo → Modo Entrenamiento → Agente Estratégico Correcto Pipeline bien conectado
Trailing Stop (suelto en canvas) Correcto Funciona automáticamente
Punto de Equilibrio (suelto en canvas) Correcto, con precaución Desactiva useBreakeven en el Agente Estratégico para evitar conflicto

Tu configuración funciona correctamente. Solo ten cuidado con el posible conflicto de breakeven duplicado (nodo independiente + el integrado en el Agente Estratégico). Elige uno u otro, no ambos.

Un saludo,

Ignacio

3 Me gusta

Hola,

Buena estrategia y buenas preguntas. Vamos a analizarlo todo:

Sobre el modelado general: Bien planteado, con algunos puntos a ajustar

Tu estructura es:

Estrategia (solo BUY) → 2 Selectores Adaptativos → O Lógico → Filtro de Señales → Puerta de Confianza → Modo Entrenamiento → Agente Estratégico

Algunos puntos:

  1. Ventas simuladas en false: La solución que usaste con el nodo Umbral fijo en false para cubrir las entradas de venta es correcta. Los Selectores Adaptativos requieren las conexiones de venta aunque estén en false, y así funciona sin problemas. El Selector evaluará y seleccionará solo entre las estrategias de compra.

  2. Dos Selectores Adaptativos con O Lógico: Cada Selector Adaptativo acepta hasta 4 estrategias. Usar 2 Selectores te permite manejar hasta 8 estrategias. El O Lógico (OR) hace que si cualquiera de los dos Selectores genera una señal de compra, esta pase al siguiente nodo. Esto es válido, pero ten en cuenta que aumenta la frecuencia de señales.

  3. Mismo Magic Number en ambos Selectores: Veo que ambos tienen Magic Number 222222. El Selector Adaptativo rastrea el rendimiento de cada estrategia usando comentarios en las órdenes (SS_0, SS_1, etc.). Si ambos Selectores comparten el mismo Magic Number, sus métricas de rendimiento podrían mezclarse. Si no quieres esto, usa un Magic Number diferente para cada Selector (ej: 222222 y 333333).

Ahora, sobre tus preguntas del Modo Entrenamiento:

Pregunta 1: “Umbral Cierre Paper (puntos)” - no es TP ni SL para trading real

El parámetro Umbral Cierre Paper (configurado en 100 puntos en tu modelo) es un umbral de cierre simétrico que solo se usa en modo Paper Trading. Funciona así:

  • Cuando estás en Paper Trading, el nodo simula posiciones virtuales. Si una posición virtual alcanza +100 puntos de ganancia O -100 puntos de pérdida, se cierra automáticamente

  • Funciona como un “TP y SL fijo virtual” que aplica en ambas direcciones, pero solo para las operaciones simuladas

  • En modo Training (que es donde tienes tu modelo ahora: “Entrenamiento - Sin trading”), no se abre ninguna posición, ni real ni virtual. Solo se observan las señales y se registran métricas

  • En modo LIVE: este parámetro no se usa en absoluto. El SL/TP lo gestiona el Agente Estratégico de forma adaptativa

Pregunta 2: “El Agente Estratégico decide SL/TP en las etapas de entrenamiento?”

No. En cada modo funciona diferente:

Modo Señales Operaciones SL/TP Quién decide
Training Se observan pero se bloquean Ninguna (ni real ni virtual) No aplica Nadie - solo observación
Paper Trading Se bloquean hacia el Agente, pero se simulan internamente Virtuales dentro del nodo Entrenamiento Umbral Cierre Paper (fijo, simétrico) El nodo Entrenamiento
Live Pasan normalmente al Agente Estratégico Reales SL/TP dinámico basado en ATR + régimen de mercado + Q-Learning El Agente Estratégico

Esto es lo importante, cuando finalmente pases a Live, el Agente Estratégico tomará el control total del SL/TP de forma adaptativa. El “Umbral Cierre Paper” no interfiere en Live.

Pregunta 3: “Es recomendable un SL/TP fijo dado que el mercado varía la volatilidad?”

Para Paper Trading (simulación): el umbral fijo de 100 puntos es aceptable porque es solo para evaluar el rendimiento virtual de las señales. No necesitas exactitud perfecta en esta etapa, solo quieres ver si las señales generan beneficio neto.

Para Live (real): no, un SL/TP fijo no es recomendable. El Agente Estratégico ya resuelve esto por ti de forma dinámica:

  • Calcula el SL basándose en el ATR (volatilidad actual del mercado)

  • Ajusta según el régimen de mercado detectado (trending, ranging, volatile, etc.)

  • Optimiza la relación SL/TP con Q-Learning basándose en experiencias pasadas

  • Adapta el tamaño de lote al nivel de riesgo configurado

La buena noticia es que tu modelo ya está configurado para que esto funcione correctamente, en Live, el Agente Estratégico toma el control y el Umbral Cierre Paper se ignora.

Observación adicional sobre tu modo actual:

Veo que tienes el Modo Entrenamiento configurado en “Entrenamiento (Sin trading)”. En este modo, el nodo solo observa y cuenta señales, pero no simula operaciones virtuales. Si quieres probar tu estrategia de forma virtual antes de ir a Live, cambia a “Paper Trading” - ahí sí se activará la simulación virtual con el umbral de 100 puntos y podrás ver el P&L virtual en el panel.

El flujo ideal de fases sería:

  1. Training (observación) → verifica que las señales se generan correctamente

  2. Paper Trading (simulación) → evalúa rendimiento virtual con el umbral de cierre

  3. Live (real) → el Agente Estratégico opera con SL/TP adaptativos

Puedes usar el parámetro Auto cambio a Live tras… para hacer la transición automáticamente después de N trades virtuales exitosos, o hacerlo manualmente cuando estés satisfecho con los resultados del Paper Trading.

Tu modelo está bien construido. El “Umbral Cierre Paper” es solo para simulación virtual y no afecta el trading real. Cuando pases a Live, el Agente Estratégico gestionará SL/TP de forma dinámica y adaptativa, que es lo más correcto dado que la volatilidad del mercado cambia constantemente.

Un saludo,

Ignacio

Un saludo,

Ignacio

2 Me gusta

Hola,

Tu flujo está bien colocado. Lo que ocurre con los parámetros y cómo conviene usarlos es lo siguiente.

1. ¿Está bien colocado el Gestor de Riesgo IA en el flujo?

Sí. El orden es correcto:

Puerta de Confianza IA (x2) → Guardián de Anomalías IA → Gestor de Riesgo IA → Modo Entrenamiento IA → Agente Estratégico IA

El Gestor de Riesgo actúa como puerta de seguridad, solo deja pasar señales de compra/venta cuando considera que se puede operar (no en pausa por drawdown, no en modo recuperación, lote calculado > 0). Si no se cumplen sus condiciones, envía managedBuy/managedSell en false y el Agente Estratégico no recibe señal para abrir. Por tanto, colocarlo antes del Modo Entrenamiento y del Agente Estratégico es lo adecuado.

2. ¿Hay parámetros repetidos? ¿Qué pasa si los configuro distintos?

Sí hay parámetros que se parecen en ambos nodos, pero no se comparten, cada uno usa los suyos.

  • Gestor de Riesgo IA

  • Usa: Riesgo base/máximo %, Min/Max lot size, Max Drawdown (pausa), recuperación, multiplicadores por régimen, etc.

  • Con eso calcula un lote (calculatedLots) y decide si bloquea o deja pasar la señal (managedBuy/managedSell).

  • Sus salidas hacia el Agente son solo condiciones (compra/venta gestionada).

  • No existe en el sistema actual ninguna conexión que lleve calculatedLots al Agente Estratégico.

  • Agente Estratégico IA

  • Solo recibe condiciones (buy/sell).

  • No tiene entrada para “lote externo”.

  • Con sus propios parámetros (Riesgo % por operación, Tamaño min/max de lote, SL/TP, drawdown, etc.) calcula él mismo SL, TP y tamaño de lote cuando abre una operación.

Por tanto:

  • Los parámetros no están “repetidos” en el sentido de que uno lea al otro, son dos conjuntos independientes.

  • Si los configuras distintos, lo que ocurre es:

  • El Gestor de Riesgo decide cuándo se permite operar (puerta: pausa por DD, recuperación, etc.) y calcula un lote que hoy no se usa para ejecutar.

  • El Agente Estratégico decide cuánto arriesgar en cada trade (lote, SL, TP) con sus propios límites.

3. Cómo conviene configurarlos

Para que no haya contradicciones y el flujo sea claro:

  • Opción A – Gestor como “circuit breaker” y Agente como único decisor de tamaño

  • Gestor de Riesgo: úsalo sobre todo para pausa por drawdown (ej. 7%) y modo recuperación.

  • Poner en el Gestor límites de lote muy amplios (ej. Min 0.01, Max 10) para que casi nunca corte por tamaño; que solo corte por DD/recuperación.

  • En el Agente Estratégico configura el riesgo real: Riesgo % por operación, Min/Max lote, SL/TP, etc.

  • Así evitas “duplicar” mentalmente el sizing: el que manda en tamaño es el Agente, el Gestor solo abre/cierra la llave.

  • Opción B – Coherencia entre ambos

  • Si quieres que el Gestor también acote “cuánto” (aunque su lote no se use aún en ejecución), define un envelope en el Gestor y luego no superes ese envelope en el Agente:

  • Ejemplo: Gestor Riesgo base 2%, máx 5%, Lotes 0.01–10 → en el Agente pon, por ejemplo, Riesgo 1% y Lotes 0.1–1 (más conservador que el techo del Gestor).

  • Drawdown: si el Gestor pausa al 7%, en la práctica el drawdown “duro” para abrir nuevas operaciones será 7%; el 20% del Agente puede seguir siendo útil para su lógica interna (pausa, aprendizaje, etc.), pero la puerta la controla el Gestor.

4. Resumen práctico

Aspecto Gestor de Riesgo IA Agente Estratégico IA
Rol en el flujo Puerta: permite o bloquea señales Ejecutor: abre trades y define SL/TP/lote
Salida que usa el Agente Solo managedBuy / managedSell (condiciones)
Lote con el que se opera No se usa en la ejecución actual El que calcula el Agente con sus parámetros
Drawdown Si pausa al 7%, no entran nuevas señales Puede tener su propio 20% para lógica interna
Magic Number 444444 (paneles/seguimiento) 888888 (órdenes reales) → sin conflicto

La colocación del nodo de Gestión de Riesgo en el canvas es correcta. Los parámetros no están “repetidos” por conexión de datos, sino que cada nodo usa los suyos, si los configuras distintos, el Agente sigue siendo quien define el tamaño y el SL/TP de cada operación, y el Gestor define cuándo se permite operar. Lo más claro es usar el Gestor como circuit breaker (pausa/recuperación) y alinear el Agente con ese criterio (por ejemplo, más conservador en riesgo y lotes) para que no haya contradicciones lógicas.

Un saludo,

Ignacio

1 me gusta