Hoy día, el aprendizaje automático ofrece un enfoque poderoso en el análisis financiero. Efectivamente, a diferencia de los métodos cuantitativos tradicionales, que se centran en un número limitado de efectos de mercado, el aprendizaje automático puede manejar grandes cantidades de datos, estructurados y no estructurados, para identificar relaciones complejas no lineales que afectan a los precios de los activos.
Pero la inversión con inteligencia artificial (IA) requiere de transparencia y una clara comprensión de sus procesos, así como de sus resultados, lo que se denomina una «caja de cristal». Así, desde principios de la década de 2010, el aprendizaje automático -subconjunto de la inteligencia artificial- ha sido una de las áreas que hemos explorado, junto con datos alternativos y procesamiento del lenguaje natural. En concreto, una de sus ventajas es que reduce el sesgo y la subjetividad en la toma de decisiones, con gran rapidez y rigor. De hecho, hoy día el aprendizaje profundo y la IA generativa facilitan que los sistemas pueden aprender por sí mismos
Aplicaciones para la inversión
Ahora bien, cuando se aplican a la inversión y la gestión de carteras pueden generar respuestas sin explicación, alucinaciones. Es el caso de herramientas como ChatGPT que no están diseñadas para inversiones. No será su próximo gestor. Por su parte el aprendizaje no supervisado puede crear clústeres de características homogéneas diferenciadas, pero es opaco, no se puede explicar el resultado.
Por ello, decidimos emplear el aprendizaje automático supervisado, lo que facilita un entrenamiento del sistema más consistente. En concreto, lo entrenamos a partir de unas 300 características del estado de un mercado financiero y sus derivadas o evolución, a partir de numerosas fuentes: pronósticos de analistas, datos de mercado (precios, volúmenes), posición de los inversores (fondos, ventas en corto), efectos calendario y otros. Para ello utilizamos diez años de historia desde 2000, dos para entrenar el modelo y dos fuera de muestra para testar la robustez, evitando que el modelo sea demasiado simplista y débil en la calidad de la predicción y también que tenga sobreajuste.
El caso de Pictet AM
En total empleamos hasta diez millones de parámetros, mediante un centro de datos en Ginebra con 15 servidores exclusivamente para el equipo Quest, con 1.112 microprocesadores CPU, cuatro GPU L40 y dos T4 Nvidia, para un total de 10 pentaFLOPs, la potencia de cómputo de 3.147 ordenadores. De hecho, necesitamos un día completo para reentrenar el modelo. Empleamos esa potencia para combinar árboles de decisión de manera supervisada. Cada árbol imita a un analista que en su ordenador toma decisiones respecto a cada acción a partir de un conjunto diverso de datos.
En nuestro modelo este analista tiene libertad para elegir entre 300 características. Ahora bien, el analista típico acierta en 30 a 45 % de las ocasiones. Para mejorarlo, otro analista puede centrarse en los errores del primero. Así, cada árbol de decisión aprende a corregir los errores de los anteriores. De esta forma empleamos 50.000 árboles de decisión, cooperando de manera eficiente, que reentrenamos cada trimestre. Además, tenemos en cuenta que la vida media del recuerdo del mercado es de solo de unos 16 días. De manera que cada semana la cartera se vuelve a equilibrar.
Ello nos permite eliminar el sesgo humano al predecir el comportamiento de cada acción a corto plazo. En concreto, aprovechamos pequeñas diferencias de solapamiento con el índice para generar exceso de rentabilidad de manera acumulativa y consistente en el tiempo. Todo ello proporciona una solución estable. Aunque el modelo se ejecuta automáticamente, es construido, probado, perfeccionado y mantenido por personas expertas y los gestores son responsables del funcionamiento diario. Examinan los resultados del modelo, si la distribución de pronósticos es coherente con lo que se espera o si las variaciones permanecen en un orden de magnitud razonable.
El caso es que estamos ante un modelo específico de inversión con IA que identifica y aprovecha relaciones no lineales en las características para hacer predicciones más precisas de rentabilidad de cada valor. El resultado es eficiente, con exceso de rentabilidad sistemáticamente positivo. Pero no es una “caja negra”, sino una verdadera “caja de cristal, como se describe en el estudio que publicamos a finales de 2021 (“Performance attribution of machine learning methods for stock returns prediction” The Journal of Finance and Data Science). Nos permite explicar de forma transparente las fuentes de exceso de rentabilidad respecto al índice.
Tribuna elaborada por Gabriele Susinno, gestor senior de carteras de clientes del equipo cuantitativo Quest en Pictet AM.