Desde siempre el ser humano ha estado muy interesado en predecir su futuro y si no que se lo digan a los griegos con su PiTIAPitonisa, mujer que emitía oráculos en nombre de Apolo, en Delfos.

Últimamente participamos en el desarrollo del producto comercial GMV-PitIA para la «detección temprana de anomalías y predicción de fallos» que hicimos gracias al desarrollo de nuestro gemelo digital ICARUS con ayuda de nuestros amigos de PcDeMaNo.

Pero esto no fue el principio ya que desde años antes estuvimos trabajando en múltiples proyectos para … adivinar el futuro.

 

PREDICIENDO EL FUTURO (Casos reales)

Uno de los primeros tenía como objetivo la predicción del consumo de queroseno de aviación desde el 2010 al 2030 teniendo en cuenta los datos de años anteriores.

Anteriormente nos tocó que diseñar un modelo capaz de predecir la electricidad generada en una unidad de Cogeneración de una refinería española para poder participar con las mayores garantías posibles en la subasta eléctrica que se hacen diariamente y que definen el precio de la luz de tu casa (como bien sabemos sad ).

 

El problema de las SERIES TEMPORALES MULTIVARIANTES

En ambos casos para la confección de los correspondientes modelos predictivos se requieren series temporales. Para su tratamiento es necesario disponer de personal técnico con suficiente conocimiento matemáticos / estadístico… o de ciencia de datos (como está de moda decir ahora). Para evitar esta dependencia un grupo de investigadores del MIT acaba de publicar un paper describiendo el mSSA (Multivariate Singular Spectrum Analysis) que aporta interesantes capacidades predictivas a los modelos de series temporales multivariantes.

 

LA HERRAMIENTA DEL MIT

Por otro lado, en base a la teoría anterior han diseñado una herramienta muy sencilla (realmente un «add-on»)  que han dado en llamar tspDB y que utiliza PostgreSQL and plpython (Python en PostgresSQL).

Aparte de integrar en el tratamiento de las series temporales un «índice de predicción» opcional es increible como funciona la imputación . Si bien «rellenar» una serie con datos faltantes no es muy complicado en series temporales univariantes no es tan sencillo hacerlo en series con más de una variable predictora. Los chicos del MIT, utilizando la teroría previamente comentada de mSSA,  han conseguido un método muy sencillo y eficaz al alcance de todos.. y que se puede ejecutar desde un Jupyter Notebook como se muestra en este ejemplo para la predicción del consumo de energía eléctrica.

367
Suscribirse
Notificación
2 Comments
Inline Feedbacks
Ver todos los comentarios
2
0
¡Aquí puedes dejar tus comentarios!x