La Inteligencia Artificial tiene mucho que decir en los próximos años y estamos a punto de empezar a ver cosas que nos sorprendan ya que hasta ahora los métodos de aprendizaje supervisado no son más que métodos de regresión (o clasificación) un poco más avanzados que los estadísticos de toda la vida.

Eso sí, cuando las máquinas puedan aprender por sí solas sin la necesidad de humanos que les tengan que preparar (etiquetar) las muestras a tratar solo entonces estaremos frente a un gran problema ya que no nos necesitarán para nada y será capaces de aprender como todos hemos aprendido en algún momento… por prueba y error, a través de juegos. Para ello solo necesitarán tiempo para experimentar!

En más de una ocasión os hemos hablado de la compañia inglesa Deepmind, que Google compró en 2014, y que «inventando» el aprendizaje reforzado profundo crearon AlphaZero que consiguió en ganar a los maestros de GO jugando simplemente jugando contra sí mismo.

Estas técnicas de aprendizaje reforzado se cree que tendrán mucha importancia en el desarrollo del coche autónomo y algunos pensamos que incluso en la «optimización» de procesos industriales tendrán mucho que decir. El problema en estos casos es que eso de «jugar» con prueba y error no está muy bien visto en una Planta de fabricación en las que trabajan personas y con productos muchas veces no inocuos sino más bien peligrosos o al menos contaminantes. Eso sí, ¿porqué no utilizar un «digital twin» de la planta para jugar con él? Icarus… y no os decimos nada más, por ahora.

Si alguien piensa que una planta química, por ejemplo, es complicada de operar que eche una pensada en lo difícil que resulta «optimizar» once jugadores de fútbol que se enfrentan a otros once en un partido y que encima ni siguen un comportamiento determinista sino todo al contrario probabilista y con multitud de variables externas no controlables y muchas veces ni siquiera medibles. A pesar de la complejidad del problema, Google y está utilizando Aprendizaje reenforzado para entrenar a sus mejores jugadores dejando el código aquí para ser mejorado por todos.

1164
Suscribirse
Notificación
2 Comments
Inline Feedbacks
Ver todos los comentarios
2
0
¡Aquí puedes dejar tus comentarios!x