Estrategias de control óptimo basadas en programación dinámica y redes neuronales para sistemas MIMO continuos no lineales
Date
1995Abstract
Para la resolución de problemas de control óptimo generales para sistemas MIMO contínuos no lineales se utiliza, en primer lugar, la programación dinámica. Para ésta se formula y demuestra un primer teorema que da las condiciones suficientes para poder tratar índices de tiempo mínimo, y, un segundo teorema que proporcionalas condiciones necesarias y suficientes para la existencia de simetrías en el sistema. Estos teoremas, junto con otras mejoras, se aplican a tres sistemas tipo. Con objeto de rebajar aún más la complejidad espacial de la PD se diseña un primer método de redes neuronales consitente en una cadena de redes que aprenden los comandos óptimos para los estados a partir de la función de costo planteada. Aplicándolo a los tres problemas ejemplo se observa que se entrena rápidamente, pero presenta problemas de sensibilidad a las perturbaciones. Para obviar este problema se diseña un segundo método de redes neuronales consitente en una cadena que aprende la trayectoria óptima a partir de la función de costo Este método permite utilizar la formulación de bloques de pulsos y aplicado a los tres problemas ejemplo se observa que presenta ciertas dificultades en el entrenamiento pero es más robusto, consiguiendo llegar al punto final deseado. La utilización de la formulación de bloques de pulsos, en este segundo método, da mejores resultados que la discretización clásica