Aprendizaje por refuerzo para el control del pH en fotobiorreactores de microalgas

Autores/as

  • Juan Diego Gil Vergel Universidad de Almería
  • Antonio Del Rio Chanona Sargent Centre for Process Systems Engineering, Imperial College London
  • José L. Guzmán Universidad de Almería
  • Manuel Berenguel Universidad de Almería

DOI:

https://doi.org/10.17979/ja-cea.2025.46.12099

Palabras clave:

Control adaptativo, Aprendizaje fuera de línea, Control de procesos biológicos

Resumen

Este trabajo propone un sistema de control basado en aprendizaje por refuerzo para regular el pH en fotobiorreactores de microalgas, utilizando un agente basado en el algoritmo Deep Deterministic Policy Gradient (DDPG). Este enfoque aprende a partir de datos históricos generados por controladores convencionales, como el PID, sin necesidad de interacción directa con el sistema físico. Además, tras su implementación, el agente puede continuar entrenándose periódicamente con nuevas experiencias, lo que le permite adaptarse a las dinámicas cambiantes del proceso biológico. Los resultados en simulación muestran que el algoritmo propuesto mejora métricas de control tradicionales, como la integral del error absoluto en un 12 %, en comparación con un controlador PID. Asimismo, el reentrenamiento periódico favorece la adaptación y robustez del sistema. Estos resultados posicionan al aprendizaje por refuerzo como una alternativa prometedora para la automatización de este tipo de bioprocesos.

Referencias

Caparroz, M., Guzmán, J. L., Berenguel, M., Acién, F., 2024. A novel datadriven model for prediction and adaptive control of pH in raceway reactor for microalgae cultivation. New Biotechnology 82, 1–13.

Caparroz, M., Guzmán, J. L., Berenguel, M., Gil, J. D., Acién, F. G., 2023. Model reference adaptive control for pH regulation. Revista Iberoamericana de Automática e Informática industrial 22 (2), 126–134.

Caparroz, M., Guzmán, J. L., Gil, J. D., Berenguel, M., Acién, F. G., 2025. A hybrid MRAC-PI approach to regulate pH in raceway reactors for microalgae production. Control Engineering Practice 156, 106191.

Castilla, M. M., Campoy-Iniesta, C., Álvarez, J. D., 2025. Control del confort térmico mediante aprendizaje por refuerzo en edificios. Revista Iberoamericana de Automática e Informática Industrial (RIAI) 22 (2), 146–155.

Guzmán, J. L., Acién, F., Berenguel, M., 2021. Modelling and control of microalgae production in industrial photobioreactors. Revista Iberoamericana de Autom´atica e Inform´atica Industrial 18 (1), 1–18.

Juneja, A., Ceballos, R. M., Murthy, G. S., 2013. Effects of environmental factors and nutrient availability on the biochemical composition of algae for biofuels production: a review. Energies 6 (9), 4607–4638.

Lillicrap, T. P., Hunt, J. J., Pritzel, A., Heess, N., Erez, T., Tassa, Y., Silver, D., Wierstra, D., 2015. Continuous control with deep reinforcement learning. arXiv preprint arXiv:1509.02971.

Monteiro, M., Kontoravdi, C., 2024. Bioprocess control: A shift in methodology towards reinforcement learning. In: Computer Aided Chemical Engineering. Vol. 53. Elsevier, pp. 2851–2856.

Pataro, I. M., Gil, J. D., Guzmán, J. L., Berenguel, M., Lemos, J. M., 2023. A learning-based model predictive strategy for pH control in raceway photobioreactors with freshwater and wastewater cultivation media. Control Engineering Practice 138, 105619.

Petsagkourakis, P., Sandoval, I. O., Bradford, E., Zhang, D., del Rio-Chanona, E. A., 2020. Reinforcement learning for batch bioprocess optimization. Computers & Chemical Engineering 133, 106649.

Rajasekhar, N., Radhakrishnan, T., Samsudeen, N., 2025. Exploring reinforcement learning in process control: a comprehensive survey. International Journal of Systems Science, 1–30.

Sachio, S., del Rio-Chanona, E. A., Petsagkourakis, P., 2021. Simultaneous process design and control optimization using reinforcement learning. IFAC-PapersOnLine 54 (3), 510–515.

The MathWorks, Inc., 2024. MATLAB R2024b. http://es.mathworks.com/products/matlab/, accessed on 15/05/2025.

Wang, H., Kontoravdi, C., Del Rio Chanona, A., 2025. Offline reinforcement learning for bioprocess optimization with historical data. In: 14th IFAC Symposium on Dynamics and Control of Process Systems, including Biosystems (DYCOPS 2025): Slovakia, Bratislava, June 16-19, 2025.

Descargas

Publicado

01-09-2025

Número

Sección

Ingeniería de Control