Generación y Ajuste Dinámico de Behavior Trees mediante LLMs para el Control de un Robot Social
DOI:
https://doi.org/10.17979/ja-cea.2025.46.12071Palabras clave:
Planificación de misiones y toma de decisiones, Aspectos cognitivos de los sistemas de automatización y los seres humanos, Robots móviles, Modelos de lenguaje a gran escala, Behavior TreesResumen
Los modelos de lenguaje a gran escala (LLMs) se han convertido en herramientas clave para generar comportamientos robóticos flexibles y conscientes del contexto. Sin embargo, adaptarse a los eventos imprevistos y garantizar la consecución de las tareas sigue siendo un reto importante. Este trabajo presenta un sistema que utiliza LLMs y Árboles de Comportamiento (BTs) para que un robot social genere, ejecute y adapte planes de tareas a partir de instrucciones en lenguaje natural. Combinando un planificador de BT y un módulo de interpretación de fallos, el sistema ajusta dinámicamente los BTs frente a errores de ejecución o cambios en el entorno. A diferencia de métodos basados en BTs estáticos, nuestro enfoque detecta problemas y propone alternativas o solicita aclaraciones al usuario, mejorando la interacción humano-robot. Validamos el sistema en múltiples escenarios reales, demostrando su flexibilidad y resiliencia en entornos dinámicos.
Referencias
Ao, J., Ren, Z., Su, H., Zhu, J., 2024. Llm-as-bt-planner: Large language models for behavior tree based robotic task planning. arXiv preprint arXiv:2402.08013.
Ben-Ari, M., Mondada, F., 2018. Finite state machines. Elements of Robotics, 55–61. DOI: 10.1007/978-3-319-62533-1 4
Biggar, O., Zamani, M., Shames, I., 2020. A principled analysis of behavior trees and their generalisations. arXiv preprint arXiv:2008.11906.
Brand, D., Zafiropulo, P., 1983. On communicating finite-state machines. Journal of the ACM (JACM) 30 (2), 323–342.
Cao, Y., Rajeswaran, A., Grover, A., Feinberg, V., 2023. Robot task planning with large language models via behavior tree generation. arXiv preprint arXiv:2310.06796.
Chang, Y., Wang, X., Wang, J., Wu, Y., Yang, L., Zhu, K., Chen, H., Yi, X., Wang, C., Wang, Y., Ye, W., Zhang, Y., Chang, Y., Yu, P. S., Yang, Q., Xie, X., 3 2024. A survey on evaluation of large language models. ACM Transactions on Intelligent Systems and Technology 15, 39. DOI: 10.1145/3641289
Colledanchise, M., Ögren, P., 8 2017. Behavior trees in robotics and ai: An introduction. Behavior Trees in Robotics and AI. DOI: 10.1201/9780429489105
De la Cruz, P., Piater, J., Saveriano, M., 2020. Reconfigurable behavior trees: Towards an executive framework meeting high-level decision making and control layer features. arXiv preprint arXiv:2007.10663.
Deng, J., Lin, Y., 1 2022. The benefits and challenges of chatgpt: An overview. Frontiers in Computing and Intelligent Systems 2, 81–83. DOI: 10.54097/FCIS.V2I2.4465
Ghzouli, R., Berger, T., Johnsen, E. B., Dragule, S., Wasowski, A., 2020. Behavior trees in action: A study of robotics applications. In: Proceedings of the 13th ACM SIGPLAN International Conference on Software Language Engineering. ACM, pp. 127–140. DOI: 10.1145/3426425.3426942
Ghzouli, R., Berger, T., Johnsen, E. B., Dragule, S., Wasowski, A., 2023. Behavior trees and state machines in robotics applications. IEEE Transactions on Software Engineering 49 (1), 1–14. DOI: 10.1109/TSE.2021.3115347
Iovino, M., Scukins, E., Styrud, J., Ögren, P., Smith, C., 2021. A survey of behavior trees in robotics and ai. Robotics and Autonomous Systems 136, 103710. DOI: 10.1016/j.robot.2020.103710
Isla, D., 2005. Handling complexity in the halo2 ai. Game Developers Conference.
Izzo, S., Ardulov, V., Scioni, E., Mohan, R., Cheng, X., He, Y., Hager, G. D., 2024. Btgenbot: Behavior tree generation using compact language models. arXiv preprint arXiv:2402.00560.
Li, M., Lin, L., Lin, Z., Li, X., Du, Y., 2024. A study of behavior tree generation from natural language with large language models. arXiv preprint arXiv:2403.12658.
Lykov, A., Ravichandar, H., Klee, S., Park, D., Nagarajan, P., Troniak, D., Liu, Z., Jenkins, R., Khante, A., Chai, J. Y., et al., 2023. Llm-mars: Leveraging large language models for multi-turn, multi-modal, multi-scene human-robot interaction. arXiv preprint arXiv:2310.02291.
Mahadevan, R., Wang, S., Thomaz, A. L., 2024. Generative language models for expressive robot social behaviors. arXiv preprint arXiv:2402.09013.
Merino-Fidalgo, S., Casanova, E. Z., García-Bermejo, J. G., Domingo, J. D., 6 2025. Generación de behavior trees mediante llm para el control de un robot social. Simposios del Comité Español de Automática (CEA) 1. URL: https://ingmec.ual.es/ojs/index.php/RBVM25/article/view/10
Mishra, B., Kertesz, A., 2020. The use of mqtt in m2m and iot systems: A survey. IEEE Access 8, 201071–201086. DOI: 10.1109/ACCESS.2020.3035849
Ögren, P., Sprague, C. I., 5 2022. Behavior trees in robot control systems. Annual Review of Control, Robotics, and Autonomous Systems 5, 81–107. DOI: 10.1146/ANNUREV-CONTROL-042920-095314
OpenAI, 2024. Introducing chatgpt — openai. Accessed: 26-12-2024. URL: https://openai.com/index/chatgpt/
Pezzato, C., Hernandez Corbato, C., Bonhof, S., Wisse, M., 2020. Active inference and behavior trees for reactive action planning and execution in robotics. arXiv preprint arXiv:2011.09756.
Sánchez-Girón, C., Gómez, M. G., Domingo, J. D., García-Bermejo, J. G., Casanova, E. Z., 2024. Integración convnext-yolo mediante cvv para detectar ca´ıdas en robot social. Jornadas de Automática. DOI: https://doi.org/10.17979/jacea.2024.45.10788
Temi, 2024. Introducing temi robot v3. Accessed: 03-01-2025. URL: https://www.robotemi.com/product/temi-sales-contact/
Wang, T., Patel, R., Qian, Y., Mataric, M. J., 2024. Srlm: Social robot language modeling for goal-conditioned navigation. arXiv preprint arXiv:2401.11317.
Descargas
Publicado
Número
Sección
Licencia
Derechos de autor 2025 Sergio Merino Fidalgo, Eduardo Zalama Casanova, Jaime Gómez García-Bermejo, Jaime Duque Domingo

Esta obra está bajo una licencia internacional Creative Commons Atribución-NoComercial-CompartirIgual 4.0.