Aprendizaje por demostración mediante datos sintéticos para tareas parametrizadas
DOI:
https://doi.org/10.17979/ja-cea.2024.45.10781Palabras clave:
Robots manipuladores, Robot móviles, Aprendizaje automático, Aprendizaje por demostración, Aprendizaje por imitaciónResumen
El aprendizaje de tareas por demostración es una tarea desafiante. Uno de los principales desafíos es la extrapolación del conocimiento a partir de demostraciones del usuario. Generar un conjunto de situaciones diversas cubriendo todos los casos posibles es una tarea compleja. Por esto, surge la idea de utilizar la parametrización de tareas, que genera información relevante de puntos característicos de una tarea, permitiendo modelar una política con una menor cantidad de demostraciones. En este artículo, presentamos un algoritmo centrado en generar información sintética para la generalización de tareas parametrizadas. El algoritmo permite la generación autónoma de datos, produciendo demostraciones de características similares a las de los usuarios. Para ello, una métrica basada en la distancia de Wasserstein, que tiene en cuenta los datos probabilísticos de las trayectorias aprendidas, ha sido desarrollada. Se han realizado pruebas en simulación, comparando la eficiencia con dos algoritmos de Lfd y en un entorno real, para una tarea de barrido, realizada con el robot ADAM.
Citas
Barber, R., Ortiz, F. J., Garrido, S., Calatrava-Nicolás, F. M., Mora, A., Prados, A., Vera-Repullo, J. A., Roca-González, J., M ́endez, I., Mozos, ́O. M., 2022. A multirobot system in an assisted home environment to support the elderly in their daily lives. Sensors 22 (20), 7983. DOI: https://doi.org/10.3390/s22207983
Calinon, S., 2016. A tutorial on task-parameterized movement learning and retrieval. Intelligent service robotics 9, 1–29. DOI: https://doi.org/10.1007/s11370-015-0187-9
Calinon, S., Lee, D., 2017. Learning control. In: Humanoid robotics: A reference. Springer Netherlands, pp. 1–52. DOI: https://doi.org/10.1007/978-94-007-7194-9_68-1
Hoyos, J., Prieto, F., Aleny`a, G., Torras, C., 2016. Incremental learning of skills in a task-parameterized gaussian mixture model. Journal of Intelligent & Robotic Systems 82, 81–99. DOI: https://doi.org/10.1007/s10846-015-0290-3
Li, J., Cong, M., Liu, D., Du, Y., 2023. Enhanced task parameterized dynamic movement primitives by gmm to solve manipulation tasks. RIA. DOI: https://doi.org/10.1108/RIA-07-2022-0199
Lopez, B., Prados, A., Moreno, L., Barber, R., 2023. Taichi algorithm: Human-like arm data generation applied on non-anthropomorphic robotic manipulators for demonstration. In: 2023 ECMR. IEEE, pp. 1–7. DOI: https://doi.org/10.1109/ECMR59166.2023.10256343
Mora, A., Prados, A., Mendez, A., Espinoza, G., Gonzalez, P., Lopez, B., Mu ̃noz, V., Moreno, L., Garrido, S., Barber, R., 2024. Adam: a robotic companion for enhanced quality of life in aging populations. Frontiers in Neurorobotics 18, 1337608. DOI: https://doi.org/10.3389/fnbot.2024.1337608
Pervez, A., Lee, D., 2018. Learning task-parameterized dynamic movement primitives using mixture of gmms. Int. Service Robotics 11 (1), 61–78. DOI: https://doi.org/10.1007/s11370-017-0235-8
Prados, A., López, B., Barber, R., Moreno, L., 2023a. Tracking humano visual aplicado a manipuladores no antropomórficos para imitación. In: XLIV Jornadas de Automática. Universidade da Coruña, pp. 714–719. DOI: https://doi.org/10.17979/spudc.9788497498609.714
Prados, A., Mora, A., López, B., Muñoz, J., Garrido, S., Barber, R., 2023b. Kinesthetic learning based on fast marching square method for manipulation. Applied Sciences 13 (4), 2028. DOI: https://doi.org/10.3390/app13042028
Ravichandar, H., Polydoros, A. S., Chernova, S., Billard, A., 2020. Recent advances in robot learning from demonstration. Annual review of control, robotics, and autonomous systems 3, 297–330. DOI: https://doi.org/10.1146/annurev-control-100819-063206
Sena, A., Michael, B., Howard, M., 2019. Improving task-parameterised movement learning generalisation with frame-weighted trajectory generation. In: 2019 IROS. IEEE, pp. 4281–4287. DOI: https://doi.org/10.1109/IROS40897.2019.8967688
Silvério, J., Huang, Y., Rozo, L., Calinon, S., Caldwell, D. G., 2018. Probabilistic learning of torque controllers from kinematic and force constraints. In: 2018 IROS). IEEE, pp. 1–8. DOI: https://doi.org/10.1109/IROS.2018.8594103
Xiao, H., Herman, M., Wagner, J., Ziesche, S., Etesami, J., Linh, T. H., 2019. Wasserstein adversarial imitation learning. arXiv:1906.08113.
Zhu, J., Gienger, M., Kober, J., 2022. Learning task-parameterized skills from few demonstrations. IEEE RAL 7 (2), 4063–4070. DOI: https://doi.org/10.1109/LRA.2022.3150013
Descargas
Publicado
Número
Sección
Licencia
Derechos de autor 2024 Adrián Prados Carasco, Alicia Mora Velasco, Alberto Méndez García, Santiago Garrido Bullón, Ramón Ignacio Barber Castaño
Esta obra está bajo una licencia internacional Creative Commons Atribución-NoComercial-CompartirIgual 4.0.