Aprendizaje por demostración mediante datos sintéticos para tareas parametrizadas

Adrián Prados Carrasco; Alicia Mora Velasco; Alberto Méndez García; Santiago Garrido Bullón; Ramón Ignacio Barber Castaño

doi:10.17979/ja-cea.2024.45.10781

Autores/as

Adrian Prados Universidad Carlos III de Madrid https://orcid.org/0000-0003-4703-7858
Alicia Mora Universidad Carlos III de Madrid https://orcid.org/0000-0002-3984-381X
Alberto Mendez Universidad Carlos III de Madrid https://orcid.org/0000-0001-5866-8773
Santiago Garrido Universidad Carlos III de Madrid https://orcid.org/0000-0002-3838-8421
Ramon Barber Universidad Carlos III de Madrid https://orcid.org/0000-0003-2800-2457

DOI:

https://doi.org/10.17979/ja-cea.2024.45.10781

Palabras clave:

Robots manipuladores, Robot móviles, Aprendizaje automático, Aprendizaje por demostración, Aprendizaje por imitación

Resumen

El aprendizaje de tareas por demostración es una tarea desafiante. Uno de los principales desafíos es la extrapolación del conocimiento a partir de demostraciones del usuario. Generar un conjunto de situaciones diversas cubriendo todos los casos posibles es una tarea compleja. Por esto, surge la idea de utilizar la parametrización de tareas, que genera información relevante de puntos característicos de una tarea, permitiendo modelar una política con una menor cantidad de demostraciones. En este artículo, presentamos un algoritmo centrado en generar información sintética para la generalización de tareas parametrizadas. El algoritmo permite la generación autónoma de datos, produciendo demostraciones de características similares a las de los usuarios. Para ello, una métrica basada en la distancia de Wasserstein, que tiene en cuenta los datos probabilísticos de las trayectorias aprendidas, ha sido desarrollada. Se han realizado pruebas en simulación, comparando la eficiencia con dos algoritmos de Lfd y en un entorno real, para una tarea de barrido, realizada con el robot ADAM.

Citas

Barber, R., Ortiz, F. J., Garrido, S., Calatrava-Nicolás, F. M., Mora, A., Prados, A., Vera-Repullo, J. A., Roca-González, J., M ́endez, I., Mozos, ́O. M., 2022. A multirobot system in an assisted home environment to support the elderly in their daily lives. Sensors 22 (20), 7983. DOI: https://doi.org/10.3390/s22207983

Calinon, S., 2016. A tutorial on task-parameterized movement learning and retrieval. Intelligent service robotics 9, 1–29. DOI: https://doi.org/10.1007/s11370-015-0187-9

Calinon, S., Lee, D., 2017. Learning control. In: Humanoid robotics: A reference. Springer Netherlands, pp. 1–52. DOI: https://doi.org/10.1007/978-94-007-7194-9_68-1

Hoyos, J., Prieto, F., Aleny`a, G., Torras, C., 2016. Incremental learning of skills in a task-parameterized gaussian mixture model. Journal of Intelligent & Robotic Systems 82, 81–99. DOI: https://doi.org/10.1007/s10846-015-0290-3

Li, J., Cong, M., Liu, D., Du, Y., 2023. Enhanced task parameterized dynamic movement primitives by gmm to solve manipulation tasks. RIA. DOI: https://doi.org/10.1108/RIA-07-2022-0199

Lopez, B., Prados, A., Moreno, L., Barber, R., 2023. Taichi algorithm: Human-like arm data generation applied on non-anthropomorphic robotic manipulators for demonstration. In: 2023 ECMR. IEEE, pp. 1–7. DOI: https://doi.org/10.1109/ECMR59166.2023.10256343

Mora, A., Prados, A., Mendez, A., Espinoza, G., Gonzalez, P., Lopez, B., Mu ̃noz, V., Moreno, L., Garrido, S., Barber, R., 2024. Adam: a robotic companion for enhanced quality of life in aging populations. Frontiers in Neurorobotics 18, 1337608. DOI: https://doi.org/10.3389/fnbot.2024.1337608

Pervez, A., Lee, D., 2018. Learning task-parameterized dynamic movement primitives using mixture of gmms. Int. Service Robotics 11 (1), 61–78. DOI: https://doi.org/10.1007/s11370-017-0235-8

Prados, A., López, B., Barber, R., Moreno, L., 2023a. Tracking humano visual aplicado a manipuladores no antropomórficos para imitación. In: XLIV Jornadas de Automática. Universidade da Coruña, pp. 714–719. DOI: https://doi.org/10.17979/spudc.9788497498609.714

Prados, A., Mora, A., López, B., Muñoz, J., Garrido, S., Barber, R., 2023b. Kinesthetic learning based on fast marching square method for manipulation. Applied Sciences 13 (4), 2028. DOI: https://doi.org/10.3390/app13042028

Ravichandar, H., Polydoros, A. S., Chernova, S., Billard, A., 2020. Recent advances in robot learning from demonstration. Annual review of control, robotics, and autonomous systems 3, 297–330. DOI: https://doi.org/10.1146/annurev-control-100819-063206

Sena, A., Michael, B., Howard, M., 2019. Improving task-parameterised movement learning generalisation with frame-weighted trajectory generation. In: 2019 IROS. IEEE, pp. 4281–4287. DOI: https://doi.org/10.1109/IROS40897.2019.8967688

Silvério, J., Huang, Y., Rozo, L., Calinon, S., Caldwell, D. G., 2018. Probabilistic learning of torque controllers from kinematic and force constraints. In: 2018 IROS). IEEE, pp. 1–8. DOI: https://doi.org/10.1109/IROS.2018.8594103

Xiao, H., Herman, M., Wagner, J., Ziesche, S., Etesami, J., Linh, T. H., 2019. Wasserstein adversarial imitation learning. arXiv:1906.08113.

Zhu, J., Gienger, M., Kober, J., 2022. Learning task-parameterized skills from few demonstrations. IEEE RAL 7 (2), 4063–4070. DOI: https://doi.org/10.1109/LRA.2022.3150013

Aprendizaje por demostración mediante datos sintéticos para tareas parametrizadas

Autores/as

DOI:

Palabras clave:

Resumen

Citas

Descargas

Publicado

Número

Sección

Licencia

Enviar un artículo

Número actual