1. Programació d'una IA per a un robot manipulador
- Author
-
Herran Valero, Roger, Universitat Politècnica de Catalunya. Departament de Ciències de la Computació, Escudero Bakx, Gerard, and Tornil Sin, Sebastián
- Subjects
Artificial intelligence ,Robots -- Programació ,xarxes neuronals ,Autonomous robots ,Intel·ligència artificial ,aprenentatge autònom ,Robots -- Programming ,Robots autònoms ,Enginyeria electrònica [Àrees temàtiques de la UPC] ,Python - Abstract
Aquest projecte centra la seva atenció en el desenvolupament d’una aplicació per a poder entrenar un robot per a que pugui dur a terme una tasca de Pick and Place. En el món de l’aprenentatge automàtic, existeixen diferents algorismes d’implementació per a poder fer exercicis d’aquest tipus, en aquest treball s’ha triat el Deep Deterministic Policy Gradient (DDPG) fusionat amb el Hindsight Experience Replay (HER). S’ha utilitzat el gym d’OpenAI per a provar i executar els diferents fulls de codi que s’han desenvolupat amb el llenguatge de programació de Python. Al llarg de l’estudi s’exposen les bases teòriques a seguir i s’expliquen les diferents estructures dels scripts desenvolupats per a entrenar al model programat. D’aquesta manera es pot seguir el fil del disseny la IA de principi a final adquirint també, paral·lelament, coneixement del món de la intel·ligència artificial. El proyecto presente centra su atención en el desarrollo de una aplicación para poder entrenar un robot para que pueda realizar una tarea de Pick and Place. En el mundo del aprendizaje autónomo, existen diferentes algoritmos de implementación para poder hacer ejercicios de este tipo, en este trabajo se ha escogido a Deep Deterministic Policy Gradient (DDPG) mezclado con el Hindsight Experience Replay (HER). Se ha utilizado el gym de OpenAI para probar y ejecutar las distintas hojas de código que se han desarrollado con el lenguaje de programación de Python. A lo largo del estudio se explican las bases teóricas a seguir y se exponen las diferentes estructures de los scripts creados para entrenar al modelo programado. De esta forma, se puede seguir el hilo del diseño de la IA de principio a fin, adquiriendo también, paralelamente, conocimientos del mundo de la inteligencia artificial. This project focuses on the development of an application to train a robot to perform a Pick and Place task. In the world of autonomous learning, there are different implementation algorithms to be able to do exercises of this type, in this work Deep Deterministic Policy Gradient (DDPG) has been chosen and mixed with Hindsight Experience Replay (HER). The OpenAI gym has been used to test and execute the different code sheets that have been developed with the Python programming language. Throughout the study, the theoretical bases to be followed are explained and the different structures of the scripts created to train the programmed model are presented. In this way, it is possible to follow the AI design thread from start to finish, acquiring, in parallel, knowledge of the world of artificial intelligence.
- Published
- 2022