Co-Evolucion competitiva de agentes de aprendizaje por refuerzo en un dominio de competencia de autos

dc.contributor.advisor Prieto, Samuel
dc.contributor.author Daza, Eduardo
dc.creator.degree Ingeniero (a) de Sistemas spa
dc.date.accessioned 2019-05-14T20:55:05Z
dc.date.available 2019-05-14T20:55:05Z
dc.date.issued 2001
dc.date.submitted 2001
dc.description.abstract El objetivo de este trabajo es mostrar la efectividad alcanzada por dos agentes de aprendizaje por refuerzo cuando se entrenan al tiempo en un ambiente compartido, tomando como dominio la competencia de autos en una pista parcialmente observable. Se definió un comportamiento satisfactorio y un comportamiento óptimo para evaluar el desempeño de los agentes. Usando lenguaje C++, fue desarrollado para plataforma Linux, el software Pcc, el cual simula las competencias en una pista virtual de carreras y entrega de manera gráfica los resultados del aprendizaje. Se usó el algoritmo SARSA(lambda) con selección de acciones E-greedy en ambos agentes y se corrió la aplicación en ocho escenarios de prueba. Los resultados mostraron el alcance de un comportamiento óptimo en todos los escenarios para ambos agentes. El ambiente discreto, estocástico y parcialmente observable empleado y la co-evolución competitiva lograda y la herramienta de software libre producida, hacen de este trabajo una importante contribución al las investigaciones en aprendizaje de máquina. spa
dc.description.provenance Submitted by Juan David Martinez Hoyos (juanmartinezdh@unimagdalena.edu.co) on 2019-04-30T23:12:39Z No. of bitstreams: 1 IS-00001.pdf: 21690105 bytes, checksum: 0b5e0dedab74927c9f05613f7d8a7b2c (MD5) spa
dc.description.provenance Approved for entry into archive by mirlis bravo (mbravo@unimagdalena.edu.co) on 2019-05-14T20:55:04Z (GMT) No. of bitstreams: 1 IS-00001.pdf: 21690105 bytes, checksum: 0b5e0dedab74927c9f05613f7d8a7b2c (MD5) spa
dc.description.provenance Made available in DSpace on 2019-05-14T20:55:05Z (GMT). No. of bitstreams: 1 IS-00001.pdf: 21690105 bytes, checksum: 0b5e0dedab74927c9f05613f7d8a7b2c (MD5) Previous issue date: 2001 spa
dc.format text spa
dc.identifier.other 25652
dc.identifier.uri http://repositorio.unimagdalena.edu.co/handle/123456789/2406
dc.language.iso es spa
dc.publisher Universidad del Magdalena spa
dc.publisher.department Facultad de Ingeniería spa
dc.publisher.place Santa Marta spa
dc.publisher.program Ingeniería de Sistemas spa
dc.rights Restringido
dc.rights info:eu-repo/semantics/restrictedAccess
dc.rights.accessrights info:eu-repo/semantics/restrictedAccess
dc.rights.cc Restringido spa
dc.rights.creativecommons https://creativecommons.org/licenses/by-nc-nd/4.0/
dc.rights.creativecommons atribucionnocomercialsinderivar spa
dc.subject.classification IS-00001 spa
dc.subject.proposal Reinforcement learning spa
dc.subject.proposal Multi-Agent Systems spa
dc.title Co-Evolucion competitiva de agentes de aprendizaje por refuerzo en un dominio de competencia de autos spa
dc.type bachelorThesis spa
dc.type.coar https://vocabularies.coar-repositories.org/resource_types/c_7a1f/
dc.type.driver info:eu-repo/semantics/bachelorThesis
dc.type.local Trabajo de Grado de Pregrado spa
oaire.accessrights http://purl.org/coar/access_right/c_16ec
thesis.degree.level Pregrado spa
Files
Original bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
IS-00001.pdf
Size:
20.69 MB
Format:
Adobe Portable Document Format
Description:
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
2.24 KB
Format:
Item-specific license agreed upon to submission
Description: