Co-Evolucion competitiva de agentes de aprendizaje por refuerzo en un dominio de competencia de autos

Daza, Eduardo

Co-Evolucion competitiva de agentes de aprendizaje por refuerzo en un dominio de competencia de autos

dc.contributor.advisor	Prieto, Samuel
dc.contributor.author	Daza, Eduardo
dc.creator.degree	Ingeniero (a) de Sistemas	spa
dc.date.accessioned	2019-05-14T20:55:05Z
dc.date.available	2019-05-14T20:55:05Z
dc.date.issued	2001
dc.date.submitted	2001
dc.description.abstract	El objetivo de este trabajo es mostrar la efectividad alcanzada por dos agentes de aprendizaje por refuerzo cuando se entrenan al tiempo en un ambiente compartido, tomando como dominio la competencia de autos en una pista parcialmente observable. Se definió un comportamiento satisfactorio y un comportamiento óptimo para evaluar el desempeño de los agentes. Usando lenguaje C++, fue desarrollado para plataforma Linux, el software Pcc, el cual simula las competencias en una pista virtual de carreras y entrega de manera gráfica los resultados del aprendizaje. Se usó el algoritmo SARSA(lambda) con selección de acciones E-greedy en ambos agentes y se corrió la aplicación en ocho escenarios de prueba. Los resultados mostraron el alcance de un comportamiento óptimo en todos los escenarios para ambos agentes. El ambiente discreto, estocástico y parcialmente observable empleado y la co-evolución competitiva lograda y la herramienta de software libre producida, hacen de este trabajo una importante contribución al las investigaciones en aprendizaje de máquina.	spa
dc.description.provenance	Submitted by Juan David Martinez Hoyos (juanmartinezdh@unimagdalena.edu.co) on 2019-04-30T23:12:39Z No. of bitstreams: 1 IS-00001.pdf: 21690105 bytes, checksum: 0b5e0dedab74927c9f05613f7d8a7b2c (MD5)	spa
dc.description.provenance	Approved for entry into archive by mirlis bravo (mbravo@unimagdalena.edu.co) on 2019-05-14T20:55:04Z (GMT) No. of bitstreams: 1 IS-00001.pdf: 21690105 bytes, checksum: 0b5e0dedab74927c9f05613f7d8a7b2c (MD5)	spa
dc.description.provenance	Made available in DSpace on 2019-05-14T20:55:05Z (GMT). No. of bitstreams: 1 IS-00001.pdf: 21690105 bytes, checksum: 0b5e0dedab74927c9f05613f7d8a7b2c (MD5) Previous issue date: 2001	spa
dc.format	text	spa
dc.identifier.other	25652
dc.identifier.uri	http://repositorio.unimagdalena.edu.co/handle/123456789/2406
dc.language.iso	es	spa
dc.publisher	Universidad del Magdalena	spa
dc.publisher.department	Facultad de Ingeniería	spa
dc.publisher.place	Santa Marta	spa
dc.publisher.program	Ingeniería de Sistemas	spa
dc.rights	Restringido
dc.rights	info:eu-repo/semantics/restrictedAccess
dc.rights.accessrights	info:eu-repo/semantics/restrictedAccess
dc.rights.cc	Restringido	spa
dc.rights.creativecommons	https://creativecommons.org/licenses/by-nc-nd/4.0/
dc.rights.creativecommons	atribucionnocomercialsinderivar	spa
dc.subject.classification	IS-00001	spa
dc.subject.proposal	Reinforcement learning	spa
dc.subject.proposal	Multi-Agent Systems	spa
dc.title	Co-Evolucion competitiva de agentes de aprendizaje por refuerzo en un dominio de competencia de autos	spa
dc.type	bachelorThesis	spa
dc.type.coar	https://vocabularies.coar-repositories.org/resource_types/c_7a1f/
dc.type.driver	info:eu-repo/semantics/bachelorThesis
dc.type.local	Trabajo de Grado de Pregrado	spa
oaire.accessrights	http://purl.org/coar/access_right/c_16ec
thesis.degree.level	Pregrado	spa

Files

Original bundle

Now showing 1 - 1 of 1

Name:: IS-00001.pdf
Size:: 20.69 MB
Format:: Adobe Portable Document Format
Description:

Download

License bundle

Now showing 1 - 1 of 1

Name:: license.txt
Size:: 2.24 KB
Format:: Item-specific license agreed upon to submission
Description:

Download

Collections

Ingeniería de Sistemas