Show simple item record

dc.rights.licenseAl consultar y hacer uso de este recurso, está aceptando las condiciones de uso establecidas por los autores.spa
dc.contributor.advisorNúñez Castro, Haydemar María
dc.contributor.authorRincón Ruiz, John Harley
dc.date.accessioned2021-11-03T16:18:40Z
dc.date.available2021-11-03T16:18:40Z
dc.date.issued2021
dc.identifier.urihttp://hdl.handle.net/1992/53331
dc.description.abstractMinuto a minuto ideas, pensamientos, opiniones, libros, documentos, mensajes entre otros, son plasmados en el mundo a través de diferentes plataformas digitales disponibles para el uso de la humanidad. Este crecimiento exponencial de textos digitales ha traído diferentes desafíos de cara al análisis, comprensión y entendimiento humano, por ejemplo, entender en un año de publicaciones de un periódico cuál fue el tema principal del que se habló en un país, conocer de los tweets disponibles cuál es el discurso real de un personaje político o extraer los detalles ocultos que se encuentran plasmados en los manuscritos de Leonardo Da Vinci. Realizar cualquiera de estas actividades de parte de un humano podría tomar un tiempo prolongado e indeterminado. Por fortuna, en los últimos años, dentro del campo del aprendizaje automático han surgido diversas técnicas que apoyan esta problemática y delegan este análisis de texto a las máquinas, entre estas se encuentra el modelado de tópicos. Esta propuesta basa su funcionamiento en el marco estadístico buscando apoyar el procesamiento y exploración de grandes volúmenes de textos digitales encontrando en ellos patrones ocultos que a simple vista no son fáciles de encontrar por un humano; es decir, es capaz de procesar colecciones de documentos digitales mostrando el espacio latente de los textos y revelando el significado profundo de la colección, del que se habla realmente.spa
dc.description.abstractMinute by minute ideas, thoughts, opinions, books, documents, messages, among others, are captured around the world through different digital platforms available for the use of humanity. This exponential growth of digital texts has brought different challenges in terms of analysis, comprehension and human understanding, for example, understand what was the main topic that was discussed in a country in one year of newspaper publications, know from the available tweets what is the real speech of a political figure or extract the hidden details that are embedded in the manuscripts of Leonardo Da Vinci. Performing any of these activities by a human could take a long and indeterminate amount of time. Fortunately, in recent years, in the machine learning area, several techniques have emerged to tackle this problem e.g., topic modeling, technique that delegate text analysis to machines. Topic modelling bases its operation on the statistical framework to support the processing and exploration of large volumes of digital documents to find hidden patterns in them that at first glance are not easy to see by a human; this technique is able to process collections of digital documents showing the latent space of the texts and revealing the deep meaning of the collection, what being talked about around documents. Today, topic modeling relies on several traditional techniques such as latent semantic analysis (LSA), probabilistic latent semantic analysis (pLSA) and latent Dirichlet attribution (LDA). In parallel, but not different way are the neural networks (NN) in constant growth and adoption due to advances in data processing and storage which have facilitated their training and deployment, neural networks are versatile when processing different types of e.g., digital text. This research presents a comparison of the traditional techniques of topic modeling versus neural networks taking as context the thoughts expressed by different authors in short and long digital documents.eng
dc.format.extent84 páginas
dc.format.mimetypeapplication/pdf
dc.language.isospa
dc.publisherUniversidad de los Andes
dc.titleEstudio comparativo de técnicas tradicionales del modelado de tópicos frente a redes neuronales artificiales tomando como contexto el discurso digital del autor en la red social Twitter y otras publicacionesspa
dc.typeTrabajo de grado - Maestríaspa
dc.publisher.programMaestría en Ingeniería de Información
dc.publisher.facultyFacultad de Ingeniería
dc.publisher.departmentDepartamento de Ingeniería de Sistemas y Computación
dc.contributor.juryJiménez Guarín, Claudia Lucía
dc.contributor.juryAfanador Llach, María José
dc.type.driverinfo:eu-repo/semantics/mastherThesisspa
dc.subject.armarcRedes neurales (Computadores)
dc.subject.armarcRecuperación de información
dc.subject.armarcSistemas de almacenamiento y recuperación de información
dc.type.versioninfo:eu-repo/semantics/publishedVersionspa
dc.description.degreenameMagíster en Ingeniería de Información
dc.description.degreelevelMaestría
dc.identifier.instnameinstname:Universidad de los Andesspa
dc.identifier.reponamereponame:Repositorio Institucional Sénecaspa
dc.identifier.repourlrepourl:https://repositorio.uniandes.edu.co/spa
dc.rights.accessrightsinfo:eu-repo/semantics/openAccessspa
dc.type.coarhttp://purl.org/coar/resource_type/c_bdccspa
dc.type.coarversionhttp://purl.org/coar/version/c_ab4af688f83e57aaspa
dc.type.contentTextspa
dc.type.redcolhttp://purl.org/redcol/resource_type/TMspa
dc.rights.coarhttp://purl.org/coar/access_right/c_abf2spa


Files in this item

Thumbnail

Name: 24279.pdf

This item appears in the following Collection(s)

Show simple item record