• español
    • English
  • Qué es Séneca
  • Cómo publicar
  • Lineamientos
  • Contáctenos
Ver ítem 
  •   Repositorio Institucional Séneca
  • Facultad de Ciencias
  • Departamento de Ciencias Biológicas
  • Maestría en Biología Computacional
  • Tesis/Trabajos de Grado
  • Ver ítem
    • español
    • English
  •   Repositorio Institucional Séneca
  • Facultad de Ciencias
  • Departamento de Ciencias Biológicas
  • Maestría en Biología Computacional
  • Tesis/Trabajos de Grado
  • Ver ítem
JavaScript is disabled for your browser. Some features of this site may not work without it.

Navegar

Todo SénecaComunidades y ColeccionesAutoresTítulosTemáticasTipos de contenidosPerfil de autor
Esta colecciónFacultades y ProgramasAutoresTítulosTemáticasTipos de contenidos

Mi cuenta

AccederRegistro

Estadísticas

Ver Estadísticas de uso

Graphing genomes in 2D, applications of multivariate statistics on the genomic composition

RISMendeley
http://hdl.handle.net/1992/34158

  • Tesis/Trabajos de Grado [30]

Martínez Villa, María Camila
Reyes Muñoz, AlejandroAutoridad Uniandes; López Kleine, Liliana
2017
Trabajo de grado - Maestría
Secuencia de nucleótidos - Investigaciones
Bioinformática - Investigaciones
Genómica - Investigaciones
Big Data - Investigaciones
Next Generation Sequencing has moved the Big Data phenomenon into the Biological Sciences, making the understanding of biological data a computational challenge. In consequence, it is important to create tools that exploit human visual skills in the interpretation of this ever-increasing information. However, transforming genomic data into an image with biological meaning is particularly difficult because the information is not comprised in a single variable but a set of them. The distribution of genomic composition embedded in k-mer frequencies (frequencies of all possible substrings of size k) is a suitable approach, since it will allow us to obtain a specific signature of different organisms in order to classify and visualize them. The main goal of this study was to develop an R function to transform a genomic sequence into a specific 2D image based on k-mer frequencies and to proof that this visualization would keep biological relationships of organisms. The function was developed such that it fragments a genome, reduce the dimensionality of genomic composition measurements and assign a specific color (RGB) to each fragment, transforming it into an image pixel. This function was applied to 52 Bacterial genomes observing that related organisms presented similar color pattern across family, class and phylum. Also, a Mantel and Chi-squared tests were performed over two distinct distance matrices, one from pixel features and another from a traditional 16S-based phylogenetic tree, in order to assess statistical similarity of the obtained 2D images to classical phylogeny. In conclusion, image-based tools can help improve genomic comparisons, exploiting human visual capabilities.
 
"La secuenciación de NGS ha trasladado el fenómeno Big Data a las Ciencias Biológicas, haciendo que la comprensión de los datos biológicos sea computacional un reto. Por lo cual, es importante crear herramientas que exploten la habilidades visuales humanas en la interpretación de información genómica que se encuentra en constante aumento. Sin embargo, el hecho de transformar datos genómicos en una imagen que tenga significado biológico es particularmente difícil porque la información no está comprendida en una sola variable sino en un conjunto de ellas. Por esto, las distribuciones de la composición genómica integrada en las frecuencias de k-mer (frecuencias de todas las subcadenas posibles de tamaño k) es una opcion adecuada, ya que nos permitirá obtener una firma específica de diferentes organismos para clasificarlos y visualizarlos. Asi, el objetivo principal de este estudio fue desarrollar una función R para transformar una genómica secuencia en una imagen 2D específica basada en las frecuencias k-mer y para probar que esto la visualización mantendría las relaciones biológicas de los organismos. La función fue desarrollada tal que fragmenta un genoma, reduce la dimensionalidad de las métricas de composición genómica y asigna un color específico (RGB) a cada fragmento, transformándolo en un píxel de imagen. Esta función se aplicó a 52 genomas bacterianos observando que los organismos más relacionados entre si, presentaron un patrón de color similar a través de familia, clase y phylum. Además, se realizaron pruebas de Mantel y Chi-cuadrado sobre dos matrices de distancia distintas, una de las características de píxeles y otra de una tradicional Árbol filogenético basado en 16S, con el fin de evaluar la similitud estadística de las imágenes en 2D y una filogenia clásica. En conclusión, las herramientas basadas en imágenes pueden ayudar mejorar las comparaciones genómicas, explotando las capacidades visuales humanas."--Tomado del Formato de Documento de Grado.
 
Ver Estadísticas de uso
Mostrar el registro completo del ítem

Portada

Thumbnail

Nombre: u806887.pdf

[PDF] PDF Open Access[PDF] VER Open Access

Cita

Cómo citar

Cómo citar

Código QR


Carrera 1 # 18A-12

Bogotá - Colombia

Postal Code: 111711

+57 1 3394949 Ext.3322

biblioteca@uniandes.edu.co

Donaciones

Los Andes

Donaciones


Icono Repositorio

Los Andes

Repositorio


Icono Egresados

Los Andes

Egresados


Icono Eventos

Los Andes

Eventos



Redes sociales

  • Facebook
  • twitter
  • youtube
  • instagram
  • whatsapp

Universidad de los Andes | Vigilada Mineducación

Reconocimiento como Universidad: Decreto 1297 del 30 de mayo de 1964.

Reconocimiento personería jurídica: Resolución 28 del 23 de febrero de 1949 Minjusticia.

© - Derechos Reservados Universidad de los Andes