Inicio
Contexto docente¶
Este tutorial se enmarca dentro del ámbito de la materia "Informática Aplicada a la Bioquímica". Dicha materia se imparte en la asignatura con el mismo nombre durante el segundo curso del Grado en Bioquímica en la Universidad de Córdoba.
El objetivo de este tutorial es introducir los elementos más importantes del lenguaje de programación R, de un modo guiado y eminentemente práctico, a un nuevo estudiante de Grado en Bioquímica y todo aquel que se inicie en el área de la programación, ya que este lenguaje es tan amplio, y existen tantas bibliotecas de funciones que lo extienden, que es necesario acotar su enseñanza a solo aquellas funcionalidades que se prevé que sean de utilidad para la gran mayoría de estudiantes de Bioquímica, no solo para aquellos que finalmente se declinen para una orientación Bioinformática.
El aprendizaje de programación y, especialmente, R, abren al bioquímico muchas puertas en su futuro profesional, ya que los laboratorios de bioinformática cada vez son más y realizan funciones de gran importancia como el alineamiento de secuencias, la predicción de genes, montaje del genoma, alineamiento estructural de proteínas, predicción de estructura de proteínas, predicción de la expresión génica, interacciones proteína-proteína, y modelado de la evolución. Así, la presencia de bioinformáticos en grupos de investigación donde los principales estudios requieren de la manipulación física en laboratorios es esencial, y aquellos que disponen de conocimientos sobre programación logran hacerse indispensables en dichos lugares.
Introducción a R¶
R es un lenguaje de programación que nació en 1993 en el Departamento de Estadística de Auckland, donde Robert Gentleman y Ross Ihaka combinaron dos lenguajes ya existentes, S y Scheme. Como anécdota, unos comentan que la denominación R es un reconocimiento a estos lenguajes, otros indican que sus creadores comenzaron a llamarlo R debido a la inicial de sus nombres. Actualmente su desarrollo es responsabilidad de R Development core Team y se encuentra disponible aquí en la versión 3.6.3 para los sistemas operativos Windows, Macintosh, Unix y GNU/Linux.
El crecimiento de este lenguaje se está extendiendo a los campos de aprendizaje automático (machine learning), minería de datos, investigación biomédica, bioinformática y matemáticas financieras, y se debe al amplio gran de herramientas y facilidades que proporciona. R destaca por su enfoque estadístico y la alta calidad de generación de gráficos, pero también por otras características resaltables como la amplia presencia de bibliotecas que permiten la interpretación de otros lenguajes de forma más dinámica. Cabe mencionar que R forma parte del proyecto colaborativo y abierto GNU, por lo que sus usuarios pueden publicar paquetes de funciones que extienden su configuración básica. De hecho, existe un repositorio oficial de paquetes, The Comprehensive R Archive Network (CRAN), que los agrupa según su función y naturaleza.