Loading [MathJax]/extensions/AssistiveMML.js
R para Análisis Científicos Reproducibles
- Usa RStudio para escribir y correr programas en R.
- R tiene operadores aritméticos y funciones matemáticas usuales.
- Utilizar
<-
para asignar valores a variables.
- Utilizar
ls()
para listar las variables en el
programa.
- Utilizar
rm()
para eliminar objetos en el
programa.
- Utilizar
install.packages()
para instalar paquetes
(libraries).
- Usar RStudio para crear y gestionar proyectos con un diseño
consistente.
- Tratar los datos brutos como de sólo lectura.
- Tratar la salida generada como disponible.
- Definición y aplicación de funciones separadas.
- Usar
help()
para obtener ayuda online de R.
- Usar
read.csv
para leer los datos tabulares en R.
- Los vectores, factores, listas y dataframes son estructuras de datos
en R
- Los tipos de datos básicos en R son double,
integer, complex,
logical, y character.
- Los factors representan variables categóricas en
R.
- Usar
cbind()
para agregar una nueva columna a un
data frame
- Usar
rbind()
para agregar una nueva fila a un data
frame
- Quitar filas de un data frame
- Usar
na.omit()
para remover filas de un data
frame con valores NA
- Usar
levels()
y as.character()
para
explorar y manipular columnas de clase factor
- Usar
str()
, nrow()
, ncol()
,
dim()
, colnames()
, rownames()
,
head()
y typeof()
para entender la estructura
de un data frame
- Leer un archivo csv usando
read.csv()
- Entender el uso de
length()
en un data
frame
- Los índices en R comienzan con 1, no con 0.
- Acceso a un elemento por posición usando
[]
.
- Acceso a un rango de datos usando
[min:max]
.
- Acceso a subconjuntos arbitrarios usando
[c(...)]
.
- Usar operaciones lógicas y vectores lógicos para acceder a
subconjuntos de datos
- Usar
if
y else
para realizar
elecciones.
- Usar
for
para operaciones repetidas.
- Usar
ggplot2
para crear gráficos.
- Piensa cada gráfico como capas: estética, geometría, estadisticas,
transformaciones de escala, y agrupamiento.
- Uso de operaciones vectorizadas en lugar de bucles.
- Usar
function
para definir una nueva función en R.
- Usar parámetros para ingresar valores dentro de las funciones.
- Usar
stopifnot()
para revisar los argumentos de una
función en R de manera flexible.
- Cargar funciones dentro de programas empleando
source()
.
- Guardar gráficos desde RStudio usando el botón de ‘Export’.
- Usar
write.table
para guardar datos tabulares.
- Uso del paquete
plyr
para dividir datos, aplicar
funciones sobre subconjuntos, y combinar los resultados
- Usar el paquete
dplyr
para manipular data frames.
- Usar
select()
para seleccionar variables de un data
frame.
- Usar
filter()
para seleccionar datos basándose en los
valores.
- Usar
group_by()
y summarize()
para
trabajar con subconjuntos de datos.
- Usar
mutate()
para crear nuevas variables.
- Usar el paquete
tidyr
para cambiar el diseño de los
data frames.
- Usar
gather()
para invertir del formato ancho al
formato largo.
- Usar
spread()
para invertir del formato largo al
formato ancho.
- Informes mixtos escritos en R Markdown usando un
programa escrito en R.
- Especificar opciones de fragmento para controlar el formateo.
- Usar
knitr
para convertir estos documentos en PDF y en
otros formatos.
- Documenta qué y por qué, no cómo.
- Divide los programas en funciones cortas de un solo propósito.
- Escribe pruebas re-ejecutables.
- No repitas tu código.
- Se coherente en la nomenclatura, indentación y otros aspectos del
estilo.