Introduction to R for Geospatial Data: Reference

Puntos Clave

Introducción a R y RStudio
  • Usa RStudio para escribir y ejecutar programas R.

  • R tiene los operadores aritméticos habituales.

  • Usa <- para asignar valores a las variables.

  • Usa install.packages() para instalar paquetes (bibliotecas).

Gestión de proyectos con RStudio
  • Usa RStudio para crear y manejar proyectos de una manera consistente.

  • Trata los datos originales sólo para lectura.

  • Trata los resultados generados como salida desechable.

Estructura de datos
  • Usar read.csv para leer datos tabulados desde R.

  • Los tipos de datos fundamentales en R son dobles, enteros, complejos, lógicos y caracteres.

  • Usar factores para representar categorías en R.

Explorando Dataframes
  • Usar cbind() para agregar una nueva columna a un dataframe.

  • Usar rbind() para agregar una nueva fila a un dataframe.

  • Eliminar filas de un dataframe.

  • Usar na.omit() para eliminar filas de un dataframe con valores NA.

  • Usar levels() y as.character() para explorar y manipular factores.

  • Usar str(), nrow(), ncol(), dim(), colnames(), rownames(), head() y typeof() para comprender la estructura de un dataframe.

  • Leer en un archivo csv usando read.csv().

  • Comprender quE representalength() en un dataframe.

Subconjunto de Datos
  • El indexado en R empieza en 1, no en 0.

  • Accedes a valores individuales por ubicación utilizando [].

  • Accedes a porciones de datos utilizando [bajo:alto].

  • Accedes a conjuntos de datos arbitrarios utilizando [c(...)].

  • Usas operaciones lógicas y vectores lógicos para acceder a subconjuntos de datos.

Manipulación de dataframes con dplyr
  • Usar el paquete dplyr para manipular dataframes.

  • Usar select() para elegir variables dentro de un dataframe.

  • Usar filter() to elegir datos basados en valores.

  • Usar group_by() y summarize() para trabajar con subconjuntos de datos.

  • Usar mutate() para crear nuevas variables.

Introducción a la Visualización
  • Usar ggplot2 para crear gráficos.

  • Pensar los gráficos en capas: estética, geometría, etc.

Escribiendo datos
  • Guardar gráficos con ggsave() o pdf() combinado con dev.off().

  • Usar write.csv para guardar datos tabulares.

Referencia

Introducción a R y RStudio

Gestión de proyectos con RStudio

Estructura de datos

Explorando Data Frames

Funciones útiles para consultar la estructura de los datos:

Subconjunto de datos

Manipulación de Data frame con dplyr

Control del flujo

-Las figuras se pueden crear con la gramática de los gráficos:

Escribiendo datos

Glosario

argumentos
Un valor dado a una función o programa mientras corre. El termino es frecuentemente intercambiando (inconsistentemente) con parámetro.
asignar
Darle un nombre a un valor al asociarlo a una variable.
cuerpo
(de una función): las instrucciones y comandos que se ejecutan cuando se corre una función.
comentario
Una observación en un programa destinado a ayudar a los lectores humanos a comprender lo que está sucediendo, pero que es ignorado por la computadora. Los comentarios en Python, R y la consola de Unix comienzan con un carácter # y se ejecutan hasta el final de la línea; los comentarios en SQL comienzan con --, y otros lenguajes tienen otras convenciones.
valores separados por coma
(CSV) Una representación textual común para tablas en el que los valores en cada fila están separados por comas.
delimitador
Un caracter o caracteres utilizados para separar valores individuales, como las comas entre columnas en un archivo CSV.
documentación
Texto en lenguaje humano escrito para explicar qué hace un software, cómo funciona o cómo usarlo.
número de coma flotante
Un número que contiene una parte fraccionaria y un exponente. Ver también: entero.
bucle for
Un bucle que se ejecuta una vez para cada valor que hay en un conjunto, lista o rango. Ver también: bucle while.
indice
Un subíndice que especifica la ubicación de un solo valor en una colección, como un solo píxel en una imagen.
entero
Un número entero, como -12343. Ver también: número de coma flotante.
biblioteca
En R, los directorios donde los [paquetes]](#package) son almacenados.
paquete
Una colección de funciones de R, datos y código compilado en un formato bien definido. Los paquetes se almacenan en una biblioteca y se cargan usando la función library().
parametro
Una variable nombrada en la declaración de la función que se utiliza para contener un valor pasado durante la llamada. El término a menudo se usa indistintamente (e inconsistentemente) con argumento.
sentencia de retorno
Una declaración que hace que una función deje de ejecutarse y devuelva un valor a quien la invocó de inmediato.
secuencia
Una colección de información que se presenta en un orden específico.
forma
Dimensiones de una matriz, representadas como un vector. Por ejemplo, la forma de una matriz de 5 × 3 es (5,3).
cadena
Abreviatura de “cadena de caracteres”, una secuencia de cero o más caracteres.
error de sintaxis
Un error de programación que ocurre cuando las declaraciones están en un orden o contienen caracteres no esperados por el lenguaje de programación.
tipo
La clasificación de algo en un programa (por ejemplo, el contenido de una variable) como un tipo de número (por ejemplo floating-point, integer), string, o algo más. En R el comando typeof() se usa para consultar el tipo de una variable.
while loop
Un bucle que se ejecuta siempre que una condición dada sea verdadera. Ver también: for loop.